回答

收藏

DeepSeek-R1技术报告解读 [翻译中]

应用科普 应用科普 299 人阅读 | 0 人回复 | 2025-04-08

R1的名气要比V3大很多,毕竟首个重量级开源大模型,并且已经在数个领域超过了GPT。
https://github.com/deepseek-ai/DeepSeek-R1

但是我们仍然需要注意到,R1的幻觉并不比其他的大模型少,曲解、答非所问以及编造数据的情况依然存在并且频率不低。可见R1距离真的人工智能还有很长的路。

R1的水平无疑是很高的,特别是671b参数的思考能力进一步提升。
v2-3ace240629c5b77fdfd5fd8bbde95c95_1440w.jpg


R1对于AI领域最大的贡献,我认为是极大的降低了显卡的使用规模,从之前数百万入门到几十万可以配置满血训练,成本只有原来的1/20,这是革命性的突破。并且可以使用CPU内存调用模式,进一步给普通人的使用机会,而不是纯纯被GPT等大AI公司割韭菜。

对于具体内容感兴趣可以浏览:https://zhuanlan.zhihu.com/p/19744278380



分享到:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

161 积分
11 主题