在4月27日,全球最大AI开源社区Hugging Face首席执行官Clément Delangue在社交平台发布了一条仅由三个眼睛的表情符号构成的动态,并在下方附上了DeepSeek团队在Hugging Face平台的官方资源库入口。
这组充满悬念的组合引发科技圈热议,业内普遍推测DeepSeek R2模型已进入发布倒计时。
近半个月来,有关“DeepSeek全新模型R2即将问世”的传闻持续发酵。除HuggingFace首席执行官Clément Delangue发布动态外,玩家@deedydas也在社交平台贴出了所谓DeepSeek-R2大模型的详细技术参数。
1、拥有 1.2万亿参数,活跃参数为 780亿,采用混合 MoE架构
2、成本比 GPT-4o便宜 97.3%(输入每百万次 0.07美元,输出每百万次 0.27美元)
3、使用了 5.2PB的训练数据,在 C-Eval2.0测试中取得了 89.7%的得分
4、视觉能力更强,在 COCO测试集上达到了 92.4%
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权,未经许可,不得转载。