来源:暗涌Waves,整理:Founder Park
因为 V3 版本开源模型的发布,DeepSeek 又火了一把,而且这一次,是外网刷屏。
训练成本估计只有 Llama 3.1 405B 模型的 11 分之一,后者的效果还不如它。
在多项测评上,DeepSeek V3 达到了开源 SOTA,超越 Llama 3.1 405B,能和 GPT-4o、Cla...
因为 V3 版本开源模型的发布,DeepSeek 又火了一把,而且这一次,是外网刷屏。
训练成本估计只有 Llama 3.1 405B 模型的 11 分之一,后者的效果还不如它。
在多项测评上,DeepSeek V3 达到了开源 SOTA,超越 Llama 3.1 405B,能和 GPT-4o、Cla...