首页   

DeepSeek模型的开发时间线

小小牛财经  · 科技创业  · 昨天

主要观点总结

文章介绍了DeepSeek模型的开发时间线,包括公司成立、模型发布和应用成效等关键事件。

关键观点总结

关键观点1: DeepSeek公司成立及首个开源代码大模型发布

2023年7月17日DeepSeek公司成立,并于2023年10月28日推出首个开源代码大模型DeepSeek-Coder。

关键观点2: DeepSeek-Coder的发布及支持多种编程语言

2023年11月2日发布的DeepSeek Coder支持多种编程语言的代码生成和调试。

关键观点3: 通用大模型DeepSeek-LLM的发布

2023年11月29日发布了参数规模达670亿的通用大模型DeepSeek-LLM,包括不同版本的base及chat模型。

关键观点4: DeepSeek-V3的发布及基于混合专家架构的特点

2024年12月26日发布的DeepSeek-V3基于混合专家(MoE)架构,参数量高达671B。

关键观点5: DeepSeek高性能AI推理模型的发布及行业应用成效

DeepSeek在成立后短时间内不断推出和更新多个高性能模型,并于2025年发布高性能AI推理模型DeepSeek-R1,性能直逼OpenAI的GPT-4。随后,DeepSeek的模型在多个行业应用中取得显著成效。


正文


© 2024 精读
删除内容请联系邮箱 2879853325@qq.com