DeepSeek创始人梁文锋2023年（疯狂的幻方：一家隐形AI-20250106195345（微信文章未删减版）

DeepSeek创始人梁文锋2023年（

疯狂的幻方：一家隐形AI巨头的大模型之路）和2024年（

揭秘DeepSeek:一个更极致的中国技术理想主义故事）两篇访谈的关键信息：

——
2023年：
1. 幻方量化进军通用人工智能领域
幻方量化成立独立公司“深度求索”DeepSeek，目标是研究和探索人类级别的通用人工智能（AGI），而不仅仅是复刻ChatGPT或从事行业垂直领域模型开发。

2. 领先的算力储备
幻方早在2021年便拥有超过1万枚英伟达A100显卡的算力储备，为其进入AI领域提供了基础支持。这种早期布局源于对AI未来发展的清晰预见。

3. 专注研究与探索
深度求索强调“不做垂类和应用”，而是专注大模型研究和探索，包括解读GPT4背后的技术与AGI的可能性。其目标不仅是技术复刻，还包括推动认知突破。

4. 非传统的团队与文化
幻方重视基础能力、好奇心与热情，选拔没有经验但有潜力的人才，通过自由发挥和试错空间，激发创新。没有传统KPI约束，而是鼓励长期信任和影响力。

5. 从好奇心驱动的成长路径
创始人梁文锋自学生时代便笃信AI将改变世界，幻方的发展源于对技术边界的好奇与实验。这种好奇心成为公司发展的主要驱动力。

6. 应对高昂成本的策略
做研究需要高成本投入，幻方不仅依赖自有资金，还在寻找合适的外部融资。同时，其算力和技术团队被视为成功的关键资源。

7. 开放与自由作为差异化竞争点
深度求索计划将部分训练结果公开，以降低技术门槛，促进技术普及化，与大厂的生态捆绑策略形成鲜明对比。

8. 对创业公司未来的信心
尽管当下大模型领域竞争激烈，梁文锋认为初创公司因灵活性和创新文化而具备长期机会，尤其是在应用门槛降低后。

9. “非传统管理”的创新支持
幻方通过“少干预、多支持”的管理方式，确保团队拥有足够的创造空间。企业文化非书面化，而是通过管理者的行为示范传递。

10. “疯狂”是一种推动力
幻方将创新视为昂贵且低效的过程，但认为这种好奇心驱动的“疯狂”可以推动行业突破和持续发展，即便其结果可能充满不确定性。

——
2024年：

1. DeepSeek的技术创新与行业影响
DeepSeek推出的DeepSeek V2模型以极低的成本引发中国大模型行业价格战，其创新架构（如MLA和DeepSeekMoESparse）显著降低显存占用和计算成本，在全球范围内受到高度评价。

2. 聚焦研究与技术创新
DeepSeek选择专注于模型研究和技术创新，未涉足ToC应用或全面商业化，并坚持开源策略，与传统大模型创业公司形成鲜明对比。

3. 突破性创新的技术差距
DeepSeek通过模型结构和数据效率的优化，努力缩小与国外先进水平的差距，探索新的模型架构以实现更高的效率和能力。

4. 从“追随”到“原创”
DeepSeek旨在改变中国AI长期处于技术追随状态的现状，希望通过技术创新成为全球AI生态的重要贡献者。

5. 开放与开源的战略选择
DeepSeek认为技术的护城河在于团队和组织文化，而非闭源，因此选择通过开源和发表论文推动技术共享，形成更大的行业影响力。

6. 人才培养与组织架构
DeepSeek重视好奇心与热情，以灵活的资源调配和自下而上的创新模式，支持团队探索最前沿的技术问题，同时培养下一代本土AI人才。

7. 技术探索的优先级与目标
DeepSeek将技术创新作为首要任务，押注于数学、代码和多模态等方向，以推动实现AGI（通用人工智能）。

8. 对中国AI生态的思考与愿景
DeepSeek希望推动中国从技术追随者向原创技术贡献者转变，认为中国需要形成类似于硅谷的技术社区和产业生态，打破长期以来的路径依赖。

9. 行业竞争与战略差异
DeepSeek认为更多的资金投入并不一定带来更多创新，与大厂相比，创业公司具备灵活性和突破限制的潜力。

10. 长期乐观的技术驱动观
DeepSeek对中国硬核创新的未来持乐观态度，认为随着经济结构调整和社会观念变化，技术创新将在中国社会中占据更重要的位置。

#ai创造营##ai#

ChatGPT

DeepSeek创始人梁文锋2023年（疯狂的幻方：一家隐形AI-20250106195345

正文

2025-01-06 19:53
本条微博链接