DeepSeek创始人梁文锋2023年(疯狂的幻方:一家隐形AI巨头的大模型之路)和2024年(揭秘DeepSeek:一个更极致的中国技术理想主义故事)两篇访谈的关键信息:
——
2023年:
1. 幻方量化进军通用人工智能领域
幻方量化成立独立公司“深度求索”DeepSeek,目标是研究和探索人类级别的通用人工智能(AGI),而不仅仅是复刻ChatGPT或从事行业垂直领域模型开发。
2. 领先的算力储备
幻方早在2021年便拥有超过1万枚英伟达A100显卡的算力储备,为其进入AI领域提供了基础支持。这种早期布局源于对AI未来发展的清晰预见。
3. 专注研究与探索
深度求索强调“不做垂类和应用”,而是专注大模型研究和探索,包括解读GPT4背后的技术与AGI的可能性。其目标不仅是技术复刻,还包括推动认知突破。
4. 非传统的团队与文化
幻方重视基础能力、好奇心与热情,选拔没有经验但有潜力的人才,通过自由发挥和试错空间,激发创新。没有传统KPI约束,而是鼓励长期信任和影响力。
5. 从好奇心驱动的成长路径
创始人梁文锋自学生时代便笃信AI将改变世界,幻方的发展源于对技术边界的好奇与实验。这种好奇心成为公司发展的主要驱动力。
6. 应对高昂成本的策略
做研究需要高成本投入,幻方不仅依赖自有资金,还在寻找合适的外部融资。同时,其算力和技术团队被视为成功的关键资源。
7. 开放与自由作为差异化竞争点
深度求索计划将部分训练结果公开,以降低技术门槛,促进技术普及化,与大厂的生态捆绑策略形成鲜明对比。
8. 对创业公司未来的信心
尽管当下大模型领域竞争激烈,梁文锋认为初创公司因灵活性和创新文化而具备长期机会,尤其是在应用门槛降低后。
9. “非传统管理”的创新支持
幻方通过“少干预、多支持”的管理方式,确保团队拥有足够的创造空间。企业文化非书面化,而是通过管理者的行为示范传递。
10. “疯狂”是一种推动力
幻方将创新视为昂贵且低效的过程,但认为这种好奇心驱动的“疯狂”可以推动行业突破和持续发展,即便其结果可能充满不确定性。
——
2024年:
1. DeepSeek的技术创新与行业影响
DeepSeek推出的DeepSeek V2模型以极低的成本引发中国大模型行业价格战,其创新架构(如MLA和DeepSeekMoESparse)显著降低显存占用和计算成本,在全球范围内受到高度评价。
2. 聚焦研究与技术创新
DeepSeek选择专注于模型研究和技术创新,未涉足ToC应用或全面商业化,并坚持开源策略,与传统大模型创业公司形成鲜明对比。
3. 突破性创新的技术差距
DeepSeek通过模型结构和数据效率的优化,努力缩小与国外先进水平的差距,探索新的模型架构以实现更高的效率和能力。
4. 从“追随”到“原创”
DeepSeek旨在改变中国AI长期处于技术追随状态的现状,希望通过技术创新成为全球AI生态的重要贡献者。
5. 开放与开源的战略选择
DeepSeek认为技术的护城河在于团队和组织文化,而非闭源,因此选择通过开源和发表论文推动技术共享,形成更大的行业影响力。
6. 人才培养与组织架构
DeepSeek重视好奇心与热情,以灵活的资源调配和自下而上的创新模式,支持团队探索最前沿的技术问题,同时培养下一代本土AI人才。
7. 技术探索的优先级与目标
DeepSeek将技术创新作为首要任务,押注于数学、代码和多模态等方向,以推动实现AGI(通用人工智能)。
8. 对中国AI生态的思考与愿景
DeepSeek希望推动中国从技术追随者向原创技术贡献者转变,认为中国需要形成类似于硅谷的技术社区和产业生态,打破长期以来的路径依赖。
9. 行业竞争与战略差异
DeepSeek认为更多的资金投入并不一定带来更多创新,与大厂相比,创业公司具备灵活性和突破限制的潜力。
10. 长期乐观的技术驱动观
DeepSeek对中国硬核创新的未来持乐观态度,认为随着经济结构调整和社会观念变化,技术创新将在中国社会中占据更重要的位置。
#ai创造营##ai#ChatGPT
——
2023年:
1. 幻方量化进军通用人工智能领域
幻方量化成立独立公司“深度求索”DeepSeek,目标是研究和探索人类级别的通用人工智能(AGI),而不仅仅是复刻ChatGPT或从事行业垂直领域模型开发。
2. 领先的算力储备
幻方早在2021年便拥有超过1万枚英伟达A100显卡的算力储备,为其进入AI领域提供了基础支持。这种早期布局源于对AI未来发展的清晰预见。
3. 专注研究与探索
深度求索强调“不做垂类和应用”,而是专注大模型研究和探索,包括解读GPT4背后的技术与AGI的可能性。其目标不仅是技术复刻,还包括推动认知突破。
4. 非传统的团队与文化
幻方重视基础能力、好奇心与热情,选拔没有经验但有潜力的人才,通过自由发挥和试错空间,激发创新。没有传统KPI约束,而是鼓励长期信任和影响力。
5. 从好奇心驱动的成长路径
创始人梁文锋自学生时代便笃信AI将改变世界,幻方的发展源于对技术边界的好奇与实验。这种好奇心成为公司发展的主要驱动力。
6. 应对高昂成本的策略
做研究需要高成本投入,幻方不仅依赖自有资金,还在寻找合适的外部融资。同时,其算力和技术团队被视为成功的关键资源。
7. 开放与自由作为差异化竞争点
深度求索计划将部分训练结果公开,以降低技术门槛,促进技术普及化,与大厂的生态捆绑策略形成鲜明对比。
8. 对创业公司未来的信心
尽管当下大模型领域竞争激烈,梁文锋认为初创公司因灵活性和创新文化而具备长期机会,尤其是在应用门槛降低后。
9. “非传统管理”的创新支持
幻方通过“少干预、多支持”的管理方式,确保团队拥有足够的创造空间。企业文化非书面化,而是通过管理者的行为示范传递。
10. “疯狂”是一种推动力
幻方将创新视为昂贵且低效的过程,但认为这种好奇心驱动的“疯狂”可以推动行业突破和持续发展,即便其结果可能充满不确定性。
——
2024年:
1. DeepSeek的技术创新与行业影响
DeepSeek推出的DeepSeek V2模型以极低的成本引发中国大模型行业价格战,其创新架构(如MLA和DeepSeekMoESparse)显著降低显存占用和计算成本,在全球范围内受到高度评价。
2. 聚焦研究与技术创新
DeepSeek选择专注于模型研究和技术创新,未涉足ToC应用或全面商业化,并坚持开源策略,与传统大模型创业公司形成鲜明对比。
3. 突破性创新的技术差距
DeepSeek通过模型结构和数据效率的优化,努力缩小与国外先进水平的差距,探索新的模型架构以实现更高的效率和能力。
4. 从“追随”到“原创”
DeepSeek旨在改变中国AI长期处于技术追随状态的现状,希望通过技术创新成为全球AI生态的重要贡献者。
5. 开放与开源的战略选择
DeepSeek认为技术的护城河在于团队和组织文化,而非闭源,因此选择通过开源和发表论文推动技术共享,形成更大的行业影响力。
6. 人才培养与组织架构
DeepSeek重视好奇心与热情,以灵活的资源调配和自下而上的创新模式,支持团队探索最前沿的技术问题,同时培养下一代本土AI人才。
7. 技术探索的优先级与目标
DeepSeek将技术创新作为首要任务,押注于数学、代码和多模态等方向,以推动实现AGI(通用人工智能)。
8. 对中国AI生态的思考与愿景
DeepSeek希望推动中国从技术追随者向原创技术贡献者转变,认为中国需要形成类似于硅谷的技术社区和产业生态,打破长期以来的路径依赖。
9. 行业竞争与战略差异
DeepSeek认为更多的资金投入并不一定带来更多创新,与大厂相比,创业公司具备灵活性和突破限制的潜力。
10. 长期乐观的技术驱动观
DeepSeek对中国硬核创新的未来持乐观态度,认为随着经济结构调整和社会观念变化,技术创新将在中国社会中占据更重要的位置。
#ai创造营##ai#ChatGPT