从2000万DAU说起（微信文章未删减版）

主要观点总结

本文主要讨论了DeepSeek作为AI应用的快速发展和影响力，以及与之相关的几个问题。DeepSeek在短时间内的DAU增长迅速，引发了关于需求、模型热点、算力供给等多个方面的讨论。

关键观点总结

关键观点1: DeepSeek成为全球DAU增速最快的AI应用，20天实现DAU 2000万。

文章介绍了DeepSeek的快速发展，并与其他应用如豆包的DAU增长进行了对比。

关键观点2: DeepSeek的推理需求远超预期，凸显了算力的挑战。

文章指出深度思考和联网模式不仅仅是技术问题，更多的是算力的挑战。国内算力资源存在结构性供需不平衡的问题。

关键观点3: 模型热点的不断切换和模型层的商品化趋势。

文章讨论了模型热点的切换和模型层的内卷现象，认为没有一家模型厂商可以在所有维度维持领先优势，模型层将在未来的切换成本将接近于零。

关键观点4: DeepSeek的开源对生态的影响以及AI商业价值的变化。

文章认为DeepSeek的开源策略是追赶闭源的重要信号，验证了模型层的商品化趋势。AI的商业价值正从模型层向上层转移，应用将会更加繁荣。

关键观点5: 关于豆包和DeepSeek的关系以及字节的战略布局。

文章强调了豆包和DeepSeek并非竞争关系，而是生态共荣。两者的战略聚焦有所不同，但互相促进。字节对模型和research的进展有强大的虹吸力，并享受向上层释放的商业价值。

正文

相信大家都看到那张图了，DeepSeek已经成为全球DAU增速最快的AI应用，用20天实现DAU 2000万。要知道豆包是23年8月上线，DAU直到24年底才到了2000万（春节放假DAU略有盘整）。过年期间的最大赢家毫无疑问是DeepSeek

而这引申出来几个问题

1. 显然推理需求远远超过了DS自己的预期。深度思考和联网模式不是所谓技术问题，就是算力不够用。这把算是让中国人民也能亲身体会什么叫test-time compute scaling law。时间越长，推理效果越高，相应的就是算力的无底洞。

供给如何？我们之前写过，国内算力资源结构性供需不平衡。官方版本要DS自己拿算力承接，但内部即便是训练算力分配都不够。海外如微软、国内腾讯阿里云用自身算力去承接。而硅基流动这次找华为云，也是考虑到昇腾是国内三方可买到的扩展能力最强的国产卡（毕竟南方产能拿最多）。但另一边，过去几年大干快上的地方智算中心利用率可能不足50%（但其实很多资源储备相当不错，比如一半的N卡...）

过去几天几乎所有加速卡厂商用最快速度“适配”了DS v3和r1，充分证明DS这次开源的穿透力。因此这波暴增的推理需求，当潮水退去（2000万肯定有尝鲜需求），真实需求沉淀下来，希望能看到r1自身的深度推理+多模态、外部开源带来的各类垂直蒸馏微调、进一步衍生出的应用产品，整体上拉动需求，对“前置投资”的国内算力供给侧来一波填充。

2. 如何看待模型热点的不断轮动。我们12月初开始写豆包，市场的焦点刚挪到字节体系不到2个月，DS又横空出世。怎么理解模型热点的不断切换？我们嘉宾“全速前进”今天有一个非常好的总结：

判断1：没有一家模型厂商可以在所有维度维持领先优势，各家模型大概率各有千秋。判断2：模型层将在未来的切换成本将接近于零。DS的发布和开源，证明模型层内卷更加激烈（或如微软CEO说的模型同质化）。一种流行的说法：模型公司终将吞噬各种AI应用公司（Wrapper），其实要具体问题具体分析，因为应用层/Wrapper一直在演化，没有创造价值的GPT套壳已经倒闭干净了，但找到PMF深度定制化的产品活得都不错。今天Cursor（26亿刀+估值）、Perplexity（90亿刀+估值）、Glean（46亿刀+估值）某种意义上都是wrapper，能做深做好一样有很大市场。

个人理解，DS这次算是过去2年LLM浪潮开启以来的重要拐点，以开源追赶闭源为信号，验证了Satya的判断，在AGI之前，模型会持续处于商品化（commoditized）。这里面有技术早期的必然性，比如算法的非线性进步和优化空间超过了头部玩家的预测；也有偶然因素，比如DS这次没有任何经济意义的开源（AGI之前甚至继续开源？）

因此闭源的压力必然非常大，要努力证明自己的价值，就要画出一条远超开源的curve。而如果上述假设成立，如我们之前阐述过的，就好比开源的安卓滋养出的手机应用生态，同样，AI更大商业价值从模型层让渡到上层，应用会繁荣。

3. 豆包是竞争关系吗？不，是生态共荣。从本质上战略聚焦略有不同。DS的资源投入重心应该还是围绕AGI，2000万DAU的背后，也要看到DS在主动支持CSP和硅基等等上线部署r1。因此DS要的不是流量，而是生态。豆包目前的定位依然偏重于super APP，或至少是应用与模型双轮驱动。与Meta等其他厂商一样，字节也会受益于DS r1的开源。而豆包在情感语音、多模态、视频生成等应用向的模型能力上，也超过DS和其他。最重要的是，字节算力储备、资本优势决定了，对任何模型和research上的进展进步，都有比较强的虹吸力。聚焦不同，完全可以后发，但却可持续享受这个过程中向上层释放的商业价值。字节是商业上的正向循环。两条路不矛盾，或许最终也殊途同归。

先说这么多，还有很多问题值得探讨，欢迎加入讨论。这两天对DS的讨论算是非常激烈且全面了...