首页   

从2000万DAU说起

信息平权  · 互联网安全 科技自媒体  · 11 小时前

主要观点总结

本文主要讨论了DeepSeek作为AI应用的快速发展和影响力,以及与之相关的几个问题。DeepSeek在短时间内的DAU增长迅速,引发了关于需求、模型热点、算力供给等多个方面的讨论。

关键观点总结

关键观点1: DeepSeek成为全球DAU增速最快的AI应用,20天实现DAU 2000万。

文章介绍了DeepSeek的快速发展,并与其他应用如豆包的DAU增长进行了对比。

关键观点2: DeepSeek的推理需求远超预期,凸显了算力的挑战。

文章指出深度思考和联网模式不仅仅是技术问题,更多的是算力的挑战。国内算力资源存在结构性供需不平衡的问题。

关键观点3: 模型热点的不断切换和模型层的商品化趋势。

文章讨论了模型热点的切换和模型层的内卷现象,认为没有一家模型厂商可以在所有维度维持领先优势,模型层将在未来的切换成本将接近于零。

关键观点4: DeepSeek的开源对生态的影响以及AI商业价值的变化。

文章认为DeepSeek的开源策略是追赶闭源的重要信号,验证了模型层的商品化趋势。AI的商业价值正从模型层向上层转移,应用将会更加繁荣。

关键观点5: 关于豆包和DeepSeek的关系以及字节的战略布局。

文章强调了豆包和DeepSeek并非竞争关系,而是生态共荣。两者的战略聚焦有所不同,但互相促进。字节对模型和research的进展有强大的虹吸力,并享受向上层释放的商业价值。


正文

相信大家都看到那张图了,DeepSeek已经成为全球DAU增速最快的AI应用,用20天实现DAU 2000万。要知道豆包是23年8月上线,DAU直到24年底才到了2000万(春节放假DAU略有盘整)。过年期间的最大赢家毫无疑问是DeepSeek

而这引申出来几个问题

1. 显然推理需求远远超过了DS自己的预期。深度思考和联网模式不是所谓技术问题,就是算力不够用。这把算是让中国人民也能亲身体会什么叫test-time compute scaling law。时间越长,推理效果越高,相应的就是算力的无底洞。

供给如何?我们之前写过,国内算力资源结构性供需不平衡。官方版本要DS自己拿算力承接,但内部即便是训练算力分配都不够。海外如微软、国内腾讯阿里云用自身算力去承接。而硅基流动这次找华为云,也是考虑到昇腾是国内三方可买到的扩展能力最强的国产卡(毕竟南方产能拿最多)。但另一边,过去几年大干快上的地方智算中心利用率可能不足50%(但其实很多资源储备相当不错,比如一半的N卡...)

过去几天几乎所有加速卡厂商用最快速度“适配”了DS v3和r1,充分证明DS这次开源的穿透力因此这波暴增的推理需求,当潮水退去(2000万肯定有尝鲜需求),真实需求沉淀下来,希望能看到r1自身的深度推理+多模态、外部开源带来的各类垂直蒸馏微调、进一步衍生出的应用产品,整体上拉动需求,“前置投资”的国内算力供给侧来一波填充

2. 如何看待模型热点的不断轮。我们12月初开始写豆包,市场的焦点刚挪到字节体系不到2个月,DS又横空出世。怎么理解模型热点的不断切换?我们嘉宾“全速前进”今天有一个非常好的总结:

判断1:没有一家模型厂商可以在所有维度维持领先优势,各家模型大概率各有千秋。判断2:模型层将在未来的切换成本将接近于零。DS的发布和开源,证明模型层内卷更加激烈(或如微软CEO说的模型同质化)。一种流行的说法:模型公司终将吞噬各种AI应用公司(Wrapper),其实要具体问题具体分析,因为应用层/Wrapper一直在演化,没有创造价值的GPT套壳已经倒闭干净了,但找到PMF深度定制化的产品活得都不错。今天Cursor(26亿刀+估值)、Perplexity(90亿刀+估值)、Glean(46亿刀+估值)某种意义上都是wrapper,能做深做好一样有很大市场。

个人理解,DS这次算是过去2年LLM浪潮开启以来的重要拐点,以开源追赶闭源为信号,验证了Satya的判断,在AGI之前,模型会持续处于商品化commoditized)。这里面有技术早期的必然性,比如算法的非线性进步和优化空间超过了头部玩家的预测;也有偶然因素,比如DS这次没有任何经济意义的开源(AGI之前甚至继续开源?)

因此闭源的压力必然非常大,要努力证明自己的价值,就要画出一条远超开源的curve。而如果上述假设成立,如我们之前阐述过的,就好比开源的安卓滋养出的手机应用生态,同样,AI更大商业价值从模型层让渡到上层,应用会繁荣。

3. 豆包是竞争关系吗?不,是生态共荣。从本质上战略聚焦略有不同。DS的资源投入重心应该还是围绕AGI,2000万DAU的背后,也要看到DS在主动支持CSP和硅基等等上线部署r1。因此DS要的不是流量,而是生态。豆包目前的定位依然偏重于super APP,或至少是应用与模型双轮驱动。与Meta等其他厂商一样,字节也会受益于DS r1的开源。而豆包在情感语音、多模态、视频生成等应用向的模型能力上,也超过DS和其他。最重要的是,字节算力储备、资本优势决定了,对任何模型和research上的进展进步,都有比较强的虹吸力。聚焦不同,完全可以后发,但却可持续享受这个过程中向上层释放的商业价值。字节是商业上的正向循环。两条路不矛盾,或许最终也殊途同归。

先说这么多,还有很多问题值得探讨,欢迎加入讨论。这两天对DS的讨论算是非常激烈且全面了...

© 2024 精读
删除内容请联系邮箱 2879853325@qq.com