Deepseek R1 的爆火,已经有好几天了。
从微信指数走势来看,Deepseek 的热度仍在攀升期。
这几天,关于 Deepseek,有几个有趣的进展,值得关注,这里与诸位分享。
英伟达股价还在坑里
1 月 27 日,因为 Deepseek R1 的爆火,引发了美国股市投资者对于“算力迷信”的反思,而英伟达作为算力供应代表,当日股价暴跌16.97%。
虽然此后许多分析都认为更优秀的算法,只会激发更多的算力需求,但这显然无助于英伟达的爬坑。
此后低位涨涨跌跌,一周间英伟达的股价依然下跌了15.81%,仍在坑中。
AI 编程新宠
之前在《Deepseek爆红背后的四个关键词》中,我就提到过,在欧美科技界,Deepseek 的名声,很大程度来自于程序员的推动,对于许多在尝试用 AI 辅助编程的程序员,Deepseek V3 和 R1 靠不靠谱,这是最立竿见影可以验证的事情。
事实上,过去几天,当红的 AI编程软件都将 Deepseek 纳入。
Cursor 作为当红的 AI 编程软件,1 月 23 日就纳入了。
我用的Winsurf,稍晚,是在 1 月 31 日纳入。同批纳入的还有当日发布的o3-mini。目前 Winsurf 下,Deepseek 模型两个、OpenAI模型两个,Claude 一个。从换算比率可以看到,Deepseek 主打高性价比。
之前也聊过,一款模型好不好,不同人有不同的评价标准。
类似文字能力,文无第一,其实很难有确认的结果。但编程无疑是最好评价的,编出来的代码不能用就是不能用,一目了然。
从这点说,当下开源模型那么多,就 Deepseek 有这个待遇被接入几个 AI 编程软件,它的强大,至少是程序员公认了。
不过,当接入 AI 编程后,Deepseek V3 和 R1 不支持多模态的问题也就突显了,很多上传界面高仿的前端需求,还是只能靠 Claude,期待今年 Deepseek 能在多模态上发力,形成大一统模型,而不是像现在这样拆分成几个。
天下谁人不通 Deepseek
这几天,Deepseek 官方服务的可访问性堪忧,下图是 Deepseek 官方(https://status.deepseek.com/)公布的可用性情况,网页端也就是 2 月 1 日才好点,而 API 服务迄今还不稳定——这场攻防战,看来焦点在 API 服务上。
但与此同时,海外用Deepseek 却变得越发便利了。
因为 Deepseek 是开源的,任何有基础技术能力的服务商都可以自行部署提供服务。
下图是 Openrouter 桥接的可提供 Deepseek R1 的供应商,这几天我一直都在看,隔几天就增加几个,如今算上 Deepseek 本身已经有9 个了。
如果说上面这些,大多是小厂,那么下面两个就是巨头级别了。
一个是亚马逊的 AWS 云服务。
另一个是英伟达,虽然 Deepseek 让其股价重挫,但不妨碍其在开发者网站上提供 Deepseek-R1 的部署。
这就是“开源”的力量。哪怕美国对中国算力禁运,但也无法禁止美国的厂商,在美国本土用高阶算力部署 Deepseek 提供服务。
从这点而言,“卡脖子”这件事儿,对 Deepseek 的影响会很小,至多是在研发层面,但在提供服务上,反而不太受影响——反正就提供 API 服务 Deepseek 一直是微利心态,也不差这点。
华为+Deepseek
当然,当海外厂商纷纷部署 Deepseek 时,另一个不容忽视的就是硅基流动用华为的 AI 生态在国内也部署了 Deepseek V3 和 R1,具体可以参见硅基流动的官微《首发!硅基流动 x 华为云联合推出基于昇腾云的 DeepSeek R1 & V3 推理服务!》。
关于华为的昇腾AI云服务器,我让 Kimi 帮我联网搜索做了一个综述,这应该是英伟达生态之外的的一套 AI硬件生态。
在硅基流动的官微稿件中有这么一句话:
开发者朋友可以感受一下 SiliconCloud 上的 DeepSeek-R1 & V3 在国产芯片上加速后的效果。更快的输出速度还在持续优化中。
我充值硅基流动,体验了下上面的 R1,直观感受是比当下的 Deepseek官网的 R1 速度更快点,不知道是真因为国产芯片加速,还是 Deepseek 官网访问量大后限流的原因。如果是前者,那就太可喜了!这意味着至少我们在服务层,也不用担心卡脖子了。PS:硅基流动的服务还有点小 bug,我已经报错过,不过相信会越来越好。
o3-mini来也
虽然这几天 Deepseek 势如破竹,但 1 月 31 日,OpenAI 总算发布了强有力的回应——发布 o3-mini。
之前,Deepseek R1 之所以在欧美程序员口碑那么好,关键是作为 OpenAI o1 的“平替”。
下图是o1 的价格,每百万 token 的输出是 60 美元。
与之相比,Deepseek R1 官方的报价,每百万 token 的输出只有 2.2 美元,差不多 1/30 的价格,近似的功能,怎能不让程序员们痴狂?
但是,从 o3-min 的发布数据来看,性能尤其是编程领域,已经轻微超过 o1 了,具体细节可以参考机器之心的《奥特曼被逼急:深夜上线 o3-mini,甚至免费,网友:还是选DeepSeek》和量子位的《首个OpenAI免费推理模型o3-mini发布!DeepSeek让奥特曼反思:不开源我们错了》。
这里就放一张软件工程的评分,满血版 o3-mini 得分高于 o1。
然而,o3-mini 的价格相当便宜,百万 token 输出只要 4.4 美元,比 Deepseek R1 只贵了 1 倍。
如果o3-mini 能有比 Deepseek R1 略好的编程性能,在 1 倍价差下,说不定还真有指望扳回一点声誉的。
毕竟,o3-mini 支持了开发者看重的Function Calling、Structured Outputs,这些 Deepseek R1暂时是还不支持。
更何况,从我有限的 Deepseek R1 编程体验来看,规划上比 Cluade 强,但偶发会有非常低级的错误,o3-mini 会不会更稳健还有等待更多的测试结果披露,可惜暂时o3-mini的 API 只对高阶用户开放,我还没体验的机会。
写在最后
下面这段结尾是 Deepseek R1 阅读上文后的总结,我觉得写的挺好:
英伟达15%的市值蒸发,OpenAI史无前例的定价让步,华为昇腾云上跃动的推理时延,这三个看似孤立的事件,实则勾勒出AI产业的价值重构。当算法优化开始对冲算力消耗,当开源模型激活全球闲置算力,算力崇拜的迷雾正在散去,显露出硬核创新的新大陆。这里既有硅基流动在国产芯片上跑通的希望曙光,也有海外多个 Deepseek-R1 服务供应商组成的去中心化网络,更藏着o3-mini与R1贴身肉搏掀起的效率革命。或许十年后再回望,2025年的这场混战,正是AI挣脱算力枷锁、走向技术平权的历史拐点。