Deepseek R1的新朋友和新对手（微信文章未删减版）

正文

Deepseek R1 的爆火，已经有好几天了。

从微信指数走势来看，Deepseek 的热度仍在攀升期。

这几天，关于 Deepseek，有几个有趣的进展，值得关注，这里与诸位分享。

英伟达股价还在坑里

1 月 27 日，因为 Deepseek R1 的爆火，引发了美国股市投资者对于“算力迷信”的反思，而英伟达作为算力供应代表，当日股价暴跌16.97%。

虽然此后许多分析都认为更优秀的算法，只会激发更多的算力需求，但这显然无助于英伟达的爬坑。

此后低位涨涨跌跌，一周间英伟达的股价依然下跌了15.81%，仍在坑中。

AI 编程新宠

之前在《Deepseek爆红背后的四个关键词》中，我就提到过，在欧美科技界，Deepseek 的名声，很大程度来自于程序员的推动，对于许多在尝试用 AI 辅助编程的程序员，Deepseek V3 和 R1 靠不靠谱，这是最立竿见影可以验证的事情。

事实上，过去几天，当红的 AI编程软件都将 Deepseek 纳入。

Cursor 作为当红的 AI 编程软件，1 月 23 日就纳入了。

我用的Winsurf，稍晚，是在 1 月 31 日纳入。同批纳入的还有当日发布的o3-mini。目前 Winsurf 下，Deepseek 模型两个、OpenAI模型两个，Claude 一个。从换算比率可以看到，Deepseek 主打高性价比。

之前也聊过，一款模型好不好，不同人有不同的评价标准。

类似文字能力，文无第一，其实很难有确认的结果。但编程无疑是最好评价的，编出来的代码不能用就是不能用，一目了然。

从这点说，当下开源模型那么多，就 Deepseek 有这个待遇被接入几个 AI 编程软件，它的强大，至少是程序员公认了。

不过，当接入 AI 编程后，Deepseek V3 和 R1 不支持多模态的问题也就突显了，很多上传界面高仿的前端需求，还是只能靠 Claude，期待今年 Deepseek 能在多模态上发力，形成大一统模型，而不是像现在这样拆分成几个。

天下谁人不通 Deepseek

这几天，Deepseek 官方服务的可访问性堪忧，下图是 Deepseek 官方(https://status.deepseek.com/)公布的可用性情况，网页端也就是 2 月 1 日才好点，而 API 服务迄今还不稳定——这场攻防战，看来焦点在 API 服务上。

但与此同时，海外用Deepseek 却变得越发便利了。

因为 Deepseek 是开源的，任何有基础技术能力的服务商都可以自行部署提供服务。

下图是 Openrouter 桥接的可提供 Deepseek R1 的供应商，这几天我一直都在看，隔几天就增加几个，如今算上 Deepseek 本身已经有9 个了。

如果说上面这些，大多是小厂，那么下面两个就是巨头级别了。

一个是亚马逊的 AWS 云服务。

另一个是英伟达，虽然 Deepseek 让其股价重挫，但不妨碍其在开发者网站上提供 Deepseek-R1 的部署。

这就是“开源”的力量。哪怕美国对中国算力禁运，但也无法禁止美国的厂商，在美国本土用高阶算力部署 Deepseek 提供服务。

从这点而言，“卡脖子”这件事儿，对 Deepseek 的影响会很小，至多是在研发层面，但在提供服务上，反而不太受影响——反正就提供 API 服务 Deepseek 一直是微利心态，也不差这点。

华为+Deepseek

当然，当海外厂商纷纷部署 Deepseek 时，另一个不容忽视的就是硅基流动用华为的 AI 生态在国内也部署了 Deepseek V3 和 R1，具体可以参见硅基流动的官微《首发！硅基流动 x 华为云联合推出基于昇腾云的 DeepSeek R1 & V3 推理服务！》。

关于华为的昇腾AI云服务器，我让 Kimi 帮我联网搜索做了一个综述，这应该是英伟达生态之外的的一套 AI硬件生态。

在硅基流动的官微稿件中有这么一句话：

开发者朋友可以感受一下 SiliconCloud 上的 DeepSeek-R1 & V3 在国产芯片上加速后的效果。更快的输出速度还在持续优化中。

我充值硅基流动，体验了下上面的 R1，直观感受是比当下的 Deepseek官网的 R1 速度更快点，不知道是真因为国产芯片加速，还是 Deepseek 官网访问量大后限流的原因。如果是前者，那就太可喜了！这意味着至少我们在服务层，也不用担心卡脖子了。PS:硅基流动的服务还有点小 bug，我已经报错过，不过相信会越来越好。

o3-mini来也

虽然这几天 Deepseek 势如破竹，但 1 月 31 日，OpenAI 总算发布了强有力的回应——发布 o3-mini。

之前，Deepseek R1 之所以在欧美程序员口碑那么好，关键是作为 OpenAI o1 的“平替”。

下图是o1 的价格，每百万 token 的输出是 60 美元。

与之相比，Deepseek R1 官方的报价，每百万 token 的输出只有 2.2 美元，差不多 1/30 的价格，近似的功能，怎能不让程序员们痴狂？

但是，从 o3-min 的发布数据来看，性能尤其是编程领域，已经轻微超过 o1 了，具体细节可以参考机器之心的《奥特曼被逼急：深夜上线 o3-mini，甚至免费，网友：还是选DeepSeek》和量子位的《首个OpenAI免费推理模型o3-mini发布！DeepSeek让奥特曼反思：不开源我们错了》。

这里就放一张软件工程的评分，满血版 o3-mini 得分高于 o1。

然而，o3-mini 的价格相当便宜，百万 token 输出只要 4.4 美元，比 Deepseek R1 只贵了 1 倍。

如果o3-mini 能有比 Deepseek R1 略好的编程性能，在 1 倍价差下，说不定还真有指望扳回一点声誉的。

毕竟，o3-mini 支持了开发者看重的Function Calling、Structured Outputs，这些 Deepseek R1暂时是还不支持。

更何况，从我有限的 Deepseek R1 编程体验来看，规划上比 Cluade 强，但偶发会有非常低级的错误，o3-mini 会不会更稳健还有等待更多的测试结果披露，可惜暂时o3-mini的 API 只对高阶用户开放，我还没体验的机会。

写在最后

下面这段结尾是 Deepseek R1 阅读上文后的总结，我觉得写的挺好：

英伟达15%的市值蒸发，OpenAI史无前例的定价让步，华为昇腾云上跃动的推理时延，这三个看似孤立的事件，实则勾勒出AI产业的价值重构。当算法优化开始对冲算力消耗，当开源模型激活全球闲置算力，算力崇拜的迷雾正在散去，显露出硬核创新的新大陆。这里既有硅基流动在国产芯片上跑通的希望曙光，也有海外多个 Deepseek-R1 服务供应商组成的去中心化网络，更藏着o3-mini与R1贴身肉搏掀起的效率革命。或许十年后再回望，2025年的这场混战，正是AI挣脱算力枷锁、走向技术平权的历史拐点。