突然崩了！刚刚，大量人涌入！网友：国产崛起，美国慌了...（微信文章未删减版）

正文

太火爆！国产AI大模型震惊全世界
大量网友涌入，服务器都宕机了
这两天，“DeepSeek崛起”相关话题
持续霸榜热搜

近日，国产AI DeepSeek在中国、美国的科技圈受到广泛关注，甚至被认为是大模型行业的最大“黑马”。

DeepSeek登顶App下载排行榜
大量网友涌入，服务短暂“崩了”

这款由国产大模型公司杭州深度求索开发的DeepSeek应用27日登顶苹果中国地区和美国地区应用商店免费App下载排行榜，在美区下载榜上超越了ChatGPT。Deepseek来自国产大模型公司深度求索，系量化巨头幻方量化旗下大模型公司。

昨日（26日），DeepSeek曾出现短时闪崩现象。对于DeepSeek网页/API不可用的原因，DeepSeek回应称，可能和服务维护、请求限制等因素有关。

■ 最新消息 据财联社报道，今天有消息称DeepSeek服务状态页面显示，DeepSeek网页/API不可用，目前正在调查该问题。

另据新浪科技报道，对于 DeepSeek 如何看待“两天两崩”，DeepSeek 回复称，技术服务的稳定性受多重因素影响，可能涉及突发流量、系统升级适配或底层基础设施的临时波动等。我们的团队始终将稳定性作为首要任务，并会在每次事件后彻底分析原因，持续优化系统韧性。

DeepSeek究竟厉害在哪里？今日，中国工程院院士、清华大学计算机系教授郑纬民及多位AI圈人士在与新浪科技沟通中，指出了DeepSeek其成功出圈的关键所在。

在郑纬民看来，DeepSeek通过自研的MLA架构和DeepSeek MOE架构，为其自身的模型训练成本下降，起到了关键作用。他指出，“MLA主要通过改造注意力算子压缩了KV Cache大小，实现了在同样容量下可以存储更多的KV Cache，该架构和DeepSeek-V3模型中FFN 层的改造相配合，打造了目前公开最大的稀疏MoE 层，这成为DeepSeek训练成本低最关键的原因。”

震惊业界！

AI大佬惊叹：中国AI已追上美国

1月20日，杭州深度求索人工智能基础技术研究有限公司正式发布推理大模型DeepSeek-R1。一经推出，DeepSeek-R1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。作为一款开源模型，R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版，并采用MIT许可协议，支持免费商用、任意修改和衍生开发等。

这篇由DeepSeekI仿《过秦论》写的文章《过美利坚论》，全文过长，本文摘选了开头和结尾。

臣闻周失其鼎，裂土而诸侯争；秦收其器，并疆而山河震。今观美利坚合众国，虽无九鼎之重，而执寰宇之权柄百有余年矣。然其兴也勃焉，其亡也忽焉，岂非天命无常，惟德是辅乎？

故曰：治国之道，在明明德，在利民生，在止于至善。恃强权者必亡于强权，重霸术者终困于霸术。五洲震荡风雷激，百年变局浪潮涌，惟以人类命运共同体为念者，方能立时代潮头。美利坚之兴亡，岂非后来者之明镜乎？

多位知名科技人士均对DeepSeek近期取得的成就表示赞叹。

AI科技初创公司Scale AI的创始人亚历山大·王（Alexandr Wang）称，过去十年来，美国可能一直在人工智能竞赛中领先于中国，但DeepSeek的AI大模型发布可能会“改变一切”。

绕开美国限制
完全颠覆了行业逻辑！

DeepSeek完全颠覆了行业的逻辑！有消息称，他只用了2000张阉割版的英伟达H800芯片和六百万美元就做到了这一切，达到甚至超过openAI的水准！

更重要的是，这一成就是在美国对华芯片出口管制加强的背景下实现的。

DeepSeek直接打破无脑堆砌算力、数据的美国式AI道路！DeepSeek团队取得的成就，相当于做芯片的用自己逆天般的开发能力，直接把摩尔定律干翻了！

而且开发团队，直接“开源”，50多页的论文各种底层架构微创新，写得清清楚楚，还公开了所有参数和代码，随便你分析随便你复制随便你验证。

“限制条件和资源匮乏往往会激发创新，这里的情况似乎就是如此。”斯托伊卡对第一财经记者表示。

著名投资公司A16z的创始人马克·安德森1月24日发文称，DeepSeek-R1是他见过的最令人惊叹、最令人印象深刻的突破之一，而且还是开源的，它是给世界的一份礼物。

1月24日，A16z合伙人、Mistral AI董事会成员Anjney Midha表示：“从斯坦福到麻省理工，DeepSeek-R1几乎一夜之间成为美国顶尖大学研究人员的首选模型。”

对于中国AI为何能有如此快速的进展，诺奖得主、“AI教父”杰弗里·辛顿在1月21日接受博主Curt Jaimungal专访中表示，中国的STEM（科学、技术、工程、数学）教育比美国更好，拥有更多受过良好教育的人才，这将为AI的发展提供坚实的基础。尽管美国试图通过限制（如英伟达芯片）来减缓中国的发展，但这只会促使中国加速发展自己的技术，“他们可能会落后几年，但最终会赶上”。

“黑神话悟空”创始人冯骥：震撼的突破

“来自一个纯粹的中国公司”

1月26日，游戏科学创始人、CEO，《黑神话：悟空》制作人冯骥评价DeepSeek：可能是个国运级别的科技成果。

冯骥表示：“希望DeepSeek R1会让你对当前最先进的AI祛魅，让AI逐渐变成你生活中的水和电。太幸运了！太开心了！这样震撼的突破，来自一个纯粹的中国公司。知识与信息平权，至此又往前迈出了坚实的一步。”

DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，成立于2023年7月17日，是一家创新型科技公司，专注于开发先进的大语言模型（LLM）和相关技术。

DeepSeek-R1 API价格。图源：澎湃新闻

去年12月DeepSeek-V3发布后，AI数据服务公司Scale AI创始人Alexander Wang就发帖称，DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时，中国（科技界）在工作，以更低的成本、更快的速度和更强的实力赶上。”

图源：证券时报

Meta进入恐慌模式

试图复制DeepSeek

1月24日，一条发布在匿名平台teamblind上的帖子疯传。一名Meta（原名Facebook，美国互联网科技公司）员工称，现在Meta内部因为DeepSeek的模型，已经进入恐慌模式。

这位Meta员工写道：

“一切源于DeepSeek-V3的出现，它在基准测试中已经让Llama 4相形见绌。更让人难堪的是，一家‘仅用550万美元训练预算的中国公司’就做到了这一点。

工程师们正在争分夺秒地分析DeepSeek，试图复制其中的一切可能技术。这绝非夸张。

管理层正为GenAI研发部门的巨额投入而发愁。当部门里一个高管的薪资就超过训练整个DeepSeek V3的成本，而且这样的高管还有数十位，他们该如何向高层交代？

DeepSeek-R1的出现让情况更加严峻。具体细节属于机密，不便透露，不过很快就会公开了。”

图源：VCG

DeepSeek或彻底改变游戏规则

英伟达股价大跌

斯坦福大学和Epoch AI的研究人员去年年中发表了一项研究表明，到2027年，最大型的模型的训练成本将超过10亿美元。Gartner预测，到2028年Google、Microsoft和AWS等超大规模企业仅在AI服务器上的支出就将高达5000亿美元。

但DeepSeek完全不同，它的训练成本并不昂贵。Noah's Arc资本管理公司表示，DeepSeek-V3模型有可能彻底改变训练和推理领域的游戏规则。

特别是在特朗普上任后开启的5000亿美元“星际之门”计划，DeepSeek更让人怀疑，巨额投入这种“大力出奇迹”的办法真是最有效的方法吗？

美股大V“THE SHORT BEAR”1月24日在X上发文称，DeepSeek给AI巨头们带来了痛苦时刻，投资者必须对此敲响警钟。

他说：“如果击败OpenAI只需要5500万美元，那么这个行业的商业化会比很多人预想的要快很多。”

他还指出：“根据红杉，美国AI公司每年必须产生约6000亿美元收入来支付其AI硬件费用。现在看来，这种冒险行为变得越来越无利可图。”

著名财经记者Holger Zschaepitz 1月25日表示，DeepSeek以极低的价格建立了一个突破性的AI模型，而且没有使用尖端芯片，这让人们质疑该行业数千亿美元资本支出的效用。

有投资者甚至认为，美股芯片股的股价也会面临挑战。

投资者Geiger Capital表示，Deepseek和OpenAI一样好，甚至更好，而且价格只有后者的3%，而美国公司却投入了数千亿美元。那么，纳斯达克会怎样呢？

值得注意的是，DeepSeek-V3发布后，英伟达股价下跌了2%。而DeepSeek-R1引发海外大讨论后，1月24日英伟达股价又大跌了3.12%。

来源：杭州日报综合第一财经、每日经济新闻、九派新闻、财联社、界面新闻等

编辑李俪杜海锋审核蒋波钟玮