首页   

突然崩了!刚刚,大量人涌入!网友:国产崛起,美国慌了...

杭州日报  · 浙江  · 昨天

正文

太火爆!国产AI大模型震惊全世界
大量网友涌入,服务器都宕机了
这两天,“DeepSeek崛起”相关话题
持续霸榜热搜

近日,国产AI DeepSeek在中国、美国的科技圈受到广泛关注,甚至被认为是大模型行业的最大“黑马”。

DeepSeek登顶App下载排行榜
大量网友涌入,服务短暂“崩了”


这款由国产大模型公司杭州深度求索开发的DeepSeek应用27日登顶苹果中国地区和美国地区应用商店免费App下载排行榜,在美区下载榜上超越了ChatGPT。Deepseek来自国产大模型公司深度求索,系量化巨头幻方量化旗下大模型公司。

昨日(26日),DeepSeek曾出现短时闪崩现象。对于DeepSeek网页/API不可用的原因,DeepSeek回应称,可能和服务维护、请求限制等因素有关。 
最新消息 据财联社报道,今天有消息称DeepSeek服务状态页面显示,DeepSeek网页/API不可用,目前正在调查该问题。

另据新浪科技报道,对于 DeepSeek 如何看待“两天两崩”,DeepSeek 回复称,技术服务的稳定性受多重因素影响,可能涉及突发流量、系统升级适配或底层基础设施的临时波动等。我们的团队始终将稳定性作为首要任务,并会在每次事件后彻底分析原因,持续优化系统韧性。
DeepSeek究竟厉害在哪里?今日,中国工程院院士、清华大学计算机系教授郑纬民及多位AI圈人士在与新浪科技沟通中,指出了DeepSeek其成功出圈的关键所在。
在郑纬民看来,DeepSeek通过自研的MLA架构和DeepSeek MOE架构,为其自身的模型训练成本下降,起到了关键作用。他指出,“MLA主要通过改造注意力算子压缩了KV Cache大小,实现了在同样容量下可以存储更多的KV Cache,该架构和DeepSeek-V3模型中FFN 层的改造相配合,打造了目前公开最大的稀疏MoE 层,这成为DeepSeek训练成本低最关键的原因。”

震惊业界!

AI大佬惊叹:中国AI已追上美国


1月20日,杭州深度求索人工智能基础技术研究有限公司正式发布推理大模型DeepSeek-R1。一经推出,DeepSeek-R1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。

这篇由DeepSeekI仿《过秦论》写的文章《过美利坚论》,全文过长,本文摘选了开头和结尾。

臣闻周失其鼎,裂土而诸侯争;秦收其器,并疆而山河震。今观美利坚合众国,虽无九鼎之重,而执寰宇之权柄百有余年矣。然其兴也勃焉,其亡也忽焉,岂非天命无常,惟德是辅乎?

故曰:治国之道,在明明德,在利民生,在止于至善。恃强权者必亡于强权,重霸术者终困于霸术。五洲震荡风雷激,百年变局浪潮涌,惟以人类命运共同体为念者,方能立时代潮头。美利坚之兴亡,岂非后来者之明镜乎?

多位知名科技人士均对DeepSeek近期取得的成就表示赞叹。
AI科技初创公司Scale AI的创始人亚历山大·王(Alexandr Wang)称,过去十年来,美国可能一直在人工智能竞赛中领先于中国,但DeepSeek的AI大模型发布可能会“改变一切”。

绕开美国限制
完全颠覆了行业逻辑!


DeepSeek完全颠覆了行业的逻辑!有消息称,他只用了2000张阉割版的英伟达H800芯片和六百万美元就做到了这一切,达到甚至超过openAI的水准!
更重要的是,这一成就是在美国对华芯片出口管制加强的背景下实现的。
DeepSeek直接打破无脑堆砌算力、数据的美国式AI道路!DeepSeek团队取得的成就,相当于做芯片的用自己逆天般的开发能力,直接把摩尔定律干翻了!
而且开发团队,直接“开源”,50多页的论文各种底层架构微创新,写得清清楚楚,还公开了所有参数和代码,随便你分析随便你复制随便你验证。
“限制条件和资源匮乏往往会激发创新,这里的情况似乎就是如此。”斯托伊卡对第一财经记者表示。
著名投资公司A16z的创始人马克·安德森1月24日发文称,DeepSeek-R1是他见过的最令人惊叹、最令人印象深刻的突破之一,而且还是开源的,它是给世界的一份礼物。

1月24日,A16z合伙人、Mistral AI董事会成员Anjney Midha表示:“从斯坦福到麻省理工,DeepSeek-R1几乎一夜之间成为美国顶尖大学研究人员的首选模型。”

对于中国AI为何能有如此快速的进展,诺奖得主、“AI教父”杰弗里·辛顿在1月21日接受博主Curt Jaimungal专访中表示,中国的STEM(科学、技术、工程、数学)教育比美国更好,拥有更多受过良好教育的人才,这将为AI的发展提供坚实的基础。尽管美国试图通过限制(如英伟达芯片)来减缓中国的发展,但这只会促使中国加速发展自己的技术,“他们可能会落后几年,但最终会赶上”。

“黑神话悟空”创始人冯骥:震撼的突破
“来自一个纯粹的中国公司”

1月26日,游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥评价DeepSeek:可能是个国运级别的科技成果。

冯骥表示:“希望DeepSeek R1会让你对当前最先进的AI祛魅,让AI逐渐变成你生活中的水和电。太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。

DeepSeek-R1 API价格。图源:澎湃新闻
去年12月DeepSeek-V3发布后,AI数据服务公司Scale AI创始人Alexander Wang就发帖称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”

图源:证券时报

Meta进入恐慌模式

试图复制DeepSeek


1月24日,一条发布在匿名平台teamblind上的帖子疯传。一名Meta(原名Facebook,美国互联网科技公司)员工称,现在Meta内部因为DeepSeek的模型,已经进入恐慌模式。

这位Meta员工写道:

“一切源于DeepSeek-V3的出现,它在基准测试中已经让Llama 4相形见绌。更让人难堪的是,一家‘仅用550万美元训练预算的中国公司’就做到了这一点。
工程师们正在争分夺秒地分析DeepSeek,试图复制其中的一切可能技术。这绝非夸张。
管理层正为GenAI研发部门的巨额投入而发愁。当部门里一个高管的薪资就超过训练整个DeepSeek V3的成本,而且这样的高管还有数十位,他们该如何向高层交代?
DeepSeek-R1的出现让情况更加严峻。具体细节属于机密,不便透露,不过很快就会公开了。”

图源:VCG

DeepSeek或彻底改变游戏规则

英伟达股价大跌

斯坦福大学和Epoch AI的研究人员去年年中发表了一项研究表明,到2027年,最大型的模型的训练成本将超过10亿美元。Gartner预测,到2028年Google、Microsoft和AWS等超大规模企业仅在AI服务器上的支出就将高达5000亿美元。
但DeepSeek完全不同,它的训练成本并不昂贵。Noah's Arc资本管理公司表示,DeepSeek-V3模型有可能彻底改变训练和推理领域的游戏规则。
特别是在特朗普上任后开启的5000亿美元“星际之门”计划,DeepSeek更让人怀疑,巨额投入这种“大力出奇迹”的办法真是最有效的方法吗?
美股大V“THE SHORT BEAR”1月24日在X上发文称,DeepSeek给AI巨头们带来了痛苦时刻,投资者必须对此敲响警钟。
他说:“如果击败OpenAI只需要5500万美元,那么这个行业的商业化会比很多人预想的要快很多。”

他还指出:“根据红杉,美国AI公司每年必须产生约6000亿美元收入来支付其AI硬件费用。现在看来,这种冒险行为变得越来越无利可图。”
著名财经记者Holger Zschaepitz 1月25日表示,DeepSeek以极低的价格建立了一个突破性的AI模型,而且没有使用尖端芯片,这让人们质疑该行业数千亿美元资本支出的效用。

有投资者甚至认为,美股芯片股的股价也会面临挑战。
投资者Geiger Capital表示,Deepseek和OpenAI一样好,甚至更好,而且价格只有后者的3%,而美国公司却投入了数千亿美元。那么,纳斯达克会怎样呢?

值得注意的是,DeepSeek-V3发布后,英伟达股价下跌了2%。而DeepSeek-R1引发海外大讨论后,1月24日英伟达股价又大跌了3.12%。

来源:杭州日报综合第一财经、每日经济新闻、九派新闻、财联社、界面新闻等

编辑 李俪 杜海锋 审核 蒋波 钟玮



© 2024 精读
删除内容请联系邮箱 2879853325@qq.com