“我们自诩达到了某个AGI里程碑,这简直就是无稽之谈,纯粹是玩弄基准测试。”微软CEO萨提亚·纳德拉(Satya Nadella)在参加知名科技播客主持人Dwarkesh Patel主持的播客节目Dwarkesh Podcast时,毫无保留地分享最真实的感受。
纳德拉在访谈中还明确表示,AI并非赢家通吃的市场,其真正的价值在于推动全球经济增长。他认为,AI的发展不应以技术里程碑为导向,而应以能否实现世界经济10%的增速为衡量标准。
此外,他还探讨了AI商业模式的未来,强调超大规模数据中心和云服务(如微软Azure)将在AI的推动下迎来巨大的发展机遇。同时,纳德拉也指出,开源模式将成为制衡闭源AI的重要力量,确保市场不会被少数巨头垄断。
当然,这场专访不仅揭示了微软在AI、量子计算和混合现实等领域的战略布局,也为全球科技行业的发展提供了深刻的洞见。纳德拉的思考和观点,无疑将为我们在快速变化的科技时代中提供重要的参考和启示。以下,Enjoy:
瓜哥AI新知
本文内容整理自Satya Nadella在Dwarkesh Patel频道的专访,公开发表于2025年02月19日。
原始内容参考:https://www.youtube.com/watch?v=4GLSzuYXh6w
内容提要: 萨提亚·纳德拉专访:微软的AGI计划与量子突破
关于AI的整体看法:
AGI里程碑的炒作不可信: 真正的衡量标准是AI能否推动世界经济以10%的速度增长。
AI不会是赢者通吃的局面: 考虑到买家的多样性,超大规模AI永远不会是赢者通吃,开源模式将制衡闭源。各国不会坐视私营企业垄断。
超大规模厂商和基础设施提供商将受益:AI对计算能力的需求将呈指数级增长,利好Azure等云服务。
模型商品化可能性: 模型最终需要在超大规模计算平台上运行,存在开源替代方案。
AI的价值: 大赢家将是各行各业利用AI提高生产力,促进经济增长。
关于AI的商业模式和应用:
超大规模数据中心运营的专业知识: 复制全球计算能力非常困难,运营专业知识至关重要。
推理收入是关键: 要关注将AI转化为实际客户价值的能力,供给和需求需平衡。
智能的价格下降(杰文斯悖论): 降低Token成本和提高 Token 效用需要同时发生。
AI应用瓶颈: 企业需要进行根本的变革管理和流程变革,以适应AI带来的新的工作方式和工作流程。
新的AI用户界面:Copilot是关键,每个人都需要一个智能代理管理器来管理与多个AI代理的交互。
AI将彻底改变SaaS:SaaS应用程序需要转型为智能代理,为多代理世界做出贡献。
关于量子计算:
量子计算的“晶体管时刻”: 实现了马约拉纳零模的存在性证明,有望构建百万量子比特的马约拉纳芯片(Majorana 1)。
软硬件分离策略: 构建软件堆栈,同时与中性原子和离子阱领域的团队合作,探索不同类型的量子计算机。
量子计算的应用: 量子计算机擅长模拟和探索状态空间,尤其是在化学、物理和生物学领域。
AI与量子的协同: 使用量子技术生成合成数据,然后使用这些数据训练AI模型,模拟化学和物理过程。
关于微软的游戏世界模型(Muse):
关于AI的安全性和伦理:
信任是关键: 法律和社会基础设施需要跟上AI的发展,解决AI的权利和责任问题。
人类担保: 除非有人以人类身份担保,否则无法部署这些智能。
需要控制AI的运行时环境: 通过沙盒等技术限制AI的行动空间,防止AI造成伤害。
劳动回报问题: 需要重视不同类型的人类劳动,确保人们在工作中获得意义和尊严。
关于微软的企业文化:
关于未来的方向:
关于通用人工智能(AGI):
对“认知劳动”的定义提出质疑。
人与AI共存,人类认知能力不会被剥夺。
Satya Nadella简介
萨提亚·纳德拉(Satya Nadella)是微软公司的首席执行官,自2014年起接替史蒂夫·鲍尔默(Steve Ballmer)担任该职位。他的领导风格以谦逊、同理心和技术远见著称。
在成为首席执行官之前,萨提亚·纳德拉(Satya Nadella)在微软工作了超过20年,曾负责云计算和企业部门,并在推动Azure云平台的转型方面发挥了关键作用。他成功地将微软从一个以Windows为中心的软件公司,转变为一个以云计算和人工智能为核心的服务型公司。
在他的领导下,微软积极拥抱开源,加强了与其他科技公司的合作,并推出了许多创新产品和服务,例如Microsoft Teams和GitHub。萨提亚·纳德拉(Satya Nadella)还积极推动多元化和包容性文化,鼓励创新和实验,并致力于解决全球性挑战。他的领导能力和商业头脑,使微软重新焕发了活力,并在竞争激烈的科技行业保持了领先地位。
以下是采访全文:
萨提亚·纳德拉: 我们自诩达到了某个AGI里程碑,这简直就是无稽之谈,纯粹是玩弄基准测试。真正的基准测试是,世界是否以10%的速度增长。善于理解哪些是赢者通吃的市场,哪些不是,在某种程度上,是至关重要的。
如果这东西真的像人们说的那样强大,国家不会坐视不理,等待私营公司行动。我们喜欢把这比作量子计算领域的晶体管时刻。
也许你会用量子技术来生成合成数据,然后这些数据被人工智能用来训练更好的模型。如果智能是计算力的对数,那么谁能进行大量的计算,谁就是……
主持人德瓦克什: 大赢家。没错。萨蒂亚,非常感谢你来参加播客。稍后,我们将讨论微软刚刚取得的两项重大突破。恭喜,同一天在《自然》杂志上发表了关于马约拉纳零模式芯片(我们面前就有)和世界人类行为模型的文章。但我们能否继续刚才的对话?你正在描述你在80年代和90年代所看到的事情。
萨提亚·纳德拉: 再次发生。是的。对我来说,Dwarkesh,最令人兴奋的是,首先,很高兴能上你的播客。我一直是你的忠实听众,这太有趣了。我喜欢你做这些采访的方式以及你探索的广泛话题。
这让我想起我在90年代初进入科技行业的最初几年,那时人们还在争论是RISC还是CISC更好,或者,我们真的能用x86架构来构建服务器吗?或者,当我加入微软时,正值Windows NT的初期。
![图片]()
从核心硅平台到操作系统再到应用层,整个堆栈都在被争论。我认为,也许可以说云计算已经做了很多这方面的工作,而且显然分布式计算和云计算确实改变了客户端-服务器模式,Web也发生了巨大变化。
但这感觉比我过去参与的任何事情都更像是更完整的堆栈。
主持人德瓦克什: 回顾80年代和90年代,哪些决策最终成为了长期赢家,哪些没有,特别是当你想到你在太阳微系统公司(Sun Microsystems)工作时,他们在那时经历了一段有趣的.com泡沫时期。人们认为当时的数据中心建设是泡沫。但与此同时,我们今天拥有的互联网也是那时建设的成果。关于什么能经受住时间的考验,你能总结出什么经验教训?什么是固有的长期趋势?什么只是昙花一现?
萨提亚·纳德拉: 是的,这很有意思。我认为,如果我回顾我参与过的至少四个重大转型,如果我们考虑客户端和客户端-服务器模型,我们可以看到图形用户界面和x86架构的诞生,这基本上使我们能够构建服务器。我非常清楚这一点。我记得在91年参加了PDC大会。事实上,当时我还在太阳公司工作,在91年,我去了Moscone中心,在那里微软首次描述了Win32界面。我意识到很明显接下来会发生什么,服务器也将是x86架构的。当规模优势积累到某种事物上时,这就是你必须押注的长期趋势。所以,客户端发生的事情也会发生在服务器端,然后你就能真正构建客户端-服务器应用程序,这明确了应用程序模型。
然后,Web成为了我们面临的重大问题,我们从一开始就必须应对它。事实上,我刚加入微软,Netscape浏览器或Mosaic浏览器就在93年12月或11月发布了。我认为那是Andreessen和他的团队发布的时候,它改变了游戏规则。有趣的是,就在我们开始进行客户端-服务器浪潮时,很明显我们也会赢得这场浪潮,但随后我们遇到了浏览器时刻。我们不得不调整,我相信我们做得很好。浏览器引入了一种新的应用程序模型,我们以我们所做的一切来拥抱它,无论是将HTML集成到Word中,构建我们自己的新浏览器来竞争,还是在我们的服务器堆栈上开发Web服务器来利用它。
然而,我们错过了后来成为Web上最大商业模式的东西,因为我们都认为Web将是分布式的。谁会想到搜索会成为组织Web的最大赢家?显然,我们在那方面没有看到,但Google看到了,而且他们执行得非常好。所以这是我吸取的一个教训:你不仅要弄对技术趋势,还要了解价值将会在哪里创造。这些商业模式的转变可能比技术趋势的转变还要困难。
主持人德瓦克什: 人工智能的价值将会在哪里创造?
萨提亚·纳德拉: 这是一个很好的问题。至少以我目前的看法来看,有两个地方我可以比较有信心地说。一个是超大规模厂商会做得很好。因为根本的一点是,如果你回顾Sam和其他人描述的方式,如果智能是计算力的对数,那么谁能进行大量的计算,谁就是大赢家。
另一个有趣的事情是,如果你看看任何AI工作负载的底层,比如ChatGPT。并非每个人都对GPU方面发生的事情感到兴奋。这很好,但它是一个比率,事实上,我甚至将我的集群视为AI加速器、存储和计算的比率。而且,从规模上看,你必须扩大它。因此,世界对这种基础设施的需求将会呈指数级增长。事实上,拥有这些AI工作负载简直是天上掉馅饼,因为你知道吗?它们对更多计算能力更加渴求,不仅仅是为了训练,而且我们现在知道对于测试时间也是如此。
正如我所说,测试时间,这里有一件有趣的事情。当你想到一个AI代理时,事实证明,AI代理将呈指数级地增加计算使用量,因为你现在甚至不受仅仅一个人类调用程序的限制。而是一个人类调用程序,这些程序又调用了更多的程序。这将为计算基础设施创造巨大的需求和规模。所以我们的超大规模业务,Azure业务,我认为那是一个很大的机会。
之后,事情变得有点模糊,因为你可以说,存在一个赢者通吃的模型。我只是不这么认为,因为这是我学到的另一件事,非常擅长理解哪些是赢者通吃的市场,哪些不是,在某种程度上,是至关重要的。我记得甚至在早期我开始接触Azure时,Amazon已经拥有非常显著的领先优势,人们会来找我,投资者会来找我说,哦,游戏结束了,你永远不会成功。Amazon,它就是赢者通吃。
但是,在与Oracle和IBM以及客户端-服务器竞争之后,我知道,买家不会容忍赢者通吃。从结构上讲,超大规模永远不会是赢者通吃,因为买家很聪明。消费者市场有时可能是赢者通吃,但是任何买家是公司、企业、IT部门的地方,他们都希望有多个供应商。因此,你必须是多个供应商之一。我认为即使在模型方面也会发生这种情况。
因此,会有开源,会有一个管理者。就像在Windows上一样,我学到的一个重要教训是,如果你有一个闭源操作系统,就会有一个补充,那就是开源。因此,在某种程度上,这实际上是对所发生事情的一种制约。所以我认为在模型方面,也许存在一些闭源的东西,但肯定会有一个开源替代方案。最终,开源替代方案实际上将确保闭源的赢者通吃得到缓解。
所以这至少是我的感觉在模型方面。顺便说一句,如果这东西真的像人们说的那样强大,我们不要低估国家不会坐视不理,等待私营公司满世界乱跑。所以我并不认为这是一个赢者通吃的局面。在那之上,我认为这还是一样的老一套,也就是在消费者领域,在某些类别中,可能会有一些赢者通吃的网络效应。
毕竟,ChatGPT就是一个很好的例子。我的意思是,它就像一个大规模的消费者产品,已经获得了真正的逃逸速度。我去应用商店,我看到它总是在前五名。我说,哇,这真是令人难以置信。所以他们能够利用这种早期的优势,并将其转化为应用程序优势。因此,在消费者领域,这种情况可能会发生。在企业领域,我认为在每个类别中,都会有不同的赢家。所以这至少我是这么分析的。
主持人德瓦克什: 我有很多后续问题。我们得立刻开始讨论量子计算。
但关于模型可能被商品化的观点,也许在几十年前,有人会对云提出类似的论点,认为它本质上只是一个芯片和一个盒子。
但最终,当然,你和许多其他人发现,你们在云领域拥有惊人的利润率,并且找到了获得规模经济和增加价值的方法。
![图片]()
而且从根本上说,即使抛开那些术语,比如,如果你拥有了AGI,它可以帮助你制造更好的AI,现在是合成数据和强化学习。也许在未来,它会是一个自动化的AI研究员。
这似乎是巩固你优势的好方法。我很好奇你对此有什么看法,就这个想法而言……
萨提亚·纳德拉: 在这个领域领先非常重要。达到一定规模后,没有什么东西是纯粹的商品,对吧?就像你刚才说的云,每个人都说,哦,云是商品,除非当你达到规模。这就是为什么运营超大规模数据中心的专业知识至关重要。你可能会说,哦,这有什么大不了的?我也可以自己搭建服务器,对吧?事实上,在超大规模数据中心发展的早期,大多数人都认为,天哪,有这么多的主机托管商,但那些都不是很好的生意。超大规模会有什么发展前景吗?超大规模甚至存在商业价值吗?事实证明,这确实是一门真正的生意,仅仅是因为运营(比如Azure,拥有遍布60多个区域的全球计算能力)的专业知识。复制起来太难了。
我想表达的重点是,是否会只有一个赢家,或者这是一个赢者通吃的局面。你必须弄清楚这一点,因为各个领域的情况可能不同。我喜欢进入那些拥有巨大潜在市场(TAM)的领域,这样你就不必担心必须成为唯一的赢家。如果你在一个可以容纳几个赢家的大市场中,并且你是其中之一,那是最好的位置。这就是我所说的超大规模机会的含义。
![图片]()
在模型层面,一个关键点是,模型最终需要在某种超大规模计算平台上运行。我认为这种联系将永远存在。不仅仅是模型本身,模型需要状态。这意味着它需要存储和常规计算来在代理环境中运行这些代理。这就是我思考为什么一个人通过一个模型完成所有事情可能不会发生的原因。
主持人德瓦克什: 从超大规模数据中心运营商的角度来看,顺便说一句,作为一个超大规模数据中心运营商,你所拥有的优势也很有趣,特别是在推理时间扩展方面,如果这涉及到未来模型的训练,你可以将你的数据中心和GPU摊销,不仅用于训练,还可以再次用于推理。我想知道你认为微软和Azure属于哪种类型的超大规模数据中心?是专注于预训练方面?是提供像O3类型推理的服务?还是你们只是要托管和部署市场上现有的任何模型,而忽略其他方面?
萨提亚·纳德拉: 关于这一点,这是一个好问题。我的意思是,我们构建机群的方式,至少是我们想要构建的方式,在某种程度上是顺应摩尔定律。我认为这会像我们过去所做的一切一样,对吧?也就是你每年都会不断地更新你的机群。你在这些东西的生命周期内进行折旧,然后非常非常擅长机群的部署,这样你就可以用高利用率运行不同的任务,对吧?
所以,有时会有一些非常大的训练任务,需要高度集中的峰值计算能力,并且需要协同一致。这很好。我们应该有足够的数据中心足迹来提供这种能力。但最终,这些任务无论如何都会变得如此之大,即使是预训练规模,如果它需要继续发展下去,预训练规模在某个时候也必须跨越数据中心边界。所以,它或多或少都在那里了。
很好。一旦你开始跨越预训练数据中心边界,它与其他任何事情有什么不同呢?因此,我认为,分布式计算将仍然是分布式的。所以,构建你的机群,使其能够为大型训练任务做好准备。它为测试时计算做好准备。事实上,如果这个强化学习(RL)可行,你可能会构建一个大型模型。
然后,在那之后,会有大量的强化学习和测试。对我来说,这有点像,再次强调,更多的训练计算,因为你想要为不同的任务创建这些高度专业化的提炼模型。所以你需要这样的机群。然后是服务需求,对吧?最终,光速是恒定的。
所以你不能在德克萨斯州有一个数据中心,然后说,我要从那里为全世界提供服务。你必须根据在世界各地都部署推理机群的情况来为全世界提供服务。这就是我对我们构建真正的超大规模机群的看法。
哦,顺便说一句,我希望我的存储和计算也靠近所有这些东西,因为不仅仅是AI加速器是无状态的。我需要能够拥有的不仅仅是我的训练数据本身需要存储。然后,我希望能够多路复用多个训练作业。我希望能够拥有内存。我希望能够拥有这些代理可以执行程序的环境。这就是我思考它的方式。
主持人德瓦克什: 你最近报告说,你们来自AI的年收入是130亿美元。但如果你看看你们在这一方面的同比增长,在四年内,它将增长10倍。如果趋势持续下去,你们将拥有1300亿美元的AI收入。如果是这样,你预计我们将如何利用所有这些智能?这种工业规模的应用,会通过Office实现吗?会由你们部署,让其他人托管吗?或者你们必须拥有AGI才能获得1300亿美元的收入?它会是什么样子?
![图片]()
萨提亚·纳德拉: Dwarkesh,我这样看待这个问题,这是一个很好的问题,因为在某种程度上,如果你要拥有这种智能的爆炸式增长、丰富性,或者说商品化,我们首先要观察的是GDP的增长,对吧?在我谈到微软的收入会是什么样子之前,这里面只有一个制约因素,对吧?这就是我们在AGI炒作中有点超前的地方,那就是,嘿,你知道吗?让我们首先看看是否,比如说,发展起来。
我的意思是,记住,发达国家是什么样的?2%的增长,如果你调整通货膨胀,那就是零?所以在2025年,当我们坐在这里的时候,我不是一个经济学家。至少我看到这种情况,然后说,伙计,我们面临着真正的增长挑战。所以我们都必须做的第一件事是,当我们说,哦,这就像工业革命,等等。让我们拥有那种工业革命类型的增长。对我来说,这意味着10%、7%、发达国家,经通货膨胀调整后,以5%的速度增长。这才是真正的标志,对吧?
所以,它不能只是供应方面,对吧?事实上,就是这样,对吧?我认为很多人都在写关于它的文章。我很高兴他们这样做,那就是,这里的大赢家不会是科技公司。赢家将是更广泛的行业,他们将使用这种商品,顺便说一句,这种商品是丰富的。突然之间,生产力提高了,经济以更快的速度增长。当这种情况发生时,我们作为一个行业就会很好。
![图片]()
但对我来说,那就是关键时刻。所以,我们自己声称达到了某个AGI里程碑,对我来说这只是毫无意义的基准测试作弊。真正的基准是,世界是否以10%的速度在增长。
主持人德瓦克什: 10%。好的。所以如果世界经济以10%的速度增长,那么全球经济规模大概是100万亿美元左右。如果世界经济增长10%,那就意味着每年会产生额外的10万亿美元的价值。如果是这样的话,作为一个超大规模企业,800亿美元似乎很多。难道你不应该投入8000亿美元吗?如果你真的认为在未来几年内,我们能够以这样的速度真正地推动世界经济增长。那么,关键的瓶颈将是,你是否拥有部署这些人工智能来完成所有这些工作所需的算力?
萨提亚·纳德拉: 我觉得你说得对。所以,关键在于平衡。我觉得现在有点像,让我来打个比方,经典的供给侧思维是,“让我先建好它,然后他们自然会来。” 这是其中的一种观点。而且,你知道,毕竟我们已经这样做了。我们已经承担了足够的风险去做了。但在某个时刻,供给和需求必须匹配。
所以我认为这就是关键。这就是为什么我同时关注这两个方面。所以,我认为,如果你只是一味地鼓吹供给侧,而不真正理解如何将其转化为客户的实际价值,你就会完全脱离实际。
所以,听着,这就是为什么我关注我的推理收入。这也是我公开推理收入的原因之一。有趣的是,没多少人谈论他们的实际收入。但对我来说,我认为这很重要,它可以作为你思考这个问题的制约因素。
你当然不能说,在任何给定的时间点,它们都必须完全对称地匹配。但是,你需要有实际的证据表明,你有能力将昨天的资本投入转化为今天的需求,这样你才能再次投资,甚至可能是指数级的投资,并且知道你不会完全失衡。
主持人德瓦克什: 我想知道这两种不同的观点是否存在矛盾。因为,你看,你做得非常出色的一件事是,你很早就进行了这些投资。比如,你在2019年投资了OpenAI,甚至在Co-pilot和任何应用出现之前。
如果你看看工业革命,那些6%、10%的铁路和其他基础设施的建设,很多都不是说我们先有了车票收入,然后再去怎样。当时损失了很多钱。这是事实。
所以,如果你真的认为,这里存在将世界经济增长率提高到10倍或5倍的潜力。然后你又在想,GPT-4的收入是多少?我的意思是,如果你真的认为下一阶段有这种可能性,你不应该直接放手一搏吗?让我们投入数千亿美元的算力。
萨提亚·纳德拉: 我是说,确实有一定的概率你会成功。关键在于……我是说,这里有趣的地方在于,真正的问题是,这仅仅是……这就是为什么我认为对算力集群采取平衡的方法非常重要。
这不仅仅是构建算力,而是构建能够帮助我不仅训练下一个大型模型,而且能够服务于下一个大型模型的算力。在你做到这两点之前,你无法真正利用你的投资。所以,这不是一场单纯的构建模型的竞赛。
这是一场创造一种能够被世界使用并驱动发展的商品的竞赛。所以,你必须有一个完整的思考,而不是只考虑一件事。至少我是这么看的。顺便说一句,其中一件事是,它会被过度建设。
就像你提到的互联网泡沫时代发生的事情一样。我现在看到的是,大家已经意识到需要更多的能源和更多的算力。谢天谢地。所以,每个人都会竞相投入。事实上,我看了这些数字。不仅仅是公司在部署,各个国家也会投入资金。
我很高兴成为一个租赁方。因为,顺便说一句,我建造了很多,也租赁了很多。我很高兴我将在2027年、2028年租赁大量的算力。因为我看了账单,我说这太棒了。所有这些算力投入,唯一的结果就是价格会下降。
智能价格下降
主持人德瓦克什: 是的。说到价格下降,你最近在DeepSeek模型发布后发了一条关于杰文斯悖论的推文。我想知道你是否能详细说明一下。杰文斯悖论发生在对某种东西的需求具有高度弹性时。
★
杰文斯悖论(Jevons paradox)是指,技术进步提高了某种资源的使用效率,反而导致该资源的总消耗量增加的现象。
简单来说,本来期望通过提高资源利用率来减少消耗,但实际结果却恰恰相反。
这个悖论的核心逻辑在于:
效率提升降低了单位资源的成本: 技术进步使得每单位产出所需的资源量减少,从而降低了使用该资源的成本。
成本降低刺激了需求: 由于使用资源的成本更低,人们会倾向于更多地使用它。这可能是直接增加使用量,也可能是通过生产更多的相关产品和服务间接增加使用量。
总消耗量增加: 需求的增长超过了效率提升带来的资源节约,最终导致该资源的总消耗量增加。
![图片]()
那么,智能是否会因为价格下降而受到瓶颈的限制?因为至少就我作为消费者的用例而言,智能已经非常便宜了。比如,每百万token两美分。我真的需要它降到0.002美分吗?我真正受到的限制是它变得更聪明。
如果你需要向我收取100倍的费用,那就进行100倍规模的训练。我乐于让公司这样做。但也许你在企业方面看到了不同的东西。智能的关键用例是什么,真正需要你将价格降到每百万token 0.002美分?
萨提亚·纳德拉: 我认为真正的问题是token的效用,对吧?所以在某种程度上,两者都需要发生。一是智能需要变得更好更便宜。每当出现突破,比如DeepSeek所做的那样,如果每次token的性能发生变化,曲线就会弯曲,前沿就会移动。这就会带来更多的需求。这就是我理解的方式。
顺便说一句,云也是如此。这里有一个有趣的事情:我们过去认为,“天哪,我们在客户端-服务器时代已经卖光了所有的服务器。” 然而,一旦我们开始将服务器放在云端,人们突然开始消费更多,因为他们可以更便宜地购买,它是弹性的,他们可以按需购买,而不是购买许可证。这完全扩大了市场。
![图片]()
我记得去像印度这样的国家,谈论“哦,这是一个SQL服务器。” 我们卖出了一些,但印度的云规模比我们在服务器时代所能做的任何事情都要大得多。我认为未来也会是这样。如果你考虑到全球南方,在一个发展中国家,如果能够以非常低廉的价格获得用于医疗保健的token,将会带来有史以来最大的改变。
主持人德瓦克什: 我认为对像我这样在旧金山的人来说,听到人们说,他们有点傻,他们不知道在现实世界中部署东西是什么样的,这是很合理的。作为与这些财富500强公司合作,并与他们合作,为数亿甚至数十亿人部署解决方案的人,你认为这些能力的部署速度会有多快?
![图片]()
即使你拥有可以工作的代理,即使你拥有可以为你做远程工作的东西等等,考虑到所有的合规性和固有的瓶颈,这会是一个很大的瓶颈吗?还是说它会很快过去?
萨提亚·纳德拉: 这将会是一个真正的挑战,因为真正的问题是变革管理或流程变革,对吧?我的意思是,这里有个有趣的事情,对吧?他们用的一个类比是,想象一下像我们这样的跨国公司在没有PC、电子邮件和电子表格的情况下是如何做预测的。传真四处传送,然后有人拿到这些传真,创建一份内部备忘录,四处分发。人们输入数字,最终生成一个预测——也许刚好赶在下个季度之前。然后,有人说,“嘿,我直接用Excel电子表格,把它放在电子邮件里,发送出去,人们会编辑它;我就会有一个预测了。”
所以,整个预测业务流程都改变了,因为工作产物和工作流程都改变了。这正是人工智能引入知识工作时需要发生的事情。事实上,当我们想到所有这些智能代理时,最根本的方面是,存在一种新的工作方式和新的工作流程。例如,当我为我们的播客做准备时,我去找我的Copilot,说,“嘿,我要和Dvarkesh谈论我们的量子公告和我们为游戏生成构建的这个新模型。给我一个我应该在去之前阅读的所有内容的摘要。” 他知道那两篇《自然》杂志的论文,获取了这些信息,我甚至要求他以播客的形式呈现它。
![图片]()
他很好地模拟了我们之间的对话,我把它分享给了我的团队。我把它拿出来,放到了Pages里,这是我们的工作成果,然后分享了出去。所以,对我来说,新的工作流程涉及人工智能和与同事的协作。这是一个根本的变革管理过程,每个从事知识工作的人都在突然之间弄清楚这些新的模式,以创新的方式完成他们的任务。这种转型需要时间,并且适用于销售、财务和供应链等各个领域。
对于一家老牌企业来说,我认为这代表着一个重大的挑战。我喜欢用的一个类比是制造商对精益方法的使用。精益成为一种系统的改善制造效率的方式,通过关注端到端的流程。它强调持续改进,减少浪费,并增加价值。这种方法类似于我们需要在知识工作中实施的方法,特别是当我们适应人工智能带来的需求和机遇时。拥抱这种改变需要管理团队和从事知识工作的人付出巨大的努力,而这需要时间。
主持人德瓦克什: 我可以简单问一下关于这个类比的问题吗?精益所做的事情之一是,它从物理上改变了工厂的样子。它揭示了人们没有意识到的瓶颈,直到你真正关注流程和工作流程时。你简要地提到了人工智能如何改变你自己的工作流程。我很好奇,如果我们能更详细地描述一下,当你拥有这些随着时间推移变得越来越聪明的AI代理时,运营一家大公司会是什么样子?
萨提亚·纳德拉: 事实上,你问得很有意思。我一直在思考这个问题。例如,今天,如果我看看,我们非常依赖电子邮件。所以我早上上班,心想,天啊,我的收件箱满了,我得回复。我迫不及待地想让这些Copilot代理自动填充我的草稿,这样我就可以开始审查和发送了。这就是我一直在思考的事情。
说实话,我觉得我已经至少在Copilot里有了10个代理,对吧?我有针对各种任务的不同查询,我觉得会创建一个新的收件箱。与我合作的数百万个代理将不得不调用一些例外情况,发送通知,并请求指示。我设想的是,将会出现一个新的脚手架,其中代理管理器将发挥关键作用。它不仅仅是一个聊天界面;我需要比聊天界面更智能的东西来管理所有代理及其对话。
这就是为什么我认为这个Copilot是人工智能的用户界面——这是一件非常非常重要的事情。我们每个人都将拥有它。从本质上讲,可以把它想象成存在知识工作和知识工作者。知识工作可能由许多代理完成,但你仍然有一个知识工作者,他处理所有的知识工作者。我认为,这将是这个领域发展的界面。
微软在量子计算领域的突破
主持人德瓦克什: 必须是这样。是的。我的意思是,我有点好奇,你是世界上为数不多的可以说你拥有20万员工,你拥有像微软这样的公司及其所有员工所组成的智能群的人之一。你必须管理它,你必须知道如何与之交互,如何最好地利用它。希望未来世界上更多的人能够拥有这种体验。我想知道你的收件箱,如果这意味着早上每个人的收件箱都会像你的一样。好的。在我们讨论这个问题之前,我想继续问你更多关于人工智能的问题,但我真的很想问你关于微软研究院宣布的量子领域的重大突破。你能解释一下发生了什么吗?
萨提亚·纳德拉: 这对我们来说是又一个30年的旅程。这令人难以置信。我是微软对量子计算感到兴奋的第三任CEO。我认为这里最根本的突破,或者说我们一直以来的愿景是,你需要一个物理上的突破才能构建一台可用的、实用规模的量子计算机。嗯,所以我们选择了这条道路,嗯,这就是说,拥有这种不太嘈杂或者更可靠的量子比特的唯一方法是押注于一种物理特性,这种物理特性从定义上来说,嗯,更可靠。
这就是引导我们采用马约拉纳零模作为发展方向的原因,这在20世纪30年代就被理论化了。所以问题是,我们实际上能不能物理地制造出这些东西?我们实际上能不能建造它们?因此,实际上,最大的突破,我知道你和Chetan谈过了,就是我们现在终于有了马约拉纳零模的存在性证明,以及在新相物质中的物理突破,对吧?
这就是为什么我认为我们喜欢将此比作量子计算的晶体管时刻,我们实际上拥有了一种新的相,即拓扑相,这意味着我们甚至现在可以可靠地隐藏量子信息并测量它,而且我们可以制造它。所以,既然我们拥有了它,我们觉得,有了这种核心的基础制造技术,我们就可以开始构建一个马约拉纳芯片,即马约拉纳一号,我认为这将基本上是第一个能够物理上拥有100万个量子比特的芯片。
![图片]()
然后在此基础上,可以实现数百万个经过纠错的逻辑量子比特。然后它就启动了,对吧?所以,你突然拥有了构建一台真正的实用规模的量子计算机的能力。对我来说,这现在变得更加可行了,对吧?我们一直在努力,因为如果没有类似的东西,你仍然能够实现里程碑,但你永远无法构建一台实用规模的计算机。这就是我们对此感到兴奋的原因。
主持人德瓦克什: 太棒了。顺便说一句,我相信就是这样,对吧?
萨提亚·纳德拉: 没错,就是这样。是的。我有点忘了,我们现在叫它 Majorana 吗?对,没错,Majorana 1。我很高兴我们用这个名字命名它。
这是…… 我的意思是,想到我们能够在一个这么小的东西里构建出一个拥有百万量子比特的量子计算机,简直令人难以置信。我认为这就是关键所在,即除非我们能够做到这一点,否则你根本无法梦想构建一个实用规模的量子计算机。
![图片]()
主持人德瓦克什: 你的意思是最终这一百万量子比特会放在这么大的芯片上?
萨提亚·纳德拉: 对,没错。
主持人德瓦克什: 太惊人了。是的。其他公司已经宣布了100个物理量子比特,比如谷歌、IBM 等。当你说到,你也宣布了一个,但你是在说你的在规模上更具优势。
萨提亚·纳德拉: 是的。顺便说一下,我们所做的另一件事是,我们采取了一种分离软硬件的方法,对吧?所以,我们正在构建我们的软件堆栈。事实上,我们现在与中性原子和离子阱领域的团队都有一些合作。我们也在与其他拥有相当不错的方法的团队合作,包括光子学等等。这意味着将会出现不同类型的量子计算机。
事实上,我们有多少个逻辑量子比特?我想我们上次宣布的是24个逻辑量子比特。我们在纠错方面也取得了一些了不起的突破。这使得我们即使在中性原子和离子阱量子计算机上,也能构建这些 20 多个量子比特。我认为这种进展将在今年持续下去,你将会看到我们改进这个标准。
此外,我们也说过,让我们回到第一性原理,构建我们自己的、基于拓扑量子比特的量子计算机。这就是这次突破的意义所在。
主持人德瓦克什: 太棒了。一百万个拓扑量子比特,数千个逻辑量子比特,扩展到这个级别的预计时间表是什么?这里的摩尔定律是什么?如果你有了第一个晶体管,它看起来...像什么?
萨提亚·纳德拉: 显然,我们已经在这个领域工作了 30 年。我很高兴我们现在有了物理学上的突破和制造上的突破。我希望我们有一台量子计算机,因为,顺便说一句,量子计算机能做的第一件事就是构建量子计算机,因为模拟这些新的量子门的原子级构造会容易得多。
但无论如何,对我来说,我认为真正重要的事情是,既然我们有了制造技术,那就让我们去构建第一台容错量子计算机,这将是合乎逻辑的事情。所以我想我现在可以预测,也许在 2027、2028 或 2029 年,我们将能够真正构建它,对吧?
所以,既然我们有了这个门,我是否可以把这个东西放到一个集成电路中,然后把这些集成电路放到一台真正的计算机中?我认为这就是下一个合乎逻辑的步骤。
主持人德瓦克什: 你所说的 2027、2028 年,你会怎么用它?它是通过 API 访问的东西吗?还是你们内部用于研究的东西?用于材料和化学领域?
萨提亚·纳德拉: 你看,我一直感到兴奋的一件事是,即使在今天的世界里,对吧?因为我们有这个量子程序,我们可以说,嘿,这里有一些 API 可以使用。大概两年前我们取得的突破是,将 HPC 堆栈、AI 堆栈和量子堆栈结合起来考虑。
事实上,如果你仔细想想,对吧?人工智能就像一个模拟器的模拟器。量子就像一个自然界的模拟器。量子将会做什么?顺便说一句,量子不会取代经典计算,对吧?量子擅长量子能做的事情,经典计算也将如此。你不能忽视这样一个事实,即量子对于任何不以数据为重,而是更多地探索状态空间的东西来说,将会非常棒,对吧?
所以,它应该是数据轻量级的,但同时你要探索指数级的状态。模拟是这方面的一个很好的应用——无论是在化学、物理还是生物学领域。我们已经开始做的一件事是,真正地使用 AI 作为仿真引擎,然后你可以进一步训练它。
我的想法是,如果你有 AI 加上量子,也许你会使用量子来生成合成数据,然后 AI 可以使用这些数据来训练更好的模型,这些模型知道如何模拟化学、物理等等。这两项技术将会协同工作。所以即使在今天,这基本上就是我们结合 HPC 和 AI 所做的事情,我希望用量子计算机取代一些 HPC 部分。
主持人德瓦克什: 你能告诉我你如何做出这些研究决策吗?这些决策在 20 年、30 年后将会真正获得回报,尤其是在像微软这样规模的公司里?显然,你对这个项目的技术细节非常了解。
![图片]()
你是否可以对微软研究院所做的所有事情都做到这一点?你对目前正在进行的、将在 20 年后获得回报的投资有何看法?它是必须通过组织有机地出现吗?或者你是如何追踪所有这些的?
萨提亚·纳德拉: 我觉得最棒的事情是比尔在 1995 年创立微软研究院时所发起的。就像,我认为在这些由好奇心驱动的研究机构的漫长历史中,仅仅做一个关于基础研究的研究机构。多年来,微软研究院已经建立了这种制度优势。所以,即使我考虑资本配置或预算等等,你也会先投入资金并说,嘿,这是微软研究院的预算。
我们每年都要面对它,知道这些投资中的大多数都不会在任何有限的时间框架内获得回报。也许是微软的第六任 CEO 将从中受益。而且我认为这在科技领域是理所当然的。我真正思考的是,当量子或一种新模型的时机到来时,你是否能够利用它?作为一个在位者,如果你回顾科技的历史,并不是人们没有投资。
![图片]()
关键是你需要有一种文化,知道如何采纳一项创新并将其规模化。坦率地说,这对 CEO 和管理团队来说是最困难的部分,这非常有趣,对吧?它既与良好的判断力有关,也与良好的文化有关。有时我们做对了,有时我们做错了。
我的意思是,我可以告诉你关于微软研究院的数千个项目,我们本应该领导这些项目,但我们没有。我总是问自己为什么。这是因为我们没有能够形成足够的信念和完整的想法,不仅要采纳创新,还要将其变成一个有用的产品,并创建一个我们能够推向市场的商业模式。CEO 和管理团队的工作不仅仅是对任何一件事感到兴奋,而是要能够真正地执行一个完整的想法。知易行难。
微软的游戏世界模型
主持人德瓦克什: 当你提到六次(或者应该说是三次)后续使用微软技术的可能性时,如果每一次都能使市值增加一个数量级,那么等到下一次突破时,你就会像整个世界经济一样重要了。或者说,别忘了世界经济将以10%的速度增长,所以我们没问题的。让我们深入探讨一下你刚刚取得的另一个重大突破,令人惊叹的是,在你的游戏世界模型中,这两个突破竟然在同一天问世。我很想听你详细介绍一下。
萨提亚·纳德拉: 我想我们会把它叫做Muse。我了解到,它将成为这个世界行为或人类行为的模型。这非常酷。
你知道,很明显,DALL-E和Sora在生成模型方面所取得的成就令人难以置信。我们想要追求的一件事是使用游戏数据来生成既一致又多样化的游戏,代表了该游戏的各个方面。我们的目标是创造出一种持久的东西,可以用于模组。
他们与我们的一个游戏工作室合作,这促成了另一篇发表在《自然》杂志上的文章。对我来说,令人兴奋的是,我们很快就会有一个游戏目录。我们将开始使用和训练这些模型来生成新的游戏,然后开始玩它们。
事实上,当Phil Spencer第一次向我展示这个时,他展示了Xbox控制器如何提供输入,而模型如何根据该输入生成输出。结果与游戏保持一致,这感觉像是一个巨大的顿悟时刻。这类似于我们第一次看到ChatGPT完成句子或DALL-E绘画——这是一个关键的时刻。
主持人德瓦克什: 是的。我今天早上有机会和你的首席研究员Katya一起观看了实时演示中的一些视频。只有和她交谈后,我才真正意识到这是多么不可思议,因为我们过去使用AI来模拟代理。仅仅使用相同的技术来模拟代理周围的世界,并提供这种一致的实时体验,是具有开创性的。
我们将在播客中叠加展示视频,以便人们有机会亲眼看看。我想届时它应该已经发布了,他们也可以在那里观看。这本身就令人难以置信。你通过你的Spana首席执行官,已经投入了数百亿美元来建立微软游戏并收购IP。
回想起来,如果你能将所有这些数据合并到一个大的模型中,这个模型能够让你体验访问和浏览多个世界,那么这似乎是我们做出的一项非常好的投资。你对此有什么预感吗?还是说只是巧合?
萨提亚·纳德拉: 不,我的意思是,我不会说我们投资游戏是为了构建模型。坦率地说,我们投资游戏,我想说一件关于我们历史的有趣的事情。我们在构建Windows之前就构建了我们的第一个游戏,对吧?在构建Windows之前很久,Flight Simulator就是微软的产品。所以游戏在公司有着悠久的历史,我们希望为了游戏本身而涉足游戏领域。
这就是为什么我总是说,我不喜欢涉足那些只是为了达到其他目的的业务。它们必须本身就是目的。然后,是的,我们不是一个企业集团。我们是一家必须将所有这些资产整合在一起,并通过增加价值来成为更好的所有者的公司,对吧?
例如,云游戏对我们来说是一项自然的投资,因为这只会扩大潜在市场,并扩大人们随时随地玩游戏的能力。AI和游戏也是如此。我们绝对认为它可能会有所帮助,甚至可能改变游戏行业。这有点像游戏行业的CGI时刻,而且作为世界上最大的发行商,这将非常有帮助。
但与此同时,我们必须制作出高质量的游戏。我的意思是,如果不是首先专注于此,你就不能成为游戏发行商。事实上,这种数据资产不仅在游戏环境中会很有趣,而且它将成为一个通用的行动模型和一个世界模型——这太棒了。
我的意思是,你知道,我认为游戏数据可能就像YouTube之于Google,游戏数据之于微软。所以,我对此感到兴奋。
主持人德瓦克什: 是的,抱歉,我的意思就是,你可以跨多种不同类型的游戏获得统一的体验。除了AI之外,这如何融入微软过去所做的其他事情中,比如混合现实?或许能让较小的游戏工作室有机会构建这些AAA级动作游戏?以及未来五到十年后,
![图片]()
萨提亚·纳德拉: 你可以通过哪些方式与它互动?我一直认为这三件事是基石,对吧?有趣的是,早在五、六、七年前,我就说过我们想要押注的三大方向是:AI、量子和混合现实。我仍然相信它们,对吧?
因为在某种意义上,什么是需要解决的大问题?临场感,这是混合现实的梦想,也就是,你能创造真实的临场感吗?就像你和我一起做播客一样。说实话,我认为我们仍然在证明这是挑战的核心之一。我原本以为它更容易解决,但也许是因为它的社交方面,比如佩戴设备等等,所以更难了。
我对我们将与Adderall和Palmer合作所做的事情感到非常兴奋,甚至包括他们将如何推进IVAS计划,因为这是一个绝佳的用例。因此,我们将继续在这方面努力。但同样,2D界面也被证明是可行的,比如Teams。多亏了疫情,我们真正获得了通过2D创造临场感的能力。我认为这将继续下去。这是一个长期趋势。
我们讨论了量子,还有AI。所以这是我关注的三个方面,我说,你如何将这些东西结合在一起?最终,不是为了技术而技术,而是为了解决我们人类生活中一些基本的需求,更重要的是,我们希望它们能推动我们的经济发展,提高我们的生产力。如果我们能以某种方式做好这一点,那么我认为我们就能取得真正的进步。
主持人德瓦克什: 当你写下一本书时,你必须解释为什么这三个部分会在同一时间汇聚在一起,对吧?因为没有内在的原因让你认为量子和AI应该分别发生在2028年和2025年。
萨提亚·纳德拉: 没错。但在某种程度上,我这样看待它,我说,我有一个简单的模型,那就是,嘿,是否存在系统性的突破?对我来说,系统性的突破就是量子。是否存在商业逻辑的突破?对我来说,这就是AI,也就是说,逻辑层是否可以从根本上以不同的方式进行推理?是否可以用学习系统来代替命令式地编写代码?这就是AI。然后UI方面就是临场感。
AI的法律障碍
主持人德瓦克什: 是的。让我们回到AI。在你2017年的书中,你提到了很早就投资OpenAI,甚至早在2017年。你写道:“我们也可以说,我们正在孕育一个新的物种,一个其智力可能没有上限的物种。”
早在2017年讨论这个概念就已经非常超前了。到目前为止,我们已经以非常细致的方式讨论了代理、Office Copilot、资本支出等等。但是,如果我们放大来看,考虑你的陈述的更广泛含义,我们有一个更大的问题需要思考。
![图片]()
作为一名超大规模计算提供商,并且积极参与这些模型的研究,我想知道你如何看待构建一个新物种的概念?你是否认为在我们担任CEO期间,我们会走向超人类智能?
萨提亚·纳德拉: 穆斯塔法使用了那个术语。事实上,他最近更多地用那个术语来描述这种新的物种。我的理解是,你绝对需要信任。我认为,在我们声称它是一种像物种一样重大的事物之前,我们需要做对的一件事,就是必须要有真正的信任,无论是个人层面还是社会层面,都需要植入信任。
那是难点所在。因为我认为,这个领域发展的最大限制将是,我们的法律,或者说基础设施,包括所有的计算基础设施,法律基础设施将如何演变以应对这种情况?
就像整个世界都是建立在人类拥有财产、拥有权利和承担责任的基础之上的。这是首先要弄清楚的根本问题,就是,对于现在人类用作工具的任何事物,这意味着什么?
如果人类要将更多的权力委托给这些事物,那么这个结构该如何演变?除非这个问题真正得到解决,否则我认为,光谈论技术能力是行不通的。
主持人德瓦克什: 就像,在我们弄清楚之前,我们无法部署这些智能?
萨提亚·纳德拉: 因为归根结底,没有办法。今天,你无法部署这些智能,除非有人以人类的身份为其担保。正如你所说,这就是为什么我认为即使是最强大的人工智能,本质上也是在人类委托的权限下工作。
你可以说,哦,那都是对齐问题,这个那个其他的。这就是为什么我认为你必须真正让这些对齐工作起来,并以某种方式得到验证。然而,我只是认为你无法部署那些超出控制的智能。
所以,例如,人工智能爆发问题可能是一个真正的问题,但在它成为一个真正的问题之前,真正的问题将出现在法庭上。我的意思是,没有哪个社会会允许某个人说:“嘿,那是我干的。”
主持人德瓦克什: 是的。嗯,世界上有很多社会,我想知道是否会有任何一个社会的法律体系更适合这种情况。如果你无法阻止爆发,你可能会担心。比如,它不一定非得发生在美国,对吧?即使……
萨提亚·纳德拉: 嗯,说得好。但即使,比如,即使我们认为没有任何一个社会关心这个问题,对吧?也可能会有不法分子。我不是说不会有不法分子。
我的意思是,有网络罪犯和流氓国家,他们会一直存在。但认为整个人类社会都不关心这件事,也是不对的,对吧?所以我认为我们都会关心,对吧?
我们今天知道如何处理流氓国家和不法分子。世界不会袖手旁观,说我们会容忍他们。所以,这就是为什么我很高兴我们有一个世界秩序,任何流氓国家或不法分子都会承担后果。
主持人德瓦克什: 但是,如果你描绘出一幅可以实现 10% 经济增长的图景,我认为,这实际上取决于是否能够让类似 HGI(人工通用智能)的东西发挥作用,对吧?因为数万亿美元的价值,听起来更接近人类的工资,或者 60 万亿美元的经济规模。要达到这个数量级,就必须以一种非常显著的方式实现劳动力自动化或补充劳动力。如果这成为可能,一旦你弄清楚了相关的法律问题,那么在你任职期间,我们就能弄清楚这个问题,这似乎是很有可能的。你是否正在考虑超人智能,比如你职业生涯中最大的成就就是这个?
萨提亚·纳德拉: 是的。顺便说一句,你提出了另一个问题。我知道戴维·奥特和其他人已经对此进行了很多讨论,那就是 60% 的劳动力。我认为另一个需要提出的问题是,至少让我们谈谈我们的民主社会。我认为,为了拥有稳定的社会结构,并让民主制度发挥作用,你不能只有资本回报,而没有劳动回报。你可以谈论它,但那 60% 必须被重新评估。
所以,我用我自己的简单方式,也许有点天真,就是,嘿,我们将开始重视不同类型的人类劳动。今天被认为是高价值的人类劳动可能成为商品。可能会有新的东西值得我们重视,包括那些来帮助我做理疗的人。
我的意思是,无论我们重视什么。但最终,如果我们没有劳动回报,工作中没有意义和尊严,所有这些,那也将成为任何这些事情的限制因素。
确保 AGI 安全
主持人德瓦克什: 在对齐方面,两年前,你们发布了 Sydney Bing。需要明确的是,我认为鉴于当时的能力水平,这是一个迷人、可爱、有点有趣的未对齐的例子。这是因为,当时,聊天机器人可以思考大约 30 秒,然后给你一些有趣或不恰当的回复。
然而,如果你考虑这种系统的演变,就会存在潜在的风险。例如,考虑这样一种情况:一个系统试图说服《纽约时报》的记者离开他的妻子。展望未来,我们可能会拥有运行数小时、数周甚至数月的智能体,它们像自主的 AGI 群体一样运作。这些系统也可能未对齐,并可能造成混乱,甚至可能以有害的方式相互协调。
![图片]()
鉴于这些担忧,你未来的计划是什么?当你最终开发出更先进的系统时,你如何确保万无一失?
萨提亚·纳德拉: 是的,你说的没错。所以,这就是我认为即使我们分配计算资源,也要为对齐挑战分配计算资源的原因之一。
更重要的是,你真正能够监控这些东西的运行时环境是什么,可观察性如何?顺便说一句,今天在传统的方面,我们也处理很多这样的事情,比如网络安全,对吧?我们不会只是编写软件然后放任不管。你有软件,然后你监控它。你监控它是否受到网络攻击,监控它是否受到故障注入等等。
因此,我认为我们必须围绕这些系统的部署方面构建足够的软件工程。此外,在模型本身内部,也存在对齐挑战。其中一些是真正的科学问题,而另一些是真正的工程问题,我们将不得不同时解决这两个问题。
这也意味着我们需要承担我们自己的责任。这就是为什么我更有兴趣在可以实际控制其影响范围和规模的环境中部署这些系统。你不能只是在世界上释放一些会造成伤害的东西,因为社会不会允许这样做。
![图片]()
主持人德瓦克什: 是的。什么是,嗯,当你真正拥有可以为你完成数周任务的智能体时,在你可以让一个随机的财富 500 强公司使用之前,你希望的最低保证是什么?
萨提亚·纳德拉: 当使用像深度研究这样的工具时,我认为我们至少希望拥有的最低保障是,尤其是在任何事物有了物理实体之前。我认为这是一个关键的门槛。这可能是一个方面。另一个方面是,例如,这个系统运行的运行时环境的权限。你可能希望确保它是在沙盒中运行,不会超出沙盒的范围。
主持人德瓦克什: 沙盒?我的意思是,我们已经有了网络搜索,已经有超出沙盒的能力了。你指的是什么?
萨提亚·纳德拉: 我说的是它如何处理网络搜索,以及它如何进行写入。例如,就像你说的,如果它只是为了进行一些计算而编写一堆代码,那么这些代码部署在哪里?这些代码是为了生成输出而临时存在的,还是会被随意部署到外部环境中?这些都是可以在行动空间中进行控制的。
主持人德瓦克什: 是的。抛开安全问题,当你考虑你自己的产品套件,并考虑到如果你真的拥有了强大的AI,在某种程度上,它不仅仅像你提到的,在准备播客时用到的Copilot那样简单。
它更像是你如何将工作委托给你的同事。鉴于你目前的产品套件,添加这样的AI会是什么样子?
我的意思是,有一个问题是,LLM是否会被其他东西商品化。我想知道,如果像数据库、画布或Excel表格之类的东西,把LLM作为访问所有这些东西的主要入口点,那么LLM是否有可能被商品化?
萨提亚·纳德拉: 是的,这很有可能发生。这是一个有趣的问题。我认为至少在第一阶段,我们可以这样考虑:LLM能否更有效地帮助我使用所有这些工具或画布来完成我的知识工作?我见过的最好的演示之一是一位医生为肿瘤会诊做准备的工作流程。她要参加一个肿瘤会诊会议。
她使用Copilot做的第一件事是为会议创建议程,因为LLM可以分析存储在SharePoint网站上的所有病例,并指出这些病例的差异。显然,肿瘤会诊会议是一个高风险的会议,你需要注意病例的差异,以便分配适当的时间。所以,即使是创建议程这样需要考虑如何分配时间的推理任务,也超级有用。我使用LLM来完成这项任务。
然后我进入会议室。我正在和我的同事进行Teams通话。猜猜会发生什么?我专注于实际的病例讨论,而不是做笔记,因为现在有AI Copilot对所有内容进行完整转录。这不仅仅是一个转录记录,而是可以理解为一个数据库条目,记录了会议中的所有内容,可以随时回顾。所以,她走出会议室时,已经讨论完了病例,而没有被做笔记分散注意力。
她是一位教学医生,她想为她的课程做准备。她把肿瘤会诊的详细信息交给Copilot,说:“用我的肿瘤会诊记录创建一个PowerPoint幻灯片,这样我就可以向我的学生讲解。”这就是我们看到的互动方式。我拥有的UI和脚手架都是现在正在使用LLM填充的画布,并且工作流程本身也在被重塑。知识工作正在被完成。
这里有一个有趣的事情。如果有人在80年代末告诉我,“你的桌子上会有数百万份文件”,我会说,“这到底是什么?”我真的会以为“哦,我的桌子上会有数百万份纸质文件。”但实际上我们现在确实有数百万个电子表格和数百万份文档。我知道,你也有。它们都在那里。
我认为这也会发生在AI助手身上。将会有一个UI层。对我来说,Office不仅仅是今天的Office,它是知识工作的UI层。它会随着工作流程的发展而进化。这就是我们想要构建的。
我认为今天存在的SaaS应用程序,这些CRUD应用程序,将从根本上发生改变,因为业务逻辑将更多地转移到这个代理层。事实上,我今天在Copilot体验中看到的另一个很酷的事情是,当我说“我要准备一个与客户的会议”时,我只需要说“给我所有我应该知道的笔记”,它就会从我的CRM数据库中提取信息。它从我的Microsoft Graph中提取信息,创建一个组合,本质上是一个人工制品。
这意味着它甚至应用了逻辑。对我来说,这将改变我们所知的SaaS应用程序。以巨大的方式改变。
主持人德瓦克什: 所以,SaaS作为一个行业,每年的价值可能达到数千亿甚至数万亿美元,这取决于你如何计算。如果AI真的能够将这些都整合起来,那么你下一个十年是否有可能再次将微软的市值提升十倍?因为,如果你真的在谈论数万亿美元的话。
萨提亚·纳德拉: 顺便说一句,我认为它也会在SaaS中创造很多价值。记住,一个大问题是世界上存在的IT积压问题。解决这个问题的方法之一是通过这些代码生成技术。此外,我可以利用Agent来查询我的所有SaaS应用程序,这将提供更多的实用性,并导致应用程序的爆炸式增长。它们将被称作代理,使我们能够为每个垂直行业、每个产业或类别提供服务。
![图片]()
这种方法会创造很多价值。你不能停滞不前;过去那种在浏览器中使用UI来规划狭窄业务流程的思维方式已经行不通了。你必须提升你的思维,并问:“我必须参与的任务是什么?”为了在这个环境中茁壮成长,你将希望将你的SaaS应用程序转变为出色的代理,为多代理世界做出贡献。
只要你能实现这种转变,我相信你可以显著提高你的SaaS产品的价值。
在微软工作34年
主持人德瓦克什: 我可以问你一些关于你在微软工作经历的问题吗?可以。做一个公司人是否被低估了?你在微软度过了你职业生涯的大部分时间。你看,也许你能创造这么多价值的原因之一是你看到了这里的文化、历史和技术,并通过晋升获得了所有的背景信息。是否应该让更多拥有这种背景信息的人来管理公司?
![图片]()
萨提亚·纳德拉: 背景信息?这是一个很好的问题。我没想过这个问题。但是,是的,我在微软的这34年中,基本上每年都比前一年更兴奋,而不是觉得自己只是一个公司人或者怎么样。
我的意思是,我不是一开始就认为一切都为了公司。我认为即使是加入微软的人,他们也不是为了加入微软而加入微软。他们认为他们可以利用这个平台来获得经济回报和使命感,以及通过利用我们作为平台来实现的目标。
因此,这就是合同。我认为公司需要创造一种文化,让人们能够加入并成为像我这样的公司人。至少就我而言,微软做得对的地方比错的地方多。我希望情况仍然如此。
主持人德瓦克什: 你打算如何留住未来的萨提亚·纳德拉?你刚才说,算上你,第六任CEO现在开始将能使用这些研究成果,你们打算如何确保他们能走到那个位置?成为未来的领导者。
萨提亚·纳德拉: 是的,这很有意思。今年是我们公司成立50周年,我一直在思考这个问题,对吧?思考公司长青之道,长青本身不是目标,保持相关性才是。我必须做的事情,以及我们全体20万员工每天都必须做的事情,就是问自己:我们所做的事情对于我们所看到的世界演变是否有用且相关?不仅仅是今天,而是明天?
![图片]()
我们必须考虑到,我们所处的行业没有特许经营价值,对吧?所以这是另一个难点。我们今年在研发上的所有投入,都是对五年后会发生什么事情的猜测。你必须抱着这样的态度:我们所做的事情,我们认为将会是相关的。所以这就是我们必须关注的。
此外,重要的是要认识到,总会有失败的可能性,你不可能所有事情都做对。你必须对失败有很高的容忍度。这至关重要,因为与其他行业不同,你必须有足够多的尝试机会,才能说“好吧,作为一家公司,我们将会成功走到终点”。这就是这个行业的棘手之处。
主持人德瓦克什: 说到这个,你刚刚提到微软的创立即将迎来50周年。如果你看看市值排名前十的公司,或者前五,取决于你如何计算沙特阿美,基本上除了微软之外的所有公司都比微软年轻。这是一个非常有趣的观察,为什么最成功的公司往往都很年轻。你知道,财富 500 强公司的平均寿命只有 10 到 15 年。微软做了什么才能保持这么多年的相关性?你们如何不断地再创业?
![图片]()
萨提亚·纳德拉: 我喜欢这个词,里德·霍夫曼也用过这个词,我喜欢“再创业”这个说法。我认为这是一种心态。我的意思是,人们谈论创始人模式,我认为对于我们这些“凡人” CEO 来说,更像是,嘿,进入再创业模式。
我认为,关键是要能够以全新的方式看待事物。所以,回到你的问题,我们能否在文化上创造一种环境,让再创业成为一种习惯?
就像我们每天上班都说,是的,我们觉得我们有权改变我们所做事情的核心假设,以及我们与周围世界的关系。我们是否允许自己这样做?
我认为很多时候,公司会因为商业模式或其他原因而感到过度受限,你只需要解除这种限制。
主持人德瓦克什: 如果你离开微软,你会创办一家什么样的公司?
萨提亚·纳德拉: 我将会创办的公司,天哪,我的“公司人”一面告诉我,我永远不会离开微软。如果我真的要考虑做点什么,我倾向于选择一个拥有... 当我展望科技的梦想时,我们总是说科技是最大、最伟大的民主化力量。我觉得我们终于拥有了这种能力。
![图片]()
如果你说,我们每瓦电力每美元能产生多少算力,我希望找到一些应用这些算力的领域,这些领域的服务严重不足。比如医疗保健、教育和公共服务。
顺便说一句,另一个领域是公共服务。我的意思是,公共部门是另一个领域。如果你关注这些领域,这些领域的服务不足,我在这个国家或这个社会的生活质量可以得到改善。如果所有这些丰富的资源都转化为更好的医疗保健、更好的教育和更好的公共服务,我将会过上更好的生活。这三个机构为我这个公民提供服务,我将会专注于这些领域。
萨提亚·纳德拉相信通用人工智能吗?
主持人德瓦克什: 嗯。我听了你对不同问题的回答后,我不确定你是否认为通用人工智能(AGI)真的会出现,是否会有一种东西能够自动化所有认知劳动,至少是从所有认知劳动开始,就像任何人在电脑上可以做的事情一样?
萨提亚·纳德拉: 我对人们谈论认知劳动的定义感到困扰,因为它不是一个静态的东西,对吧?今天存在认知劳动。如果我有一个收件箱来管理我的所有代理,这算不算一种新的认知劳动?今天的认知劳动可能会被自动化,但又会创造出什么新的认知劳动?这两件事都必须考虑,对吧?这就是认知劳动不断变化的本质。
这就是为什么我认为这种区分,至少在我看来很重要:不要将知识工作者与知识工作混为一谈。今天的知识工作很可能被自动化。谁说我的人生目标是整理我的电子邮件,对吧?让一个 AI 代理来整理我的电子邮件。
但是在整理完我的电子邮件之后,给我一个更高级别的认知劳动任务:“嘿,这是我真正希望你审核的三个草案。” 这是一个不同的抽象层次。
主持人德瓦克什: 但是 AI 最终会达到第二件事吗?
萨提亚·纳德拉: 也许会,但是一旦它达到第二件事,就会出现第三件事,对吧?所以,为什么我们总是认为我们已经处理过改变了历史上认知劳动的工具?为什么我们要担心所有的认知劳动都会消失?
主持人德瓦克什: 我的意思是,我确信你以前听过这些例子,但就像马匹仍然适用于某些事情,有些地形你不能开车去。但如果认为你会在街上看到数百万匹马被雇佣,这根本不可能发生。然后,这种想法是类似的事情会发生在人类身上吗?
萨提亚·纳德拉: 但这只是在一个非常狭窄的维度上,对吧?仅仅是人类历史中我们重视某些狭隘的、我们所理解的认知劳动这200年。
让我们看看化学领域,对吧?如果像量子+AI这样的东西真正帮助我们做了很多新材料科学等等。是的,让它来做新材料科学真是太棒了。
但这真的会夺走人类可以做的所有其他事情吗?对吧?所以,为什么我们不能生活在一个拥有强大的认知机器的世界里,同时知道我们的认知能力并没有被剥夺?
主持人德瓦克什: 嗯。我不会问你这个问题,而是在一个不同的场景中问这个问题,也许你可以毫无尴尬地回答它。假设在微软董事会中,你是否能想象在董事会中增加一个 AI?它是否能够拥有判断力、背景知识和对董事会的整体理解?
萨提亚·纳德拉: 为了成为一个有用的顾问,我们添加的一项创新是在 Teams 中增加了一个辅助代理。这个代理目前还处于早期开发阶段,其目标是利用长期记忆,不仅用于会议的背景,还用于正在进行的项目和团队动态的背景。这个代理可以作为一个优秀的辅助者,帮助在讨论过程中保持专注。
我设想这在董事会会议中尤其有益,因为董事会会议很容易分心。董事会成员每季度才开一次会,他们通常难以理解像微软这样的大型组织的复杂性。能够帮助每个人专注于关键问题的辅助代理将会非常宝贵。
这个概念与你之前提出的关于拥有无限记忆的问题相关。这样的工具可以极大地帮助我们,尤其是考虑到赫伯特·西蒙的有限理性思想。如果我们能够通过外部认知放大器来解决人类认知的局限性,我们就可以改进我们的决策过程。
主持人德瓦克什: 太棒了。说到材料和化学方面的事情,我想你最近说过,你希望未来250年里这些领域取得的进步,能在未来的25年内实现。当我想象未来250年可能发生的事情时,我想到的是太空旅行、太空电梯、永生和治愈所有疾病。未来25年,你觉得怎么样?我觉得...
萨提亚·纳德拉: 我提出这一点的原因之一是,我喜欢这样的想法:比如,工业革命,如果你说有250年历史,对吧?我的意思是,如果你甚至把从碳基系统到某种不同系统的整个转变都考虑进去,那就意味着你必须从根本上重新发明过去250年来化学领域发生的一切。这就是我希望我们拥有量子计算机的原因。量子计算机可以帮助我们获得新材料,然后我们可以制造这些新材料,以帮助我们应对地球上所有的挑战。而且我完全支持星际旅行。
主持人德瓦克什: 太棒了。Satya,非常感谢你抽出时间。谢谢你。
经纬张颖:2025,4个重要判断