首页   

马斯克发布新一代人工智能模型,“地球上最聪明的AI”来了?

国际金融报  · 金融  · 2 天前

正文

当地时间2月17日晚,特斯拉首席执行官埃隆·马斯克(Elon Musk)发布了新一代人工智能模型Grok 3。

这一款被马斯克称为“好得可怕”的人工智能模型誓言对最前沿的AI研发发起挑战。其团队声称,Grok 3的性能已经优于竞争对手的尖端模型。

创造“最智能”的AI

Grok这个词来自于罗伯特·海因莱因的小说《异乡的陌生人》,由在火星上长大的人物所使用的,表示对某事有完整而深刻的理解,其中,同理心是这种理解的重要组成部分。

Grok 1于2023年初发布,是马斯克旗下初创企业xAI推出的首款人工智能聊天机器人。2023年年中,xAI在Grok 1的基础上推出了Grok 2。这一代模型在多个方面进行了重大改进,然而,在众多优秀大模型层出不穷的2023年,Grok 2的问世并没有掀起太大水花。

去年4月,马斯克就产生了创造“最智能”AI的想法。在他看来,成功创造最好的人工智能的唯一途径就是创建自己的数据中心。

xAI拥有一台用于训练AI的“Colossus超级计算机”,这台计算机在8个月内就搭建完成,搭载了10万颗英伟达H100 GPU,提供了超过2亿GPU小时的计算资源——是Grok 2的10倍。

此外,xAI与戴尔达成价值50亿美元的协议,为Grok 3提供人工智能服务器。此次交易旨在满足Grok 3和其他人工智能应用不断增长的计算需求。

Grok 3不是一个模型,更确切地说,它是一个模型系列。Grok 3 mini是Grok 3的缩小版,可以更快地回答问题,但代价是准确性会有所损失。

Grok 3的初步训练大约一个月前完成,此后团队一直致力于将推理能力集成到当前的Grok 3模型中。不过目前,该模型仍处于早期阶段。已经发布的只是Grok 3推理模型的一部分。与此同时,开发人员还在训练迷你版的论证模型。

多项评估高分

产品发布之前,马斯克就在X个人主页上发帖宣布,“Grok 3将成为地球上最聪明的AI”,并承诺,其性能将超越任何目前可用的其他人工智能产品。

Grok 3于线上发布时,有超过10万人观看了这一AI新玩家的上线演示。在Grok 3发布的问答环节中,xAI还回答了观众关于最新AI模型的一些问题,比如问Grok是女孩还是男孩。

“Grok就是你想要他成为的任何人”,马斯克回答道,“人们会爱上Grok,可能性是1000%!”

xAI声称,Grok 3在AIME(评估模型在数学问题样本上的表现)和GPQA(测试博士级物理、生物和化学问题的模型)等测试中优于GPT-4o。xAI还称,Grok 3的早期版本在Chatbot Arena中也获得了高分。

而Grok 3的两个变体,Grok 3 Reasoning和Grok 3 mini Reasoning,可以仔细地“思考”问题,类似于OpenAI的o3-mini和中国公司DeepSeek的R1等“推理”模型。

推理模型在产生结果之前会仔细地进行自我测试,这有助于它们避免模型通常面临的一些陷阱。

xAI声称,Grok 3 Reasoning在多项流行测试中的表现优于o3-mini的最佳版本(o3-mini high),包括新的AIME 2025数学测试。

xAI还现场演示了Grok 3的推理+编程能力,其中一个问题是“生成3D动画代码,演示从地球发射、着陆火星,然后在下一个发射窗口返回地球的过程”。

经过近两分钟的思考,Grok 3生成了可以直接跑起来的python代码,3D动画可以运行,但是否正确还有待验证。

xAI还称,Grok 3最具人文色彩的方面之一就是它的创造力。其开发了一款新游戏的概念,该游戏巧妙地结合了俄罗斯方块和Puyo Puyo的元素,展示了其在科学和技术之外的领域,如娱乐和艺术领域的潜力。根据马斯克的说法,Grok 3正在创造俄罗斯方块和宝石迷阵的混合体。

Grok 3的最后一个新功能是代理/智能体(Agent)。发布会演示的是新产品DeepSearch,基于Grok 3的搜索引擎,它不仅可以搜索网页,查找现有资料,还可以“推测用户的真正意图”并加以思考,在经过交叉对比不同信源后,确保“能够反馈正确的信息”。

未来发展计划

目前,X上的Premium Plus订户将是第一批获得Grok 3访问权限的群体。此外,如果想要抢先体验新功能,也可以通过Grok应用程序和grok.com网站单独订阅Super Grok。

Super Grok还可以在新的DeepSearch搜索引擎中解锁额外的注意事项及搜索查询,并添加无限的图像生成功能。

尽管Grok 3被马斯克誉为“地球上最聪明的AI”,但它在早期测试中仍然暴露出一些局限性。

在正式发布之前,几名X平台用户表示自己可以提前体验Grok 3。他们发现,尽管该模型能够正确回答一些困难的谜题,并生成HTML和JavaScript代码,但是它在编写代码时仍然存在一些细节上的疏漏,出现了bug。

几周后,Grok 3模型将与DeepSearch功能一起出现在xAI企业API中。马斯克表示,几个月后,xAI将开源Grok 2。

“我们的总体做法是,当下一个版本完全准备好时,我们将发布开源的最新版本”,马斯克说。

他向用户承诺一周内会推出“更精美的版本”。“我们还在开发语音交互功能,以便进行对话。我今天尝试了一下,效果很好,尽管还需要一些工作。我们的目标是让它可以像人一样交谈。我认为这将是使用Grok 3的最佳体验之一”。


记者:袁源

文字编辑:王哲希

版面编辑:毕丹丹

—— / 好文推荐 / ——

       

       

点亮“在看”,你最好看! (*╯3╰)

© 2024 精读
删除内容请联系邮箱 2879853325@qq.com