首页   

刚刚,Claude 3.7 Sonnet正式发布,开启混合推理革命!

夕小瑶科技说  · 科技自媒体  · 20 小时前

主要观点总结

Anthropic推出了新一代的AI模型Claude 3.7 Sonnet,并同时发布了编码工具Claude Code。该模型提出了一个新的混合推理模式,在编程能力上进行了优化。除了提供即时回应,它还能展示详细的思考步骤,有两种模式:标准模式和扩展模式。在真实世界的任务中表现出色,特别是在编码和前端Web开发方面。新工具Claude Code是一个AI编码命令行终端工具,可以直接在终端操作。此外,还介绍了模型的定价和发展蓝图。

关键观点总结

关键观点1: 新一代AI模型Claude 3.7 Sonnet的推出

除了官方宣传的“迄今为止最聪明的模型”外,该模型还开创性地提出了混合推理模式,是市场上首个采用此模式的推理模型。

关键观点2: 编码工具Claude Code的发布

Claude Code是一个AI编码命令行终端工具,可以在终端直接操作,搜索和阅读代码、编辑文件等。

关键观点3: 模型的关键特性

除了即时回应外,该模型还能展示详细的思考步骤,有两种模式:标准模式和扩展模式。扩展模式下,在数学、物理、指导跟踪、编码等任务上表现出色。

关键观点4: 模型在真实世界任务中的表现

在SWE-bench和TAU-bench测试中刷新纪录,优于其他推理模型。定价方面,每百万输入token 3美元,每百万输出token 15美元(包括思考token)。此外,官方给出了从助手到协作者,最终成为引领者的发展蓝图。


正文

刚刚,Anthropic 推出了新一代的 AI 模型 Claude 3.7 Sonnet。

不是万众期待的cluade 4,而是3.7 Sonnet 以及 Claude Code。

推理模型早在意料之中,还捎带一个编码神器,是没想到的。感觉Claude一直把代码编程能力当作一个重点优化。

Claude 3.7 Sonnet,除了官方说的“迄今为止最聪明的模型”外,还开创性地提出一个新的模型模式——“混合推理模型”,是市场上第一个混合推理模型。

除了可以提供即时回应,展示详细的思考步骤外,

一种模型,两种思考方式。

  • Normal(标准模式)

  • Extended(扩展模式)


标准模式下,Claude 3.7是Claude 3.5升级版本。

扩展模式下,也就是它的强推理版本,不出意外的话,在数学,物理,指导跟踪,编码等任务上表现出色。

先看得分——


光看榜单得分,并没有以为的屠榜。而是在编码和前端 Web 开发方面表现出色。

官方表示,优化重点是真实世界的任务,而不是数学和计算机科学竞赛问题。

在SWE-bench(真实软件问题解决)和TAU-bench(复杂任务交互)测试中刷新纪录,超越一众推理模型。

Claude Code -终端里的AI全栈工程师

这次一同发布的是,还有一个重磅级的代理编码工具—— Claude Code 。

目前是一个预览版本,作为首款AI编码命令行工具,可以在终端直接操作,搜索和阅读代码、编辑文件、编写和运行测试、提交代码到 GitHub,所有开发流程在终端不用Linux命令全部搞定。

Anthropic 团队内部已经在使用,并强调说在测试驱动开发、调试复杂问题和大规模重构方面表现非常出色。

推特上第一时间测试case——

草莓有几个R,现在改成交互效果了,点击草莓就给你答案。

还有生成流体模拟器

扩展思考模式在除免费版 Claude 之外的所有平台上都可用了,同时API也放出来了,用户可以通过API控制思考的时长,即token数量,最高128K token。

模型定价依旧保持不变:每百万输入 token 3 美元,每百万输出 token 15 美元(包括思考 token)。

Claude 3.7 Sonnet 和 Claude Code 的发布,按照官方说法,是在 “构建真正增强人类能力的 AI 系统” 更进一步,并且给出了发展蓝图——

从助手到协作者,最终成为引领者。


© 2024 精读
删除内容请联系邮箱 2879853325@qq.com