刚刚，Claude 3.7 Sonnet正式发布，开启混合推理革命！（微信文章未删减版）

首页

主要观点总结

Anthropic推出了新一代的AI模型Claude 3.7 Sonnet，并同时发布了编码工具Claude Code。该模型提出了一个新的混合推理模式，在编程能力上进行了优化。除了提供即时回应，它还能展示详细的思考步骤，有两种模式：标准模式和扩展模式。在真实世界的任务中表现出色，特别是在编码和前端Web开发方面。新工具Claude Code是一个AI编码命令行终端工具，可以直接在终端操作。此外，还介绍了模型的定价和发展蓝图。

关键观点总结

关键观点1: 新一代AI模型Claude 3.7 Sonnet的推出

除了官方宣传的“迄今为止最聪明的模型”外，该模型还开创性地提出了混合推理模式，是市场上首个采用此模式的推理模型。

关键观点2: 编码工具Claude Code的发布

Claude Code是一个AI编码命令行终端工具，可以在终端直接操作，搜索和阅读代码、编辑文件等。

关键观点3: 模型的关键特性

除了即时回应外，该模型还能展示详细的思考步骤，有两种模式：标准模式和扩展模式。扩展模式下，在数学、物理、指导跟踪、编码等任务上表现出色。

关键观点4: 模型在真实世界任务中的表现

在SWE-bench和TAU-bench测试中刷新纪录，优于其他推理模型。定价方面，每百万输入token 3美元，每百万输出token 15美元（包括思考token）。此外，官方给出了从助手到协作者，最终成为引领者的发展蓝图。

正文

刚刚，Anthropic 推出了新一代的 AI 模型 Claude 3.7 Sonnet。

不是万众期待的cluade 4，而是3.7 Sonnet 以及 Claude Code。

推理模型早在意料之中，还捎带一个编码神器，是没想到的。感觉Claude一直把代码编程能力当作一个重点优化。

Claude 3.7 Sonnet，除了官方说的“迄今为止最聪明的模型”外，还开创性地提出一个新的模型模式——“混合推理模型”，是市场上第一个混合推理模型。

除了可以提供即时回应，展示详细的思考步骤外，

一种模型，两种思考方式。

Normal(标准模式)
Extended（扩展模式）

标准模式下，Claude 3.7是Claude 3.5升级版本。

在扩展模式下，也就是它的强推理版本，不出意外的话，在数学，物理，指导跟踪，编码等任务上表现出色。

先看得分——

光看榜单得分，并没有以为的屠榜。而是在编码和前端 Web 开发方面表现出色。

官方表示，优化重点是真实世界的任务，而不是数学和计算机科学竞赛问题。

在SWE-bench（真实软件问题解决）和TAU-bench（复杂任务交互）测试中刷新纪录，超越一众推理模型。

Claude Code -终端里的AI全栈工程师

这次一同发布的是，还有一个重磅级的代理编码工具—— Claude Code 。

目前是一个预览版本，作为首款AI编码命令行工具，可以在终端直接操作，搜索和阅读代码、编辑文件、编写和运行测试、提交代码到 GitHub，所有开发流程在终端不用Linux命令全部搞定。

Anthropic 团队内部已经在使用，并强调说在测试驱动开发、调试复杂问题和大规模重构方面表现非常出色。

推特上第一时间测试case——

草莓有几个R，现在改成交互效果了，点击草莓就给你答案。

还有生成流体模拟器

扩展思考模式在除免费版 Claude 之外的所有平台上都可用了，同时API也放出来了，用户可以通过API控制思考的时长，即token数量，最高128K token。

模型定价依旧保持不变：每百万输入 token 3 美元，每百万输出 token 15 美元（包括思考 token）。

Claude 3.7 Sonnet 和 Claude Code 的发布，按照官方说法，是在 “构建真正增强人类能力的 AI 系统” 更进一步，并且给出了发展蓝图——

从助手到协作者，最终成为引领者。

推荐文章

我刚看网上讲“地域黑”，有个误会要和大家解释下。其实不... · sven_shi · 昨天

手机辐射真相来了！ · 中国商报 · 昨天

手机辐射真相来了！ · 中国商报 · 昨天

我回答了 @王胖胖它爸的问题，如果这笔社保钱是资本家... · sven_shi · 2 天前

确认-3℃！上海明天气温暴跌！很多人连夜离沪，部分路段... · 话匣子 · 2 天前

确认-3℃！上海明天气温暴跌！很多人连夜离沪，部分路段... · 话匣子 · 2 天前

海外顶流 MKBHD 的 Oppo Find N5 测... · 李楠或kkk · 3 天前

【企业会员动态】CD3ε配体ITPRIPL1（CD3L... · 华人抗体 · 8 月前

NF-κB、MAPK、AKT、PI3K、TGF-β……... · 解螺旋 · 1 年前

固收投研是怎么看城投报表的 · 喜鹊固收 · 5 年前

限时限量，五一兰州海洋馆兰大学生特价专场来了！ · 兰小e · 5 年前

猜瓜子的骗子：论如何快速地亏成穷光蛋 · 沧海一土狗 · 6 年前

© 2024 精读
删除内容请联系邮箱 2879853325@qq.com