OpenAI o3 mini即将发布/国产爆火AI推出App/图灵奖得主称大语言模型无法实现AGI|Hunt Good周报

APPSO · app · 6 天前

主要观点总结

本期周报主要介绍了最新的科技发展情况，包括人工智能、机器学习等领域的新进展和新应用。具体内容包括OpenAI的CEO关于新模型的表态，多个科技公司的创新动态，以及一些新兴工具的应用和发展趋势。

关键观点总结

关键观点1: OpenAI o3 模型即将推出

OpenAI的CEO Sam Altman表示，O3 mini模型即将率先推出，将向ChatGPT Plus账户开放。定价方面，Altman表示仍在努力提高API定价。

关键观点2: OpenAI重启机器人业务

OpenAI正在重启其此前曾被解散的机器人业务，公司硬件总监Caitlin Kalinowski近日发布消息，公布了团队的发展规划和重点开发方向。OpenAI计划自主研发新型传感器和计算组件，并将其与公司内部开发的AI模型深度整合。

关键观点3: Anthropic拟融资20亿美元

据报道，Anthropic正在与风投机构Lightspeed Venture Partners进行深入谈判，计划融资20亿美元。若本轮融资成功，公司估值将达到600亿美元，有望成为美国第五大最有价值的初创企业。

关键观点4: 阿里收购传闻和英伟达发布会总结

零一万物被阿里收购的传闻被创始人李开复辟谣。同时，英伟达在CES 2025主题演讲上正式发布GeForce RTX 50系列消费级显卡。此外，伯克利团队以450美元打造高性能开源模型也引起了广泛关注。

关键观点5: 神经链接和微软开源模型的新进展

Neuralink创始人马斯克透露了脑机接口项目的最新进展。同时，微软在Hugging Face平台上开源了小语言模型Phi-4，在数学问题解决能力上表现出色。

关键观点6: 工具和应用的新动态

包括Grok、Deepseek推出独立App，通义万相2.1模型升级，海螺AI主体参考功能上新等工具的最新发展和应用。

关键观点7: 专家预测和展望

Canvas创始人Cameron Adams对2025年的七大预测，包括AI在音乐、艺术、商业等领域的应用和发展，以及AI对工作和领导力的影响等。

正文

欢迎收看最新一期的 Hunt Good 周报！

在本期内容你会看到：

7 条新鲜资讯
5 个有用工具
1 个有趣案例
3 个鲜明观点

Hunt for News｜先进头条

⏰ Altman 称 o3 mini 即将到来

继 Grok 3 蓄势待发后，OpenAI CEO Sam Altman 也在 X 平台透露了有关 OpenAI o3 模型的更多信息。

Altman 表示，o3-mini 模型即将率先推出，将向 ChatGPT Plus 账户开放。至于定价方面，Altman 表示：「仍在努力提高 API 定价，但不是那么多。」

Altman 还调侃预测了 o3 模型的发展弧线：

天哪，它比我聪明多了，这简直颠覆了一切！（十分钟过去了）

话说，晚餐到底吃什么啊？（十分钟过去了）

你信不信 o3 竟然这么差劲？而且还这么慢？他们真得抓紧发布 o4了。

🔗 https://x.com/sama/status/1877814587636006924

🤖 OpenAI 正式重启机器人业务

OpenAI 正在重启其此前曾被解散的机器人部门。该公司硬件总监 Caitlin Kalinowski 近日通过 X 平台发布消息，首次详细公布了团队的发展规划。

根据发布的多个招聘信息显示，公司的机器人团队将重点开发「通用型」、「自适应」和「多功能」机器人。

这些机器人将能够在动态的真实环境中展现类人智能，实现灵活作业。为此，OpenAI 计划自主研发新型传感器和计算组件，并将其与公司内部开发的 AI 模型深度整合。

招聘信息还透露，OpenAI 计划通过合同工形式开展机器人原型测试，且正在研发的机器人可能具备肢体功能。更值得关注的是，OpenAI 正在招募具备「百万级机械系统设计经验」的工程师。

🔗 https://techcrunch.com/2025/01/10/new-openai-job-listings-reveal-its-robotics-plans/

💰 Anthropic 拟募资 20 亿美元

据 WSJ 报道，Anthropic 正在与风投机构 Lightspeed Venture Partners 进行深入谈判，计划融资 20 亿美元。若本轮融资成功，公司估值将达到 600 亿美元。

这也意味着，Anthropic 将有望成为仅次于 SpaceX、OpenAI、Stripe 和 Databricks 的美国第五大最有价值初创企业。

值得注意的是，Anthropic 在过去几年已获得亚马逊和 Google 的大力支持。

去年 11 月，亚马逊承诺投资 40 亿美元，使其对 Anthropic 的总投资达到 80 亿美元。且目前 Anthropic 的技术开发和运营都依托于亚马逊和 Google 的数据中心。

据知情人士透露，该公司年化收入已达到约 8.75 亿美元，主要来自企业客户，相比之下，OpenAI 预计去年收入达到 37 亿美元，很大一部分来自面向 C 端付费用户。

🔗 https://www.wsj.com/tech/ai/ai-startup-anthropic-raising-funding-valuing-it-at-60-billion-19d0605a?mod=tech\_feat1\_ai\_pos5

✖️ 传零一万物被阿里收购，李开复辟谣

1 月 6 日，一则有关「01 万物散伙了；卡和预训练团队卖给阿里了」的传闻开始出现在社交媒体。同时有媒体报道称，阿里洽谈收购零一万物的预训练团队。

随即，零一万物创始人兼 CEO 李开复在个人社交账号对此进行了辟谣，并表示 2025 年是大模型考验年、商业化淘汰年，希望与各方协力让行业回归商业本质，一起促进大模型生态的良性健康成长。

同时李开复也透露零一万物 2024 年确认收入一亿多元，2025 年会数倍增长。

此后，零一万物于 1 月 7 日凌晨发布公告，表示针对传言零一万物将被收购、经营问题等不实言论属于恶性中伤，公司予以否认。

据智能涌现获悉，2024 年 12 月中旬，零一万物对整个预训练算法团队和 Infra 团队进行了裁撤，裁员范围包括硅谷团队；同月，零一万物预训练算法团队获得通义团队 offer，Infra 团队则获得阿里云 offer；目前阿里对零一万物团队的收编以提供工作岗位的形式进行，而非收购。

零一万物与阿里云于 1 月 2 日，联合宣布启动「产业大模型实验室」，其合作内容包含双方在技术、算力、业务、人才等板块技术共享与深度共建。

另外，近日，零一万物 CEO 李开复接受晚点对话的采访，并表示只有大公司能继续做超大模型。

李开复也继续回应了零一万物调整，表示不会停止预训练，但不再追逐超大模型。并且他认为追寻 AGI 需要充足甚至不计代价的弹药储备，而零一万物现阶段的最高优先级是先巩固拿到弹药的实力。

🔗 https://mp.weixin.qq.com/s/ensXY3qh9tVHtdyDxQ1AQQ

🧠 Neuralink 完成第三例脑机接口植入手术

Neuralink 创始人马斯克近日在直播中透露了脑机接口项目的最新进展。

马斯克表示，Neuralink 已经成功完成第三例脑机接口设备植入手术，且目前三名植入者的设备均运行良好，同时，该公司计划在 2025 年为 20 至 30 名新患者实施植入手术。

目前，Neuralink 在美国食品药品监督管理局（FDA）正式注册了两项临床研究项目。

其中规模较大的 Prime 研究项目计划招募 5 名瘫痪患者，主要探索通过脑机接口技术实现患者用意念控制计算机、智能手机等外部设备的可能性。

另一个名为 Convoy 的研究项目则针对 3 名患者，重点研究如何让患者通过意念控制辅助机械臂等设备，以帮助他们重获部分行动能力。

🔗 https://www.bloomberg.com/news/articles/2025-01-11/musk-says-neuralink-implanted-third-patient-with-brain-device?srnd=phx-technology

💥 英伟达发布会一文总结

北京时间 1 月 7 日，英伟达在 CES 2025 主题演讲上，正式发布 GeForce RTX 50 系列消费级显卡，售价高达 1999 美元（约 1.46 万人民币）。

据官方介绍，GeForce RTX 50 系列采用英伟达 Blackwell 架构、第五代 Tensor Cores 和第四代 RT Cores，其中，RTX 5090 GPU 配备了 920 亿个晶体管，每秒可实现超过 3352 万亿次 AI 运算，性能较上一代 RTX 4090 提升了近两倍。

RTX 50 系列还搭载了 DLSS 4 技术。DLSS 4 将推出多帧生成功能，通过使用 AI 为每个渲染帧生成多达 3 帧来提高帧速率，同时，DLSS 4 还引入了图形行业首个实时 Transformer 模型架构应用。

国行版 RTX 5090D 与 RTX 5080 售价也一同公布，分别为 16499 元起和 8299 元起，将于 1 月 30 日上市。

此外，搭载 72 个 Blackwell 架构 GPU 所组成的 Grace Blackwell NVLink72 巨型芯片和只手可握的超级计算机 Project Digits 也一同亮相。

Project Digits 专为 AI 研究人员、数据科学家和学生设计，可提供高达 petaflop 级别的计算性能，将于今年 5 月推向市场，定价 3000 美元。

更多具体信息欢迎点击下文观看~ 👇

黄仁勋化身美队发布新「核弹」RTX 5090 ！售价 1.46 万，还有一台 AI 超级计算机 | CES 2025

👀 伯克利团队以 450 美元打造高性能开源模型

加州大学伯克利分校 Sky Computing Lab 的研究团队 NovaSky 近日推出了一款开源推理模型 Sky-T1-32B-Preview。

该模型不仅在多项关键基准测试中与 o1-preview 不分伯仲，更值得关注的是，其开发成本仅为 450 美元。

成本大幅降低的关键在于合成训练数据的应用。

据 NovaSky 团队透露，他们首先使用阿里巴巴的 QwQ-32B-Preview 模型生成初始训练数据，随后通过 GPT-4o-mini 对数据进行重构和优化。

整个训练过程仅用了 19 小时，使用了 8 个 H100 GPU。

在 MATH500和 LiveCodeBench 等测试中，Sky-T1 的表现甚至超过了 o1-preview。

此外，Sky-T1 也是一个开源推理模型。

研究团队不仅公布了训练所需的数据集，还开放了完整的训练代码，这也意味着其他研究者能够从零开始复制这一成果。

🔗 https://techcrunch.com/2025/01/11/researchers-open-source-sky-t1-a-reasoning-ai-model-that-can-be-trained-for-less-than-450/

Hunt for Tools｜先进工具

📱 Grok、Deepseek 推出独立 App

近日，马斯克旗下 xAI 的 AI 聊天机器人「Grok」正式推出独立 App，目前已上架外版苹果 App Store。

据了解，此前用户若想访问 Grok，需要通过 X 平台才能使用。目前 Grok App 仍是早期的「测试版」产品，支持免费访问 xAI 的最新模型 Grok 2。

具体信息欢迎回看 👇

马斯克版 ChatGPT iOS 应用上线，我用一整天发现了这些惊喜和槽点

与此同时，国产爆火 AI Deepseek 近日也推出了 App。

附 iOS 版 Grok 下载地址：
https://apps.apple.com/us/app/grok/id6670324846

附 iOS 版 Deepseek 下载地址：
https://apps.apple.com/cn/app/deepseek/id6737597349

📀 阿里通义万相 2.1 模型宣布升级

1 月 9 日，阿里云通义万相迎来重磅升级，推出万相 2.1 视频生成模型，在大幅度复杂运动、物理规律遵循、艺术表现等方面全面提升。

根据权威评测榜单 VBench 的信息显示，新版通义万相登上榜首位置，超越混元、海螺 AI、Gen3、Pika 等国内外视频生成模型。

具体项目中，通义万相在运动幅度、多对象生成、空间关系等关键能力上拿下最高分，并以总分 84.7% 的成绩斩获第一。

据官方介绍，通义万相团队采用自研高效的 VAE 和 DiT 架构，有效增强时空上下文关系建模能力，解决了精准理解和模拟物理世界这两大难题。

此外，通义万相在文字视频生成上实现了突破，成为首个支持中文文字生成能力、且同时支持中英文文字特效生成的视频生成模型。

🔗 https://mp.weixin.qq.com/s/UPE1AEdmyUxY65XDph4hig

👏 微软开源 14B 参数模型 Phi-4

近日，微软在 Hugging Face 平台上开源小语言模型 Phi-4。

据微软官方称，得益于更优质的训练数据，这款模型相比其前代产品在多个方面都有所提升，尤其在数学问题解决能力上表现出色。

据悉，Phi-4 拥有 140 亿参数规模，在数学和推理任务中的表现明显优于 GPT-4o 和 Gemini Pro 1 等更大的模型。Phi-4 的训练主要依赖于合成生成的高质量数据，而非网络抓取内容，重点在于增强推理能力。

Phi-4 于 12 月发布时仅限于微软的 Azure 平台，现在开发人员可以通过 Hugging Face 完全访问，并用于商业用途。

🔗 https://huggingface.co/microsoft/phi-4

🐚 海螺 AI「主体参考」功能上新

近日，MiniMax 宣布推出最新自研 S2V-01 视频模型。

该模型通过单图主体参考架构，以传统方案 1% 以下的输入和计算成本，只需输入一张图片，即可实现视觉细节的精确还原，同时具备高自由度和组合性。

用户等待时长大幅降低，达到高可用的效果。

用户在海螺 AI 中选择「主体参考」功能后，仅需上传一张图片即可识别并锁定主体角色。

文本框内输入 Prompt 提示词，无需漫长等待，即可生成富有创意且主体保持一致的高质量视频。具体信息，欢迎回看 👇

AI 视频的国产之光，这个新功能彻底解放抽卡的双手

🔗 https://mp.weixin.qq.com/s/vYEZ3QCyMlKClsk7MYLhqA

📹 这个新模型，支持生成透明背景视频

近日，Adobe Research 与香港科技大学联合开发的 TransPixar 正式发布。

这项技术最大的特点在于能够生成包含透明通道（Alpha 通道）的 RGBA 视频，使得诸如烟雾、反射等透明元素能够自然地融入场景中，提升视觉效果的真实感。

项目负责人 Yijun Li 表示，Alpha 通道对视觉效果制作至关重要，但由于数据集限制和模型适配难度，生成包含透明度的 RGBA 视频一直是业界难题。

目前，研究团队已在 GitHub 开源代码。

🔗 https://venturebeat.com/ai/smoke-reflections-and-portals-adobes-transpixar-takes-ai-vfx-to-the-next-level/

Hunt for Fun｜先行

😄 CES 奇葩产品大展示

在本周召开的 CES 2025 展会上，AI 成了当之无愧的主角。但与此同时，我们看到了不少「奇葩」的产品。

有无弦的假吉他，有黄金智能戒指，也有耳机形状的「洗耳神器」，还有从搞笑诺贝尔奖走出来的电子盐味勺……

当然，也有一些比较实用的产品。

比方说，会说话的手杖 Smart Cane 2 就因为装进了 ChatGPT，有望给盲人带来巨大便利，而得到外媒的一致好评。

具体信息欢迎回看此前文章👇

逛遍 CES 后，我被这些奇葩产品整笑了

Hunt for Insight｜先知

👀 马斯克：AI 训练数据去年就已耗尽

马斯克最近在访谈中表示，可用于 AI 模型训练的人类知识数据已经耗尽。

他指出，这种数据资源的枯竭实际上在去年就已经发生。目前像 GPT-4o 这样的 AI 模型，都是通过分析和学习海量互联网数据来识别信息模式，从而实现预测下一个词语等功能。

但随着可用的人类知识数据逐渐见底，业界正在寻找新的解决方案。

作为应对之策，马斯克建议转向由 AI 合成数据。「唯一的补充方法是用合成数据来补充……它会写一篇论文或写一篇论文，然后会给自己评分……经历这个自我学习的过程。」

不过，马斯克也表示 AI 模型容易产生「幻觉」，而使用 AI 合成数据后，「你怎么知道它的答案是否幻觉，或者这是一个真实的答案。」

🔗 https://www.theguardian.com/technology/2025/jan/09/elon-musk-data-ai-training-artificial-intelligence

🙅 Yann LeCun：大语言模型无法实现真正的 AGI

在 CES 大会上，Meta 首席 AI 科学家 Yann LeCun 直接反驳了 Altman 关于已掌握 AGI 构建方法的说法，并强调目前的大语言模型不可能达到真正的人类智能水平。

LeCun 指出，现有的 AI 存在根本性局限。

虽然它们在国际象棋等特定任务上表现出色，但这并不意味着它们已接近人类智能。他举例说，即使在自动驾驶领域发展了 13 年，我们仍未实现完全自动驾驶。

「AI 可能会完成很多任务，但这不等于它们具备规划、推理或理解物理世界的能力。」

LeCun 认为 AI 在处理物理世界任务时表现出明显不足。「我们甚至还无法让 AI 达到猫狗对物理世界的理解程度。」

另外，他认为，随着生成式世界模型的发展，让机器人在虚拟世界中进行训练将大大降低成本和风险。他预计在未来三到五年内，机器人领域可能会迎来类似 ChatGPT 的突破性时刻。

同时，他相信 AI 助手会变得越来越普及，但这些助手仍将局限于执行特定训练过的任务，而非具备真正的通用智能。

🔗 https://www.pymnts.com/artificial-intelligence-2/2025/meta-large-language-models-will-not-get-to-human-level-intelligence/

🕐 Canvas 创始人对 2025 年的 7 大预测

最近，Canvas 联合创始人 Cameron Adams 对 2025 年作出了如下七大预测：

AI 将帮助一位音乐艺术家赢得格莱美奖

AI 原生创作者的崛起，引领全新的商业、艺术，音乐等行业

AI 没有全面取代工作，而是在创造新的工作。

AI 将承担「夜班」，处理重复性任务。

AI 增强决策树将彻底改变领导力

教育将从答案转向可执行的思维

可持续发展将成为 AI 的下一个前沿领域

🔗 https://fortune.com/2025/01/09/ai-predictions-2025-canva-cofounder/

彩蛋时间

作者：@gizakdag

工具：Midjourney v6.1

链接：https://x.com/gizakdag/status/1878003500761686481