腾讯研究院AI速递 20250326（微信文章未删减版）

主要观点总结

本篇文章综述了关于生成式AI、英伟达、百度、阿里等科技前沿的多个新闻报道，涉及AI性能提升、智能体协作、模型迭代等多个方面。

关键观点总结

关键观点1: 生成式AI性能提升与突破

MI300X运行DeepSeek-R1性能超越H200，SGLang框架和AITER张量引擎是性能提升关键。AMD通过提高内存占用换取预填充加速，解决大量线程运行瓶颈。

关键观点2: 英伟达发布AI-Q Blueprint及工具包

NVIDIA发布AI-Q Blueprint和AgentIQ工具包，通过智能体协作实现复杂任务自动化。AI-Q支持多模态提取和检索功能，AgentIQ可实现智能体间无缝连接，支持系统可追溯性和性能分析。

关键观点3: ARC-AGI-2测试与竞赛

顶级AI模型在ARC-AGI-2测试中全线崩盘，暴露出AI的三大短板。2025年ARC奖竞赛启动，旨在推动开源项目发展，打造能战胜ARC-AGI-2的系统。

关键观点4: 英伟达Cosmos-Reason1模型推出

Cosmos-Reason1系列模型专注物理常识推理，采用Mamba-MLP-Transformer混合架构，在物理常识及具身推理任务上表现优异。

关键观点5: 百度“秒哒”平台上线

百度上线对话式应用开发平台“秒哒”，实现AI驱动开发，采用“无代码编程+多智能体协作+多工具调用”技术组合，吸引大量用户创建应用。

关键观点6: 阿里推出Qwen2.5-VL-32B模型

阿里推出Qwen2.5-VL-32B模型，解决了图像理解、数学推理等方面的问题，在MMMU、MMMU-Pro等多模态任务上表现突出。

关键观点7: AI智能体首次跨实验室协作

AI智能体框架AgentRxiv允许多个实验室智能体共享研究成果，打破“孤岛”隔离状态，显著提升研究效率和科研效率。

关键观点8: Github CEO谈AI对软件开发的影响

Github CEO表示AI正在改变软件开发过程，未来的Agent需具备四大特性才能被广泛采用。AI将重塑软件价值定价模式，基于算力而非人力成本定价。

关键观点9: 关于MCP的详解

MCP已垄断Agentic AI中间层，成为开发者首选的统一连接协议。其生态下的创业机会包括Agent OS、MCP Infra和MCP Marketplace等。

正文

生成式AI

一、 AMD MI300X跑满血DeepSeekR1，性能全面超H200？

1. MI300X运行DeepSeek-R1性能超越H200，同延迟下吞吐量达5倍，同并发下高75%；

2. SGLang框架和AITER张量引擎是性能提升关键，AITER可显著提升GEMM、MoE等多项性能；

3. AMD通过提高chunked_prefill_size参数，用更高内存占用换取预填充加速，解决大量线程运行瓶颈。

https://mp.weixin.qq.com/s/dtw0nXl5WVKeC_nrhUSYkg

二、英伟达发布连接 AI 智能体的 AI-Q Blueprint及工具包

1. NVIDIA发布AI-Q Blueprint和AgentIQ工具包，通过智能体协作实现复杂任务自动化；

2. AI-Q支持多模态提取和检索功能，集成NVIDIA加速计算、合作伙伴存储平台及相关软件工具；

3. AgentIQ作为开源工具，可实现智能体间无缝连接，支持系统可追溯性和性能分析，优化代理式系统表现。

https://mp.weixin.qq.com/s/k4_Tv3-S2ADpDx-MfnCqYQ

三、时隔6年，ARC-AGI-2正式推出，AI「智商大考」升级

1. ARC-AGI-2测试中，顶级AI模型全线崩盘，基础大模型得0分，CoT推理模型仅4%，而普通人类5分钟即可解题；

2. 测试暴露AI三大短板：符号解释、组合推理、上下文规则应用，证明当前AI缺乏真正的适应能力和流体智力；

3. 2025年ARC奖竞赛启动，总奖金100万美元，旨在推动开源项目发展，打造能战胜ARC-AGI-2的系统。

https://mp.weixin.qq.com/s/UZtE7CJi6wf9cfs_WzwH9Q

四、将推理延展到真实物理世界，英伟达Cosmos-Reason1

1. Cosmos-Reason1系列模型专注物理常识推理，能识别选项不全问题，表现超越OpenAI ο1模型；

2. 模型采用Mamba-MLP-Transformer混合架构，包含8B和56B两个版本，经过视觉预训练、微调和强化学习；

3. 在物理常识及具身推理任务上显著优于基准模型，可正确识别空间关系、时间动态及物体持久性。

https://mp.weixin.qq.com/s/4q94N0ulQv7HXGWH7Pd3vg

五、百度对话式应用开发平台“秒哒”上线，无代码应用开发

1. 百度"秒哒"平台实现AI驱动开发，让非专业用户通过自然语言描述即可生成应用；

2. 平台采用"无代码编程+多智能体协作+多工具调用"技术组合，全量上线首日吸引2万用户，创建应用超3万个；

3. 秒哒覆盖从需求到部署全流程，内置十余个垂直领域智能体，可实现H5、网站等多种应用的快速开发与发布。

https://mp.weixin.qq.com/s/RRPKeCuqSuql1cNkC3HnHQ

六、阿里推出 Qwen2.5-VL-32B：兼顾视觉语言与数学推理

1. Qwen2.5-VL-32B-Instruct模型更新，解决了72B过大和7B能力不足问题；

2. 新模型在细粒度图像理解、数学推理和符合人类偏好的回答方面有显著提升；

3. 性能测试显示32B版本在MMMU、MMMU-Pro等多模态任务上表现突出，甚至超越72B模型。

https://mp.weixin.qq.com/s/-SxZOYsLs3vwSHhPeKiGSg

前沿科技

七、 AI智能体首次跨实验室协作，AgentRxiv组队「抄作业」

1. AI智能体框架AgentRxiv允许多个实验室智能体共享研究成果，打破"孤岛"隔离状态；

2. 基于AgentRxiv的协作模式显著提升研究效率，在多项基准测试中准确率平均提升3.3%，最高达13.7%；

3. 智能体协作可加速研究进程，并行实验比顺序实验更快达成关键里程碑，科研效率提升14%。

https://mp.weixin.qq.com/s/2-QrnE1YfTc0vSjtceGeiw

报告观点

八、 Github CEO：Copilot重塑开发，AI编程将影响软件定价

1. AI正在改变软件开发过程，未来的Agent需具备可预测、可引导、可验证和可容忍四大特性，才能被广泛采用；

2. 软件开发市场变化迅速，模型迭代频繁，代码审查不会消失，AI将大幅减轻安全积压和技术债务；

3. AI正重塑软件价值定价模式，单一功能(如Copilot自动完成)已能达到完整平台功能价格水平，未来将基于算力而非人力成本定价。

https://mp.weixin.qq.com/s/-zjFhnFKz5BjFLukkYNq_Q

九、万字详解MCP：Agentic AI中间层最优解与相关创业机会

1. MCP已显著垄断了Agentic AI中间层，成为开发者首选的统一连接协议，其使用增长速度极快且应用场景多元;

2. MCP作为Context Layer价值最大化工具，其核心在于提供标准化接口，使AI应用、数据源和工具之间能无缝连接;

3. MCP生态下创业机会包括Agent OS、MCP Infra(提升可靠性和可扩展性)以及MCP Marketplace(类似应用商店的双边平台)。

https://mp.weixin.qq.com/s/LYyJSzg8akfmE0JKMzbSSQ

👇订阅下方合集，获取每日推送