首页   

腾讯研究院AI速递 20250326

腾讯研究院  · 科技媒体  · 4 天前

主要观点总结

本篇文章综述了关于生成式AI、英伟达、百度、阿里等科技前沿的多个新闻报道,涉及AI性能提升、智能体协作、模型迭代等多个方面。

关键观点总结

关键观点1: 生成式AI性能提升与突破

MI300X运行DeepSeek-R1性能超越H200,SGLang框架和AITER张量引擎是性能提升关键。AMD通过提高内存占用换取预填充加速,解决大量线程运行瓶颈。

关键观点2: 英伟达发布AI-Q Blueprint及工具包

NVIDIA发布AI-Q Blueprint和AgentIQ工具包,通过智能体协作实现复杂任务自动化。AI-Q支持多模态提取和检索功能,AgentIQ可实现智能体间无缝连接,支持系统可追溯性和性能分析。

关键观点3: ARC-AGI-2测试与竞赛

顶级AI模型在ARC-AGI-2测试中全线崩盘,暴露出AI的三大短板。2025年ARC奖竞赛启动,旨在推动开源项目发展,打造能战胜ARC-AGI-2的系统。

关键观点4: 英伟达Cosmos-Reason1模型推出

Cosmos-Reason1系列模型专注物理常识推理,采用Mamba-MLP-Transformer混合架构,在物理常识及具身推理任务上表现优异。

关键观点5: 百度“秒哒”平台上线

百度上线对话式应用开发平台“秒哒”,实现AI驱动开发,采用“无代码编程+多智能体协作+多工具调用”技术组合,吸引大量用户创建应用。

关键观点6: 阿里推出Qwen2.5-VL-32B模型

阿里推出Qwen2.5-VL-32B模型,解决了图像理解、数学推理等方面的问题,在MMMU、MMMU-Pro等多模态任务上表现突出。

关键观点7: AI智能体首次跨实验室协作

AI智能体框架AgentRxiv允许多个实验室智能体共享研究成果,打破“孤岛”隔离状态,显著提升研究效率和科研效率。

关键观点8: Github CEO谈AI对软件开发的影响

Github CEO表示AI正在改变软件开发过程,未来的Agent需具备四大特性才能被广泛采用。AI将重塑软件价值定价模式,基于算力而非人力成本定价。

关键观点9: 关于MCP的详解

MCP已垄断Agentic AI中间层,成为开发者首选的统一连接协议。其生态下的创业机会包括Agent OS、MCP Infra和MCP Marketplace等。


正文

生成式AI

一、  AMD MI300X跑满血DeepSeekR1,性能全面超H200?

1. MI300X运行DeepSeek-R1性能超越H200,同延迟下吞吐量达5倍,同并发下高75%;

2. SGLang框架和AITER张量引擎是性能提升关键,AITER可显著提升GEMM、MoE等多项性能;

3. AMD通过提高chunked_prefill_size参数,用更高内存占用换取预填充加速,解决大量线程运行瓶颈。

https://mp.weixin.qq.com/s/dtw0nXl5WVKeC_nrhUSYkg

二、  英伟达发布连接 AI 智能体的 AI-Q Blueprint及工具包

1. NVIDIA发布AI-Q Blueprint和AgentIQ工具包,通过智能体协作实现复杂任务自动化;

2. AI-Q支持多模态提取和检索功能,集成NVIDIA加速计算、合作伙伴存储平台及相关软件工具;

3. AgentIQ作为开源工具,可实现智能体间无缝连接,支持系统可追溯性和性能分析,优化代理式系统表现。

https://mp.weixin.qq.com/s/k4_Tv3-S2ADpDx-MfnCqYQ

三、  时隔6年,ARC-AGI-2正式推出,AI「智商大考」升级

1. ARC-AGI-2测试中,顶级AI模型全线崩盘,基础大模型得0分,CoT推理模型仅4%,而普通人类5分钟即可解题;

2. 测试暴露AI三大短板:符号解释、组合推理、上下文规则应用,证明当前AI缺乏真正的适应能力和流体智力;

3. 2025年ARC奖竞赛启动,总奖金100万美元,旨在推动开源项目发展,打造能战胜ARC-AGI-2的系统。

https://mp.weixin.qq.com/s/UZtE7CJi6wf9cfs_WzwH9Q

四、  将推理延展到真实物理世界,英伟达Cosmos-Reason1

1. Cosmos-Reason1系列模型专注物理常识推理,能识别选项不全问题,表现超越OpenAI ο1模型;

2. 模型采用Mamba-MLP-Transformer混合架构,包含8B和56B两个版本,经过视觉预训练、微调和强化学习;

3. 在物理常识及具身推理任务上显著优于基准模型,可正确识别空间关系、时间动态及物体持久性。

https://mp.weixin.qq.com/s/4q94N0ulQv7HXGWH7Pd3vg

五、  百度对话式应用开发平台“秒哒”上线,无代码应用开发

1. 百度"秒哒"平台实现AI驱动开发,让非专业用户通过自然语言描述即可生成应用;

2. 平台采用"无代码编程+多智能体协作+多工具调用"技术组合,全量上线首日吸引2万用户,创建应用超3万个;

3. 秒哒覆盖从需求到部署全流程,内置十余个垂直领域智能体,可实现H5、网站等多种应用的快速开发与发布。

https://mp.weixin.qq.com/s/RRPKeCuqSuql1cNkC3HnHQ

六、  阿里推出 Qwen2.5-VL-32B:兼顾视觉语言与数学推理

1. Qwen2.5-VL-32B-Instruct模型更新,解决了72B过大和7B能力不足问题;

2. 新模型在细粒度图像理解、数学推理和符合人类偏好的回答方面有显著提升;

3. 性能测试显示32B版本在MMMU、MMMU-Pro等多模态任务上表现突出,甚至超越72B模型。

https://mp.weixin.qq.com/s/-SxZOYsLs3vwSHhPeKiGSg

前沿科技

七、  AI智能体首次跨实验室协作,AgentRxiv组队「抄作业」

1. AI智能体框架AgentRxiv允许多个实验室智能体共享研究成果,打破"孤岛"隔离状态;

2. 基于AgentRxiv的协作模式显著提升研究效率,在多项基准测试中准确率平均提升3.3%,最高达13.7%;

3. 智能体协作可加速研究进程,并行实验比顺序实验更快达成关键里程碑,科研效率提升14%。

https://mp.weixin.qq.com/s/2-QrnE1YfTc0vSjtceGeiw

报告观点

八、  Github CEO:Copilot重塑开发,AI编程将影响软件定价

1. AI正在改变软件开发过程,未来的Agent需具备可预测、可引导、可验证和可容忍四大特性,才能被广泛采用;

2. 软件开发市场变化迅速,模型迭代频繁,代码审查不会消失,AI将大幅减轻安全积压和技术债务;

3. AI正重塑软件价值定价模式,单一功能(如Copilot自动完成)已能达到完整平台功能价格水平,未来将基于算力而非人力成本定价。

https://mp.weixin.qq.com/s/-zjFhnFKz5BjFLukkYNq_Q

九、  万字详解MCP:Agentic AI中间层最优解与相关创业机会

1. MCP已显著垄断了Agentic AI中间层,成为开发者首选的统一连接协议,其使用增长速度极快且应用场景多元;

2. MCP作为Context Layer价值最大化工具,其核心在于提供标准化接口,使AI应用、数据源和工具之间能无缝连接;

3. MCP生态下创业机会包括Agent OS、MCP Infra(提升可靠性和可扩展性)以及MCP Marketplace(类似应用商店的双边平台)。

https://mp.weixin.qq.com/s/LYyJSzg8akfmE0JKMzbSSQ

👇订阅下方合集,获取每日推送

© 2024 精读
删除内容请联系邮箱 2879853325@qq.com