首页   

腾讯研究院AI速递 20250221

腾讯研究院  · 科技媒体  · 昨天

主要观点总结

这是一篇关于生成式AI的进展报道,涵盖了多个领域包括游戏生成、CUDA工程师的诞生、谷歌的AI co-scientist、腾讯的深度思考模型混元T1、视觉语言领域的突破以及量子芯片等重大突破和成果展示。

关键观点总结

关键观点1: Grok-3全面免费开放,具有DeepSearch和Think两大模式,可以判断数字大小,展现出优秀的代码编写、长文本理解和图像生成能力。

Grok-3是首个展示优秀能力的AI模型,在评测中可能存在争议。

关键观点2: 微软与Xbox发布游戏生成式AI模型Muse,基于《Bleeding Edge》游戏数据训练,能实时生成游戏环境。

Muse计划应用于游戏跨平台复现、开发效率提升及创意拓展,强调AI仅作为辅助工具。

关键观点3: Sakana AI发布世界首个「AI CUDA工程师」,能将PyTorch代码自动转换为CUDA内核,性能大幅提升。

该系统的实现原理是LLM驱动的进化算法,并构建了包含已验证CUDA内核的开源数据集。

关键观点4: 谷歌的AI co-scientist可独立提出科学发现、研发新药物。

该多智能体AI系统采用专业化智能体协同工作,自我迭代进化机制优化假设质量。

关键观点5: 腾讯混元T1模型已对全部用户开放免费无限量使用。

混元T1与DeepSeek-R1同属于推理型模型,专注于处理复杂任务的深度思考能力。

关键观点6: 视觉语言领域有重大突破,VLM-R1项目成功迁移DeepSeek R1方法至视觉语言领域。

该模型在Qwen2.5-VL基础上展现出卓越的稳定性和泛化能力,项目已完全开源。

关键观点7: 微软发布全球首款拓扑架构量子芯片Majorana 1,采用砷化铟和铝制造。

该芯片成功在单芯片上集成多个单元,微软预计几年内实现量子计算商用。

关键观点8: 法国WEST托卡马克装置创造等离子体持续运行新世界纪录。

核聚变领域进展迅速,但商业化发电仍面临技术瓶颈和经济可行性挑战。

关键观点9: 高盛认为DeepSeek等中国大模型将加速全球AI应用普及和对GDP的贡献。

目前美国企业在日常生产中使用AI的比例仍然较低,但预计AI将在未来十年内大幅提升美国劳动生产率。

关键观点10: 微软CEO纳德拉的最新观点包括谈DeepSeek突破、预测计算资源价格下降等。

他认为SaaS行业将被AI重塑,AI领域不会出现赢家通吃局面,开源模型会制衡闭源垄断。


正文

生成式AI

一、  Grok-3免费上线!答对9.11和9.9谁大,攻克MIT积分难题

1. Grok-3全面免费开放,搭载DeepSearch和Think两大模式,在开启Think模式后能正确判断9.11与9.9大小;

2. OpenAI研究员指控Grok-3在评测中使用64样本多数投票刷分,双方就此展开争论;

3. Grok-3展示出优秀的代码编写、长文本理解和图像生成能力,并计划推出高级语音功能。

https://mp.weixin.qq.com/s/Uia8h23AN4i4MB5ucaWqTA

二、  微软与Xbox首个AI游戏生成模型Muse,加速推进游戏生成

1. 微软与Xbox发布游戏生成式AI模型Muse,基于《Bleeding Edge》游戏数据训练,能实时生成游戏环境并理解3D物理规则;

2. 当前模型支持300×180像素分辨率输出,实时交互帧率10fps,可对玩家操作做出动态响应;

3. Muse计划应用于游戏跨平台复现、开发效率提升及创意拓展,但微软强调AI仅作为辅助工具,不会替代人类创意。

https://mp.weixin.qq.com/s/RqWrCV317c-yfbQ0j8ICEg

三、  首位「AI CUDA工程师」诞生!自己写代码优化CUDA内核

1. Sakana AI发布世界首个「AI CUDA工程师」,能将PyTorch代码自动转换为CUDA内核,性能提升10-100倍,还兼具内核优化和多运算融合能力;

2. 该系统通过LLM驱动的进化算法实现CUDA代码优化,同时构建了包含17,000余个已验证CUDA内核的开源数据集;

3. 研究团队认为AI系统效率仍有巨大提升空间,利用AI优化AI自身将是未来发展的关键方向。

https://mp.weixin.qq.com/s/10WcoPyp8ZNSLSuiGoqboQ

四、  谷歌 的AI co-scientist:可独立提出科学发现、研发新药物?

1. 谷歌基于Gemini 2.0发布多智能体AI系统"AI co-scientist",可独立提出科研假设并推荐实验方法,在多个生物医学领域已取得早期研究成果;

2. 系统采用多个专业化智能体协同工作,通过自我迭代和进化机制不断优化假设质量,其Elo评分与实际输出质量呈正相关;

3. 在急性髓性白血病药物再利用、肝纤维化靶点发现、抗菌素耐药性等领域的实验验证中,AI co-scientist展现出优秀的科研助手能力。

https://mp.weixin.qq.com/s/WIcSA5QWyQGWQQITzUcHMg

五、  对标DeepSeekR1,腾讯深度思考模型「混元T1」全面开放

1. 腾讯混元T1模型已对全部用户开放免费无限量使用,用户可通过腾讯元宝平台体验;

2. 混元T1与DeepSeek-R1同属于推理型模型,专注于处理复杂任务的深度思考能力;

3. 此外,腾讯元宝平台同时提供DeepSeek-V3和混元Turbo快速版供用户选择。

https://mp.weixin.qq.com/s/jkpJjbHaXWIHdGFl96d58A

六、  DeepSeek R1方法成功迁移到视觉领域?多模态AI迎来新突破!

1. VLM-R1项目成功将DeepSeek R1方法迁移至视觉语言领域,基于GRPO强化学习实现了优于传统SFT方法的性能;

2. 该模型在Qwen2.5-VL基础上展现出卓越的稳定性和泛化能力,尤其在领域外测试数据上持续提升;

3. 项目已完全开源,提供完整训练评估流程,在视觉识别、知识推理和文本表达等方面表现出色。

https://mp.weixin.qq.com/s/TZHdZ2H_-dkjzODr1dxjrw

前沿科技

七、  微软推出了其首款基于「拓扑体」的量子芯片Majorana 1

1. 微软发布全球首款拓扑架构量子芯片Majorana 1,通过创造新型拓扑体材料,实现了马约拉纳粒子的观察和控制;

2. 芯片采用砷化铟和铝制造,能在极低温下形成稳定的马约拉纳量子比特,已成功在单芯片上集成8个H型单元;

3. 微软预计几年内实现量子计算商用,目标是在单芯片上集成百万量子比特,计划2030年前通过Azure提供服务。

https://mp.weixin.qq.com/s/bFTSrbuA6J2p_YeIgDFaZQ

八、  法国核聚变重大突破,等离子体运行1337秒刷新世界纪录!

1. 法国WEST托卡马克装置创造等离子体持续运行1337秒新纪录,温度达5000万度,超越了此前中国EAST的1066秒;

2. WEST采用磁约束技术控制等离子体,证明了钨等特殊材料组件能在极端高温和辐射环境下长期稳定运行;

3. 多国核聚变领域进展迅速,但实现商业化发电仍面临技术瓶颈和经济可行性等挑战。

https://mp.weixin.qq.com/s/Zs2DSIdoCmnQ4Cj-BzvcZQ

报告观点

九、  高盛:DeepSeek等中国大模型,加速AI对全球GDP贡献

1. 高盛发布报告认为,DeepSeek等中国公司开发的低成本先进AI模型将加速全球AI应用普及,提升其对GDP的贡献;

2. 目前仅6%的美国企业在日常生产中使用AI,高盛预测AI可在十年内提升美国劳动生产率15%,年增GDP约4.5万亿美元;

3. 全球AI竞争加剧有望促进跨境合作、降低监管壁垒,美国将在2027年开始体现AI生产力提升,其他市场则晚几年。

https://mp.weixin.qq.com/s/Bea9pDoofvScZ5imdYI2lg

十、  纳德拉最新专访:谈DeepSeek突破,批AGI测试无意义

1. 微软CEO纳德拉认为AI、量子计算和混合现实(MR)是公司三大战略赌注,表示DeepSeek等突破将改变每个Token的性能效率前沿,带来更多需求;

2. 纳德拉评价微软首次实现"量子计算领域的晶体管时刻",首款Majorana 1芯片有望在2027-2029年集成百万量子比特;

3. 他预测计算资源价格会下降,SaaS行业将被AI重塑,AI领域不会出现赢家通吃局面,开源模型会制衡闭源垄断。

https://mp.weixin.qq.com/s/KPx32vwDnYM-z6ihIfsF4Q

👇订阅下方合集,获取每日推送

© 2024 精读
删除内容请联系邮箱 2879853325@qq.com