本篇文章总结了关于生成式AI、模型发布、音乐推理模型、模型更新、AI自动化工具、实体清单、机器人进化、高性能3D打印机和WIRED调查报告的相关内容。
OpenAI发布GPT-4o原生多模态图像生成功能,支持逼真图像生成;GPT-4o取代了DALL-E 3成为ChatGPT默认图像引擎,具有精准渲染文字、执行复杂指令等能力。
谷歌发布Gemini 2.5 Pro"思考"模型,一经上线即创下Arena排行榜最大分数飞跃;新模型在编程、数学等基准测试中表现卓越,已向用户开放。
昆仑万维发布全球首款音乐推理大模型Mureka O1,在音乐结构连贯性和乐器编排精准度方面实现突破。
腾讯元宝同时发布两款模型更新,包括混元T1正式版和DeepSeek V3;DeepSeek V3最新版在HTML等前端代码任务表现更出色,推动了商业化应用。
AI自动化工具n8n完成B轮融资,估值约2.7亿美元;该平台现有3000多家企业客户和约20万活跃用户,融资将用于技术投资和市场扩张。
美国商务部将54家中国实体列入出口管制实体清单,涉及大模型、高性能计算和量子技术领域;这可能对相关领域的科技发展带来一定影响。
Figure机器人通过纯强化学习算法实现了自然流畅行走;团队成功解决"Sim-to-Real"难题,展示了自主研发路线的可行性。
拓竹科技发布高性能3D打印机H2D,具备工业级精度和消费级价格;新机型推动了桌面级制造进入"工业级桌面化"新阶段。
调查显示,大部分软件工程师尝试过AI编程助手,但对AI未来的态度存在分歧;不同资历的程序员对AI的态度存在差异,独立开发者比公司员工更青睐AI。
生成式AI
一、 跳票近一年!OpenAI终于上线GPT-4o 直接一句话生图功能
1. OpenAI发布GPT-4o原生多模态图像生成功能,支持一分钟内生成逼真图像,取代DALL-E 3成为ChatGPT默认图像引擎;
2. 新功能优势包括精准渲染文字、执行复杂指令、保持视觉一致性和支持多种艺术风格,已向大部分用户开放;
3. 技术突破源于人类训练师标注工作和RLHF技术,但仍存在裁剪、非拉丁字符准确性等局限性。
https://mp.weixin.qq.com/s/Evm4c1i_omfsXZSKwQq6CA
二、 Gemini 2.5 Pro发布即屠榜,「思考」模型专为复杂任务打造
1. 谷歌发布Gemini 2.5 Pro"思考"模型,一经上线即创下Arena排行榜历史最大分数飞跃,比竞品高出40分,横扫多个基准测试榜单;
2. 新模型推理能力显著增强,在编程、数学和科学基准测试中表现卓越,能通过简单提示词生成复杂动画和游戏代码;
3. Gemini 2.5 Pro保留了原生多模态和100万token上下文长度优势,已向Gemini Advanced用户开放,未来将支持200万token。
https://mp.weixin.qq.com/s/20PiTyIXYmdEE8joQtWNYQ
三、 音乐界迎来自己的DeepSeek!首个音乐推理模型Mureka O1
1. 昆仑万维发布全球首款音乐推理大模型Mureka O1,引入CoT技术使AI音乐"会思考",在多项评测中力压Suno V4登顶TOP 1;
2. Mureka O1基于升级版基座模型V6开发,支持10种语言创作,在音乐结构连贯性和乐器编排精准度方面实现巨大突破;
3. 创新MusiCoT框架让模型先预生成音乐结构再精细填充细节,并提供多轨分离下载功能,同时开放API服务推动商业化应用。
https://mp.weixin.qq.com/s/5anNt3afJO1KXkE8zcY1TA
四、 元宝重大更新:混元T1正式版+新DeepSeek V3一次给足
1. 腾讯元宝同时发布两款模型更新:自研深度思考模型"混元T1"正式版和"DeepSeek V3-0324"最新版本;
2. 混元T1正式版相比Preview版本响应速度更快、吐字更快、推理能力更强,并大幅提升了长文处理效率;
3. DeepSeek V3最新版在HTML等前端代码任务表现更出色,代码可用性更高,并提升了中长篇文本创作质量。
https://mp.weixin.qq.com/s/Hw2NkVYH0LZOlciIVwLj6g
五、 AI自动化工具n8n获6000万美元融资,估值2.7亿美元
1. AI自动化工具n8n完成5500万欧元(约6000万美元)B轮融资,估值约2.7亿美元,Highland Europe领投,红杉资本等参与;
2. n8n是基于"公平代码"构建的工作流自动化平台,2022年对平台进行AI友好化调整后收入增长5倍,近两月翻番;
3. 该平台现有3000多家企业客户和约20万活跃用户,75%客户使用其AI工具,融资将用于技术投资和美国以及新兴市场扩张。
https://mp.weixin.qq.com/s/DOlReDJkmA2EAGbMlcitmQ
六、 大模型、高性能计算、量子相关54家中国实体列入实体清单
1. 美国商务部工业与安全局将54家中国实体列入出口管制实体清单,涉及大模型、高性能计算和量子技术领域;
2. 12家大模型和高性能计算领域企业被列入,包括北京智源人工智能研究院、浪潮集团旗下六家子公司、宁畅信息产业和中科可控旗下服务器品牌Suma;
3. 其余42家实体主要涉及量子技术领域,包括中国航空工业集团、重庆西南集成电路设计等企业及高校,正式文档计划于3月28日发布。
https://mp.weixin.qq.com/s/z9GJwWjT9m9ehbPtVHvIfQ
前沿科技
七、 抛弃 OpenAI 后,Figure 机器人再「进化」:像人一样行走!
1. Figure宣布其机器人Figure 02通过纯强化学习算法实现了像人类般自然流畅行走,这是该公司终止与OpenAI合作后的重要进展;
2. Figure采用端到端神经网络和强化学习技术,让机器人自主掌握行走技巧,不依赖预编程步态,通过模拟环境训练和奖励机制模仿人类步态;
3. 团队成功解决"Sim-to-Real"难题,采用域随机化和高频扭矩反馈控制实现零样本迁移,使十台机器人能用同一神经网络运行,展示了自主研发路线的可行性。
https://mp.weixin.qq.com/s/z1JgP8NvbXWi2keyI9jABg
八、 拓竹新款高性能3D打印机H2D发布,大众智造时代已来
1. 拓竹科技发布融合工业级精度与消费级价格的高性能3D打印机H2D,售价11999元起,预售500台几分钟内全部售罄;
2. H2D配备双喷嘴伺服系统、350×320×325mm³大成型体积、65°C主动腔温加热和350°C高温热端,支持"4进2出"多材料切换;
3. 新机型可选配10W或40W激光雕刻切割模块,采用工业级光学校准系统,实现尺寸误差小于0.1mm,被视为推动桌面级制造进入"工业级桌面化"新阶段。
https://mp.weixin.qq.com/s/sDPAoqLP1EkvKxUy4BvC-g
报告观点
九、 解读WIRED 调查报告:软件工程师们究竟怎样使用AI?
1. 根据WIRED调查,四分之三程序员已尝试AI编程助手,17%全天候使用,但对AI未来的态度呈三分天下:35.6%乐观,38.4%悲观,26%中立;
2. 不同资历程序员对AI态度差异明显:75%初级程序员持乐观态度,近半数中级开发者表示悲观,资深工程师则乐观与谨慎并存;
3. 独立开发者比公司员工更青睐AI,程序员普遍认为AI提高效率并减少琐碎工作,但也担忧过度依赖导致技能退化和初级岗位减少。
https://mp.weixin.qq.com/s/W1SQj1xp6Pbv2LJKXtJsRw
👇订阅下方合集,获取每日推送