本文介绍了AI领域的最新进展,包括图像生成、语音合成、AI入驻智能经理、模型成本修正、自动化AI代理、AI代理评测基准、移动发行商收入榜单、AGI预测和安全策略,以及NotebookLM的新功能等。
即梦3.0模型能够在简单文字提示下生成高质量、细节丰富的图像,突破了复杂场景和细节的精准把控。ChatGPT的图片生成功能也得到了显著提升,特别是在中文文字生成方面。
饿了么推出的AI入驻智能经理简化了新商家的入驻流程,将商家上线外卖平台的时间缩短至最快5分钟。这一智能助手提供24小时服务,支持材料上传、实名认证等一站式入驻流程。
OpenAI的o3模型成本修正预计每项ARC-AGI任务的费用将达到30,000美元。谷歌DeepMind预测到2030年AGI可能会超过人类,并发布了相关的安全策略。
Genspark发布的自动化AI代理Super Agent具备自主思考、调用工具的能力,整合了8个大型语言模型,配备了超过80种工具,能够在多种场景下高效处理任务。OpenAI也推出了AI代理评测基准PaperBench,用于评估AI代理在复制先进AI研究方面的能力。
全球移动应用市场付费总额持续增长,OpenAI首次进入收入榜单。此外,谷歌DeepMind的战略文件指出当前机器学习方法可能是实现AGI的主要途径。
NotebookLM推出了“Discover sources”功能,用户只需输入主题,系统便能迅速找到相关网页并总结,用户可以一键将这些来源添加到笔记本中。
1、设计师天又塌了!即梦3.0内测:可直出2K商业海报
2、ChatGPT又更新了图片生成功能
3、饿了么推出“AI入驻智能经理” 新商家上线只需 5 分钟
4、Hugging Face 新增实用功能:一键查看电脑可运行模型
5、字节跳动在Hugging Face发布MegaTTS3:轻量化语音合成新突破
6、OpenAI 的 o3模型成本修正:每任务价格或将达到30,000美元
7、Genspark发布自动化AI代理Super Agent 具备自主思考、调用工具的能力
8、OpenAI推出AI Agent评测基准PaperBench
9、2024 年全球移动发行商收入榜单发布OpenAI 首次上榜
10、谷歌DeepMind预测:到2030年AGI 可能会超过人类并发布安全策略
11、NotebookLM 推出 “ Discover sources” 功能,输入主题系统自动搜集网络来源
1. 设计师天又塌了!即梦3.0内测:可直出2K商业海报
即梦3.0模型在图像生成领域取得了重大突破,能够通过简单的文字提示生成高质量、细节丰富的图像。其对复杂场景和细节的精准把控,使得生成的视觉效果超越了传统设计师的手工绘制水平。
亮点提要:
🖼️ 即梦3.0在图像质量上有重大突破,能够生成细节丰富的图像作品。
⚙️ 该模型在训练数据量和生成网络结构上进行了大幅改进,提升了用户意图理解能力。
⏱️ 从输入提示到输出成品仅需数秒,极大提升了创意迭代的效率。
2. ChatGPT又更新了图片生成功能
最近,ChatGPT的图片生成能力得到了显著提升,尤其是在中文文字生成方面。新版本不仅支持草书生成,还在细节渲染和对复杂指令的理解上有了明显改进。用户能够通过简单的描述生成高质量的图像,这一快速迭代的能力展示了OpenAI在算法优化上的深厚积累。

亮点提要:
🎨 新版ChatGPT支持草书生成,文字笔画完整且准确。
🛠️ 引入选区工具,用户可对图像特定区域进行精细调整。
🚀 细节渲染和色彩协调性有明显提升,满足用户需求。
3. 饿了么推出“AI入驻智能经理” 新商家上线只需 5 分钟
饿了么近期推出了“AI入驻智能经理”这一智能助手,旨在简化新商家的入驻流程。商家在启动外卖业务时,整个入驻过程可在最快5分钟内完成,极大地提高了效率。该助手提供24小时自然语言对话服务,支持商家完成实名认证、签约授权、材料上传等一站式操作,避免了以往繁琐的手动填写申请表的过程。

亮点提要:
🍔 饿了么推出 AI 入驻智能经理,商家上线外卖最快仅需5分钟。
🤖 该智能助手提供24小时服务,支持材料上传、实名认证等一站式入驻流程。
💰 饿了么计划在2025年前投入超10亿元,持续加强 AI 技术的应用支持。
4. Hugging Face 新增实用功能:一键查看电脑可运行模型
Hugging Face 推出了一个新功能,允许用户轻松查看其电脑硬件可以运行哪些机器学习模型。用户只需在个人设置中添加硬件信息,系统将智能分析并显示可运行的模型。这一功能简化了模型选择过程,特别对开发者和 AI 爱好者非常友好。

亮点提要:
🛠️ 用户可以通过设置添加硬件信息,系统将显示可运行的机器学习模型。
📊 该功能直观便捷,简化了开发者和研究人员的模型选择流程。
🔗 新功能与 Hugging Face 生态系统其他工具互补,提升开发效率。
5. 字节跳动在Hugging Face发布MegaTTS3:轻量化语音合成新突破
字节跳动在Hugging Face上发布了其最新的文本转语音模型MegaTTS3,吸引了全球AI研究者的关注。该模型以其轻量化设计和多语言支持而闻名,参数仅为0.45亿,适合资源受限的设备使用。
亮点提要:
🛠️ MegaTTS3是字节跳动与浙江大学合作开发的轻量级语音合成工具,参数仅为0.45亿,适合资源受限设备。
🌍 支持中英混合朗读和口音强度控制,用户可生成多样化的语音输出,满足个性化需求。
📥 开源代码和模型已在GitHub和Hugging Face上发布,推动AI技术的普及和创新。
详情入口:
🔗 https://huggingface.co/ByteDance/MegaTTS3
6.
OpenAI 的 o3模型成本修正:每任务价格或将达到30,000美元
Arc Prize Foundation对OpenAI即将推出的o3推理AI模型的成本估算进行了重大修正,预计每项ARC-AGI任务的费用将达到30,000美元,这一价格比最初的3,000美元高出十倍。尽管o3尚未正式发布,Arc Prize Foundation认为o1-pro模型的成本更能反映o3的真实情况。
亮点提要:
💸 成本修正:o3模型的每项ARC-AGI任务成本从3,000美元调整至30,000美元,显示出高昂的运行费用。
🖥️ 计算需求:o3high配置在解决ARC-AGI问题时所需计算量是o3low的172倍,反映出模型的复杂性。
📈 企业计划:OpenAI可能为企业客户推出高价计划,专业AI代理的月费或达2万美元。
7. Genspark发布自动化AI代理Super Agent 具备自主思考、调用工具的能力
Genspark最近推出了其全新的自动化AI代理Super Agent,凭借其强大的自主思考和任务执行能力,迅速成为行业的焦点。该系统采用了创新的多智能体混合系统设计,能够在多种场景下高效处理任务,从日常事务到复杂研究均展现出巨大潜力。

亮点提要:
🚀 Super Agent通过多智能体混合系统设计,整合了8个大型语言模型,提升了任务处理的灵活性和准确性。
🛠️ 该系统配备超过80种工具,能够与外部系统无缝交互,完成从信息检索到实际操作的全流程任务。
🔍 尽管Super Agent表现出色,但其具体实现细节尚未完全公开,未来在复杂任务中的表现仍需进一步验证。
详情入口:
🔗 https://top.aibase.com/tool/genspark
8. OpenAI推出AI Agent评测基准PaperBench
OpenAI团队推出了PaperBench基准测试,旨在评估AI代理在复制先进AI研究方面的能力。该测试要求AI代理从头开始复制20篇2024年国际机器学习会议的重点和口头论文,整个过程涉及理解论文贡献、开发代码库以及成功执行实验。研究团队设计了详细的评分标准,并开发了基于大型语言模型的自动评分系统。
亮点提要:
🌟 PaperBench是一个新基准,用于评估AI代理复制AI研究的能力,涉及20篇ICML2024论文。
🔍 该测试设计了8316个可单独评分的任务,评分标准与论文作者共同开发。
🤖 Claude3.5Sonnet是测试中表现最佳的模型,但仍未超越顶尖人类研究者。
详情入口:
🔗 https://github.com/openai/preparedness/tree/main/project/paperbench
9. 2024 年全球移动发行商收入榜单发布OpenAI 首次上榜
Sensor Tower发布的《2024年全球移动发行商收入 TOP50》榜单显示,全球移动应用市场付费总额首次突破1500亿美元,增长13%。腾讯继续稳居第一,字节跳动紧随其后,AI技术的崛起使OpenAI首次进入榜单,显示出其在用户分析和个性化推荐方面的进步。

亮点提要:
🎮 腾讯以绝对优势继续领跑全球移动发行商,得益于其丰富的产品线和庞大的用户基础。
📊 字节跳动通过TikTok的全球化战略实现了38.2%的收入增长,稳居第二。
🤖 OpenAI首次进入全球TOP50,显示出在用户分析和内容生成等领域的显著进步。
10. 谷歌DeepMind预测:到2030年AGI 可能会超过人类并发布安全策略
谷歌DeepMind最近发布了一份战略文件,详细阐述了其开发安全人工通用智能(AGI)的方针。AGI被定义为能够与人类在大多数认知任务中匹配或超越的系统。DeepMind预计,当前的机器学习方法,尤其是神经网络,将是实现AGI的主要途径。
亮点提要:
💡 AGI系统可能在2030年前超越人类能力,影响多个领域。
🔒 DeepMind关注防止AI滥用和目标错位,推出多层次安全策略。
⚡ 报告分析基础设施限制,认为继续扩展具经济可行性。
11. NotebookLM 推出 “ Discover sources” 功能,输入主题系统自动搜集网络来源
谷歌的NotebookLM推出了新功能“Discover sources”,旨在帮助用户快速获取网络上的相关信息。用户只需输入感兴趣的主题,系统便能迅速找到相关网页并总结,用户可以一键将这些来源添加到笔记本中,方便查阅。
亮点提要:
🌐全新功能: NotebookLM推出“Discover sources”,让用户能快速获取网络信息。
📝便捷操作: 用户只需输入主题,即可获得相关来源并一键添加到笔记本。
🔍趣味体验: 新用户可通过“我很好奇”按钮随机生成话题,体验系统功能