本文报道了关于AI领域的多个进展和创新,包括国产机器人公司的推出、AI技术的商业化应用、开源项目的推出以及投融资情况。同时,还介绍了多个AI相关产品的特点和功能。
众擎机器人推出SE01人形机器人,具有步态拟人、成本低等特点,掀起国际关注。产品性价比高,除SE01外还推出其他几款机器人。公司创始人背景深厚,具备强大的机器人研发经验。
AI正在赋能千行百业,生产效率提升点燃科技大爆炸时代。AI走向应用落地阶段,硬件智能化再升级。训练“大脑”是大模型的核心,感知、记忆与执行是AI终端核心。
Arxiver开源项目包含大量arXiv论文,推动学术研究进展。Micro Diffusion开源项目让人人都能训练扩散模型,降低成本。vdr-2b-multi-v1模型专为处理多语言文档设计。
介绍了Lingocat AI语言导师、Reset焦虑思绪应对应用、一目科技的多模态感知与AI计算解决方案等产品的特点和功能。
一目科技完成数亿元D轮融资,投资方包括赛富投资基金、南京市创新投资集团和松霖科技等。融资资金将用于提升多模态感知技术、AI计算能力,并加速在具身智能等应用领域的拓展。
我们希望能够搭建一个AI学习社群,让大家能够学习到最前沿的知识,大家共建一个更好的社区生态。
https://www.feishu.cn/community/article/wiki?id=7355065047338450972
点击「订阅社区精选」,即可在飞书每日收到《大模型日报》每日最新推送
学术分析报告:ResearchFlow -- 奇绩F23校友的开发的深度研究产品,PC端进入RFlow的分析报告,可直接点击节点右侧的小数字展开节点,登录后可在节点上直接“询问AI”,进一步探索深度信息如果想和我们空间站日报读者和创作团队有更多交流,欢迎扫码。
欢迎大家一起交流!
资讯
o1不是聊天模型
o1 是 OpenAI 推出的系列模型之一,但许多用户在体验之后发现,o1 并没有达到宣传中的效果。以曾任 SpaceX 软件工程师的 Ben Hylak 为例,他反映使用 o1 时,常常遇到自相矛盾的输出,且输出内容与请求无关。最初,Hylak 对模型的失望甚至直言其为“垃圾”。但随着对模型使用的深入,他意识到自己犯了个错误——他将 o1 误当作聊天模型使用。o1 实际上不是设计来进行反复对话的模型,而是适用于需要大量上下文并能一次性完成任务的场景。对于有效使用 o1,用户需要提供足够的背景信息和上下文,不像与聊天模型的迭代交互。用户应将 o1 当作新入职的员工来对待,提供尽可能详细的背景说明,并清晰表达所需输出。o1 模型的强项在于其处理大量代码或文本的能力,能够在一个请求中一次性完成复杂任务。它尤其擅长于报告生成、代码补全、医学诊断等领域。然而,o1 对于需要特定语气、风格或长期迭代的任务表现不佳,例如写作风格或构建复杂应用程序。虽然 o1 能快速处理工程问题,但对于需要细致推敲的任务,它的表现可能不尽如人意。Hylak 将 o1 称为“报告生成器”,而非聊天模型。他认为,o1 适合用于那些能够接受一定延迟的应用场景,例如长时间运行的后台智能系统。其独特的长时间延迟特性,可能使得一些全新的产品和服务成为可能。国产机器人“众擎SE01”登场:成本低、步态拟人,掀起国际关注
深圳一家成立不到1年半的机器人公司“众擎机器人”推出了其最新旗舰型号SE01人形机器人,引起了国内外广泛关注。SE01在步态、速度和稳定性方面表现出色,仿人走路的能力几乎无差别,甚至能做俯卧撑等高难度动作,震惊业内外。机器人的售价预计将控制在15万元以内,且已计划两个月后进行小规模商用。该产品的开发团队由小鹏机器人(鹏行智能)核心技术人员组成,商汤科技也参与了投资,表明其背后有着强大的技术支持。众擎机器人的SE01拥有32个自由度,体重大约55公斤,采用航空级铝材,具备2米/秒的行走速度和2小时的电池续航能力。它搭载英伟达和英特尔的处理器,配备360度激光雷达和6颗高清摄像头,支持3D感知与避障导航。尽管机器人的步态和运动能力堪比真人,但在公开展示中,偶尔出现了跌倒等不稳定现象。值得一提的是,众擎机器人的产品性价比非常高。除SE01外,该公司还推出了其他几款机器人,如售价仅为3.85万元的SA01,专为科研和教育场景设计。该款机器人采用自研电机和开源运动算法,支持单腿站立、跳跃等复杂动作,并且提供高度扩展性,适用于多种机器人开发需求。众擎机器人成立于2023年,由赵同阳创立,赵曾是小鹏旗下鹏行智能的创始人。公司在成立不到一年内完成了天使轮融资,融资金额接近亿元,且获得了商汤科技和国香资本的支持。创始团队背景深厚,成员多来自于鹏行智能和优必选等知名公司,拥有强大的机器人研发经验。凭借其出色的机器人产品和创新的技术路线,众擎机器人正在吸引越来越多的国际关注,并有望成为未来智能机器人市场中的重要玩家。科技革命提升效率,开启AI与智驾落地之时
■科技革命开始加速,特朗普当选成新变数。近年来新能源、商业航天、量子技术的突飞猛进,尤其是AI大模型,令人类对能动、时空、物质、智慧4方面的能力大幅提升,大有开启全维度科技加速之势,对生产力与社会关系将起到深远影响。西方白左主义(WesternWokeism)逐渐走向极端,唐纳德·特朗普(Donald Trump)的胜选,推动产业重构与科技加速。2025年,密切关注以下领域的创新加速:
■生产效率提升点燃科技大爆炸时代,多维度创新更值期待。AI赋能千行百业,Scaling Law边际效益显著递减,大模型由训练转入推理与应用落地的阶段。1、 拜登重视AI安全,特朗普欲放宽监管;联邦政府赤字高涨,马斯克领衔提质增效;AI应用软件频获政府订单,开启DOGE变革。2、 AI走向终端推理,硬件智能化再升级;电子全产业链卷入AI浪潮,受益弹性各有差异。3、 训练“大脑”是大模型的核心,感知、记忆与执行是AI终端核心。4、 自研ASIC性价比高,推理应用改善ROIC;AI训练规模化通用,终端推理形态多样;“存算墙”导致延迟与功耗双增加,存算一体与AI匹配度高。5、 AI算力激增,电网压力堪忧;核电重启,SMR最理想;新型稳定清洁能源,探索尝试再突破;变电供能,保障稳定。■OpenAI创始成员+胜选功臣,马斯克深入布局AI。马斯克以理解宇宙本质为愿景创建xAI,所训Grok-2大模型初露锋芒,xAI“大脑”唤醒特斯拉“身体”,加速Optimus和Neuralink崛起。■监管放松自动驾驶或迎来新契机,特斯拉FSD推动Robotaxi落地。特斯拉FSD积累训练,厚积薄发持续引领,AI助力加速迭代,软硬协同提升。特斯拉FSD算法迭代路径从HydraNets到BEV (Bird’s-Eye-View) + Transformer,再到Occupancy Network现至End-To-End。自动驾驶软硬件迭代愈发成熟,Robotaxi应运而生,挑战虽仍在,重在再权衡,Robotaxi业态迎突破,聚焦运营新变革。
https://mp.weixin.qq.com/s/BiLIEr-vnmegGxvWvEUDnA
推特
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格式
Micro Diffusion开源:任何人都可以使用8张H100 GPU在仅需2.5天内从头训练出Stable Diffusion v1/v2质量的模型
遵循完全开源的理念,我们已经发布了官方的训练代码、数据代码以及模型检查点(ckpts),用于从零开始以微预算训练扩散模型(MicroDiTs)。现在,任何人都可以使用8张H100 GPU在仅需2.5天内从头训练出Stable Diffusion v1/v2质量的模型(成本低于2000美元)。GitHub链接: https://github.com/SonyResearch/micro_diffusion模型检查点: https://huggingface.co/VSehwag24/MicroDiThttps://x.com/VSehwag_/status/1878575242077253932
vdr-2b-multi-v1:完全开源的视觉嵌入模型,专为处理最复杂的多语言文档设计
推出 vdr-2b-multi-v1 —— 一个完全开源的视觉嵌入模型,专为处理最复杂的多语言文档设计 🧿🖼️📊文档搜索和检索正日益转向多模态化,因为越来越多的公司正在构建自主文档工作流。现有的大多数 RAG、OCR、IDP 等管道主要依赖于文本处理,但这本质上会导致信息丢失——而大量信息通常被锁定在非结构化文档的视觉格式中。https://x.com/jerryjliu0/status/1878491439291842618
Gooefire AI开源适用于 Llama 3.3 70B 和 Llama 3.1 8B 的稀疏自编码器
我刚刚编辑了我的讲座《RAG初学者指南》,并上传到了YouTube。这是我去年五月讲的一堂课。你喜欢吗?如果喜欢的话,我会在空闲时间继续编辑并上传更多类似的讲座。链接在下方评论区👇https://x.com/ProfTomYeh/status/1878501208777793965
一图解释RAG与Agentic RAG
https://x.com/DailyDoseOfDS_/status/1878380541193667047产品
Lingocat AI 语言导师
Lingocat 是一款语言学习应用,可通过与 AI 语言导师进行互动练习来更快地提升语言流利度。其课程遵循语言教学最佳实践,旨在尽快提升用户的口语交流技能。- 结构化课程:通过多种用于对话练习的课程提升你的口语自信,让你在不同场景中保持参与度。
- AI 语言导师:当你犯错时,AI 语言导师会实时提供反馈,并给出有用的建议和指导。
- 进度追踪器:追踪你迈向流利的进度,每次在对话中成功使用一个新单词,你都会在每节课中获得积分!
- 依赖语境的提示:通过动态提示学习如何说新短语以及回应各种问题,帮助你用目标语言组织回答。
- 词汇追踪器:查看你已经学会说的单词数量,每次在课程中说出一个新单词,它都会更新。
https://getlingocat.com/?ref=producthunt
Reset 用AI挑战你的焦虑思绪
问题:当涉及到我们的焦虑思绪时,很难保持专注和客观。我们忘记了我们的想法并不总是真实的,而相信它们往往会导致不必要的压力。解决方案:Reset 帮助你养成识别和挑战焦虑思绪的习惯。倾诉你心中所想,AI 将使用经过验证的认知行为疗法(CBT)技术客观地评估你的想法,以帮助你保持更平衡的视角。- AI 评估:通过 AI 使用 CBT 技术客观评估用户倾诉的想法。
- 洞察触发因素:让用户深入了解焦虑中反复出现的触发因素和主题。
https://www.resetapp.co.uk/?ref=producthunt 投融资
00Arxiver开源:包含 138,830 篇 arXiv 论文的多Markdown格式
一目科技完成数亿元D轮融资
近日,多模态感知与AI计算解决方案提供商一目科技完成数亿元D轮融资,本轮由赛富投资基金领投,南京市创新投资集团和松霖科技跟投。融资资金将用于提升多模态感知技术、AI计算能力,并加速在具身智能等应用领域的拓展。一目科技自2015年在硅谷成立以来,已累计完成五轮融资,投资方涵盖顺为资本、投控东海、TCL等多个企业背景的投资机构。公司专注于开发微光谱AI芯片和流体识别传感器,打造多模态感知与AI计算解决方案,将物理世界信号转化为数字信号,应用于家电、水务、机器人和生命科学等多个行业,助力智能升级。目前,一目科技的技术已广泛应用于智慧水务、智慧家居和生命科学等领域,并进入TCL、惠而浦、松下等头部家电企业的供应链。公司创始人李智强博士曾是卡内基梅隆大学的研究员,致力于大数据、AI模型、微流控生物传感器等领域的研究,并在高端光谱仪市场实现国产替代,推动技术在市政水务和实验室等领域的应用。在刚结束的CES 2025展会上,一目科技推出了其AI洗护机器人,该机器人结合了自主研发的衣物洗护识别AI多模态模型及视觉和光谱感知技术,能智能识别衣物的材质、颜色、数量和污渍,并调节洗涤程序。李智强表示,这一模型是行业内首个针对洗护场景的专有多模态模型,能够通过对100万样本数据的学习和分析,实现精准的光电数据信号识别。一目科技的技术平台包括光谱传感技术和AI算法,并已获得超过200项国内外专利、61项软件著作权,以及12项国际奖项。公司在智慧水务和智慧家居领域取得了稳固的市场基础后,正在加速向生命科学和具身智能领域拓展。特别是在生命科学方面,一目科技通过高通量光谱检测仪和AI药物分析模型,正在加速药物研发过程,缩短临床前研究周期。此外,一目科技还计划于2025年推出针对人形机器人的触觉感知传感器和算法解决方案,专注于提升机器人的触觉感知能力,瞄准未来万亿级的机器人市场,推动AI和机器人技术在人类场景的演进。通过持续积累应用数据和强化AI算法能力,一目科技将不断巩固其技术壁垒,并在多个领域开辟新的增长点。--- END ---
快速获得3Blue1Brown教学动画?Archie分享:使用 Manim 引擎和 GPT-4o 将自然语言转换为数学动画