本文梳理了过去一段时间内关于人工智能领域的重大事件和发展,包括ChatGPT的两次宕机事件、小米搭建GPU万卡集群、比亚迪研发具身智能、xAI完成60亿美元C轮融资、阿里云通义发布多模态推理模型QVQ等。文章对这些事件进行了概述和解析。
OpenAI的ChatGPT在一个月内发生了两次宕机事件,一次是由上游提供商引起的连锁故障,另一次是由于新部署的遥测服务配置错误。这两次事件都导致了服务性能下降甚至完全不可用,持续时间超过四个小时。
小米正在着手搭建自己的GPU万卡集群,以大力投入AI大模型的研发。小米大模型团队在成立时已有6500张GPU资源,这表明小米在人工智能领域的投入正在不断增加。
比亚迪第十五事业部成立了一个专门的团队研发具身智能,主要目标是工业机器人落地,形式为AGV(类轮式移动机器人)。其余具身形态还在预研阶段。
马斯克创立的xAI完成了60亿美元的C轮融资,这将用于进一步加速其先进基础设施的建设,推出将被数十亿人使用的突破性产品,并加速未来技术的研发。
阿里云通义千问发布了业界首个开源多模态推理模型QVQ-72B-Preview,具备视觉理解和推理能力,可解决数学、物理、科学等领域的复杂推理问题。该模型在评测中表现优异,引发了行业关注。
整理|吴莹
ChatGPT一个月宕机2次;小米正搭建GPU万卡集群;消息称比亚迪成立未来实验室研发具身智能;马斯克旗下xAI宣布完成60亿美元C轮融资;阿里云通义发布首个多模态推理模型QVQ;谷歌被曝使用Anthropic的Claude模型训练AI;智谱开源GLM-PC基座模型CogAgent-9B;英伟达已初步敲定GB300订单配置……
12月27日凌晨,OpenAI宣布,聊天机器人ChatGPT、视频生成模型Sora和API产生了重大错误,大部分已经宕机数小时,但已经确定了问题所在,并已开始着手恢复。OpenAI随即给出报告指出,ChatGPT、API和Sora目前的错误率很高,该问题是由上游提供商引起的。
最近的一次大规模宕机发生在12月11日,发布Sora后几天,OpenAI旗下所有服务,包括ChatGPT、API和Sora,在太平洋时间12月11日下午3:16至晚上7:38期间经历了严重的性能下降甚至完全不可用,持续时间超过四个小时。这次宕机是由于新部署的遥测服务配置错误,导致全球数百个Kubernetes集群的控制平面超载,进而引发关键系统的连锁故障。
12月26日,记者获悉,小米正在着手搭建自己的GPU万卡集群,将对AI大模型大力投入。小米大模型团队在成立时已有6500张GPU资源。记者据此向小米方面求证,截至发稿,小米暂未置评。
一名知情人士表示,该计划已经施行数月之久,雷军在其中扮演了重要的领导角色。“在AI硬件这件事情上,最核心的是手机而不是眼镜,小米在这个领域不‘all in’是不可能的。”12月26日,有媒体援引独立信源消息称,比亚迪第十五事业部成立了一个专门的团队研发具身智能,事业部最高负责人罗忠良直接主管该项目。
知情人士透露,第十五事业部今年上半年进行了组织架构调整,事业部旗下科技研究院拆分出一部分员工成立人工智能实验室,后更名未来实验室,定位做具身智能,包含机器人,目前正在大规模招揽相关人才。两名通过面试的人员透露,目前实验室初期的目标是工业机器人落地,主要形式为AGV(类轮式移动机器人),其余具身形态还在预研阶段。12月24日消息,马斯克创立的xAI宣布完成60亿美元的C轮融资。本轮融资吸引了众多知名投资机构和科技巨头的参与,包括a16z、贝莱德、富达管理与研究公司、王国控股、光速创投、MGX、摩根士丹利、OIA、卡塔尔投资局(QIA)、红杉资本、Valor Equity Partners以及Vy Capital等。值得注意的是,英伟达和AMD也参与了本轮投资。
这是xAI在今年5月完成上一轮60亿美元融资后的又一次大规模融资。xAI在其融资公告中表示:“本轮融资将用于进一步加速我们先进基础设施的建设,推出将被数十亿人使用的突破性产品,并加速未来技术的研发,以实现公司理解宇宙真正本质的使命。”
12月25日,阿里云通义千问发布业界首个开源多模态推理模型QVQ-72B-Preview,具备视觉理解和推理能力,可解决数学、物理、科学等领域的复杂推理问题。在聚焦数学的视觉推理测试MathVista中,QVQ得分超过OpenAI o1;在更具多样性和学科广度的MathVison评测中,QVQ表现超越Claude3.5及GPT4o。据TechCrunch获得的内部通信内容,参与改进谷歌Gemini人工智能模型的承包商正在将其答案与Anthropic的竞品模型Claude的输出进行比较。此举引发了谷歌是否获得Anthropic授权使用Claude进行测试的合规性质疑。
Anthropic的商业服务条款禁止客户未经Anthropic批准访问Claude“以构建竞争产品或服务”或“训练竞争AI模型”。谷歌是Anthropic的主要投资者。对此,谷歌DeepMind发言人表示,DeepMind确实会“比较模型输出”以进行评估,但并未在Anthropic模型上训练Gemini。智谱技术团队公众号12月26日发布博文,宣布开源GLM-PC的基座模型CogAgent-9B-20241220,基于GLM-4V-9B训练,专用于智能体(Agent)任务。
该模型仅需屏幕截图作为输入(无需HTML等文本表征),便能根据用户指定的任意任务,结合历史操作,预测下一步的GUI操作。得益于屏幕截图和GUI操作的普适性,CogAgent可广泛应用于各类基于GUI交互的场景,如个人电脑、手机、车机设备等。英伟达预计明年3月GTC大会揭露下世代GB300 AI服务器产品线,鸿海等供应商近期已进入GB300研发设计阶段。据悉,英伟达已初步拍定GB300订单配置,鸿海仍是最大供应商,预计明年上半年推出实机面市。业界人士透露,广达、英业达也是英伟达GB300重要伙伴,订单份额上,广达仅次于鸿海,为第二大供应商,英业达订单比重则较GB200显著拉升。