o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2（微信文章未删减版）

主要观点总结

文章介绍了OpenAI的o1模型泄露事件，包括模型的功能特点以及网友们的反应。OpenAI的o1模型在ChatGPT官网上被泄露，具有图像推理能力并支持上传附件。有网友测试后发现模型具有惊艳表现，但也有错误情况。此次模型泄露事件持续了3个小时，引发网友对模型预期的猜测和讨论。同时，文章还提及了量子位2024人工智能年度评选活动。

关键观点总结

关键观点1: OpenAI的o1模型泄露事件

介绍了OpenAI的o1模型在ChatGPT官网上被泄露的情况，包括模型的图像推理能力和上传附件功能。

关键观点2: 网友对o1模型的测试与反馈

描述了网友对o1模型的测试情况，包括惊艳表现和错误情况，以及网友对模型预期的猜测和讨论。

关键观点3: 模型泄露事件的影响

分析了此次模型泄露事件对网友和业界的影响，包括引发网友热议和对即将发布的模型的预期。

关键观点4: 量子位2024人工智能年度评选活动

介绍了量子位2024人工智能年度评选活动的相关信息，包括报名通道、奖项设置和评选结果公布的时间。

正文

鱼羊发自凹非寺
量子位 | 公众号 QbitAI

o1满血版泄露了！

没想到，OpenAI还搁那儿“今年一定”呢，不少网友已经率先上手体验到了（doge）。

事情是酱婶的：有网友发现，OpenAI已经在ChatGPT官网上部署了完整版o1，大家伙儿还都能卡bug直接用！

最初发现此事的网友，测试确认泄露模型具有奥特曼所说的图像推理能力。

△图源：𝕏@legit_rumors

而日志也显示该模型就是o1本模。

于是，赶在OpenAI出手修复之前，网友们抓紧大玩特玩了一波——

满血o1到底有多牛

和已经发布的o1-preview、o1-mini最直观的不同是，泄露出来的o1支持上传附件。

这也就意味着，终于能测测o1的多模态能力了。

网友们也不说废话，直接上强度，普特南数学竞赛的证明题截图一贴，甩给满血o1。

对正整数n，有fn(x)=cos(x)cos(2x)cos(3x)…cos(nx)。找出最小的n，使得|fn^‘’(0)|＞2023。

思考了18秒之后，o1给出答案：18。

答案正确：

再来一道更复杂的，虽然在识图上遇到了一点小问题，但还是稳稳做对了。

在如此惊艳表现之下，似乎正确识别人类史上首张黑洞照片也不算什么了（doge）。

不过嘛，也不是没有翻车案例。比如，让大模型数数图里有多少个三角形。

ID为anagh的𝕏网友，给泄露模型和GPT-4o做了个同屏对比：

4o速度很快，给出了错误答案19。

而满血o1花了1分39秒，狂刷一堆token……给出了不同的错误答案：29。

正确答案是24。

这个bug现在已经修复了。不过，有意思的是，这次模型泄露，持续了整整3个小时。

不小心还是故意的？

有网友犀利地点出，这事儿看上去不是“不小心”，而是“精心策划”：

目的是让人们对即将发布的模型有一个预期。

不少网友赞同这样的观点：

奥特曼的目的是测试和炒作。

而由于一切看上去已经部署就绪，甚至有人猜测，o1完整版的正式上线时间就在未来一周之内。

值得注意的是，就在这次泄露事件之后，奥特曼马上在𝕏上开始了自己的表演：

好家伙，都已经吹上o2的风了（还假装上错号……）。

至于为什么是这个时间……

那不得赶在Anthropic发布Claude Haiku 3.5之前搞点事嘛（doge）。

参考链接：
[1]https://x.com/legit_rumors/status/1852625385801859321
[2]https://x.com/koltregaskes/status/1852657291469709626
[3]https://x.com/anaghnairr/status/1852668741751919016

— 完 —

评选征集中

「2024人工智能年度评选」

量子位2024人工智能年度评选已开启报名通道，评选从企业、人物、产品三大维度设立了5类奖项。

欢迎扫码报名评选！评选结果将于12月MEET2025智能未来大会公布，期待与数百万从业者共同见证荣誉时刻。

点这里👇关注我，记得标星哦～

一键三连「点赞」、「分享」和「在看」

科技前沿进展日日相见 ~

o1满血版泄露！奥数题图片推理手拿把掐，奥特曼上线剧透o2