正文

在2024年6月，阿里的Qwen2发布的时候，我说目前中国大模型跟美国大模型的代差不到一年，当时我还被人嘲讽来着。万万想不到的是，短短半年之后，中国的AI已经有了反超的趋势，实在是可喜可贺。

中国的大模型卷到什么程度？DeepSeek在1月20日发布了R1开源模型，性能堪比OpenAI o1，而且他的思维过程是开放的，可参考性非常强，这是继阿里的Qwen2登顶全球开源大模型之后，中国的开源大模型首次打破了OpenAI等闭源模型的技术封锁，成为世界第一。

短短两年，全球的大模型行业已经卷成了中美两国顶尖企业角力的情况，在匿名的大模型竞技场上，前十名一共有13个大模型，其中中国有四个企业共5个大模型入围，包括阿里巴巴的Qwen2.5-Max、Deepseek的R1和V3两个大模型，以及智谱科技的GLM4-Plus、阶跃星辰的Step-2；美国有两家共8个大模型入围，只剩下Google和OpenAI两家企业。

优势竟然在我？优势的确在我国。这是一个非常可喜可贺的事情，意味着中国的技术创新速度将会反超美国了。而且Deepseek、Qwen、GLM等都是开源的，特别是Deepseek发布的基于思维链R1的技术报告，现在已经有4-5家企业和学校开始照猫画虎的复现了，意味着我们将迎来新一波的人工智能技术井喷。如果你问大模型的快速发展对我月薪3000有什么用？那我只能说，只要大模型技术更进一步，你就能用极低的成本获得一个高度忠诚、智能的助手和管家，他不但能够帮你打理杂务，帮你赚钱，甚至还能帮你进行健康护理，规避风险甚至规避诈骗的。

旅行和医疗助手

这次我选择了最新的大模型，是阿里在25年除夕之夜发布的Qwen2.5-Max大模型，我让他们帮我规划一次日本的旅行计划，并且把旅行者的病史提供给AI，让AI给我建议。

1、提供基础信息

首先把旅行者的基础情况提供给大模型：

你是一个非常资深的全科医生，我是旅行社的导游。目前我们准备去日本旅行。

有一位女性旅客60岁，有基础病史，有糖尿病，抵抗力一般。我想知道日本最近（2025年1月）是否有流行病爆发？我还应该注意点什么？

然后大模型给了一个提醒：提醒旅客日本冬季是流感高发季节，每年12月至次年3月为流感高峰期。需要关注日本厚生劳动省或当地卫生部门发布的最新动态。

因为Qwen2.5-Max刚推出的时候没有接入网络搜索功能，但是现在已经可以啦。直接去chat.qwenlm.ai就可以体验包括Qwen-2.5-max在内的最新模型。

但是对于我这种IT开发者来说，还有更方便的工具的。我用Cline这个插件，接入了Qwen2.5-Max的API接口，实现了我口述任务，AI帮我写代码、执行代码、查看文档等任务，我的任务是一边中美对账，一边抽空看一下程序跑到什么程度了。

日本的流感报告网站自动化找到了。インフルエンザに関する報道発表資料｜厚生労働省^[1]。如果让我自己搜索，因为我不懂外国语言，其实我是很难快速找到这个网页的。但是AI编程工具改变了这个现状。

根据Qwen2.5-Max提供的网站我很快就找到了相关内容，不过着实给我吓了一大跳，在12月8日的一周内，日本流感确诊人数为4万4673人，比前一周增加约2万病例，目前全国估计有34万7000名旅客。日本流感与冠病疫情升温当局吁民众戴口罩^[2]

然后等到2025年1月9日，日本厚生劳动省的统计显示，截至2024年12月29日的一周内，全国约5000家医疗机构报告的季节性流感旅客数为每家医疗机构64.39人，已连续10周增加，是自1999年以来感染人数最多的一次。等于一周就新增了32万人！

等到2月初的报道，就已经提到了日本有950万人患有流感，药品急缺，医院的承载力也爆表了。

在这种情况下，一个有基础病史、身体虚弱的中老年人，其实是没必要去日本凑这个热闹的。

2、要不要去日本

我把搜索到的日本流感情况发给了Qwen2.5-Max，他给的重要信息是：

1)、在流感高峰期，日本的医疗机构可能面临较大的压力，急诊科和门诊可能会人满为患。

2)、如果您的旅行目的是休闲娱乐（如观光、购物、美食体验），考虑到当前的流感疫情，这些活动可能无法带来预期的愉悦感，反而增加了感染风险。

3)、如果一定要前往，请携带您日常服用的药品，还有充足的口罩。

4)、强烈建议推迟旅行计划，或者去流感感染率较低的国家旅行。

后面还可以问很多关于旅行相关的问题，比如询问如何就医：

在日本北海道泡温泉，如果我感冒了，身体很不舒服，我应该如何在日本北海道当地就医？

比如要不要去大城市：

prompt：如果旅客的状态非常不好，有高烧。北海道当地的医疗条件好不好，要不要去附近的大城市治疗？

比如如果感染甲流怎么办：

prompt：如果大医院诊断旅客感染了甲流，但是又面临医疗挤兑，外国人能否顺利住院？如果旅客的症状恶化，我应该做点什么？请给我尽量完整可行的建议

比如买不到药品怎么办：

prompt：我现在因为日本的甲流流行，药品缺少，我目前拿不到专业抗病毒药品。日本的医疗都需要预约，我作为一个外国人，应该如何预约到好一点的医院，并且买到对症的药品。

上面这些问题，Qwen2.5-Max都回答得很好，在快思考这个层面上，他已经不输一个专业人士的直觉反应了。

大模型会告诉我应该如何寻找医疗机构，包括搜索“クリニック (clinic)”或“病院 (hospital)”，输入关键词如搜索“クリニック”或“病院”，查看附近医疗机构的位置和评价，或者由酒店前台推荐附近的诊所或者医院。

大模型还会回复了语言沟通问题以及就医流程、费用、保险、交通方式、药品购买情况。并且推荐附近的几家大型医院名称，以及提供了预约电话、预约内容、线上预约方案等，从快思考的层面来说，已经非常贴心了。

新闻和资讯助手

人类的思考是有两种模式的，一种是慢思考，也就是逻辑思考后的回复；一种是快思考，可以理解为毫不拖延地基于直觉和经验回答。

在OpenAI o1这样的深度推理模型出现之前，所有的头部大模型都采用快思考的模式，你问他，他就回答，哪怕乱说一气也不在乎；在这种情况下，我们就只能提前设定好一个完整的AI工作流，告诉大模型先迈左脚，再迈右脚，然后伸右手，每一步只完成一个小任务。

我在这种限制下，已经做了不少应用了，比如我构造了基于Qwen2.5-Max的工作流，帮我听新闻联播（我用的阿里开源的FunASR转写成文字)，进行总结并配上截图，效果如下：

20250208新闻联播摘要

第九届亚洲冬季运动会在哈尔滨隆重开幕

第九届亚洲冬季运动会于7日在哈尔滨开幕，开幕式气氛热烈，来自34个国家和地区的运动员入场，展示了亚洲的团结与友谊。文艺表演精彩纷呈，主火炬点燃仪式引发全场欢呼。各国领导人及贵宾出席，展现了对冰雪运动的重视与支持。

【央视快评】抓住机遇乘势而上勇于创新苦干实干

央视快评强调抓住机遇、乘势而上，鼓励勇于创新和苦干实干，以推动发展和应对挑战。

【新年新气象奋斗正当时】锚定目标全力以赴谋发展

新春之际，各地积极推进重点工程项目，力求实现高质量发展。新疆加快油气和煤炭产业建设，浙江推进国际枢纽港和交通项目，天津聚焦新能源汽车等产业，陕西推动科技创新，黑龙江实施大量产业项目，山东进行国企改革，力图提升发展优势。

【哈尔滨第九届亚冬会】李方慧夺得中国体育代表团首金

哈尔滨第九届亚冬会首个比赛日，中国队共获8枚金牌，包括自由式滑雪女子U型场地技巧赛的金牌得主李方慧和银牌得主张可欣，以及越野滑雪和速度滑冰项目的多位金牌选手。这一天，中国代表团在历届亚冬会上的金牌总数累计达到了100枚。

国内联播快讯

1月末，我国外汇储备为32090亿美元，较上月增加67亿美元。冷链物流市场持续扩大，2024年需求达3.65亿吨，同比增长4.3%。受寒潮影响，南方多地出现大风降温，气温下降6到12℃。国际奥委会主席巴赫为总台2026年米兰冬奥会信号制作团队授牌，总台将首次承担相关项目的信号制作。

每日重点资讯

除了新闻联播，我也会让AI帮我总结一些重点资讯，自动发到我的微信上，类似这种效果，主打一个碎片时间的利用。

如果能用好AI

如果旅客都能够在出行之前先听听AI的建议，看看目的地是否有什么流行病、有什么天灾人祸的风险，再评估自己是否要去凑热闹就好了。

比如我，自从看过《流感下的北京中年》那篇稿子后，对流感就真的严阵以待，真的不敢带着老父母去流行病爆发的地方旅游了。

这不就是旅行顾问和个人医疗助理么？如果你是贵族，舍得花一年100万雇一个管家、一个家庭医生，那肯定没问题；但如果是我们这种月薪3000的老百姓，这种能够免费使用的工具，显然要活学活用啊。

乐观的未来

在2025年，AI的快思考能力已经很好的帮我完成各种高度重复的日常工作了；而随着思维链、深度推理等功能的实现，AI开始具备慢思考的能力，加上可以执行代码、操作浏览器、查看桌面屏幕，已经逐步具备完成长链条复杂工作的条件了。

当然，我只是说现在已经具备了这个条件，目前的大模型，还不能全自动完成工作，比如我让AI帮我写一个程序：

1、接收我口述的任务，是一段语音或者一段文字，其中包含时间、地点和事项， 2、你会把他统一成文字，并利用大模型接口提取时间、地点、事件等事宜 3、你会帮我把任务同步到我的Google Calendar上面

这么简单的活儿，AI大模型还是不能全自动完成的；但是我相信以AI在2025年的发展速度，完全可以胜任普通人的个人助理。

同样的活儿我也问了Deepseek R1，跟Qwen2.5-Max可以说各有千秋，符合排行榜上的排名，都是非常优秀的大模型企业。

有这些一心要超过美国的卷王企业在，我可以做更多的应用创新，帮我写代码，看网页，画个图，整理文件夹，真的很快乐。

我们没必要拿快思考模式的Qwen2.5-Max、GPT-4o、DeepSeek V3跟采用思维链技术、慢思考模式思考几十秒的OpenAI-o1、DeepSeek R1直接对比，这两类大模型的使用场景是完全不一样的，一个主打见多识广速度快，一个主打精益求精造诣深。

Deepseek在1月20日发布的R1大模型，直接打破了OpenAI和软银规划的星际之门的神话，证明不需要那么多的算力，同样可以搞出来世界头部的大模型，通过思维链的方式增强了大模型的整体能力；直接断绝了美国资本想靠人工智能再吸血30年的念想，作为同行，与有荣焉。

阿里巴巴这次在1月25日发布的Qwen-Max大模型，使用了20万亿token的预训练数据进行训练，综合性能显著提升。在标准大模型的能力（大学知识、编程能力、综合能力、人类偏好）上，超越了 DeepSeek V3、GPT-4o 和 Claude-3.5-Sonnet，也是与有荣焉的创新！

在这两天刚刚更新的LiveBench上，Qwen2.5-Max更是闯入前十，拿下非推理类模型的中国冠军。

你看DeepSeek是在V3的版本上，花了两三周的时间，就训练出来了让国人惊艳的R1大模型；既然DeepSeek慷慨的用MIT协议开源了R1模型，而且发布了技术报告，意味着阿里、智谱、阶跃星辰都可以很快复现思维链的成果，以中国科技公司的内卷程度——毕竟阿里云是一家除夕都要发版本的公司——再给阿里云两周时间，能超越OpenAI o1吧？

Pls keep 卷，and take my money！我还是慧眼识珠的，我在2024年，给阿里充值2万，给DeepSeek充值2万，给火山引擎充值1万，全部购买了API，做了一点微不足道的贡献，哈哈。

参考资料

[1]

インフルエンザに関する報道発表資料｜厚生労働省: https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/kenkou_iryou/kenkou/kekkaku-kansenshou01/houdou_00018.html

[2]

日本流感与冠病疫情升温当局吁民众戴口罩: https://www.zaobao.com.sg/news/world/story20241214-5595059

是时候让AI当你的个人助理了

正文