在2024年6月,阿里的Qwen2发布的时候,我说目前中国大模型跟美国大模型的代差不到一年,当时我还被人嘲讽来着。万万想不到的是,短短半年之后,中国的AI已经有了反超的趋势,实在是可喜可贺。中国的大模型卷到什么程度?DeepSeek在1月20日发布了R1开源模型,性能堪比OpenAI o1,而且他的思维过程是开放的,可参考性非常强,这是继阿里的Qwen2登顶全球开源大模型之后,中国的开源大模型首次打破了OpenAI等闭源模型的技术封锁,成为世界第一。
短短两年,全球的大模型行业已经卷成了中美两国顶尖企业角力的情况,在匿名的大模型竞技场上,前十名一共有13个大模型,其中中国有四个企业共5个大模型入围,包括阿里巴巴的Qwen2.5-Max、Deepseek的R1和V3两个大模型,以及智谱科技的GLM4-Plus、阶跃星辰的Step-2;美国有两家共8个大模型入围,只剩下Google和OpenAI两家企业。
优势竟然在我?优势的确在我国。这是一个非常可喜可贺的事情,意味着中国的技术创新速度将会反超美国了。而且Deepseek、Qwen、GLM等都是开源的,特别是Deepseek发布的基于思维链R1的技术报告,现在已经有4-5家企业和学校开始照猫画虎的复现了,意味着我们将迎来新一波的人工智能技术井喷。如果你问大模型的快速发展对我月薪3000有什么用?那我只能说,只要大模型技术更进一步,你就能用极低的成本获得一个高度忠诚、智能的助手和管家,他不但能够帮你打理杂务,帮你赚钱,甚至还能帮你进行健康护理,规避风险甚至规避诈骗的。
旅行和医疗助手
这次我选择了最新的大模型,是阿里在25年除夕之夜发布的Qwen2.5-Max大模型,我让他们帮我规划一次日本的旅行计划,并且把旅行者的病史提供给AI,让AI给我建议。
1、提供基础信息
首先把旅行者的基础情况提供给大模型:
你是一个非常资深的全科医生,我是旅行社的导游。目前我们准备去日本旅行。
有一位女性旅客60岁,有基础病史,有糖尿病,抵抗力一般。我想知道日本最近(2025年1月)是否有流行病爆发?我还应该注意点什么?
然后大模型给了一个提醒:提醒旅客日本冬季是流感高发季节,每年12月至次年3月为流感高峰期。需要关注日本厚生劳动省或当地卫生部门发布的最新动态。
因为Qwen2.5-Max刚推出的时候没有接入网络搜索功能,但是现在已经可以啦。直接去chat.qwenlm.ai就可以体验包括Qwen-2.5-max在内的最新模型。
但是对于我这种IT开发者来说,还有更方便的工具的。我用Cline这个插件,接入了Qwen2.5-Max的API接口,实现了我口述任务,AI帮我写代码、执行代码、查看文档等任务,我的任务是一边中美对账,一边抽空看一下程序跑到什么程度了。
日本的流感报告网站自动化找到了。インフルエンザに関する報道発表資料 |厚生労働省[1]。如果让我自己搜索,因为我不懂外国语言,其实我是很难快速找到这个网页的。但是AI编程工具改变了这个现状。
254c0eb5fba471eed4be78b2e9f59c5b.png根据Qwen2.5-Max提供的网站我很快就找到了相关内容,不过着实给我吓了一大跳,在12月8日的一周内,日本流感确诊人数为4万4673人,比前一周增加约2万病例,目前全国估计有34万7000名旅客。日本流感与冠病疫情升温 当局吁民众戴口罩[2]
然后等到2025年1月9日,日本厚生劳动省的统计显示,截至2024年12月29日的一周内,全国约5000家医疗机构报告的季节性流感旅客数为每家医疗机构64.39人,已连续10周增加,是自1999年以来感染人数最多的一次。等于一周就新增了32万人!
等到2月初的报道,就已经提到了日本有950万人患有流感,药品急缺,医院的承载力也爆表了。
在这种情况下,一个有基础病史、身体虚弱的中老年人,其实是没必要去日本凑这个热闹的。
2、要不要去日本
我把搜索到的日本流感情况发给了Qwen2.5-Max,他给的重要信息是:
1)、在流感高峰期,日本的医疗机构可能面临较大的压力,急诊科和门诊可能会人满为患。
2)、如果您的旅行目的是休闲娱乐(如观光、购物、美食体验),考虑到当前的流感疫情,这些活动可能无法带来预期的愉悦感,反而增加了感染风险。
3)、如果一定要前往,请携带您日常服用的药品,还有充足的口罩。
4)、强烈建议推迟旅行计划,或者去流感感染率较低的国家旅行。![image-20250205223220245]()
后面还可以问很多关于旅行相关的问题,比如询问如何就医:
在日本北海道泡温泉,如果我感冒了,身体很不舒服,我应该如何在日本北海道当地就医?
比如要不要去大城市:
prompt:如果旅客的状态非常不好,有高烧。北海道当地的医疗条件好不好,要不要去附近的大城市治疗?
比如如果感染甲流怎么办:
prompt:如果大医院诊断旅客感染了甲流,但是又面临医疗挤兑,外国人能否顺利住院?如果旅客的症状恶化,我应该做点什么?请给我尽量完整可行的建议
比如买不到药品怎么办:
prompt:我现在因为日本的甲流流行,药品缺少,我目前拿不到专业抗病毒药品。日本的医疗都需要预约,我作为一个外国人,应该如何预约到好一点的医院,并且买到对症的药品。
上面这些问题,Qwen2.5-Max都回答得很好,在快思考这个层面上,他已经不输一个专业人士的直觉反应了。
大模型会告诉我应该如何寻找医疗机构,包括搜索“クリニック (clinic)”或“病院 (hospital)”,输入关键词如搜索“クリニック”或“病院”,查看附近医疗机构的位置和评价,或者由酒店前台推荐附近的诊所或者医院。
大模型还会回复了语言沟通问题以及就医流程、费用、保险、交通方式、药品购买情况。并且推荐附近的几家大型医院名称,以及提供了预约电话、预约内容、线上预约方案等,从快思考的层面来说,已经非常贴心了。![da0356fef94c524e6f42708b8455539c.png]()
新闻和资讯助手
人类的思考是有两种模式的,一种是慢思考,也就是逻辑思考后的回复;一种是快思考,可以理解为毫不拖延地基于直觉和经验回答。
在OpenAI o1这样的深度推理模型出现之前,所有的头部大模型都采用快思考的模式,你问他,他就回答,哪怕乱说一气也不在乎;在这种情况下,我们就只能提前设定好一个完整的AI工作流,告诉大模型先迈左脚,再迈右脚,然后伸右手,每一步只完成一个小任务。
我在这种限制下,已经做了不少应用了,比如我构造了基于Qwen2.5-Max的工作流,帮我听新闻联播(我用的阿里开源的FunASR转写成文字),进行总结并配上截图,效果如下:
20250208新闻联播摘要
第九届亚洲冬季运动会在哈尔滨隆重开幕
第九届亚洲冬季运动会于7日在哈尔滨开幕,开幕式气氛热烈,来自34个国家和地区的运动员入场,展示了亚洲的团结与友谊。文艺表演精彩纷呈,主火炬点燃仪式引发全场欢呼。各国领导人及贵宾出席,展现了对冰雪运动的重视与支持。
【央视快评】抓住机遇 乘势而上 勇于创新 苦干实干
央视快评强调抓住机遇、乘势而上,鼓励勇于创新和苦干实干,以推动发展和应对挑战。
【新年新气象 奋斗正当时】锚定目标 全力以赴谋发展
新春之际,各地积极推进重点工程项目,力求实现高质量发展。新疆加快油气和煤炭产业建设,浙江推进国际枢纽港和交通项目,天津聚焦新能源汽车等产业,陕西推动科技创新,黑龙江实施大量产业项目,山东进行国企改革,力图提升发展优势。
【哈尔滨第九届亚冬会】李方慧夺得中国体育代表团首金
哈尔滨第九届亚冬会首个比赛日,中国队共获8枚金牌,包括自由式滑雪女子U型场地技巧赛的金牌得主李方慧和银牌得主张可欣,以及越野滑雪和速度滑冰项目的多位金牌选手。这一天,中国代表团在历届亚冬会上的金牌总数累计达到了100枚。
国内联播快讯
1月末,我国外汇储备为32090亿美元,较上月增加67亿美元。冷链物流市场持续扩大,2024年需求达3.65亿吨,同比增长4.3%。受寒潮影响,南方多地出现大风降温,气温下降6到12℃。国际奥委会主席巴赫为总台2026年米兰冬奥会信号制作团队授牌,总台将首次承担相关项目的信号制作。
每日重点资讯
除了新闻联播,我也会让AI帮我总结一些重点资讯,自动发到我的微信上,类似这种效果,主打一个碎片时间的利用。![aa2ffd3eeec565e02ebc2d057d69b8df.png]()
如果能用好AI
如果旅客都能够在出行之前先听听AI的建议,看看目的地是否有什么流行病、有什么天灾人祸的风险,再评估自己是否要去凑热闹就好了。
比如我,自从看过《流感下的北京中年》那篇稿子后,对流感就真的严阵以待,真的不敢带着老父母去流行病爆发的地方旅游了。
这不就是旅行顾问和个人医疗助理么?如果你是贵族,舍得花一年100万雇一个管家、一个家庭医生,那肯定没问题;但如果是我们这种月薪3000的老百姓,这种能够免费使用的工具,显然要活学活用啊。
乐观的未来
在2025年,AI的快思考能力已经很好的帮我完成各种高度重复的日常工作了;而随着思维链、深度推理等功能的实现,AI开始具备慢思考的能力,加上可以执行代码、操作浏览器、查看桌面屏幕,已经逐步具备完成长链条复杂工作的条件了。
当然,我只是说现在已经具备了这个条件,目前的大模型,还不能全自动完成工作,比如我让AI帮我写一个程序:
1、接收我口述的任务,是一段语音或者一段文字,其中包含时间、地点和事项,
2、你会把他统一成文字,并利用大模型接口提取时间、地点、事件等事宜
3、你会帮我把任务同步到我的Google Calendar上面
这么简单的活儿,AI大模型还是不能全自动完成的;但是我相信以AI在2025年的发展速度,完全可以胜任普通人的个人助理。
同样的活儿我也问了Deepseek R1,跟Qwen2.5-Max可以说各有千秋,符合排行榜上的排名,都是非常优秀的大模型企业。
有这些一心要超过美国的卷王企业在,我可以做更多的应用创新,帮我写代码,看网页,画个图,整理文件夹,真的很快乐。
我们没必要拿快思考模式的Qwen2.5-Max、GPT-4o、DeepSeek V3跟采用思维链技术、慢思考模式思考几十秒的OpenAI-o1、DeepSeek R1直接对比,这两类大模型的使用场景是完全不一样的,一个主打见多识广速度快,一个主打精益求精造诣深。
Deepseek在1月20日发布的R1大模型,直接打破了OpenAI和软银规划的星际之门的神话,证明不需要那么多的算力,同样可以搞出来世界头部的大模型,通过思维链的方式增强了大模型的整体能力;直接断绝了美国资本想靠人工智能再吸血30年的念想,作为同行,与有荣焉。
阿里巴巴这次在1月25日发布的Qwen-Max大模型,使用了20万亿token的预训练数据进行训练,综合性能显著提升。在标准大模型的能力(大学知识、编程能力、综合能力、人类偏好)上,超越了 DeepSeek V3、GPT-4o 和 Claude-3.5-Sonnet,也是与有荣焉的创新!![img]()
在这两天刚刚更新的LiveBench上,Qwen2.5-Max更是闯入前十,拿下非推理类模型的中国冠军。
aa034a00585b60971a06244108862fa2.png你看DeepSeek是在V3的版本上,花了两三周的时间,就训练出来了让国人惊艳的R1大模型;既然DeepSeek慷慨的用MIT协议开源了R1模型,而且发布了技术报告,意味着阿里、智谱、阶跃星辰都可以很快复现思维链的成果,以中国科技公司的内卷程度——毕竟阿里云是一家除夕都要发版本的公司——再给阿里云两周时间,能超越OpenAI o1吧?
Pls keep 卷,and take my money!我还是慧眼识珠的,我在2024年,给阿里充值2万,给DeepSeek充值2万,给火山引擎充值1万,全部购买了API,做了一点微不足道的贡献,哈哈。
[1]インフルエンザに関する報道発表資料 |厚生労働省: https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/kenkou_iryou/kenkou/kekkaku-kansenshou01/houdou_00018.html
[2]日本流感与冠病疫情升温 当局吁民众戴口罩: https://www.zaobao.com.sg/news/world/story20241214-5595059