首页   

阿里推出对标DeepSeek-R1的大模型产品,我试了试发现……

数字进化岛  · 互联网安全 科技自媒体  · 9 小时前

主要观点总结

文章介绍了阿里Qwen团队发布的推理模型——深度思考 (QwQ),其与DeepSeek-R1的对比,以及DeepSeek的技术架构优化情况。文章还提到了其他云市场的情况,以及深度思考模型的功能和特点,包括支持联网搜索、生成图片和视频等。

关键观点总结

关键观点1: 阿里Qwen团队发布的新推理模型深度思考 (QwQ)

深度思考是基于Qwen2.5-Max的推理模型,擅长数学理解、编程、AI智能体等。它支持联网搜索,并且不卡顿。

关键观点2: DeepSeek-R1与深度思考 (QwQ)的对比

两者都擅长解决数学和推理问题,并展示思考过程。但深度思考在生成答案质量方面还有待提升,目前还是一个预制版本。

关键观点3: DeepSeek的技术架构优化

DeepSeek进行技术架构升级优化,以解决繁忙次数过多和联网问题。优化后,其体验有所提升,但偶尔仍会宕机。

关键观点4: 其他云市场的情况

其他云服务商如腾讯、百度、华为等在AI领域有不同的发展战略。腾讯和百度拥抱DeepSeek更为深刻,而华为不涉及C端AI入口应用。

关键观点5: 深度思考模型的功能和特点

深度思考支持生成图片,后续还会支持生成视频。这是一个多模态大模型,功能上更加健全。


正文

一早醒来就看到个大消息—— 阿里Qwen团队今日宣布在Qwen Chat发布了推理模型——深度思考 (QwQ) 。
在我理解中,这其实就是阿里对标DeepSeek-R1的大模型产品。因为这是一个基于Qwen2.5-Max的推理模型,更加擅长数学理解、编程、AI智能体等。DeepSeek-R1也是擅长解决数学和推理问题。
更为重要的是,这俩都把思考过程给显示出来了。
和DeepSeek-R1表现出来的产品心态,一模一样。
更重要的事,经过测试我发现,深度思考 (QwQ) 不仅支持深度思考,还支持联网搜索。并且,不卡顿。
其实,DeepSeek-R1现在最大的痛点有两个。第一总是繁忙,根本没办法实现多轮对话,除非你有耐心每次提问中间都能等一个小时。第二,联网基本不给你答案。
昨天我看到凤凰网科技发了个报道,说DeepSeek繁忙次数变少了。原因可能是因为DeepSeek又进行了技术架构升级优化。
有接近DeepSeek的人士对凤凰网科技表示,“DeepSeek没有特别限制过,但之前可能是资源不太够”,对于近期DeepSeek繁忙次数变少,系DeepSeek官方团队仍在进行技术架构优化,使得较少资源情况下仍能支持广泛用户使用。
我去试了一下,确实如此,DeepSeek繁忙的次数确实变少了,而且联网也能给出答案来,体验非常不错。不过,偶尔还是会宕机……
阿里的深度思考 (QwQ)我测试了一下,虽然说支持联网,也不卡顿,但是生成的结果确实比不过DeepSeek。
不过,现在的深度思考 (QwQ)还是一个预制版本,现在还在更新中,等正式版本发布后,生成的答案质量大概率会提升。
大家看到这个行业趋势了吗?从整个云市场来看,腾讯和百度拥抱DeepSeek最为深刻,腾讯元宝直接融合上线了DeepSeek,百度的文小言也上线了DeepSeek来辅助做题——用户不能直接使用。
华为云、火山引擎、阿里云等等其他几家基本的态度还是蹭热度来推自家的云计算产品。在C端,基本不涉及DeepSeek。
华为不涉及可以理解,毕竟本身就没有做C端的AI入口应用。火山也是,并没有推出C端的个人应用。阿里是有的,但是为啥不融合DeepSeek呢?现在答案明了了,因为阿里正在做对标DeepSeek的深度思考模型了。
其实阿里在大模型领域一直很强势,尤其是在开源市场长期是中国大模型第一的存在。而这次的深度思考 (QwQ) ,我相信最终产品出来也不会太差。
更关键的是,深度思考 (QwQ)支持生成图片,后面还会支持生成视频。这是多模态大模型,比DeepSeek的功能上更加健全。
相信现在阿里的Qwen团队还在加班加点打磨细节,目的,就是要正式推出的时候,想要取得类似DeepSeek一般的炸裂开场,汇聚全网流量,成为全民焦点。
不过就算这次没有引起轰动,相信在3800亿AI投资的力度之下,阿里应该会拿出过硬的产品,一鸣惊人。

-全文完-

写干货,说人话,欢迎关注

关于「数字进化岛」:坚持日更,每天撰写一篇深度剖析文章,解读当日科技产业中最具影响力的热点话题。这是一个说人话的科技号,让我们共同透视全球真相!希望和你交个朋友~

图片

推荐文章
© 2024 精读
删除内容请联系邮箱 2879853325@qq.com