首页   

【科普知识】一文带你了解deepseek

环球物理  · 物理  · 3 天前

正文

图片


近年来,全球AI技术进入“超参数竞赛”阶段,OpenAI、谷歌等巨头通过千亿级模型推动技术边界,但高昂的算力成本与封闭生态逐渐成为行业瓶颈。2024 年底,DeepSeek 发布了新一代大语言模型V3,以“低成本+开源”策略破局,标志着中国AI技术路径的颠覆性创新。


什么是deepseek?它的工作原理是什么?我们可以用deepseek做什么?

针对这些问题,小编整理了一些资料,咱们一起来学习。


图片

什么是deepseek?


DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。


2024年1月,DeepSeek发布首个670亿参数大模型DeepSeekLLM,其推理与编码能力超越同期Llama270B模型;同年5月推出的DeepSeek-V2采用混合专家(MoE)架构,性能对标GPT-4Turbo而成本仅为其1%,被业界称为“AI届拼多多”。至2025年1月,R1模型正式发布,在数学推理、代码生成等任务上达到GPT-4o同等水平,7天内用户破亿,登顶全球140国应用商店榜首,重构了AI技术的普及范式。


【拓展阅读】

关于DeepSeek,你关心的答案都在这了



图片

什么是AI大模型?


通俗来说,AI大模型是一种复杂的计算机程序,经过大量数据的训练,能够理解和生成类似人类的语言。你可以把它想象成一个非常聪明的助手,能够回答问题、写文章、翻译语言,甚至创作诗歌。


它的工作原理类似于学习:通过分析大量文本,模型学会了语言的规律和上下文关系,从而能够根据输入生成有意义的回答。


【拓展阅读】

一文全面说透,AI大模型!



图片

deepseek军事应用展望


在军事智能化的大趋势下,DeepSeek的先进技术有望为军事领域带来革命性的变革,其在情报侦察、导航定位、指挥控制等多个关键方面的应用潜力。


【拓展阅读】

DeepSeek军事应用展望


图片

我们可以用deepseek做什么?


deepseek作为一款开源软件,我们在日常生活中能方便使用,有了DeepSeek后,如何真正用好它?


1.常规提问

要精准提问,这样才能实现高效交互。和大模型交流,提问是个技术活。比如,如果你希望大模型帮你规划健身计划,不要只是说“给我写个健身计略”,而是要提供具体的细节,如“我打算下个月健身15天,每天1小时,喜欢跑步和球类运动,帮我规划一下”。

推荐简单但超级实用的“四步提问法”:背景+任务+要求+补充。

比如:

【背景】我是一名阅读爱好者;

【任务】需要一份阅读计划;

【要求】每月读完2本书,主要学习文学名著;

【补充】碎片时间比较多,完整阅读时间只有1小时。


2.处理工作任务

AI在处理复杂任务的时候时常会出现“偷懒”这种情况,这时需要我们帮AI拆解任务。

以让AI写文章为例:

第一步:让AI写出大纲

第二步:让AI根据大纲完善第一部分的内容

第三步:让AI根据大纲继续分批输出后面几部分的内容

第四步:让AI检查文章内容错误,核对信息

第五步:让AI阅读生成文章,并对文章进行优化


3.善用提问技巧

不要指望AI能一次性完成你想要的内容,需要通过继续提问的方式让它优化内容,直到符合我们的要求。

巧用提示词,提示词是与大模型沟通的“咒语”,不同提示词可以引导大模型产生完全不同的输出结果。如果你想写一篇科幻小说,可以用“星际战争”“外太空”“外星人”等提示词写一个开头,有了详细的提示就能输出更精彩的作品。



来源:梦课学堂,转载旨在分享,如有侵权请联系删除。

免责声明:自媒体综合提供的内容均源自自媒体,版权归原作者所有,转载请联系原作者并获许可。文章观点仅代表作者本人,不代表环球物理立场。

环球物理

ID:huanqiuwuli

环球物理,以物理学习为主题,以传播物理文化为己任。专业于物理,致力于物理!以激发学习者学习物理的兴趣为目标,分享物理的智慧,学会用物理思维去思考问题,为大家展现一个有趣,丰富多彩的,神奇的物理。

投稿请联系 14511055@qq.com

图片

© 2024 精读
删除内容请联系邮箱 2879853325@qq.com