书名:DeepSeek快速上手
ISBN:978-7-115-57587-6
本书由人民邮电出版社发行数字版。版权所有,侵权必究。
您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。
编 著 李强
责任编辑 龚昕岳
人民邮电出版社出版发行 北京市丰台区成寿寺路11号
邮编 100164 电子邮件 315@ptpress.com.cn
网址 http://www.ptpress.com.cn
读者服务热线:(010)81055410
反盗版热线:(010)81055315
DeepSeek是一种生成式人工智能(artificial intelligence, AI)大模型,擅长处理复杂任务,具有训练效率高、成本低、性能强、开源等优势,吸引了全世界的关注。本书是写给DeepSeek初学者的快速上手实践指南。本书通过项目实例进行讲解,手把手地教读者如何使用DeepSeek。
本书共6章,首先对DeepSeek进行概述,包括其成长路线、优势、技术原理、应用场景、应用方式等;其次讲解如何为DeepSeek写提示词,包括结构化提示词、提示词的写作陷阱和优化技巧;接着介绍DeepSeek的高级使用方法,包括用Coze和DeepSeek搭建智能体、调用DeepSeek API进行AI编程、在本地计算机中安装部署DeepSeek、为DeepSeek构建个人知识库。
本书不仅适合想要使用DeepSeek的基础对话功能的读者阅读,还适合想要学习基于DeepSeek搭建智能体、通过API调用和本地化部署实现任务自动化的专业程序员阅读。
2025年初,DeepSeek凭借其训练效率高、成本低、性能强大和开源等优势,吸引了全世界的关注,刷新了大众对AI的认知。
作为一款国产AI,DeepSeek在理解中文文本、处理中文任务方面极具优势,非常适合AI“小白”学习和使用。DeepSeek不仅能为我们的生活、学习、工作“减负”,还能借助AI的力量将无数创意和想法转化为现实,为创新的灵感插上飞翔的“翅膀”。
本书是为DeepSeek初学者量身打造的实践指南,通过轻松易懂的方式介绍DeepSeek的使用方法和技巧。无论是大学生、上班族,还是小学生、银发族,都能通过本书快速上手DeepSeek。
针对DeepSeek的基础对话功能,本书详细讲解了结构化提示词的写作方法、10种提示词陷阱、19种优化技巧,并提供43个提示词示例,涵盖文字创作、方案策划、生活管理、办公辅助、教育辅导、商业分析等众多应用场景。
此外,本书还手把手地带领读者实践DeepSeek的智能体搭建、API调用、AI编程、本地化部署、个人知识库构建等高级用法,通过分步骤的详细讲解,让零基础读者也能利用DeepSeek实现任务自动化。
翻开本书,让DeepSeek带你进入AI新世界!
百万粉丝公众号“码小辫”主理人
2025年1月20日,幻方量化旗下AI公司深度求索(DeepSeek)发布了DeepSeek-R1,其性能媲美OpenAI o1。随后,DeepSeek App的全球下载量激增,在苹果App Store免费下载榜排名第一。2025年2月1日,DeepSeek日活用户突破3000万大关,成为史上最快达成这一成就的应用。
DeepSeek向世人展示了人工智能技术的“东方神秘力量”,大大提振了我国AI研究者的士气和信心。一时之间,DeepSeek被誉为“国产之光”。DeepSeek的创业经历、技术路径、创新故事,也为大家所津津乐道。
DeepSeek-R1发布后,迅速引发了大众学习和研究DeepSeek的热潮。一时之间,网络上出现了大量的DeepSeek学习资源,各大技术媒体排满了DeepSeek相关技术研讨的直播。这反映出人们了解和学习DeepSeek的迫切需求和热情。
当前,网络上关于DeepSeek的相关学习资料已有不少,但系统介绍DeepSeek的技术特点、使用技巧、安装部署和开发的还不多。为了给广大读者提供简单易学、快速上手的学习资料,我编写了这本简单明了、能够让读者快速动手实践的DeepSeek使用指南。
本书共分6章,各章主要内容如下。
第1章“这就是DeepSeek”,帮助读者初步认识DeepSeek。本章首先介绍DeepSeek是什么,它的成长路线、优势、技术创新点,然后从个人用户和企业用户的角度分别介绍可以使用DeepSeek做些什么,最后总结DeepSeek的使用方式和工作模式。
第2章“提示词工程”,介绍提示词的相关知识,包括结构化提示词的写作方法,10种常见的提示词写作陷阱,以及提示词优化技巧,帮助读者通过提示词提升使用DeepSeek的效率和效果。
第3章“用Coze和DeepSeek搭建智能体”,介绍如何在Coze平台利用DeepSeek搭建智能体(Agent),并实现一个自动生成宣传标语的智能体实例。本章在讲解动手操作的过程中,穿插介绍了智能体和工作流的概念。
第4章“调用DeepSeek API进行AI编程”,介绍如何以调用API的方式来使用DeepSeek,并基于VS Code和AI插件Cline实现两个AI编程的应用案例(自动生成一个类似DeepSeek的网页版程序、Python代码补全)。
第5章“DeepSeek本地化安装部署”,介绍如何将DeepSeek- R1部署到本地计算机中,以及如何使用AI交互界面工具Chatbox AI,以便随时随地、随心所欲地在本地使用DeepSeek。
第6章“为DeepSeek构建个人知识库”,介绍如何在本地构建个人知识库,并将DeepSeek与个人知识库结合,利用RAG技术实现一个智能客服系统,最后通过3个问答示例展示该系统的应用效果。
本书是写给DeepSeek初学者的快速上手实践指南。想要认识和了解DeepSeek,使用DeepSeek的对话、搜索和推理功能的读者,以及想要初步掌握基于DeepSeek搭建智能体、通过API调用和本地化部署实现任务自动化的专业程序员,都可以通过本书学到所需的知识和技能。
在编写本书的过程中,我特意避免追求大而全,而是力求让读者能够快速掌握DeepSeek的原理及必备的应用和开发技能。本书围绕DeepSeek的不同使用方法,按照从易到难的顺序来编排内容,以实例为驱动,重视动手实操。读者按照顺序阅读和学习本书内容,可以快速掌握DeepSeek的应用和开发方法。
DeepSeek给大模型带来了新的冲击和机遇!同时,我们要认识到,DeepSeek本身也是一个大模型,其技术迭代和更新速度很快。希望本书能够帮助读者快速入门DeepSeek。同时,随着DeepSeek版本的不断迭代更新,我们需要不断地学习和掌握新的知识和技能,而这些是本书无法在有限的篇幅内全部覆盖的,需要读者持续学习和实践。
限于本书篇幅和作者水平,书中难免有不足之处,希望读者多多指正。如有任何疑问,可以通过reejohn@sohu.com与我沟通、交流。期待和你在AI的道路上共同进步!
李强
2025年3月
DeepSeek是一家专注于通用人工智能(Artificial General Intelligence,AGI)的中国科技公司,成立于2023年7月17日,主攻大模型研发与应用。其推出的同名大模型产品DeepSeek,实现了高效的训练,显著降低了成本,且开源可定制。DeepSeek大模型的出现,改变了技术界乃至整个社会对大模型的看法,引发了广泛的关注。
2025年1月20日,DeepSeek公司正式发布了DeepSeek-R1模型并同步开源了模型参数及权重。DeepSeek-R1擅长处理复杂任务,性能媲美OpenAI o1,而且可免费商用。DeepSeek-R1遵循MIT License,允许用户通过知识蒸馏技术利用DeepSeek-R1训练其他模型。对于用户来说,DeepSeek-R1就像一个“聪明且省钱”的AI大脑,能帮助用户处理各种复杂任务(如智能对话、分析文档、推荐商品),而且比同类产品更快、更便宜、更灵活。
我们先来梳理一下DeepSeek公司的一些重要事件和DeepSeek大模型的重要版本,这有助于我们了解其技术成长路线。
DeepSeek发展过程中的重要事件和版本如表1-1所示。
表1-1 DeepSeek发展过程中的重要事件和版本
时间 |
事件 |
---|---|
2023年7月17日 |
DeepSeek公司由幻方量化投资成立,专注于开发高效、高性能的生成式大语言模型(LLM)和相关技术 |
2023年11月29日 |
推出参数规模达670亿的通用大模型DeepSeek LLM |
2024年5月6日 |
发布第二代开源混合专家(Mixture of Experts,MoE)架构模型DeepSeek-V2,其总参数达2360亿 |
2024年12月26日 |
正式发布DeepSeek-V3且直接开源,其总参数达6710亿,采用创新的MoE架构和FP8混合精度训练,训练成本进一步降低 |
2025年1月20日 |
发布全新的推理模型DeepSeek-R1并开源,其性能媲美OpenAI o1,而其API价格远低于OpenAI o1的API价格 |
2025年1月26日 |
DeepSeek登顶苹果App Store免费下载榜,超越Google Gemini和Microsoft Copilot等产品,引发全球用户使用、研究和讨论的热潮 |
2025年1月31日 |
英伟达宣布DeepSeek-R1模型登陆NVIDIA NIM,亚马逊和微软也宣布接入DeepSeek-R1模型 |
DeepSeek的火热,让全世界见证了AI的“东方神秘力量”,大大提振了我国IT技术圈的士气,被称为大模型“国产之光”。
和传统的大语言模型相比,DeepSeek有哪些特点和优势,让它赢得了广大用户和国内外厂商的青睐呢?
概括起来,DeepSeek有以下几个特点,也是其显著的优势。
DeepSeek-V3体现出多项性能提升。根据DeepSeek的官方文档,DeepSeek-V3的多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上与世界顶尖的闭源模型GPT-4o及Claude-3.5-Sonnet不分伯仲。
DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、编程、自然语言推理等领域,DeepSeek-R1的性能比肩OpenAI o1正式版。
用户能够从多个方面感受到DeepSeek的性能优越性,例如DeepSeek在处理复杂任务和提供个性化建议方面具有显著优势,DeepSeek在自然语言理解和推理方面的能力也非常强大。在客户服务领域,DeepSeek能够精准识别客户的不同需求,并提供相应的解决方案。DeepSeek的推理能力和适应性也很强,用户可以直接用自然语言与DeepSeek交流,无须复杂的提示词,这使用户体验更加自然和流畅。
正是基于这些性能优势,DeepSeek才能够在较短的时间内引发大量企业用户的接入和个人用户的下载、体验。
DeepSeek通过技术架构的创新,大大降低了训练成本。DeepSeek-V3模型的训练成本仅为557.6万美元,相比之下,Meta的Llama-3.1模型的训练成本超过6000万美元,而OpenAI的GPT-4模型的训练成本约为1亿美元。DeepSeek通过使用英伟达H800 GPU集群进行训练,显著降低了训练成本。
此外,DeepSeek在API服务定价方面极具竞争优势。DeepSeek-R1的API服务定价为每百万输入tokens 1元(缓存命中)/ 4元(缓存未命中),每百万输出tokens 16元,而OpenAI的GPT-4o模型的上述三项服务的定价分别为1.25美元、2.5美元和10美元[1]。低廉的API价格使得DeepSeek在市场上具有明显的成本优势。
[1] 这里列出的DeepSeek和GPT-4o的API服务定价为2025年3月6日的官网定价,未来价格以官方为准。
DeepSeek一开始就秉承开源的初衷。2023年11月2日,DeepSeek Coder作为DeepSeek的第一个开源模型发布。此后的DeepSeek大模型都是发布即开源。这种策略既推动了AI技术的普及和发展,也客观上帮助DeepSeek快速进入并占领市场,获得更多的关注。作为大模型领域的后来者,DeepSeek采取开源的策略是一种非常明智的做法。
作为中国的人工智能模型,DeepSeek在理解和处理中文文本及中华文化背景的任务时具有天然的优势。它能够更好地理解中文的语义、语法和文化内涵,对于中国用户的需求和问题能够给出更贴切、更准确的回答。
作为“全球新秀”惊艳亮相之后,DeepSeek很有可能成为“本土王者”。DeepSeek的出现展现了我国的科技力量,也体现了我国大力推动创新的趋势和成果。各大IT企业、电信运营商等陆续在各自的产品和应用场景中接入DeepSeek。中小企业和个人用户就更不用说了,纷纷拥抱这一高性能、低成本、零门槛的大模型。
DeepSeek是一款基于Transformer神经网格架构的大模型,它结合了自然语言处理、机器学习等先进技术,同时也有自己的技术创新。
本节主要介绍DeepSeek的一些显著的技术创新点,并用通俗易懂的解释和比喻,帮助读者对这些复杂的技术创新有一个初步认识。了解了这些技术创新点的基本原理,我们就更容易理解为什么DeepSeek相对于其他大模型在技术上更有优势了。
DeepSeek通过采用混合专家(Mixture of Experts,MoE)架构改进了Transformer架构,提升了大规模模型训练中的性能和效率,大大降低了计算成本。
MoE架构由多个“专家”组成,每个专家擅长处理不同的任务。MoE架构会根据输入数据的特点,动态选择最合适的专家来处理任务。
想象你有这样一个团队,其中包括不同领域的专家——数学家、语言学家、艺术家等。当你遇到一个问题时,这个团队会根据问题的特点和所涉及的领域,自动分配最合适的专家来处理问题。比如,遇到数学题就交给数学家,遇到语言问题就交给语言学家。这样一来,团队的工作效率非常高,而且每个人都能发挥自己的专长。MoE架构的工作原理也是类似的,模型会根据任务的特点选择最合适的“专家”来处理任务。
为了进一步降低计算需求,DeepSeek采用了知识蒸馏(Knowledge Distillation)与模型压缩(Model Compression)技术,将大规模模型的能力压缩到更小规模的模型中。
知识蒸馏技术是由诺贝尔奖得主Geoffrey Hinton等人于2015年提出。知识蒸馏的基本思路是通过训练一个较小的模型(学生模型)来模仿一个大型的、已经训练好的模型(教师模型),从而以更低的计算成本实现近似的性能。知识蒸馏本质上是一种模型压缩技术,由大模型得到小模型的这个过程,就实现了模型压缩。
想象你有一本厚厚的近1000页的考前复习资料。在复习的过程中,你的指导老师对这本复习资料中的要点、主要题型、解题方法等作了进一步的提炼,将篇幅压缩到了200多页。通过这200多页精简的复习资料,你仍然能够掌握主要知识点,复习备考的效果和使用1000页的复习资料的效果差别不大,并且也取得了不错的考试成绩。
DeepSeek在模型训练中广泛应用强化学习(Reinforcement Learning,RL)和奖励工程,让模型获得推理能力,甚至表现出某种思维能力,达到了“令人难以置信的成效”。
强化学习是一种机器学习方法,不同于传统的监督学习和无监督学习,它不依赖固定的数据标签,而是让智能体在环境中不断尝试、学习并优化策略,最终获得最大化的奖励。强化学习通过试错和奖励机制来训练模型,使其在特定任务中,尤其是在推理和复杂问题解决方面,表现出色。
你玩过游戏《超级马力欧兄弟》[2]吧!这个游戏的机制就是强化学习最好的例子。在游戏中,马力欧吃到蘑菇后会马上变大,而且能够碰掉头顶的墙砖;如果继续吃到蘑菇,他就能发射子弹,消灭迎面而来的敌人。但一旦被敌人触碰到,他就会失去发射子弹的能力;再次碰到的话,还会缩小到原来的体格,甚至导致游戏结束。这种奖励和惩罚的机制,就是强化学习的基本策略。
[2] 《超级马力欧兄弟》是任天堂公司开发的系列游戏,也曾被译作《超级马里奥兄弟》。
DeepSeek引入了多头潜在注意力(Multi-Head Latent Attention,MLA)机制,通过动态路由将输入数据分配给不同的专家网络。
多头潜在注意力是一种让模型从多个角度分析输入数据的技术。它不仅能充分关注数据的表面信息,还能深入挖掘数据背后的隐含特征。
想象你和几个朋友一起在规定的很短的时间内看同一幅画,每个人关注的内容和记忆的信息都不相同:一个人关注颜色,另一个人关注形状,还有一个人关注主题。显然,如果让一个人在有限的时间内同时记住所有这些信息是很难的,几乎无法做到准确无误;但如果让每个人分别记住某一方面的信息,就简单多了,正确率也更高。多头潜在注意力的原理也是类似的,模型从多个角度同时分析输入序列,最后把这些角度的结果综合起来,得到更全面的理解。
当然,DeepSeek模型的技术创新不止以上这些,本节也不可能一一列举,但上述的技术创新是其中比较典型的,也是当前人工智能技术领域认可度较高的几个方面。我们相信,随着DeepSeek版本的持续迭代,还会有更多的创新性技术浮现出来。
我们来对DeepSeek-R1和GPT-4的技术做一个简单的对比(见表1-2),以便更加清晰地了解DeepSeek的特点和优点。
表1-2 DeepSeek-R1和GPT-4的技术对比
技术 |
DeepSeek-R1 |
GPT-4 |
---|---|---|
架构 |
混合专家(MoE)架构,动态路由专家网络 |
统一的Transformer架构,参数共享 |
注意力机制 |
多头潜在注意力(MLA) |
多头注意力(Multi-Head Attention) |
训练方法 |
稀疏化计算,旋转位置嵌入,分布式并行训练 |
大规模预训练,强化学习(RLHF) |
计算效率 |
通过稀疏化和专家并行优化计算效率 |
依赖大规模计算资源,统一模型计算 |
任务适应性 |
动态路由专家网络,适用于多种任务 |
通用模型,适用于广泛任务 |
打个比方,DeepSeek-R1就像一个超级团队,每个专家都有自己的专长,团队会根据任务的特点动态分配专家,发挥团队作战的优势,因此效率高且灵活;而GPT-4就像一个全能的天才,他什么都懂,但需要从头到尾一步一步地思考,适合处理通用任务,但所有的责任和重担都落在一个人肩上。
了解了DeepSeek的基本情况和它的技术特点,那么我们能用DeepSeek做些什么有价值的事情呢?
对于个人用户来说,DeepSeek常见的应用功能包括如下几个方面。
DeepSeek能够与用户进行智能、流畅的对话,快速解答各类问题,包括科学知识、历史文化、生活常识和技术问题等。它不仅能给出准确答案,还能根据用户的追问深入拓展相关内容。从这方面来讲,DeepSeek毫不逊色于OpenAI的GPT-4。
DeepSeek可以生成多种类型的文字内容,例如撰写新闻报道、学术论文、商业文案、小说故事,列出报告大纲、图书目录,撰写信件,生成广告语、社交媒体文案、剧本大纲等。
对于办公族来说,DeepSeek是一个好帮手。DeepSeek支持上传各类文件(如文献、报告、图片等),能够快速提取关键信息,帮助用户梳理重点。DeepSeek支持数据处理、清洗、统计分析及可视化图表生成,能够将数据转化为直观的图表,如柱状图、折线图、饼图等。
对于程序员来说,DeepSeek是一个强大的工具和得力的帮手。它可用于代码生成、代码调试、代码分析、代码优化等。
DeepSeek是一个好翻译,它提供准确流畅的翻译服务,支持多语言对话和语法纠正,帮助用户提升语言能力。
DeepSeek可以解决理科难题,提供详细的解题思路和步骤,是学习的好帮手。
DeepSeek支持用户上传文件建立自定义知识库,提供更个性化的回答和建议。
当然,DeepSeek的功能和应用远比上面列出的要多,而这主要取决于用户的需求和应用场景。你完全可以根据自己的需求,发挥想象,充分拓展DeepSeek的强大功能。
除了支持个人用户,DeepSeek还支持商业应用和行业应用。下面列举几个行业应用的实践,希望对一些企业和行业用户有所启发和帮助。
金融行业可以使用DeepSeek分析金融历史数据、实时监控舆情、预测波动,实现动态风控。银行还可以使用DeepSeek实现智能对账、投资分析、决策分析、智能投资等。
DeepSeek可以助力智能制造的实现。一方面,DeepSeek可以在数控制造方面实现工艺优化、加强知识管理、提高生产效率。另一方面,DeepSeek可以分析历史生产数据和监控实时生产数据,进行故障预警,减少停机时间。DeepSeek还可以通过制订和管理生产计划,优化生产排程,提高库存周转率,实现供应链的智能化管理。
DeepSeek可以辅助智能诊疗,通过分析电子病历辅助医生优化诊疗方案。DeepSeek具备多模态功能,可以辅助实现医学图像的分析和处理。此外,制药企业通过将DeepSeek与专业数据库集成,可以构建智能化药物筛选和评估体系,显著提升药品的早期研发效率。
DeepSeek可以用于辅助教学,实现智能化知识管理、学生测试和能力分析。DeepSeek可以基于学情分析,制订个性化的教学方案;基于教学数据分析,为教育政策研究和决策提供科学依据,助力教育资源配置优化和教学实践创新。
当前,以阿里巴巴、百度、腾讯、360等为代表的国内互联网公司,以电信运营商为代表的国有企业,以英伟达、亚马逊和微软为代表的外企,以及越来越多的企业,纷纷宣布在自己的平台、产品或服务中接入DeepSeek。可以预见,作为大模型的代表之一,DeepSeek未来将会赋能千行百业。
要使用DeepSeek,一般有4种方式,本节将一一介绍,读者可以根据自己的需求来选择。
最简单直接的使用方式,就是通过浏览器打开DeepSeek的网站,直接使用DeepSeek网页版。
DeepSeek网页版的界面如图1-1所示。
图1-1
点击图1-1界面下方的“开始对话”,就会弹出一个账号登录的对话框,如图1-2所示。填入你的手机号码,点击“发送验证码”。
图1-2
输入收到的验证码,选中下方的复选框,点击“登录”即可打开网页版DeepSeek的聊天界面,如图1-3所示。在输入框中发送消息,就可以和DeepSeek畅聊了。
图1-3
在图1-1所示的界面中,点击“获取手机App”,就会弹出一个下载App的二维码,如图1-4所示。
图1-4
用手机扫描图1-4中的二维码,即可下载安装DeepSeek App。安装完毕后,同样需要完成登录注册步骤,然后就可以在手机端使用DeepSeek了。
当然,你也可以在手机的应用商店中直接搜索DeepSeek,找到相应的App,下载安装使用。
手机端的DeepSeek App界面如图1-5所示。
图1-5
在图1-1所示界面的右上方,点击“API开放平台”,就可以打开API开放平台的界面,如图1-6所示。第4章将详细介绍API开放平台的具体使用方式。
图1-6
如果你想通过本地化部署的方式使用DeepSeek,需要通过本地化部署工具来下载安装DeepSeek。在这种方式下,我们可以根据自己的具体需求,下载不同参数规模的DeepSeek版本并部署,因此,这种方式可以满足高度定制化的本地使用需求。第5章将详细介绍本地化部署的完整过程和应用示例。
表1-3比较了上述4种使用方式,方便读者结合自己的需求选择合适的使用方式。
表1-3 DeepSeek的使用方式比较
使用方式 |
是否收费 |
适用场景 |
---|---|---|
DeepSeek网页版 |
免费 |
适合个人工作学习中深度使用 |
手机App |
免费 |
适合个人工作学习中深度使用,以及日常聊天和智能搜索等 |
API开放平台 |
收费,根据输入输出token计量收费 |
适合专业开发者使用 |
本地化部署 |
免费,但对硬件和技术有一定要求 |
适合企业及对本地使用便捷性和数据安全性有要求的用户使用 |
在网页版(图1-3)和App版(图1-5)的DeepSeek使用界面中,我们都可以在输入框下方看到“深度思考”和“联网搜索”两个选项,其实还有一种默认工作模式,就是两个选项都不选的“基础模式”。因此,DeepSeek一共有3种工作模式。这3种工作模式的对比参见表1-4。
表1-4 DeepSeek的3种工作模式的对比
模式 |
说明 |
特点 |
适用场景 |
---|---|---|---|
深度 思考 |
深度思考模式是DeepSeek的高级功能,它通过多步骤的逻辑推理、知识整合和结构化分析来生成答案 |
对复杂问题的处理能力强,展示推理过程,速度相对较慢 |
复杂问题的深度分析和推理,尤其适合需要多步骤推理、逻辑分析、知识整合的问题 |
联网 搜索 |
联网搜索模式允许Deep-Seek实时访问互联网,获取最新的信息和数据。这种模式主要用于补充实时信息,增强回答的时效性和准确性 |
实时信息获取,增强回答的准确性,适用场景广泛,速度可能变慢 |
适合需要最新数据支持的问题,特别是要求时效性、准确性的问题 |
基础 模式 |
基础模式是DeepSeek的默认模式,主要依赖其预训练的模型知识库来回答问题 |
速度快,适用范围广,有一定知识局限性 |
适合处理一般性问题,如简单的问答、文本生成、语言翻译等 |
DeepSeek的3种工作模式各有特点,用户可以根据具体需求选择合适的模式,或者将它们结合使用(例如,对一个问题先联网搜索获取最新数据,然后利用深度思考进行分析和推理;又或者先通过深度思考生成框架,再通过联网搜索补充细节信息),以获得最佳的使用体验和答案。