Skip to content

Latest commit

 

History

History

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 

README.md

title DeepSeek使用指南
difficulty beginner
roles
everyone
type guide
duration 45min
tools
deepseek
tags
DeepSeek
AI助手
编程
推理
开源模型

DeepSeek使用指南

国产AI之光,开源模型的新标杆

概述

DeepSeek(深度求索)是中国AI公司推出的开源大语言模型系列,以其超高性价比、强大的编程能力和创新的推理模型闻名。2026年,DeepSeek已成为全球开发者和企业的首选AI工具之一,在编程、数学推理和长文本处理方面表现卓越。

本指南将帮助你全面了解DeepSeek模型系列、使用技巧和最佳实践。


什么是DeepSeek?

核心特点

1. Mixture-of-Experts (MoE) 架构

  • 智能路由机制,每个token只激活部分参数
  • 大幅降低推理成本,保持高质量输出
  • 总参数大,但实际计算量小

2. 超长上下文窗口

  • V4: 100万tokens(行业领先)
  • V3: 128K tokens
  • 可以处理整个代码库或超长文档

3. 原生多模态(V4)

  • 文本、图像、视频统一处理
  • 支持多模态内容生成

4. 创新的推理技术

  • R1模型:纯强化学习训练,无需人工标注
  • 透明推理过程,可解释性强

5. 完全开源

  • MIT/Apache 2.0许可
  • 模型权重完全开放
  • 支持商用

DeepSeek模型家族

DeepSeek V4 - 万亿参数旗舰(2026最新)

特点:

  • 1万亿总参数,~37B活跃参数
  • 100万tokens上下文窗口
  • 原生多模态支持

核心创新:

1. Engram条件记忆系统

  • 解决长上下文检索难题
  • 在100万tokens中精准定位信息
  • Needle-in-a-Haystack准确率97%

2. 流形约束超连接(mHC)

  • 优化MoE专家协同
  • 提升40%跨专家信息利用率

3. 分层稀疏注意力

  • 降低40%推理成本
  • 保持高质量输出

适用场景:

  • 大型代码库分析(整个项目一次性输入)
  • 超长文档处理(法律合同、研究报告)
  • 多模态应用(图像+文本混合任务)
  • 系统架构设计

性能基准:

  • HumanEval(编码): 98%
  • SWE-bench Verified: 80%+
  • GSM8K(数学): 96%
  • 上下文长度: 100万tokens

DeepSeek V3 - 高性价比通用模型

特点:

  • 671B总参数,37B活跃参数
  • 128K上下文窗口
  • 极高性价比

适用场景:

  • 日常编程工作
  • 数据分析
  • 技术写作
  • 一般推理任务

性能表现:

  • HumanEval: ~90%
  • GSM8K: ~85%
  • MMLU: ~88%

性价比:

  • 输入: ¥1/百万tokens
  • 输出: ¥4/百万tokens
  • 比GPT-4便宜50倍

DeepSeek R1 - 推理专用模型

特点:

  • 纯强化学习训练(无SFT)
  • 透明推理过程
  • 接近OpenAI O1水平

核心创新:

  • 跳过监督微调,直接RL训练
  • GRPO算法降低训练复杂度
  • 自动生成长思维链

训练路径:

DeepSeek V3 → R1 Zero(纯RL) → R1(冷启动+RL)

奖励机制:

  • 准确性奖励:答案正确
  • 格式奖励:按格式输出
  • 语言一致性:避免语言混杂

推理输出格式:

<think>
[推理过程]
模型展示完整思考步骤
</think>

<answer>
[最终答案]
</answer>

适用场景:

  • 复杂数学问题
  • 逻辑推理任务
  • 多步骤问题解决
  • 研究分析

性能基准:

  • AIME 2024: 79.8%(OpenAI O1: 79.2%)
  • MATH-500: 97.3%
  • Codeforces评分: 2029

使用建议:

  • Temperature: 0.5-0.7(推荐0.6)
  • 不要使用系统提示词
  • 对于数学问题,要求"step by step"

DeepSeek Coder V2 - 编程专用模型

特点:

  • 支持338种编程语言
  • 128K上下文窗口
  • 代码生成和优化

适用场景:

  • 代码生成
  • 代码补全
  • 代码审查
  • Bug修复
  • 代码重构

性能基准:

  • HumanEval: Pass@1 ~90%
  • BigCode-Bench: 第2名(与Claude 3.5 Sonnet并列)
  • Aider基准: 73%

编程语言支持:

  • 主流语言: Python, JavaScript, Java, C++, Go, Rust
  • 框架: Django, Spring Boot, React, Vue
  • 总计: 338种语言

最佳实践:

  • ✅ 提供完整的项目上下文
  • ✅ 明确技术栈和约束
  • ✅ 要求编写测试
  • ✅ Review生成的代码

价格方案

API定价(2026年3月)

DeepSeek V4:

类型 价格
输入tokens ¥1-4/百万
输出tokens ¥16/百万

DeepSeek V3:

类型 价格
输入tokens ¥1/百万(缓存命中)
输入tokens ¥4/百万(缓存未命中)
输出tokens ¥4/百万

DeepSeek R1:

类型 价格
输入tokens ¥1/百万(缓存命中)
输入tokens ¥4/百万(缓存未命中)
输出tokens ¥16/百万

价格对比:

模型 相对成本
DeepSeek V3 1x(基准)
GPT-4 50x
Claude Opus 30x

性价比优势:

  • 比GPT-4便宜50倍
  • 比Claude便宜30倍
  • 性能接近,成本极低

核心功能详解

1. 超长上下文处理

功能描述: DeepSeek V4的100万tokens上下文窗口可以处理:

  • 整个代码库(大型项目)
  • 多本技术书籍
  • 完整法律合同集
  • 研究论文集

使用示例:

我上传了一个包含100个TypeScript文件的前端项目。
请:
1. 分析项目架构
2. 找出潜在的依赖问题
3. 提出重构建议
4. 生成架构文档

[上传所有文件]

最佳实践:

  • ✅ 一次性提供完整上下文
  • ✅ 明确分析目标
  • ✅ 利用V4的检索能力
  • ❌ 不要分批提问

2. 代码生成与优化

功能描述: DeepSeek Coder专为编程优化:

  • 多语言代码生成
  • 代码补全(FIM)
  • 代码审查
  • 性能优化

使用示例:

使用Python实现一个高性能的LRU缓存:
- 支持并发访问
- O(1)时间复杂度
- 线程安全
- 包含单元测试

输出质量:

  • ✅ 符合PEP8规范
  • ✅ 包含完整注释
  • ✅ 错误处理完善
  • ✅ 测试覆盖率高

3. 推理任务处理

功能描述: DeepSeek R1的透明推理:

  • 展示完整思考过程
  • 可追溯的推理链
  • 高准确率

使用示例:

问题: 有一个池塘,第一天长1朵荷花,第二天长2朵,
第三天长4朵,以此类推。第30天荷花铺满整个池塘。
问:什么时候荷花铺满半个池塘?

[DeepSeek R1会展示推理过程]

<think>
这是一个经典的指数增长问题。
荷花数量每天翻倍:
第1天: 1朵
第2天: 2朵
第3天: 4朵
...
第30天: 铺满池塘 = 2^29朵

那么半个池塘就是 2^29 / 2 = 2^28朵
这正好是第29天的数量。

答案: 第29天荷花铺满半个池塘。
</think>

<answer>
第29天
</answer>

4. 多模态应用(V4)

功能描述: DeepSeek V4原生支持:

  • 文本生成
  • 图像理解
  • 视频分析
  • SVG生成

使用示例:

分析这张架构图:
[上传架构图]

请:
1. 解释每个模块的作用
2. 找出潜在瓶颈
3. 提出优化建议

使用技巧

技巧1: 为R1提供简洁提示词

R1模型特点:

  • 不需要逐步引导
  • 自动生成推理过程
  • 简洁的任务描述即可

不推荐:

请一步步思考:
1. 首先分析...
2. 然后考虑...
3. 接着评估...

推荐:

解这个数学题:
[x的题目]

展示你的推理过程。

技巧2: 利用超长上下文

V4的100万tokens:

场景:分析整个前端框架源码

传统方法:
- 分文件上传
- 分多次提问
- 上下文丢失

V4方法:
- 一次性上传所有文件
- 全局分析
- 跨文件理解

技巧3: 编程任务最佳实践

DO:

  • ✅ 提供完整项目背景
  • ✅ 说明技术栈
  • ✅ 指定代码规范
  • ✅ 要求编写测试

示例:

项目背景: 电商平台的订单服务
技术栈: Go + gRPC + PostgreSQL

需求: 实现订单创建API
- 验证库存
- 计算折扣
- 生成订单号
- 事务保证

请提供:
1. gRPC proto定义
2. Go实现代码
3. 单元测试
4. 性能考虑

技巧4: 成本优化

利用缓存:

  • V3/R1支持缓存
  • 缓存命中价格更低
  • 重复提示词可复用

批量处理:

  • 合并多个小任务
  • 减少API调用次数
  • 降低总成本

模型选择:

简单任务 → V3(便宜)
复杂推理 → R1(推理强)
大型项目 → V4(长上下文)
编程任务 → Coder(专业)

最佳实践

1. 编程任务

场景: 开发REST API

提示词模板:

项目背景: [描述]
技术栈: [框架、语言、数据库]
核心需求: [功能列表]

约束:
- 代码规范: [PEP8/Google Style]
- 性能要求: [响应时间、并发量]
- 安全要求: [认证、授权]

请提供:
1. 项目结构
2. 核心代码
3. 测试用例
4. 部署建议

2. 数据分析

场景: 分析销售数据

提示词:

数据: [上传CSV]
目标:
1. 销售趋势分析
2. 产品表现对比
3. 异常值检测

输出:
- 关键洞察
- 数据可视化建议
- 行动建议

3. 文档处理

场景: 分析法律合同

提示词:

文档: [上传完整合同]

分析要求:
1. 关键条款提取
2. 风险点识别
3. 权利义务总结
4. 建议修改项

4. 研究分析

场景: 文献综述

提示词:

文献集: [上传多篇论文]

综述要求:
1. 研究主题分类
2. 方法对比
3. 结论总结
4. 研究空白

常见问题解决

问题1: R1跳过推理过程

现象: 输出\n\n,没有<think>标签

解决方案:

# 在提示词开头强制添加
prompt = """任何输出都要有思考过程,
输出内容必须以 "\n\n嗯" 开头

[你的问题]
"""

问题2: 编程任务质量不稳定

原因:

  • 上下文不足
  • 技术栈不明确
  • 缺少约束

解决:

  • 提供完整项目背景
  • 明确技术栈和版本
  • 指定代码规范
  • 提供示例代码

问题3: 长文本处理效果不佳

原因:

  • 未利用V4的检索能力
  • 分析目标不明确

解决:

  • 明确告诉模型要找什么
  • 使用V4而不是V3
  • 一次性提供完整上下文

与其他工具对比

DeepSeek vs GPT-4

维度 DeepSeek V3 GPT-4
编程能力 90% 92%
推理能力 85% 95%
上下文长度 128K 128K
价格 ¥1-4/百万 ¥140/百万
开源

选择建议:

  • 性价比优先 → DeepSeek
  • 生态丰富 → GPT-4
  • 开源需求 → DeepSeek

DeepSeek vs Claude

维度 DeepSeek V4 Claude Opus 4.6
上下文长度 100万 200万
编程能力 98% 88%
推理能力 85% 90%
价格 ¥1-4/百万 ¥105/百万
多模态 文本+图像+视频 文本+图像

选择建议:

  • 编程密集型 → DeepSeek
  • 超长文档 → Claude
  • 预算有限 → DeepSeek

DeepSeek R1 vs OpenAI O1

维度 DeepSeek R1 OpenAI O1
数学推理(AIME) 79.8% 79.2%
代码(Codeforces) 2029 2061
价格 ¥1-4/百万 ¥140/百万
开源

选择建议:

  • 成本敏感 → R1
  • 开源需求 → R1
  • 略高推理 → O1

部署和使用

在线使用

官方平台:


API调用

Python示例:

from openai import OpenAI

# 兼容OpenAI API
client = OpenAI(
    api_key="your-deepseek-api-key",
    base_url="https://api.deepseek.com"
)

# 调用V3
response = client.chat.completions.create(
    model="deepseek-chat",
    messages=[
        {"role": "user", "content": "用Python实现快速排序"}
    ]
)

print(response.choices[0].message.content)

调用R1推理模型:

response = client.chat.completions.create(
    model="deepseek-reasoner",
    messages=[
        {"role": "user", "content": "解这个数学题..."}
    ],
    temperature=0.6  # 推荐0.5-0.7
)

本地部署

DeepSeek Coder V2:

# 使用vLLM部署
pip install vllm

python -m vllm.entrypoints.openai.api_server \
    --model deepseek-ai/DeepSeek-Coder-V2-Instruct \
    --port 8000

硬件要求:

  • V3(671B): 8x A100 80GB
  • Coder V2(236B): 4x A100 80GB
  • Coder V2 Lite(16B): 1x A100 40GB

进阶技巧

1. 提示词优化

R1模型提示词:

对于数学问题,建议包含:
"Please reason step by step,
and put your final answer within \boxed{}."

V4长文本提示词:

在分析长文档时:
1. 明确告知文档长度
2. 指定需要提取的信息
3. 要求结构化输出

2. 温度参数调整

任务类型 推荐Temperature
编程 0.2-0.4
数学推理 0.5-0.7
创意写作 0.7-1.0
问答 0.3-0.5

3. 流式输出

Python示例:

stream = client.chat.completions.create(
    model="deepseek-chat",
    messages=[...],
    stream=True
)

for chunk in stream:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="")

安全和隐私

数据处理

DeepSeek承诺:

  • ✅ 不存储对话用于训练(默认)
  • ✅ 支持私有化部署
  • ✅ 数据安全合规

最佳实践:

  • ✅ 不分享敏感信息
  • ✅ 使用本地部署处理机密数据
  • ✅ 定期清理对话历史

总结

DeepSeek的核心优势

  1. 超高性价比 - 比GPT-4便宜50倍
  2. 强大编程能力 - HumanEval 98%(V4)
  3. 超长上下文 - 100万tokens(V4)
  4. 创新推理 - R1纯RL训练
  5. 完全开源 - MIT/Apache 2.0许可

何时选择DeepSeek

  • ✅ 编程密集型任务
  • ✅ 处理大型代码库
  • ✅ 预算有限
  • ✅ 需要开源模型
  • ✅ 中文内容处理

何时选择其他工具

  • 需要丰富生态 → GPT-4
  • 超长文档(>100万tokens) → Claude
  • 多模态(视频生成) → Gemini

下一步

立即行动:

  1. 注册DeepSeek账号(免费)
  2. 测试不同模型(V3/R1/Coder)
  3. 尝试API调用
  4. 探索超长上下文功能

深入学习:

  • DeepSeek官方文档
  • GitHub开源仓库
  • 技术论文

参考来源:

  • DeepSeek官方文档 (2026)
  • DeepSeek V4技术报告 (2026)
  • DeepSeek R1论文 (2025)
  • BigCode-Bench排行榜 (2026)
  • Aider模型评估 (2025)