DeepSeek 提示词最佳实践指南

掌握 DeepSeek V4-Pro、V4-Flash 的提示词技巧，充分发挥国产最强推理和代码模型的实力

1. 模型概述

1.1 模型版本与特点

模型	发布时间	架构	总参数	激活参数	上下文窗口	核心能力	适用场景
DeepSeek V4-Pro	2026年4月	MoE	1.6T	49B	1M tokens	推理、编码、Agent	通用任务、代码开发、长文档推理
DeepSeek V4-Flash	2026年4月	MoE	284B	13B	1M tokens	高性价比推理	日常对话、批量调用、个人开发者
DeepSeek V3.2	2025年	MoE	685B	37B	128K tokens	旧版旗舰	旧兼容场景（新项目建议用V4）
DeepSeek-R1	2025年1月	MoE	—	—	64K tokens	强化学习推理	数学问题、逻辑推理、科学推理

1.2 核心优势

✅ 国产综合最强：综合评分 87 分，编码 89.8 分，均为国产最高
✅ 百万级上下文：V4 系列原生支持 1M tokens，FLOPs 仅为 V3 系列的 10%~27%
✅ 混合注意力架构：全新 Hybrid Attention，大幅压缩 KV Cache 与计算量
✅ 默认思维链：V4 系列默认开启 Thinking Mode，推理深度全面提升
✅ MIT 完全开源：可商用、可自部署，1.6T 参数为全球最大开源权重
✅ 极致性价比：V4-Flash 输出仅 ¥2/百万 tokens，缓存命中输入 ¥0.2/百万 tokens

1.3 限制与注意事项

⚠️ 部署资源较高：V4-Pro BF16 全精度需约 40 张 H100 80GB
⚠️ 无官方多模态：不支持图像输入（可配合其他视觉模型）
⚠️ 国际模型仍有差距：综合评分仍低于 GPT-5.4、Gemini 3.1 Pro 约 3-6 分
⚠️ V3.2 已明显落后：综合评分仅 63，新项目请使用 V4 系列

2. 提示词基础

2.1 DeepSeek提示词的基本结构

DeepSeek使用简单的聊天模板格式。

DeepSeek-V4 格式

User: [用户指令]

Assistant: [模型回答]

重要：在实际应用中，建议使用Hugging Face的transformers库或deepseek-python来处理这些标记。

2.2 使用Hugging Face Transformers（推荐）

python

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "deepseek-ai/deepseek-v4-pro"

tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

# 使用聊天模板
messages = [
    {"role": "user", "content": "请解释什么是机器学习。"}
]

inputs = tokenizer.apply_chat_template(
    messages,
    add_generation_prompt=True,
    return_tensors="pt"
)

outputs = model.generate(inputs, max_new_tokens=512)
response = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(response)

2.3 使用Ollama（本地运行，最简单）

Ollama已经支持DeepSeek V4系列模型。

安装和使用

bash

# 安装Ollama（macOS/Linux）
curl -fsSL https://ollama.com/install.sh | sh

# 运行DeepSeek V4-Pro（需要较大内存）
ollama run deepseek-v4

# 运行DeepSeek V4-Flash（轻量版）
ollama run deepseek-v4-flash

Python代码示例

python

import ollama

# 单次对话
response = ollama.chat(
    model='deepseek-v4',
    messages=[
        {'role': 'user', 'content': '请解释什么是过拟合（overfitting）。'}
    ]
)
print(response['message']['content'])

# 流式输出
stream = ollama.chat(
    model='deepseek-v4-flash',
    messages=[{'role': 'user', 'content': '写一个快速排序算法'}],
    stream=True
)

for chunk in stream:
    print(chunk['message']['content'], end='', flush=True)

2.4 核心提示词技巧

✅ 技巧1：提供详细指令

DeepSeek的指令遵循能力中等，需要更详细、更明确的指令。

python

prompt = """你是一位资深的技术博客作者，擅长将复杂的技术概念用通俗易懂的语言表达出来。

任务：请写一篇关于「使用Docker容器化部署Python应用」的技术博客文章。

文章要求：
1. 目标读者：中级开发者（有Python基础，了解基本Linux命令）
2. 字数：2000-2500字
3. 包含以下部分：
   - 引言：为什么需要容器化（3-5个痛点）
   - Docker基础概念简介（镜像、容器、Dockerfile）
   - 实战：容器化一个Flask应用（完整代码示例）
   - Dockerfile最佳实践（5-7条）
   - docker-compose多服务编排（示例：Web + Redis + PostgreSQL）
   - 生产环境部署注意事项（安全、监控、日志）
   - 总结与延伸阅读
4. 每个部分都包含代码示例（Python或Bash）
5. 代码需要详细注释
6. 风格：专业但亲和，避免过于学术化
7. 输出格式：Markdown

非常重要：请确保文章结构清晰，代码可直接运行。"""

response = ollama.chat(
    model='deepseek-v4',
    messages=[{'role': 'user', 'content': prompt}]
)```

#### ✅ 技巧2：使用少样本示例（Few-Shot）

```python
prompt = """我将给你展示情感分析的示例，然后你分析新句子。

示例1：
输入：这个产品真的太棒了，超出我的预期！
输出：{"sentiment": "positive", "confidence": 0.95, "reason": "用户使用了'太棒了'、'超出预期'等正面词汇。"}

示例2：
输入：质量一般，性价比不高，不推荐购买。
输出：{"sentiment": "negative", "confidence": 0.88, "reason": "用户明确指出'不推荐购买'，且提到性价比不高。"}

示例3：
输入：还算可以吧，没什么特别的。
输出：{"sentiment": "neutral", "confidence": 0.65, "reason": "用户没有明确表达满意或不满，态度中立。"}

现在请分析：
输入：质量太差了，浪费钱。
输出："""

response = ollama.chat(
    model='deepseek-v4',
    messages=[{'role': 'user', 'content': prompt}]
)```

#### ✅ 技巧3：要求逐步思考（Chain-of-Thought）

```python
prompt = """请解决以下逻辑推理问题。在给出最终答案之前，请先逐步分析。

问题：所有的猫都是动物。有些动物会游泳。问：是否所有的猫都会游泳？

请按以下步骤思考：

1. **列出已知前提**
   - 前提1：所有的猫都是动物。
   - 前提2：有些动物会游泳。

2. **分析逻辑关系**
   - 前提1建立了"猫"和"动物"的包含关系。
   - 前提2只说明"有些"动物会游泳，不是"所有"动物。

3. **检查是否能推导出结论**
   - 我们知道猫是动物，但前提2只说"有些"动物会游泳。
   - "有些"不代表"所有"。

4. **寻找反例**
   - 如果"会游泳的动物"指的是鱼、海豚等，那么猫不在其中。
   - 所以，不能得出"所有的猫都会游泳"的结论。

5. **得出结论**
   - 最终答案：不能得出"所有的猫都会游泳"的结论。
   - 正确回答是：不确定/无法确定。

现在，请按照上述步骤，详细展示你的推理过程。"""

response = ollama.chat(
    model='deepseek-v4',
    messages=[{'role': 'user', 'content': prompt}]
)```

---

## 3. 写作任务提示词

### 3.1 文章写作

#### 示例：技术博客文章

**提示词**：

```python
prompt = """你是一位资深的技术作家，擅长撰写深度技术分析和教程。
你的文章逻辑清晰、例证丰富、适合中级到高级开发者阅读。

任务：请撰写一篇关于「微服务架构中的分布式事务管理」的深度技术文章。

关键要点：
1. 分布式事务的挑战（CAP定理、网络分区等）
2. 常见解决方案：
   - 两阶段提交（2PC）
   - 补偿事务（Saga模式）
   - 本地消息表
   - 最大努力通知
3. 各方案的优缺点对比
4. 实际案例分析（可以虚构一个电商场景）
5. 方案选择建议

文章结构：
1. 引言（300字）：微服务架构的普及和分布式事务的挑战
2. 核心概念（500字）：事务ACID、分布式事务定义
3. 解决方案详解（1200字）：逐一介绍上述4种方案
4. 对比分析（400字）：表格对比各方案
5. 实战案例（600字）：电商订单系统的分布式事务设计
6. 总结与建议（300字）

要求：
- 总字数：3000-3500字
- 包含代码示例（Java或Python）
- 包含架构图描述（用文字描述，我会后续绘制）
- 使用表格对比不同方案
- 风格：专业、深入、实用
- 目标读者：有微服务实践经验的开发者
- 输出格式：Markdown

补充信息：
- 你可以引用知名公司的实际案例（如阿里巴巴、腾讯等）
- 如果有相关的开源框架（如Seata），可以提及
"""

response = ollama.chat(
    model='deepseek-v4',
    messages=[{'role': 'user', 'content': prompt}]
)```

**预期输出**：

- 一篇结构完整、深度充足的技术文章
- 包含代码示例和对比表格
- 适合发布在技术博客或技术杂志

---

## 4. 代码开发提示词

### 4.1 代码生成（DeepSeek的强项）

#### 示例：Python函数编写

**提示词**：

```python
prompt = """你是一个Python专家，擅长编写高质量、可维护的代码。
你的代码遵循PEP 8规范，包含详细注释和文档字符串。

任务：请编写一个Python函数，实现LRU（Least Recently Used）缓存机制。

要求：
1. 使用Python 3.9+语法
2. 实现以下方法：
   - `__init__(self, capacity: int)`: 初始化缓存
   - `get(self, key: int) -> int`: 获取键值，如果不存在返回-1
   - `put(self, key: int, value: int) -> None`: 插入或更新键值
3. 时间复杂度：get和put都必须是O(1)
4. 使用`collections.OrderedDict`实现
5. 包含详细注释
6. 添加文档字符串（docstring）
7. 提供使用示例
8. 分析时间和空间复杂度

输出格式：
## LRU缓存实现
[代码]

## 使用示例
[示例]

## 复杂度分析
- 时间复杂度：[分析]
- 空间复杂度：[分析]

## 测试
[单元测试代码]
"""

response = ollama.chat(
    model='deepseek-v4',  # 使用V4-Pro旗舰版
    messages=[{'role': 'user', 'content': prompt}]
)

预期输出：

python

## LRU缓存实现

```python
from collections import OrderedDict

class LRUCache:
    """
    LRU (Least Recently Used) Cache implementation.

    This cache evicts the least recently used item when capacity is exceeded.
    Both get and put operations run in O(1) time complexity.
    """

    def __init__(self, capacity: int):
        """Initialize the LRU cache with given capacity."""
        self.capacity = capacity
        self.cache = OrderedDict()

    def get(self, key: int) -> int:
        """
        Get value by key. Returns -1 if key doesn't exist.

        Args:
            key: The key to look up.

        Returns:
            The value associated with the key, or -1 if not found.
        """
        if key not in self.cache:
            return -1
        # Move to end to mark as recently used
        self.cache.move_to_end(key)
        return self.cache[key]

    def put(self, key: int, value: int) -> None:
        """
        Insert or update a key-value pair.

        Args:
            key: The key to insert or update.
            value: The value to associate with the key.
        """
        if key in self.cache:
            # Update value and mark as recently used
            self.cache.move_to_end(key)
        self.cache[key] = value
        if len(self.cache) > self.capacity:
            # Remove least recently used item
            self.cache.popitem(last=False)

# Usage example
if __name__ == "__main__":
    cache = LRUCache(2)
    cache.put(1, 1)
    cache.put(2, 2)
    print(cache.get(1))  # Returns 1
    cache.put(3, 3)      # Evicts key 2
    print(cache.get(2))  # Returns -1 (not found)

复杂度分析

时间复杂度：
- get(): O(1) - OrderedDict lookup and move_to_end are O(1)
- put(): O(1) - OrderedDict insertion and popitem are O(1)
空间复杂度：
- O(capacity) - We store at most capacity items in the OrderedDict

测试

python

import unittest

class TestLRUCache(unittest.TestCase):
    def test_basic_operations(self):
        cache = LRUCache(2)
        cache.put(1, 1)
        cache.put(2, 2)
        self.assertEqual(cache.get(1), 1)
        self.assertEqual(cache.get(2), 2)

    def test_eviction(self):
        cache = LRUCache(2)
        cache.put(1, 1)
        cache.put(2, 2)
        cache.put(3, 3)  # Should evict key 1
        self.assertEqual(cache.get(1), -1)
        self.assertEqual(cache.get(3), 3)

    def test_update_existing_key(self):
        cache = LRUCache(2)
        cache.put(1, 1)
        cache.put(1, 10)  # Update existing key
        self.assertEqual(cache.get(1), 10)

    def test_capacity_one(self):
        cache = LRUCache(1)
        cache.put(1, 1)
        self.assertEqual(cache.get(1), 1)
        cache.put(2, 2)
        self.assertEqual(cache.get(1), -1)
        self.assertEqual(cache.get(2), 2)

if __name__ == "__main__":
    unittest.main()


---

## 5. 数据分析提示词

### 5.1 数据解读

#### 示例：销售数据分析

**提示词**：

```python
data = """
日期,销售额,订单数,客单价,活跃用户数,退货率,广告支出
2024-04-01,150000,500,300,1200,5.2%,15000
2024-04-08,165000,550,300,1250,5.0%,18000
2024-04-15,170000,520,327,1300,4.8%,20000
"""

prompt = f"""你是一位数据分析师，擅长从数据中提取业务洞察，并提供可操作的建议。
你的分析严谨、客观，注重数据驱动的决策。

任务：请分析以下电商平台的销售数据，并提取关键洞察。

数据（CSV格式）：


分析要求：
请完成以下分析：

1. **数据概览**
   - 数据时间范围
   - 核心指标的变化趋势

2. **关键指标分析**
   - 销售额增长率（按周）
   - 订单数增长率
   - 客单价变化趋势
   - 活跃用户增长
   - 退货率趋势
   - 广告支出回报率（ROAS）分析

3. **业务洞察**
   - 至少提取3个关键洞察
   - 每个洞察都应该有数据支撑

4. **建议**
   - 提供至少2条可操作的业务建议
   - 建议应该基于数据分析结果

输出格式：
请以Markdown格式输出分析报告，包含：
- 标题和章节结构
- 表格（用于展示数据和对比）
- 要点列表
- 结论和建议

非常重要：请基于数据说话，不要添加数据中没有的信息。"""

response = ollama.chat(
    model='deepseek-v4',
    messages=[{'role': 'user', 'content': prompt}]
)```

---

## 6. 推理任务提示词

### 6.1 逻辑推理

#### 示例：演绎推理

**提示词**：

```python
prompt = """你是一位逻辑推理专家，擅长演绎推理、归纳推理和批判性思维。
你的推理严谨、清晰，能够让读者轻松跟随你的思路。

任务：请解决以下逻辑推理问题，并详细展示推理过程。

问题：
所有的哺乳动物都是脊椎动物。
所有的猫都是哺乳动物。
请问：所有的猫都是脊椎动物吗？

推理步骤：
请按以下步骤推理：

1. **理解问题**：重述问题，确保准确理解。
2. **列出已知前提**：清晰列出所有给定的前提。
3. **分析逻辑关系**：识别前提之间的逻辑关联。
4. **应用推理规则**：使用演绎推理（如三段论）。
5. **检查有效性**：验证推理过程是否符合逻辑规则。
6. **得出结论**：给出明确的最终答案。

输出格式：
请以清晰的Markdown格式输出推理过程，包含：
- 标题和分节
- 逻辑符号（如⊆表示包含于）
- 示范性解释
- 结论的明确表述
"""

response = ollama.chat(
    model='deepseek-v4',
    messages=[{'role': 'user', 'content': prompt}]
)```

---

## 7. 高级技巧

### 7.1 使用DeepSeek V4-Pro进行推理（默认思维链）

DeepSeek V4系列默认开启思维链（Thinking Mode），特别擅长数学和逻辑推理。

```python
prompt = """请解决以下数学问题。让我们逐步思考：

问题：一个游泳池有甲、乙两根水管。单开甲管，2小时注满；单开乙管，3小时注满。如果同时打开两根水管，需要多少小时注满游泳池？

让我们一步步分析：

步骤1：理解问题
- 甲管单独注满需要2小时，意味着甲管每小时注满1/2个游泳池。
- 乙管单独注满需要3小时，意味着乙管每小时注满1/3个游泳池。

步骤2：建立数学模型
- 当两根水管同时打开时，它们的注水速度相加。
- 总速度 = 甲管速度 + 乙管速度 = 1/2 + 1/3

步骤3：计算总速度
- 1/2 + 1/3 = 3/6 + 2/6 = 5/6
- 所以两根水管同时工作，每小时注满5/6个游泳池。

步骤4：计算所需时间
- 时间 = 总工作量 ÷ 速度 = 1 ÷ (5/6) = 6/5 = 1.2小时

步骤5：转换为分钟（可选）
- 1.2小时 = 1小时12分钟

步骤6：验证答案
- 检查：1.2小时内，甲管注入了1.2 × (1/2) = 0.6个游泳池
- 乙管注入了1.2 × (1/3) = 0.4个游泳池
- 总计：0.6 + 0.4 = 1.0个游泳池 ✓

最终答案：需要1.2小时（或1小时12分钟）。

现在，请使用相同的步骤，解决以下新问题：
问题：如果丙管单独注满需要4小时，那么三根水管（甲、乙、丙）同时打开，需要多少小时注满游泳池？
"""

response = ollama.chat(
    model='deepseek-v4-pro',  # 使用推理专用模型
    messages=[{'role': 'user', 'content': prompt}]
)

7.2 思维链（Chain-of-Thought）在DeepSeek中的应用

python

prompt = """请解决以下数学问题。让我们逐步思考：

问题：[问题内容]

步骤1：列出已知条件
- [条件1]
- [条件2]
...

步骤2：建立数学模型
- [模型或方程]

步骤3：逐步计算
- [计算步骤1]
- [计算步骤2]
...

步骤4：验证答案
- [验证方法]

最终答案：[答案]

现在，请使用相同的步骤，解决以下新问题：
问题：[新问题]
"""

response = ollama.chat(
    model='deepseek-v4',
    messages=[{'role': 'user', 'content': prompt}]
)```

---

## 8. 配置参数建议

### 8.1 Temperature（温度）

控制生成文本的随机性。

| 任务类型                       | 推荐Temperature | 说明                     |
| ------------------------------ | --------------- | ------------------------ |
| 事实性任务（翻译、摘要、问答） | 0.1 - 0.3       | 低温度使输出更确定、一致 |
| 平衡任务（通用对话、解释）     | 0.3 - 0.7       | 适度随机性，保持连贯     |
| 创意任务（写作、头脑风暴）     | 0.7 - 1.0       | 高温度增加多样性和创意   |
| 代码生成                       | 0.2 - 0.5       | 较低温度确保语法正确     |

**使用Ollama的示例**：

```python
response = ollama.chat(
    model='deepseek-v4',
    messages=[{'role': 'user', 'content': '请将以下句子翻译成法语：[句子]'}],
    options={'temperature': 0.2}  # 低温度确保翻译准确
)

response = ollama.chat(
    model='deepseek-v4',
    messages=[{'role': 'user', 'content': '写一个关于太空探险的短篇故事'}],
    options={'temperature': 0.85}  # 高温度增加创意
)

8.2 Top P（核采样）

控制生成时考虑的token范围。

建议：

一般任务：top_p=0.9（默认）
需要高质量输出：top_p=0.95
需要更多样性：top_p=0.99

python

response = ollama.chat(
    model='deepseek-v4',
    options={
        'temperature': 0.8,
        'top_p': 0.95  # 从高概率token中采样
    }
)

8.3 Num Predict（最大生成长度）

控制模型生成的最大token数。

建议：

简单任务：100-300 tokens
中等任务（摘要、解释）：300-1000 tokens
复杂任务（文章、代码）：1000-4000 tokens

python

response = ollama.chat(
    model='deepseek-v4',
    messages=[{'role': 'user', 'content': '写一篇关于气候变化的文章'}],
    options={
        'num_predict': 2000,  # 限制输出长度约1500字
        'temperature': 0.7
    }
)

8.4 推荐配置组合

配置1：精准翻译任务

python

{
    "model": "deepseek-v4",
    "temperature": 0.2,
    "top_p": 0.9,
    "num_predict": 500
}

配置2：创意写作

python

{
    "model": "deepseek-v4",
    "temperature": 0.85,
    "top_p": 0.95,
    "num_predict": 4096
}

配置3：代码生成（使用DeepSeek V4-Pro）

python

{
    "model": "deepseek-v4",
    "temperature": 0.3,
    "top_p": 0.95,
    "num_predict": 3000
}

配置4：数学推理（使用DeepSeek V4-Pro Thinking）

python

{
    "model": "deepseek-v4",
    "temperature": 0.2,  # 低温度确保推理准确
    "top_p": 0.9,
    "num_predict": 2048
}

9. 常见错误与解决方案

9.1 输出格式不符合要求

问题描述：期望JSON输出，但DeepSeek输出纯文本。

解决方案：

方法1：在提示词中强制格式

python

prompt = """请分析以下句子的情感，并以JSON格式输出结果。

句子："这个产品真的很棒，超出我的预期！"

输出格式（严格遵守）：
{
  "sentiment": "[Positive/Neutral/Negative]",
  "confidence": [0-1之间的数值],
  "reason": "[简要说明]"
}

非常重要：只输出JSON，不要添加任何JSON以外的内容。
"""

response = ollama.chat(
    model='deepseek-v4',
    messages=[{'role': 'user', 'content': prompt}]
)```

#### 方法2：使用少样本示例

```python
prompt = """请学习以下情感分析的输出格式，然后分析新句子。

示例1：
输入：这个产品真的太棒了，超出我的预期！
输出：{"sentiment": "Positive", "confidence": 0.95, "reason": "用户使用了'太棒了'、'超出预期'等正面词汇。"}

示例2：
输入：质量一般，性价比不高，不推荐购买。
输出：{"sentiment": "Negative", "confidence": 0.88, "reason": "用户明确指出'不推荐购买'，且提到性价比不高。"}

现在请分析：
输入：还算可以吧，没什么特别的。
输出："""

response = ollama.chat(
    model='deepseek-v4',
    messages=[{'role': 'user', 'content': prompt}]
)```

### 9.2 输出过于冗长

**问题描述**：DeepSeek容易生成过长的输出，超出预期长度。

**解决方案**：

#### 方法1：明确指定字数要求

```python
prompt = """请写一篇关于人工智能的短文。

要求：
1. 字数：500-600字（严格遵守）
2. 包含3个主要观点
3. 每个观点用一段话阐述

非常重要：请确保字数在500-600字之间，不要超出。"""

response = ollama.chat(
    model='deepseek-v4',
    options={'num_predict': 800}  # 约500-600字
)

10. 实用提示词模板

模板1：技术文章写作

python

prompt = """你是一位[角色，如：资深技术博客作者/学术写作助手]，擅长[写作风格描述]。

任务：请写一篇关于「[文章主题]」的[文体，如：教程/评论/分析报告]。

## 目标读者
[描述目标读者，如：中级开发者/学术研究/普通消费者]

## 文章要求
1. 字数：[X-Y字]
2. 结构：
   - 引言：[要求]
   - 主体：[章节安排]
   - 结论：[要求]
3. 风格：[专业/亲和/学术/营销]
4. 包含：[代码示例/数据图表/案例分析]
5. 语调：[客观/热情/严谨/ persuasive]

## 补充信息
[提供任何相关的背景信息、关键词、参考资料等]

输出格式：Markdown
"""

response = ollama.chat(
    model='deepseek-v4',
    messages=[{'role': 'user', 'content': prompt}]
)```

### 模板2：代码生成（Python）

```python
prompt = """你是一个[语言]高级开发工程师，
擅长[领域，如：Web开发/数据科学/算法实现]。

## 任务描述
[详细描述需要实现的的功能或解决的问题]

## 具体需求
1. [需求1]
2. [需求2]
3. [需求3]
...

## 技术要求
- 编程语言：[语言及版本]
- 框架/库：[列出需要的框架]
- 代码规范：[如：PEP 8/Airbnb Style]
- 性能要求：[如：时间复杂度O(n log n)]

## 输出要求
1. 完整的可运行代码
2. 详细注释
3. 文档字符串（docstring）
4. 使用示例
5. 单元测试
6. 复杂度分析

## 约束条件
[列出任何限制或特殊情况]
"""

response = ollama.chat(
    model='deepseek-v4',  # 使用V4-Pro旗舰版
    messages=[{'role': 'user', 'content': prompt}]
)

11. 参考资料

官方文档

DeepSeek Official Documentation
https://platform.deepseek.com/docs
DeepSeek的官方API文档（如果使用API服务）。
DeepSeek-V4 Technical Report
https://arxiv.org/abs/2504.12345（待更新） DeepSeek-V4的技术报告，详细介绍混合注意力架构和训练方法。

社区资源

DeepSeek AI on Hugging Face
https://huggingface.co/deepseek-ai
DeepSeek的官方模型仓库，可以下载模型权重。
Ollama - DeepSeek
https://ollama.com/library/deepseek-v4
使用Ollama运行DeepSeek-V4的最简单方式。
Awesome DeepSeek
https://github.com/awesome-deepseek/awesome-deepseek
DeepSeek相关的资源、项目、教程集合。

教程

DeepSeek-V4 部署指南
https://platform.deepseek.com/docs
官方提供的DeepSeek-V4部署和使用指南。
DeepSeek-V4 开源发布
https://developer.aliyun.com/article/1730877
DeepSeek-V4开源的详细介绍，含Pro和Flash双版本说明。

📝 更新日志

2026-05-31：更新至DeepSeek V4系列（V4-Pro 1.6T / V4-Flash 284B）
2026-05-18：初始版本发布，完成DeepSeek提示词指南
包含DeepSeek-V2/R1/Coder的详细提示词技巧
涵盖写作、代码、数据分析、推理等主流场景
提供丰富的实用示例和可复用模板

🤝 贡献与反馈

如果你发现任何错误或有改进建议，欢迎：

提交Issue进行讨论
提交Pull Request贡献内容
分享你的提示词使用技巧

📄 许可证

本文档采用 MIT 许可证。可自由使用、修改和分发。

最后更新时间：2026年5月31日
作者：AI Engineering Team
版本：v2.0（更新至V4系列）

DeepSeek 提示词最佳实践指南 ​

1. 模型概述 ​

1.1 模型版本与特点 ​

1.2 核心优势 ​

1.3 限制与注意事项 ​

2. 提示词基础 ​

2.1 DeepSeek提示词的基本结构 ​

DeepSeek-V4 格式 ​

2.2 使用Hugging Face Transformers（推荐） ​

2.3 使用Ollama（本地运行，最简单） ​

安装和使用 ​

Python代码示例 ​

2.4 核心提示词技巧 ​

✅ 技巧1：提供详细指令 ​

复杂度分析 ​

测试 ​

7.2 思维链（Chain-of-Thought）在DeepSeek中的应用 ​

8.2 Top P（核采样） ​

8.3 Num Predict（最大生成长度） ​

8.4 推荐配置组合 ​

配置1：精准翻译任务 ​

配置2：创意写作 ​

配置3：代码生成（使用DeepSeek V4-Pro） ​

配置4：数学推理（使用DeepSeek V4-Pro Thinking） ​

9. 常见错误与解决方案 ​

9.1 输出格式不符合要求 ​

方法1：在提示词中强制格式 ​

10. 实用提示词模板 ​

模板1：技术文章写作 ​

11. 参考资料 ​

官方文档 ​

社区资源 ​

教程 ​

📝 更新日志 ​

🤝 贡献与反馈 ​

📄 许可证 ​

DeepSeek 提示词最佳实践指南

1. 模型概述

1.1 模型版本与特点

1.2 核心优势

1.3 限制与注意事项

2. 提示词基础

2.1 DeepSeek提示词的基本结构

DeepSeek-V4 格式

2.2 使用Hugging Face Transformers（推荐）

2.3 使用Ollama（本地运行，最简单）

安装和使用

Python代码示例

2.4 核心提示词技巧

✅ 技巧1：提供详细指令

复杂度分析

测试

7.2 思维链（Chain-of-Thought）在DeepSeek中的应用

8.2 Top P（核采样）

8.3 Num Predict（最大生成长度）

8.4 推荐配置组合

配置1：精准翻译任务

配置2：创意写作

配置3：代码生成（使用DeepSeek V4-Pro）

配置4：数学推理（使用DeepSeek V4-Pro Thinking）

9. 常见错误与解决方案

9.1 输出格式不符合要求

方法1：在提示词中强制格式

10. 实用提示词模板

模板1：技术文章写作

11. 参考资料

官方文档

社区资源

教程

📝 更新日志

🤝 贡献与反馈

📄 许可证