DeepSeek 系列论文阅读清单

发表于2026-05-30|更新于2026-06-01|学习笔记

DeepSeek 系列论文清单

截至 2026-05，按研究主线整理。标 ⭐ 为 2025Q4–2026 的最新工作；arXiv 编号均已逐条核对。

概览

论文总数：约 30 篇（含技术报告，不含纯代码仓库与模型版本发布）
时间跨度：2024-01 ～ 2026-04
七条主线：基座大模型 / 推理 / 架构与基建 / 数学 / 代码 / 定理证明 / 多模态与 OCR

一、基座大模型主线

论文	时间	链接	一句话核心
DeepSeek LLM: Scaling Open-Source Language Models with Longtermism	2024-01	2401.02954	起点，7B/67B，系统研究开源 scaling law
DeepSeek-V2	2024-05	2405.04434	首提 MLA（多头潜在注意力），极致降本
DeepSeek-V3 Technical Report	2024-12	2412.19437	671B MoE（激活 37B），FP8 训练
DeepSeek-V3.2	2025-12	2512.02556	引入 DSA（稀疏注意力），长上下文提效
DeepSeek-V4: Towards Highly Efficient Million-Token Context Intelligence ⭐	2026-04	HF 技术报告	V4-Pro(1.6T/49B) + V4-Flash(284B/13B)，CSA+HCA 混合注意力、mHC，1M 上下文

二、推理

论文	时间	链接	一句话核心
DeepSeek-R1: Incentivizing Reasoning via RL	2025-01	2501.12948	纯 RL 激发推理；登上 Nature 封面（645:633–638）
Inference-Time Scaling for Generalist Reward Modeling（SPCT / DeepSeek-GRM）	2025-04	2504.02495	通用奖励模型的推理时扩展
CodeI/O: Condensing Reasoning Patterns via Code Input-Output Prediction †	2025-02	2502.07316	用「代码输入输出预测」蒸馏通用推理模式

三、核心架构 / 训练 / 基建

论文	时间	链接	一句话核心
DeepSeekMoE: Towards Ultimate Expert Specialization	2024-01	2401.06066	细粒度专家 + 共享专家，贯穿 V2/V3
Let the Expert Stick to His Last（ESFT）	2024-07	2407.01906	专家特化微调，省 90% 存储
Auxiliary-Loss-Free Load Balancing for MoE	2024-08	2408.15664	无辅助损失的 MoE 负载均衡
Fire-Flyer AI-HPC	2024-08	2408.14158	万卡 A100 软硬件协同，降本 50%
Native Sparse Attention（NSA）	2025-02	2502.11089	硬件对齐、可原生训练的稀疏注意力
Insights into DeepSeek-V3（ISCA’25）	2025-05	2505.09343	V3 训练的硬件-模型协同设计反思
mHC: Manifold-Constrained Hyper-Connections ⭐	2025-12	2512.24880	流形约束超连接，稳定残差扩展（V4 采用）
Conditional Memory via Scalable Lookup（Engram） ⭐	2026-01	2601.07372	条件记忆，N-gram 式 O(1) 查表，新的稀疏轴
DualPath: Breaking the Storage Bandwidth Bottleneck in Agentic LLM Inference ⭐	2026-02	2602.21548	破解 agentic 推理的 KV-Cache 存储带宽瓶颈

四、数学

论文	时间	链接	一句话核心
DeepSeekMath	2024-02	2402.03300	首提 GRPO（后被 R1 沿用）
DeepSeekMath-V2: Towards Self-Verifiable Math Reasoning	2025-11	2511.22570	自验证式数学推理

五、代码

论文	时间	链接	一句话核心
DeepSeek-Coder	2024-01	2401.14196	1.3B–33B，项目级代码 + FIM
DeepSeek-Coder-V2	2024-06	2406.11931	MoE 代码模型，逼近闭源

六、定理证明（Lean）

论文	时间	链接	一句话核心
DeepSeek-Prover	2024-05	2405.14333	大规模合成 Lean 4 证明数据
DeepSeek-Prover-V1.5	2024-08	2408.08152	RMaxTS（蒙特卡洛树搜索变体）
DeepSeek-Prover-V2	2025-04	2504.21801	子目标分解 + RL

七、多模态 / 视觉 / OCR

论文	时间	链接	一句话核心
DeepSeek-VL	2024-03	2403.05525	真实场景视觉-语言理解
Janus	2024-10	2410.13848	解耦视觉编码，理解/生成统一
JanusFlow	2024-11	2411.07975	融合自回归与 rectified flow
DeepSeek-VL2	2024-12	2412.10302	MoE 视觉-语言模型
Janus-Pro	2025-01	2501.17811	Janus 数据 + 模型双扩展
DeepSeek-OCR: Contexts Optical Compression	2025-10	2510.18234	用「光学压缩」承载长上下文
DeepSeek-OCR 2: Visual Causal Flow ⭐	2026-01	2601.20552	DeepEncoder V2，视觉 token 因果重排

附注

模型发布但无独立论文：DeepSeek-V3.1 / V3.1-Terminus、R1-0528 等属版本迭代发布。
† 合作署名：CodeI/O（HKUST-NLP）、Engram（北大）、DualPath（北大 / 清华）均由 DeepSeek-AI 参与。
未纳入：DreamCraft3D（2310.16818，非 DeepSeek 论文，部分三方清单误收）；Open-Source Week 的 FlashMLA / DeepGEMM / DualPipe / EPLB / 3FS 等为开源代码库而非论文。

文章作者: Bolin Chen

文章链接: https://baisen.site/2026/05/30/deepseek-papers-list/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Baisen's Blog！

todolist 大模型论文清单 DeepSeek

相关推荐

MiniMax 系列论文阅读清单

Qwen 系列论文阅读清单

GPT 列技术报告与论文清单

Kimi 系列论文阅读清单

投机采样 / 投机解码：原理推导与论文清单

DeepSeek-V4: Towards Highly Efficient Million-Token Context Intelligence