GPT 系列技术报告清单
截至 2026-05 整理。重要说明:与 DeepSeek / Qwen 不同,OpenAI 很少发布完整技术论文 —— GPT-3、GPT-4、InstructGPT、Codex、WebGPT 是真正的论文;而 GPT-4o 之后(o1、GPT-5 等)基本只有 System Card(系统/安全报告),没有架构与训练细节。下面按「正式论文」与「System Card」分层标注。
概览
- 正式论文 / 技术报告:7 篇(GPT-1 ~ GPT-4 + InstructGPT / Codex / WebGPT)
- System Cards:7 份(GPT-4o ~ GPT-5.5)
- 时间跨度:2018-06 ~ 2026-04
一、GPT 主线模型报告(GPT-1 → GPT-4)
| 报告 |
时间 |
链接 |
一句话核心 |
| GPT-1: Improving Language Understanding by Generative Pre-Training |
2018-06 |
OpenAI PDF |
生成式预训练 + 判别式微调范式开端 |
| GPT-2: Language Models are Unsupervised Multitask Learners |
2019-02 |
OpenAI PDF |
零样本多任务,规模化语言模型 |
| GPT-3: Language Models are Few-Shot Learners |
2020-05 |
2005.14165 |
175B,in-context few-shot learning |
| GPT-4 Technical Report |
2023-03 |
2303.08774 |
多模态、大规模,几乎无架构细节 |
二、方法 / 能力论文(RLHF・代码・检索)
| 论文 |
时间 |
链接 |
一句话核心 |
| InstructGPT: Training language models to follow instructions with human feedback |
2022-03 |
2203.02155 |
RLHF 对齐,ChatGPT 的方法基础 |
| Codex: Evaluating Large Language Models Trained on Code |
2021-07 |
2107.03374 |
代码模型,GitHub Copilot 的底座 |
| WebGPT: Browser-assisted question-answering with human feedback |
2021-12 |
2112.09332 |
浏览器辅助问答 + 人类反馈 |
三、System Cards(系统 / 安全报告)
| 报告 |
时间 |
链接 |
备注 |
| GPT-4o System Card |
2024-08 |
2410.21276 |
全模态(文/音/图/视) |
| OpenAI o1 System Card |
2024-12 |
2412.16720 |
首个 o 系列推理模型 |
| GPT-4.5 System Card |
2025-02 |
OpenAI PDF |
research preview(已退役) |
| OpenAI o3 & o4-mini System Card |
2025-04 |
OpenAI PDF |
新版 Preparedness Framework |
| GPT-5 System Card |
2025-08 |
2601.03267 |
路由式统一系统(快/慢模型) |
| GPT-5.2 System Card |
2025-12 |
OpenAI PDF |
GPT-5 系列更新 |
| GPT-5.5 System Card |
2026-04 |
OpenAI PDF |
最新,含 5.5 Pro |
附注
- 仅博客 / 发布说明、无正式报告或独立 System Card:GPT-4.1(2025-04,API 发布)、GPT-4o-mini、o3-mini、GPT-5.1 等。
- GPT-4V(ision) System Card(2023-09)存在,但下载链接未在本次核对中确认,未纳入下载。
- 非 GPT 系列、未纳入:CLIP、DALL·E、Whisper、Sora 等 OpenAI 其他方向工作。
- OpenAI 自 GPT-4 起几乎不再公开训练 / 架构细节,System Card 主要覆盖安全评估与红队测试。