Qwen 系列论文清单
截至 2026-05,按模型方向整理。标 ⭐ 为 2025Q4–2026 的最新工作;arXiv 编号均已逐条核对。
概览
- 论文总数:约 25 篇技术报告 / 论文(不含纯模型发布与博客)
- 时间跨度:2023-08 ~ 2026-05
- 九条方向:基础大模型 / 代码 / 数学与推理 / 视觉-语言 / 音频语音 / 全模态 / 图像生成 / 向量检索 / 安全
一、基础大模型(Foundation LLMs)
| 论文 |
时间 |
链接 |
一句话核心 |
| Qwen Technical Report |
2023-09 |
2309.16609 |
通义千问开山,base + RLHF chat |
| Qwen2 Technical Report |
2024-07 |
2407.10671 |
0.5B–72B,引入 MoE,多语言增强 |
| Qwen2.5 Technical Report |
2024-12 |
2412.15115 |
18T tokens 预训练,全尺寸开源 |
| Qwen2.5-1M Technical Report |
2025-01 |
2501.15383 |
上下文扩展到 100 万 token |
| Qwen3 Technical Report |
2025-05 |
2505.09388 |
thinking/non-thinking 统一,0.6B–235B MoE,119 语言 |
二、代码(Coding)
| 论文 |
时间 |
链接 |
一句话核心 |
| Qwen2.5-Coder Technical Report |
2024-09 |
2409.12186 |
0.5B–32B,5.5T 代码语料 |
| Qwen3-Coder-Next Technical Report ⭐ |
2026-03 |
2603.00729 |
小型混合模型,3B 激活做 agentic coding |
三、数学与推理(Math & Reasoning)
| 论文 |
时间 |
链接 |
一句话核心 |
| Qwen2.5-Math Technical Report |
2024-09 |
2409.12122 |
自我改进式数学专家模型 |
| The Lessons of Developing Process Reward Models(Qwen2.5-Math-PRM) |
2025-01 |
2501.07301 |
过程奖励模型(PRM)经验总结 |
四、视觉-语言(Vision-Language)
| 论文 |
时间 |
链接 |
一句话核心 |
| Qwen-VL |
2023-08 |
2308.12966 |
首代 VLM,定位 / 文字识别 |
| Qwen2-VL |
2024-09 |
2409.12191 |
Naive Dynamic Resolution 任意分辨率 |
| Qwen2.5-VL Technical Report |
2025-02 |
2502.13923 |
675M ViT,图文 + 视频 |
| Qwen3-VL Technical Report ⭐ |
2025-11 |
2511.21631 |
256K 上下文,dense + MoE |
五、音频与语音(Audio & Speech)
| 论文 |
时间 |
链接 |
一句话核心 |
| Qwen-Audio |
2023-11 |
2311.07919 |
30+ 任务统一音频理解 |
| Qwen2-Audio Technical Report |
2024-07 |
2407.10759 |
语音 / 自然声 / 音乐 |
| Qwen3-TTS Technical Report ⭐ |
2026-01 |
2601.15621 |
文本转语音 |
六、全模态(Omni)
| 论文 |
时间 |
链接 |
一句话核心 |
| Qwen2.5-Omni Technical Report |
2025-03 |
2503.20215 |
端到端文 / 音 / 图 / 视,Thinker-Talker |
| Qwen3-Omni Technical Report |
2025-09 |
2509.17765 |
全模态无性能损失,Thinker-Talker MoE |
| Qwen3.5-Omni Technical Report ⭐ |
2026-04 |
2604.15804 |
原生全模态 agent,Hybrid-Attention MoE |
七、图像生成(Image Generation)
| 论文 |
时间 |
链接 |
一句话核心 |
| Qwen-Image Technical Report |
2025-08 |
2508.02324 |
图像生成 + 编辑,强中文文字渲染 |
| Qwen-Image-2.0 Technical Report ⭐ |
2026-05 |
2605.10730 |
Qwen-Image 二代 |
| Qwen-Image-VAE-2.0 Technical Report ⭐ |
2026-05 |
2605.13565 |
配套 VAE 二代 |
八、向量表示与检索(Embedding & Retrieval)
| 论文 |
时间 |
链接 |
一句话核心 |
| Qwen3 Embedding |
2025-06 |
2506.05176 |
文本嵌入 + 重排,MTEB 多语第一 |
| Qwen3-VL-Embedding & Qwen3-VL-Reranker ⭐ |
2026-01 |
2601.04720 |
多模态检索 / 排序统一框架 |
九、安全(Safety)
| 论文 |
时间 |
链接 |
一句话核心 |
| Qwen3Guard Technical Report |
2025-10 |
2510.14276 |
多语言安全护栏,0.6B/4B/8B |
附注
- 仅发布模型 / 博客、无独立论文:QwQ-32B、QVQ-72B-Preview、Qwen2-Math、CodeQwen1.5、Qwen3-Coder(480B)、Qwen2.5-Turbo、Qwen3-Max、Qwen3.5(base)等。
- 未纳入:M6 / OFA / Chinese-CLIP 等通义实验室早期工作(早于 Qwen 品牌,非 Qwen 系列)。