MiniMax 系列论文阅读清单
MiniMax 系列论文清单
截至 2026-05。MiniMax 的技术底色是线性注意力(Lightning Attention)。下面分两部分:①「MiniMax 官方模型报告」;②「Lightning Attention 技术谱系」(OpenNLPLab 的基础工作,是 MiniMax 线性注意力的来源,相关但非 MiniMax 官方署名)。arXiv 编号均已逐条核对。
概览
- MiniMax 官方论文:5 篇
- Lightning Attention 谱系(相关):4 篇
- 时间跨度:2023-07 ~ 2026-05
一、MiniMax 官方模型 / 技术报告
| 论文 | 时间 | 链接 | 一句话核心 |
|---|---|---|---|
| MiniMax-01: Scaling Foundation Models with Lightning Attention | 2025-01 | 2501.08313 | 456B MoE(激活 45.9B)+ 闪电注意力;含 Text-01 & VL-01;训练 1M、外推 4M 上下文 |
| MiniMax-Speech: Intrinsic Zero-Shot TTS with a Learnable Speaker Encoder | 2025-05 | 2505.07916 | 可学习音色编码器,32 语言零样本语音克隆 |
| One RL to See Them All: Visual Triple Unified Reinforcement Learning | 2025-05 | 2505.18129 | V-Triune 统一视觉推理 + 感知 RL;Orsta 7B/32B |
| MiniMax-M1: Scaling Test-Time Compute Efficiently with Lightning Attention | 2025-06 | 2506.13585 | 首个开源大规模混合注意力推理模型,原生 1M 上下文 |
| The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence ⭐ | 2026-05 | 2605.26494 | 230B / 10B 激活,主打 agentic & coding;Forge RL 系统;含 M2.7 |
二、Lightning Attention 技术谱系(OpenNLPLab,相关基础工作)
作者多为 Zhen Qin / Weigao Sun / Yiran Zhong 等(OpenNLPLab)。这是 MiniMax 线性注意力的技术来源,与 MiniMax 一脉相承,但并非 MiniMax 官方署名论文。
| 论文 | 时间 | 链接 | 一句话核心 |
|---|---|---|---|
| TransNormerLLM: A Faster and Better LLM with Improved TransNormer | 2023-07 | 2307.14995 | 首个在精度与效率上超越 softmax 注意力的线性注意力 LLM |
| Lightning Attention-2: A Free Lunch for Handling Unlimited Sequence Lengths | 2024-01 | 2401.04658 | 让线性注意力真正兑现理论复杂度的 IO 友好实现 |
| Linear Attention Sequence Parallelism(LASP) | 2024-04 | 2404.02882 | 线性注意力的序列并行训练 |
| Various Lengths, Constant Speed: Efficient Language Modeling with Lightning Attention | 2024-05 | 2405.17381 | 恒定速度的高效语言建模 |
附注
- 仅模型 / 发布、无独立论文:MiniMax-M2.1、M2.5 等迭代版本;Hailuo 视频、音乐生成等方向暂未见独立 arXiv 论文。
- MiniMax-VL-01 不是独立论文,与 MiniMax-Text-01 同属 2501.08313。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Baisen's Blog!








