MiniMax 系列论文清单

截至 2026-05。MiniMax 的技术底色是线性注意力(Lightning Attention)。下面分两部分:①「MiniMax 官方模型报告」;②「Lightning Attention 技术谱系」(OpenNLPLab 的基础工作,是 MiniMax 线性注意力的来源,相关但非 MiniMax 官方署名)。arXiv 编号均已逐条核对。

概览

  • MiniMax 官方论文:5 篇
  • Lightning Attention 谱系(相关):4 篇
  • 时间跨度:2023-07 ~ 2026-05

一、MiniMax 官方模型 / 技术报告

论文 时间 链接 一句话核心
MiniMax-01: Scaling Foundation Models with Lightning Attention 2025-01 2501.08313 456B MoE(激活 45.9B)+ 闪电注意力;含 Text-01 & VL-01;训练 1M、外推 4M 上下文
MiniMax-Speech: Intrinsic Zero-Shot TTS with a Learnable Speaker Encoder 2025-05 2505.07916 可学习音色编码器,32 语言零样本语音克隆
One RL to See Them All: Visual Triple Unified Reinforcement Learning 2025-05 2505.18129 V-Triune 统一视觉推理 + 感知 RL;Orsta 7B/32B
MiniMax-M1: Scaling Test-Time Compute Efficiently with Lightning Attention 2025-06 2506.13585 首个开源大规模混合注意力推理模型,原生 1M 上下文
The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence ⭐ 2026-05 2605.26494 230B / 10B 激活,主打 agentic & coding;Forge RL 系统;含 M2.7

二、Lightning Attention 技术谱系(OpenNLPLab,相关基础工作)

作者多为 Zhen Qin / Weigao Sun / Yiran Zhong 等(OpenNLPLab)。这是 MiniMax 线性注意力的技术来源,与 MiniMax 一脉相承,但并非 MiniMax 官方署名论文

论文 时间 链接 一句话核心
TransNormerLLM: A Faster and Better LLM with Improved TransNormer 2023-07 2307.14995 首个在精度与效率上超越 softmax 注意力的线性注意力 LLM
Lightning Attention-2: A Free Lunch for Handling Unlimited Sequence Lengths 2024-01 2401.04658 让线性注意力真正兑现理论复杂度的 IO 友好实现
Linear Attention Sequence Parallelism(LASP) 2024-04 2404.02882 线性注意力的序列并行训练
Various Lengths, Constant Speed: Efficient Language Modeling with Lightning Attention 2024-05 2405.17381 恒定速度的高效语言建模

附注

  • 仅模型 / 发布、无独立论文:MiniMax-M2.1、M2.5 等迭代版本;Hailuo 视频、音乐生成等方向暂未见独立 arXiv 论文。
  • MiniMax-VL-01 不是独立论文,与 MiniMax-Text-01 同属 2501.08313