MiniMax 系列论文清单

截至 2026-05。MiniMax 的技术底色是线性注意力（Lightning Attention）。下面分两部分：①「MiniMax 官方模型报告」；②「Lightning Attention 技术谱系」（OpenNLPLab 的基础工作，是 MiniMax 线性注意力的来源，相关但非 MiniMax 官方署名）。arXiv 编号均已逐条核对。

概览

MiniMax 官方论文：5 篇
Lightning Attention 谱系（相关）：4 篇
时间跨度：2023-07 ～ 2026-05

一、MiniMax 官方模型 / 技术报告

论文	时间	链接	一句话核心
MiniMax-01: Scaling Foundation Models with Lightning Attention	2025-01	2501.08313	456B MoE（激活 45.9B）+ 闪电注意力；含 Text-01 & VL-01；训练 1M、外推 4M 上下文
MiniMax-Speech: Intrinsic Zero-Shot TTS with a Learnable Speaker Encoder	2025-05	2505.07916	可学习音色编码器，32 语言零样本语音克隆
One RL to See Them All: Visual Triple Unified Reinforcement Learning	2025-05	2505.18129	V-Triune 统一视觉推理 + 感知 RL；Orsta 7B/32B
MiniMax-M1: Scaling Test-Time Compute Efficiently with Lightning Attention	2025-06	2506.13585	首个开源大规模混合注意力推理模型，原生 1M 上下文
The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence ⭐	2026-05	2605.26494	230B / 10B 激活，主打 agentic & coding；Forge RL 系统；含 M2.7

二、Lightning Attention 技术谱系（OpenNLPLab，相关基础工作）

作者多为 Zhen Qin / Weigao Sun / Yiran Zhong 等（OpenNLPLab）。这是 MiniMax 线性注意力的技术来源，与 MiniMax 一脉相承，但并非 MiniMax 官方署名论文。

论文	时间	链接	一句话核心
TransNormerLLM: A Faster and Better LLM with Improved TransNormer	2023-07	2307.14995	首个在精度与效率上超越 softmax 注意力的线性注意力 LLM
Lightning Attention-2: A Free Lunch for Handling Unlimited Sequence Lengths	2024-01	2401.04658	让线性注意力真正兑现理论复杂度的 IO 友好实现
Linear Attention Sequence Parallelism（LASP）	2024-04	2404.02882	线性注意力的序列并行训练
Various Lengths, Constant Speed: Efficient Language Modeling with Lightning Attention	2024-05	2405.17381	恒定速度的高效语言建模