西郊有密林,助君出重围
DeepSeek-V4: Towards Highly Efficient Million-Token Context Intelligence
Muon 优化器:它怎么做、为什么有效,以及哪些大模型在用
Kimi 系列论文阅读清单
投机采样 / 投机解码:原理推导与论文清单
MiniMax 系列论文阅读清单
GPT 列技术报告与论文清单
Qwen 系列论文阅读清单
DeepSeek 系列论文阅读清单
Farewell to Item IDs: Unlocking the Scaling Potential of Large Ranking Models via Semantic Tokens