掌握自己熟知的 探索未来需要的
从内燃机时代的跑车,到超音速飞行,人类对速度的渴望刻在基因里。AI推理速度同样决定智能的边界——足够快的模型不再是“等待结果”的工具,而是思维延伸:可实时响应、即时迭代、无缝协作。
今日 MiMo × TileRT 联合发布:Xiaomi MiMo-V2.5-Pro 的 UltraSpeed 模式,让万亿参数的旗舰模型输出速度首次突破 1000 tokens/s。
MiMo-V2.5-Pro-UltraSpeed:完成时间 00:12.35
MiMo-V2.5-Pro(标准模式):完成时间 00:19.46
TileRT(Tile-based Reasoning Transformer)是本次突破的核心。它的核心思路是将长序列的注意力计算切分为更小、更易管理的“砖块”(tile),在不损失精度的情况下大幅降低计算复杂度。
Xiaomi MiMo-V2.5-Pro 采用了 MoE(Mixture of Experts)架构,万亿参数分布在多个专家网络中。在 UltraSpeed 模式下,TileRT 与 MoE 的动态路由机制协同工作,使推理路径更加高效。
1000 tokens/s 的输出速度相当于每秒生成约500个中文字。这意味着:
原文来源:小米大模型 Xiaomi MiMo | 发布时间:2026年6月9日