掌握自己熟知的   探索未来需要的
当前位置: 首页 >> 行业前沿 >> Xiaomi MiMo 携手 TileRT | 1T 模型首次突破 1000 tokens/s 输出速度

Xiaomi MiMo 携手 TileRT | 1T 模型首次突破 1000 tokens/s 输出速度

创建时间: 2026-06-11

从内燃机时代的跑车,到超音速飞行,人类对速度的渴望刻在基因里。AI推理速度同样决定智能的边界——足够快的模型不再是“等待结果”的工具,而是思维延伸:可实时响应、即时迭代、无缝协作。

今日 MiMo × TileRT 联合发布:Xiaomi MiMo-V2.5-Pro 的 UltraSpeed 模式,让万亿参数的旗舰模型输出速度首次突破 1000 tokens/s

1000 tokens/s 到底有多快

MiMo-V2.5-Pro-UltraSpeed:完成时间 00:12.35
MiMo-V2.5-Pro(标准模式):完成时间 00:19.46

TileRT:让注意力计算更聪明

TileRT(Tile-based Reasoning Transformer)是本次突破的核心。它的核心思路是将长序列的注意力计算切分为更小、更易管理的“砖块”(tile),在不损失精度的情况下大幅降低计算复杂度。

万亿参数 + MoE:TileRT 助力 MiMo-V2.5-Pro

Xiaomi MiMo-V2.5-Pro 采用了 MoE(Mixture of Experts)架构,万亿参数分布在多个专家网络中。在 UltraSpeed 模式下,TileRT 与 MoE 的动态路由机制协同工作,使推理路径更加高效。

1000 tokens/s 意味着什么

1000 tokens/s 的输出速度相当于每秒生成约500个中文字。这意味着:

  • 实时对话:AI 可以像真人一样即时响应,无延迟感
  • 长文本生成:一篇3000字的文章在6秒内生成完毕
  • 多轮推理:在复杂推理任务中,模型可以快速迭代中间步骤

原文来源:小米大模型 Xiaomi MiMo | 发布时间:2026年6月9日

相关资讯
微信咨询
微信在线客服
7*10小时为您服务
QQ在线
欢迎QQ在线资讯
工作时间: 8:00 - 21:00
在线客服
在线客服