小米开源首个原生端到端语音大模型 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

小米开源首个原生端到端语音大模型

2025-09-19

今日，小米正式开源其首个原生端到端语音模型Xiaomi-MiMo-Audio。该模型基于创新预训练架构及上亿小时训练数据，首次在语音领域实现基于ICL的少样本泛化，并在预训练中观察到明显的“涌现”行为。在多项标准评测中，MiMo-Audio性能大幅超越同参数量开源模型，并在音频理解基准MMAU测试集上超越Google闭源模型Gemini-2.5-Flash，在音频复杂推理基准Big Bench Audio S2T任务中超越OpenAI闭源模型GPT-4o-Audio-Preview。

上一篇：郭明錤：英伟达与英特尔合作有望定义AI PC并加速其发展

下一篇：面壁智能联合清华发布VoxCPM语音模型性能达业界顶尖

返回列表

热文阅读

2 天前

刚刚，全球首个超高帧世界模型诞生，英伟达含量0，狂飙50帧

1 天前

那个当面把马斯克怼到破防的刺头，也离开OpenAI了

2 天前

腾讯放“手”，AI没有大哥

2 天前

小米再传重大调整，小爱同学被分拆了