微软自研AI三件套落地 豪言到2027年自主打造大型尖端模型
22 小时前

美国科技公司微软于2026年4月2日宣布,其AI超级智能团队开发的MAI-Transcribe-1、MAI-Voice-1和MAI-Image-2三款自研AI模型正式广泛商用。此举旨在减少对长期合作伙伴OpenAI的依赖,并展示微软在AI领域的自主能力。MAI-Transcribe-1是语音转录模型,在FLEURS基准测试中平均字错误率仅3.9%,为全球最精准,支持25种语言,转录速度达Azure Fast服务的2.5倍,定价0.36美元/小时。MAI-Voice-1是语音生成模型,能在单块GPU上不到1秒生成60秒音频,支持单人叙述与多说话人对话,已集成至Copilot Daily、Podcasts等功能。MAI-Image-2是图像生成模型,上线即跻身Arena.ai榜单前三,生成速度较前代提升一倍,已全面接入必应搜索与幻灯片软件,能精准还原光影效果与真实肤色,并增强文本渲染能力。