1月8日,在阿里云通义智能硬件展上,阿里云发布多模态交互开发套件。该套件集成千问、万相、百聆三款通义基础大模型,预置十多款生活休闲、工作效率等领域的Agent和MCP工具,具备听、看、思考及与物理世界交互的能力,可应用于AI眼镜、学习机、陪伴玩具、智能机器人等硬件设备。该套件适配30多款主流终端芯片平台,端到端语音交互时延低至1秒,视频交互时延低至1.5秒,还接入了阿里云百炼平台生态,支持扩展应用能力边界。