腾讯发布AudioGenie无训练多智能体系统,该系统在多模态到多音频(MM2MA)生成领域取得突破,能从视频、文本、图像等多模态输入中合成音效、语音、音乐等,解决了高质量配对数据稀缺等挑战。AudioGenie采用双层架构,包含生成与监督团队,实验表明其性能优异,为跨模态音频生成应用开辟新路径。