AI通过聆听街道背景音乐生成准确的街道图像
2024-12-03

德克萨斯大学奥斯汀分校康宇豪副教授及其团队开发了一项新技术,能将街道录音转化为高度准确的图像。这项名为“声音到图像扩散模型”的技术,与以往生成声音效果的人工智能系统相反,实现了从声音到图像的转换。该技术在一个包含10秒视听片段的数据集上进行了训练。