阿里千问上线全模态大模型Qwen3.5-Omni
4 天前

2026年3月30日,阿里千问宣布全模态大模型Qwen3.5-Omni正式上线。该系列包含Plus、Flash、Light三种尺寸的Instruct版本,支持256k长上下文,可处理超过10小时的音频输入及超过400秒的720P(1 FPS)音视频输入。Qwen3.5-Omni在音视频理解、识别、交互等215项任务中取得SOTA(性能最佳),超越Gemini-3.1 Pro,成为全球最强的全模态大模型之一。该模型支持113种语种和方言的语音识别,以及36种语种和方言的语音生成,目前可通过Offline API和Realtime API进行体验。此外,Qwen3.5-Omni还涌现出了音视频Vibe Coding能力,用户可通过口述需求直接生成带有复杂UI的产品原型界面。普通用户可前往Qwen Chat免费体验,开发者和企业可通过阿里云百炼平台调用该模型,每百万Tokens输入价格不到0.8元。