阿里又一大模型开源 手机电脑样样玩的溜 多项测试秒GPT-5
5 天前

2025年9月24日,阿里通义大模型团队推出全新升级的Qwen3-VL系列模型,并宣布旗舰版本Qwen3-VL-235B-A22B系列开源。作为Qwen系列中最强的视觉语言模型,Qwen3-VL不仅能让模型看到图像或视频,更能使其看懂世界、理解事件并做出行动。在官方演示中,该模型已展现出强大的视觉驱动推理与执行能力,可操作手机、电脑等设备,并根据自然语言指令完成打开应用、点击按钮、填写信息等任务,还能轻松完成航班的查询和预定。Qwen3-VL具备识别万物的能力,其知识储备范围涵盖名人、美食、动植物、汽车品牌、动漫角色等。在十个维度的全面评估中,Qwen3-VL-235B-A22B-Instruct在非推理类模型中多数指标表现最优,超越了Gemini 2.5 Pro和GPT-5等闭源模型,同时刷新了开源多模态模型的最佳成绩。目前,Qwen3-VL-235B-A22B-Instruct、Qwen3-VL-235B-A22B-Thinking均已开源至Github、Hugging Face、魔搭等开源平台。