阿里巴巴发布全球最强开源模型Qwen3.5-Plus,分析称显示出全球化雄心
16 小时前 / 阅读约4分钟
来源:集微网
阿里巴巴发布Qwen3.5人工智能模型,含开源和托管版本,性能成本改进,具原生多模态能力,支持新编码和代理能力,与开源AI代理兼容。Qwen-3.5性能登顶全球最强开源模型,支持201种语言和方言。

阿里巴巴集团发布了其最新的人工智能模型系列,以应对在中国人工智能领域日益激烈的竞争。据报道,Qwen3.5人工智能模型推出了开源版本,允许用户下载、运行、微调和部署在自己的基础设施上。阿里巴巴还发布了一个“托管版本”,意味着模型可以在阿里巴巴自己的服务器上运行。

这两款模型都在2月16日,即中国新年前夕发布,仅在阿里巴巴发布一款专为机器人设计的新型人工智能模型一周后。该公司强调,Qwen3.5-Plus在性能和成本上都有改进,并具有“原生多模态能力”,使模型能够在一个系统中同时理解文本、图像和视频。

今年,该模型也顺应了人工智能的主要趋势,支持新的编码和代理能力,并与开源人工智能代理兼容,例如最近人气飙升的 OpenClaw 代理。据悉,人工智能代理是能够独立采取行动并代表用户完成多步骤任务的系统,且只需最少的监督。这些代理及其能力在最近几周引起了很多关注,此前美国人工智能公司Anthropic发布了新的代理工具。

值得注意的是,阿里巴巴的本地竞争对手,如字节跳动和智谱AI,也在上周发布了旨在支持更多代理能力的升级模型。Counterpoint Research 的研究主管马克·爱因斯坦 (Marc Einstein)称,人工智能公司正在为人工智能代理可能“颠覆传统互联网商业模式”的可能性做准备。

阿里巴巴表示,其新的Qwen3.5-Plus开源模型带有3970亿个参数——这些变量塑造了人工智能系统的学习和推理方式。虽然少于其之前的旗舰模型,但公司表示,根据报告的基准评估,最新模型显示出了显著的改进。

阿里巴巴提供的基准测试显示,Qwen-3.5的性能与OpenAI、Anthropic和谷歌DeepMind的领先模型相当,登顶全球最强开源模型。该模型部署显存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。

同时,它还通过其云平台Model Studio发布了一个名为Qwen-3.5-Plus的“托管模型”。阿里巴巴表示,这个版本也展示了与领先竞争对手相当的性能。

据介绍,Qwen-3.5-Plus在MMLU-Pro认知能力评测中得分87.8分,超越GPT-5.2;在博士级难题GPQA测评中斩获88.4分,高于Claude 4.5;在指令遵循IFBench以76.5分刷新所有模型纪录。而在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等基准中,Qwen-3.5-Plus3.5表现均超越Gemini 3 Pro。

此外,在多模态推理(MathVison)、通用视觉问答VQA(RealWorldQA)、文本识别和文件理解(CC_OCR)、空间智能(RefCOCO-avg)、视频理解(MLVU)等众多权威评测中,Qwen-3.5-Plus均斩获最佳性能。在视频理解方面,千问3.5支持长达2小时(1M token上下文)的视频直接输入,适用于长视频内容分析与摘要生成。

报道称,新的Qwen3.5模型实现了从纯文本模型到原生多模态模型的代际跃迁,基于视觉和文本混合token上预训练,并大幅新增中英文、多语言、STEM和推理等数据。同时,其支持201种语言和方言,比上一代的82种有所增加。Counterpoint 的 Einstein 表示,这一特性反映了阿里巴巴的全球雄心。

在Anthropic发布最新的Claude人工智能代理工具后,其他美国人工智能巨头也在加快代理能力的开放。OpenAI首席执行官Sam Altman周日表示,OpenClaw的创造者将加入公司。此外,上个月,谷歌DeepMind负责人Demis Hassabis称,中国的人工智能模型仅比西方竞争对手“落后几个月”。