阿里开源Qwen3-VL双子星模型,革新多模态检索技术
17 小时前

据通义大模型官方消息,2026年1月8日,阿里云通义千问团队正式开源多模态检索核心模型Qwen3-VL-Embedding与Qwen3-VL-Reranker。这两个模型基于Qwen3-VL构建,专为多模态信息检索与跨模态理解设计,能在统一框架内处理文本、图像、可视化文档及视频等多种模态输入。在图文检索、视频-文本匹配、视觉问答和多模态内容聚类等多样化任务中,均达到业界领先水平。Qwen3-VL-Embedding采用双塔架构,能高效地将不同模态内容独立编码为统一向量表示,实现高效的跨模态相似度计算与检索。Qwen3-VL-Reranker则采用单塔架构,通过交叉注意力机制深度分析查询与文档之间的语义关联,输出精确的相关性分数。在实际应用中,二者常协同工作,构成“两阶段检索流程”,显著提升最终结果精度。该系列模型继承了Qwen3-VL的多语言能力,支持超过30种语言,适合全球化部署。