凤凰网科技讯 5月19日,据小米技术官方透露,近日,计算语言学和自然语言处理领域国际顶级会议——第63届国际计算语言学年会(ACL 2025)公布了论文录用结果,小米大模型团队共有10篇研究成果入选,包括9篇主会长文和1篇findings长文,成果涵盖大模型端侧高效推理、大模型GUI智能体、大模型基础结构创新等多个领域。
据了解,ACL是国际计算语言学协会主办的年度学术会议,在计算语言学和自然语言处理领域享有极高声誉,被中国计算机学会(CCF)列为A类会议。本届ACL将于今年7月27日至8月1日在奥地利维也纳举行,这也是该会议的第63届年会。
值得注意的是,小米本次入选的10篇论文中,有5篇获得了小米揭榜挂帅科研专项(Xiaomi Open-Competition Research Program)的支持,展示了小米在大模型领域的持续投入和技术积累。
从论文内容来看,小米大模型团队的研究成果聚焦在多个前沿技术方向,如:无长期衰减的新型位置编码,能够增强模型的上下文感知和外推能力;混合框架,通过定制化KV缓存优化实现长上下文推理;针对指令扩展过程中的“固定思维模式”问题提出了基于动态提示更新的新方法等。
此外,小米研究团队还在多图像场景的视觉语言模型、KV缓存压缩、Web智能体等方面取得了一系列进展。例如,以焦点为中心的视觉链范式,显著提升了视觉语言模型在多图像场景中的表现;维度级别和深浅层平衡的角度解决KV缓存优化问题;模拟了人类“快慢思考”的规划过程,提升Web智能体的导航能力。