通义全尺寸GUI智能体基座模型MAI-UI开源:原生具备用户交互能力
22 小时前

通义实验室多模态交互团队于2025年12月29日宣布开源通用GUI智能体基座模型MAI-UI。该模型提供2B、8B、32B和235B-A22B四种参数规模,采用Qwen3-VL作为骨干网络,首次在统一架构中实现用户交互、MCP工具调用和端云协同三项核心能力。在GUI视觉定位与移动端任务执行基准测试中取得领先性能,目前MAI-UI-2B/8B模型已在Hugging Face平台开源。