腾讯混元发布多模态理解模型混元Large-Vision
1 周前

8月12日,腾讯混元发布多模态理解模型Large-Vision,该模型采用MoE架构,拥有52B激活参数,支持任意分辨率的图像、视频及3D空间输入,并显著提升了多语言场景的理解能力。