微软发布多模态推理模型Phi-4-reasoning - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

微软发布多模态推理模型Phi-4-reasoning

4 天前

2026年3月5日，微软发布并开源了15亿参数的多模态推理模型Phi-4-reasoning-vision-15B。该模型结合视觉编码算法SigLIP-2和推理模型Phi-4Reasoning，采用“中融合”架构，在部分网络层实现多模态处理，显著降低算力消耗。用户可通过提示词动态启用或关闭推理功能，平衡推理强度与资源效率。训练数据主要来自开源数据集，经多阶段筛选和优化，确保高质量。基准测试显示，该模型在多模态数学问题测试中表现优异，成绩较同规模模型高出17%，在数学与科学推理方面竞争力突出。应用层面，该模型可用于构建具备界面理解能力的AI代理系统，分析科学图表等复杂视觉内容。目前，微软已在HuggingFace、GitHub及Azure平台开放模型代码与访问渠道。

上一篇：Raycast推出Glaze，简化“氛围编程”应用开发流程

下一篇：阿里通义千问核心团队人事调整，谷歌DeepMind公开邀约人才

返回列表

热文阅读

2 天前

【头条】绿色厂务国际创新论坛预览！以技术赋能半导体绿色供应链转型

2 天前

小米们开始下场“养虾”，豆包手机应如何接招？

2 天前

英特尔和美商务部长被起诉，涉特朗普政府芯片补贴政策

2 天前

【出货】江波龙：自研主控UFS4.1产品批量出货在即