Google推出Gemini 3.1 Flash-Lite,主推高性价比与高效推理
1 天前

2026年3月3日,Google正式发布Gemini 3.1 Flash-Lite,作为Gemini系列最新轻量级多模态AI模型。该模型专为高吞吐、低复杂度任务设计,在成本与速度上显著优化:输入价格为每百万token 0.25美元,输出为1.50美元,远低于Gemini 3.1 Pro。性能方面,Gemini 3.1 Flash-Lite推理速度最高达363 tokens/s,较前代Gemini 2.5 Flash提速45%,首token响应时间缩短2.5倍。其支持128k tokens上下文窗口(部分测试达100万token),在MMLU基准测试中准确率达68.9%,在博士级科学问答集GPAQ Diamond中取得领先,并在11项基准测试中6项超越GPT-5 mini与Claude 4.5 Haiku。功能上,该模型支持动态思考级别调节,开发者可根据任务复杂度调整推理深度,兼顾简单任务的高效处理与复杂任务的深度推理。应用场景包括大规模翻译、内容审核、客服系统、数据分析及实时交互类应用。目前,Gemini 3.1 Flash-Lite已通过Google AI Studio的Gemini API及企业级Vertex AI平台开放预览,早期合作伙伴反馈其表现接近高端模型水准。