2026年3月4日,谷歌正式发布Gemini 3.1 Flash-Lite,称其为Gemini 3系列中速度最快、性价比最高的模型,专为开发者大规模、高吞吐量工作负载设计。该模型即日起通过Google AI Studio的Gemini API向开发者开放预览版,企业用户可通过Vertex AI平台使用。定价为每百万输入Token 0.25美元,每百万输出Token 1.50美元。根据Artificial Analysis基准测试,其首字响应速度较前代提升2.5倍,输出速度提升45%,在Arena.ai排行榜上获得1432分,在GPQA Diamond和MMMU Pro测试中分别取得86.9%和76.8%的成绩,超越同级别模型。此外,Gemini 3.1 Flash-Lite配备“思考等级”功能,允许开发者根据任务复杂度灵活控制模型推理深度,适用于批量翻译、内容审核等低成本任务,以及生成用户界面、创建模拟环境等复杂场景。
