Google推出Gemini 3.1 Flash-Lite，主推高性价比与高效推理

1 天前

2026年3月3日，Google正式发布Gemini 3.1 Flash-Lite，作为Gemini系列最新轻量级多模态AI模型。该模型专为高吞吐、低复杂度任务设计，在成本与速度上显著优化：输入价格为每百万token 0.25美元，输出为1.50美元，远低于Gemini 3.1 Pro。性能方面，Gemini 3.1 Flash-Lite推理速度最高达363 tokens/s，较前代Gemini 2.5 Flash提速45%，首token响应时间缩短2.5倍。其支持128k tokens上下文窗口（部分测试达100万token），在MMLU基准测试中准确率达68.9%，在博士级科学问答集GPAQ Diamond中取得领先，并在11项基准测试中6项超越GPT-5 mini与Claude 4.5 Haiku。功能上，该模型支持动态思考级别调节，开发者可根据任务复杂度调整推理深度，兼顾简单任务的高效处理与复杂任务的深度推理。应用场景包括大规模翻译、内容审核、客服系统、数据分析及实时交互类应用。目前，Gemini 3.1 Flash-Lite已通过Google AI Studio的Gemini API及企业级Vertex AI平台开放预览，早期合作伙伴反馈其表现接近高端模型水准。

上一篇：奥特曼告诫员工：OpenAI无法左右美军方决策 Anthropic是前车之鉴

下一篇：开发者因泄露Gemini API 密钥遭遇 8.2 万美元账单，谷歌拒绝减免

返回列表

热文阅读

2 天前

马斯克谈中国芯片产业：3-5年内没有突破会感到惊讶

2 天前

2025年国内AI应用排行榜出炉：豆包、DeepSeek、元宝位居前三

2 天前

爱立信下一代芯片将基于英特尔工艺，加速商用 AI 原生 6G 进程

2 天前

英特尔与爱立信达成合作，携手加速商用AI原生6G进程