谷歌近日更新了Gemini API的计费方案,新方案根据实际推理需求制定价格。新增的推理服务包括标准、弹性、优先、批量和缓存版。其中,弹性推理利用非高峰闲置算力,价格打五折,目标延迟1至15分钟,但不保证延迟。批量API也享受五折优惠,延迟最长可达24小时。