Google发布TurboQuant算法,突破高维向量压缩瓶颈
5 小时前

Google于2026年3月推出新型AI内存压缩算法TurboQuant,旨在降低大语言模型和向量搜索引擎的内存占用。该算法通过两步压缩,在不损失准确性的前提下,将键值缓存内存压缩至3比特,内存占用减少约6倍,在英伟达H100加速器上性能提升最高达8倍。受此影响,存储芯片股普遍下跌。