马斯克的xAI坐拥55万张英伟达GPU加速卡 利用率仅11%
4 小时前

马斯克旗下xAI坐拥约55万块英伟达GPU,但实际算力利用率仅11%,引发业界对其算力利用效率的广泛质疑。据《The Information》获取的xAI内部备忘录显示,xAI总裁迈克尔·尼科尔斯向团队坦言,公司模型浮点运算利用率(MFU)约为11%,并设定了未来几个月内将利用率提升至50%的目标。当前,生产级大模型训练的MFU通常维持在35%至45%之间,Meta和谷歌的GPU利用率分别可达约43%和46%,xAI的表现远低于行业主流水平。xAI的算力利用率低,主要源于软件堆栈与并行策略的滞后,当GPU规模从数千张推向数十万张时,通信、调度、容错和并行策略的挑战会呈指数级增长。为改变现状,xAI正计划通过基础设施和软件栈优化来解决利用率问题,并考虑将部分闲置算力对外出租。