联想AI服务器首次实现本地部署DeepSeek满血大模型低于1TB,支持100并发
2025-03-03

联想集团近日宣布,其问天WA7780 G3服务器首次在行业内实现单机部署DeepSeek-R1/V3 671B大模型,仅需768GB显存即可承载100并发用户流畅体验,远低于行业公认的1TGB显存要求。联想实测显示,在512 token标准测试下,该系统能支持100个并发用户每秒稳定输出10 token,且首token响应时间不超过30秒。