加速国产大模型：AMD 推出 vLLM-ATOM 插件大幅提升推理效率 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

加速国产大模型：AMD 推出 vLLM-ATOM 插件大幅提升推理效率

10 小时前

AMD正式推出专为大语言模型部署设计的vLLM-ATOM插件，该插件可在不改变现有工作流的情况下，优化DeepSeek-R1等国产主流大模型在AMD硬件上的推理性能。作为vLLM的扩展，vLLM-ATOM插件针对Instinct系列GPU提供优化方案，实现“零成本”部署，用户无需修改原有API或工作流。其架构分为三层，集成了混合专家模型和量化技术。该插件主要面向AMD Instinct MI350及MI400系列GPU，支持多种主流中文大语言模型和应用场景，降低了企业级AI部署的门槛，帮助开发者实现更高效、稳定的在线AI服务。

上一篇：OpenAI 推出 Daybreak 项目：重塑软件安全开发流程

下一篇：王腾 AI 睡眠公司获新一轮融资，多方资本加持

返回列表

热文阅读

2 天前

中国赛车 + 车手再夺世界冠军，吉利星瑞 TCR 首战即登顶

2 天前

功勋车型正式停产：特斯拉弗里蒙特工厂最后一辆 Model S 和 X 生产下线

2 天前

蔚来 CEO 李斌开启 24 小时直播，验收河西走廊换电路线

2 天前

【融资】中国AI史上最大融资？梁文锋亲自操盘 DeepSeek传募资73.5亿美元估值上看515亿美元