华为发布并开源 Flex:ai AI 容器技术,实现单卡同时承载多个 AI 工作负载
7 小时前 / 阅读约1分钟
来源:IT之家
11月21日华为发布Flex:ai AI容器软件,通过算力切分技术将单张GPU/NPU切分为多份虚拟算力单元,实现单卡承载多AI工作负载,并聚合集群内空闲XPU算力形成共享算力池,该技术将同步开源。
感谢IT之家网友 Roronoa_、六月河 的线索投递!

IT之家 11 月 21 日消息,在今日的 AI 容器应用落地与发展论坛上,华为发布 Flex:ai AI 容器软件,通过算力切分技术,将单张 GPU / NPU 算力卡切分为多份虚拟算力单元,切分粒度精准至 10%,实现了单卡同时承载多个 AI 工作负载,并可聚合集群内各节点的空闲 XPU 算力聚合形成“共享算力池”。

据悉,Flex:ai 将在发布后同步开源在魔擎社区中

IT之家正在补充更多内容。