英特尔陈葆立:应对数据爆炸式增长 至强领航智算新时代
13 小时前 / 阅读约7分钟
来源:集微网
英特尔在重庆举办技术创新与产业生态大会,分享数据中心新产品、新技术。至强6处理器提升内存带宽和IO性能,优化存储场景,构建企业软硬件生态,加码AI算力,并计划2026年推出新一代至强6+处理器和GPU产品。

11月19日,英特尔技术创新与产业生态大会在重庆举办。会上,英特尔数据中心与人工智能集团副总裁、中国区总经理陈葆立做了题为《至强芯动力,AI新引擎,共赢智算新时代》,就英特尔在数据中心领域的新产品、新技术和新机遇等话题进行了分享。

持续创新应对数据中心市场演进

陈葆立的演讲由几组关键数据的介绍引出。

如今,每个月中国电商市场有超过1.25万亿营业额;各类视频平台每个月的视频播放次数已经突破10万亿次;全球AI大模型每个月产生超过一千万亿的Token。同时,在今年第三季度中国公司所贡献的开源大模型,全球下载量达到世界第一,综合能力也达到领先地位。未来五年全球支撑AI所产生的电力将增加3.5倍。通用工作负载也将翻番。

为了满足激增的计算需求,未来五年全球数据中心累计投资额预计近7万亿美元。在这一背景下,产业创新范式加速演进,对数据中心提出更高要求。

陈葆立表示,英特尔作为过去十几年来数据中心技术的核心技术提供商,通过跟客户的沟通交流后发现,打造一个先进的技术中心需要多维考虑,除了性能更高之外,要考虑软件适配能力、可靠性、可用性,以及对于储存、IO各方面的综合平衡性。

凭借多年积累的知识,英特尔打造了完整面向数据中心的产品方案。陆续发布了全新至强6全系列产品,致力于为中国的客户与合作伙伴构建更强大、更灵活、可持续发展的技术基础设施。

陈葆立指出,数据中心处理器的一个主要工作就是保证数据在数据中心能快速传输,其中包括两个重要数据指标:内存和IO,而至强6在内存带宽和IO方面都有显著提升。

通过结合一些典型的企业应用场景,陈葆立介绍称,企业中广泛使用的32核至强6处理器,相比前一代拥有更强的计算能力和更快的内存性能,在多数企业业务中实现了超过20%的性能提升;而在高内存带宽的数据库场景中,性能提升更是达到35%。

在互联网场景中,比如电商的搜索、广告、推荐等方面,其背后依托复杂强大的算法体系,而至强6处理器针对上述服务也能够表现出色。

“经过过去几年与客户的合作和交流,我们持续强化至强6在AI计算方面的能力:在AVX-512指令集基础上,进一步引入了专用的AMX矩阵加速引擎。以基于HNSWLib的近似近邻搜索为例,通过将查询向量合并为矩阵运算,利用至强 6 的AMX内置加速引擎,相比传统AVX-512指令,端到端性能提升超过72%。”陈葆立说。

重塑存储服务器性能与 TCO 标杆

在云原生AI的驱动下,全球数据量正持续呈指数级增长,推动了存储业务的新一轮热潮。无论是企业级数据存储、分布式文件系统,还是大规模数据备份与恢复,都对存储服务器的性能、密度、能效以及TCO提出了更高要求。

为应对上述挑战,至强6围绕存储场景进行了大量优化设计,包括在单路最高支持136条PCIe 5.0通道,双路系统可搭载32块以上PCIe Gen5固态盘;通过内置的QAT和DSA引擎,高效执行数据压缩、加密、传输和转换操作,释放CPU核心资源,有效降低数据访问延迟。

陈葆立举例称,火山引擎作为国内领先的云与软件服务公司,基于DSA技术做了许多优化,实现最高30%以上的CPU成本节省同时,降低了时延8倍。今年10月,火山引擎将代码开源,希望中国不同客户能够利用最新的至强6处理器以及火山引擎所提供的开源软件,打造新一代的存储设备。

在内存方面,据陈葆立介绍,在至强6平台上,英特尔率先提供内存介质——MRDIMM,显著提升了全球环境模式(GEM)与全球预测模型(GDPS)的预报精度和模拟速度。国内某知名高校则利用至强6加速基因测序、蛋白质结构解析与药物分子动力学模拟,满足其对高双精度算力、大容量内存以及AI训练与推理融合计算的需求。国内外已经陆续有许多公司将英特尔最新的产品落地在其数据中心里。

在可靠性方面,一是数据可靠性,过去几年英特尔在不同平台上推出了数据可靠的平台方案,通过这几年的推广以及同国内许多软件厂商和云服务商的紧密合作,TDX技术已经在云上落地,真正实现数据可用不可“见”。

二是可靠服务器设计,过去十年之内,英特尔在数据中心硬件设计以及软件设计上面,做了许多工作。希望能达成高可用、高可靠、高可调的目标。至强6构建了广泛兼容企业软硬件环境的成熟生态,确保持久稳定的高性能计算服务,助力AI服务器实现“五个九”(99.999%)的运行可用。

软硬协同加码AI算力

在软件能力方面,陈葆立表示,中国许多AI创新大模型在过去一年采用了很多不同的创新使用方式。英特尔软件工程师也在过去的一年里,跟客户进行了深度交流,研究如何通过更好地相互合作提供更好的AI算力。

比如,在大模型的最新发展方向上,英特尔通过组合方案,为厂商带来更平衡的选择,更好地满足用户在价格与性能之间的双重需求。针对这些软件解决方案,英特尔的研究团队在过去几个月中进行了深入探索,并在第一时间将代码上传至开源社区。

“我们期待与中国的软件服务商携手,共同推动至强6的软件优化,让它在更多应用中释放更卓越的表现。”陈葆立说。

AI算法市场的需求正在飞速扩展,英特尔希望在这一领域提供全新的替代方案。过去一年,越来越多企业在探索AI落地的可能性,对成本控制和灵活部署都提出了更高要求。为此,英特尔推出了全新AI加速器——不仅在硬件层面实现突破,更在过去6个月中,由软件团队完成对中国主流开源大模型的第一时间适配与性能优化。选择PCIe形态的原因是,它是当前服务器市场最普遍的标准,英特尔能为企业灵活提供4卡、8卡、单机、双机或三节点等多种组合,满足不同价位与应用模式的需求。

“软件层面仅支持基础大模型并不够。许多本地创新企业,正在教育、医疗、政务等领域寻找AI落地的方案,英特尔也在第一时间将这些新的AI应用迁移至算力池,并由本地团队提供协作支持。”陈葆立强调。

最后,陈葆立介绍称,在数据中心领域,2026年英特尔将推出新一代至强6+处理器产品,采用最新制程工艺,带来更高性能与更低功耗,为客户不断增长的需求提供有力支撑。此外,英特尔已宣布启动下一代 GPU 的产品规划,这款产品将于 2026 年下半年正式发布。