【进展】国内团队,存算一体芯片获重要进展!
18 小时前 / 阅读约12分钟
来源:集微网
南方科技大学林龙扬课题组提出并验证了首个精度无损、全并行的数字式非易失存算一体芯片,解决了传统模拟式存算一体芯片的瓶颈,为下一代高能效AI芯片提供可靠路径。

1.南科大林龙扬课题组在非易失存算一体芯片领域取得重要进展

2.中国科大利用拓扑单极子实现光驱动液晶斯格明子拓扑转换

3.上海交大张东方团队基于太赫兹表面波的“源压缩”技术实现飞秒级亚keV低能电子脉冲


1.南科大林龙扬课题组在非易失存算一体芯片领域取得重要进展

近日,南方科技大学深港微电子学院林龙扬课题组在非易失存算一体芯片领域取得重要研究进展。团队基于40纳米CMOS及STT-MRAM工艺,提出并流片验证了首个精度无损、全并行的数字式非易失存算一体芯片(nvDCIM, non-volatile Digital Compute-in-Memory),系统性解决了传统模拟式存算一体芯片在计算精度、可扩展性与鲁棒性上的瓶颈,并提出基于翻转率感知的网络训练方法以提升存算一体芯片在人工智能应用的能效。相关研究成果以“A lossless and fully parallel spintronic computeinmemory macro for artificial intelligence chips”为题发表于Nature Electronics(DOI:10.1038/s41928-025-01479-y)。研究由南方科技大学联合西安交通大学等单位共同完成,南方科技大学为论文第一单位和通讯单位。南方科技大学林龙扬助理教授、西安交通大学闵泰教授为论文的通讯作者。南方科技大学林龙扬课题组2024级博士研究生李瑚淼(南科大2018级本科毕业生,2022级硕士研究生)为论文的第一作者。

人工智能芯片的性能正日益受到传统冯·诺依曼架构中“存算分离”模式的制约,频繁的数据搬运导致高能耗与高延迟。非易失存算一体(nvCIM)架构将矩阵向量乘法(MVM)直接嵌入存储单元执行,从而显著降低数据移动的开销,为突破这一瓶颈提供了可行路径。然而,当前主流的模拟式nvCIM 架构存在计算精度受限、受工艺电压温度波动影响大、可扩展性差等问题。此外,在先进制程下,模拟电路中数模/模数转换器的设计也面临精度下降以及面积与功耗开销增大等挑战,限制了系统的可扩展性与鲁棒性。这些因素使得模拟式nvCIM 难以胜任物理信息神经网络(PINN)等对计算精度和可靠性要求严苛的人工智能驱动科学(AI for Science)研究任务。因此,如何在非易失存储上实现兼具高能效、高通量、全精度数字式计算,已成为该领域亟待突破的核心难题。

针对上述挑战,研究团队基于40纳米CMOS及STT-MRAM工艺,成功设计并流片验证了一款64 kb非易失数字式存算一体芯片,在存储单元、电路与算法三个层面实现了系统性创新:

1. 在存储单元层面,团队提出“单元内乘法与数字化” (IBMD,In-Bitcell Multiplication and Digitization),在STT-MRAM位单元中实现单比特输入与存储权重的乘法运算并直接输出数字化结果,等效实现数字“与”逻辑。该设计从源头避免使用模拟式nvCIM中常见的数模/模数转换器,有效提升了系统的鲁棒性与可扩展性。

2. 在电路层面,团队实现了全精度加法树与精度可重构累加器,支持4/8/12/16比特多种精度配置的输入与权重,实现了全并行、精度无损的MVM,在保证计算精度的同时大幅提升吞吐率。

3. 在算法层面,团队提出翻转率感知训练方法(Toggle-rate-aware Training),通过将存算一体阵列输入信号的比特翻转率作为正则项,融入神经网络损失函数中进行联合优化。该算法在不降低模型任务精度的前提下,显著降低了芯片在执行推理过程中的动态功耗,实现了软件与硬件协同优化能效的目标。

该研究展现了nvDCIM架构在实现高吞吐、高能效、无损数字式计算方面的综合潜力,为下一代高能效AI芯片提供了一条可靠路径。IBMD单元设计不仅成功在STT-MRAM中实现了高速数字逻辑运算,该方案还可进一步推广至其他阻性非易失存储技术,拓宽了nvDCIM的技术路线与应用场景。未来,团队将继续优化电路设计与芯片架构,推动存算一体芯片向更大容量发展,并探索在复杂AI系统中的集成应用。通过软硬件协同优化策略,该技术有望为打破“内存墙”、推动边缘与云端智能设备的高效能部署奠定坚实基础。

本研究获国家重点研发计划、国家自然科学基金、深圳市高等院校稳定支持计划等项目资助。

论文原文链接:https://www.nature.com/articles/s41928-025-01479-y

图1:基于非易失存储的数字存算一体(nvDCIM)芯片动机与概述

(南方科技大学深港微电子学院)

2.中国科大利用拓扑单极子实现光驱动液晶斯格明子拓扑转换

近日,中国科学技术大学物理学院彭晨晖教授、蒋景华研究员团队与香港科技大学张锐教授合作,在向列相液晶体系中实现了通过光控拓扑单极子介导的半斯格明子拓扑动态转换,并成功将单极子作为载体实现了胶体颗粒的可控输运。这一成果为拓扑物态的非平衡调控和微纳尺度物质输运提供了全新途径。相关研究成果于10月16日以“Monopole-mediated light control of half skyrmion topology in nematic liquid crystals”为题发表在《自然·通讯》上。

斯格明子作为一种具有拓扑保护特性的非平庸结构,在信息存储、自旋电子学和量子计算等领域具有重要应用前景。然而,在单一系统中实现不同拓扑构型之间的可控转换,并对转换过程进行实时观测和动态调控,是研究者长期追求的目标。特别是由于斯格明子具有拓扑保护的奇异特性,改变其诸如斯格明子数等拓扑不变量极具挑战,因此如何实现斯格明子的拓扑转换已经成为热点研究方向。

近年来,彭晨晖教授团队在液晶斯格明子拓扑结构调控方面取得了重要进展,揭示了光场驱动下非平衡态半斯格明子与半双半子间的拓扑结构重构机制,并展现了胶体颗粒随之发生的动态自组装行为,为本工作的开展奠定了坚实基础。

在本研究中,研究团队通过在向列相液晶盒中设计具有几何阻挫的界面图案,成功在半斯格明子弦中诱导产生了8种不同类型的单极子结构,包括双曲型、圆形及中间态的(反)刺猬构型。这些单极子作为拓扑场的源与汇,成为连接不同半斯格明子构型的关键桥梁。通过线性偏振蓝光(波长455nm)驱动系统脱离平衡态,研究团队实现了单极子对之间从吸引到排斥的动态切换,进而诱导半斯格明子发生拓扑转变,如从半奈尔斯格明子(HNS,N sk= -1/2)转变为半反斯格明子(HAS,N sk= +1/2)。

尤为重要的是,研究团队进一步开发了拓扑单极子的微纳操控功能,将其作为微型“搬运工”。在螺旋形半斯格明子弦中,单极子可沿预设轨迹自主运动,并带动胶体颗粒从中心向边界(或反向)进行可控输送,运动速度在0.35-2.32µm/s范围内可控,且几乎不受流体动力学干扰,展现出其在微米尺度货物输送中的巨大应用潜力。

单极子在半斯格明子弦中的运动轨迹及其驱动的胶体自组装输运过程

以上结果首次系统揭示了单极子在半斯格明子拓扑转换中的核心作用,实现了光控下的动态编程调控,为拓扑物态的非平衡动力学研究提供了重要范例。审稿人认为,该研究“在无本征手性的向列相液晶中,实现了对三维斯格明子拓扑转变的重要控制,是一项显著的进展”。

中国科学技术大学物理学院博士研究生扎吾热·阿斯了汉、香港科技大学博士研究生唐文滔和中国科学技术大学博士研究生郑新达为文章的共同第一作者,彭晨晖教授、蒋景华研究员和张锐教授为文章的共同通讯作者。该研究工作得到了国家自然科学基金、中国科学院百人计划、安徽省自然科学基金、中国科学技术大学“双一流”平台建设经费以及香港研究资助局等项目的大力支持。

论文链接:https://doi.org/10.1038/s41467-025-64188-2

(中国科学技术大学)

3.上海交大张东方团队基于太赫兹表面波的“源压缩”技术实现飞秒级亚keV低能电子脉冲

近日,上海交通大学张东方副教授及其合作者在太赫兹表面波压缩技术上取得新突破。研究团队构建了基于“源压缩”的电子脉冲调控新方案,成功解决了低能电子脉冲压缩的关键技术难题,为推进高精度超快表面探测成像开辟了新路径(图1)。该研究成果以“Terahertz Surface Wave Compression for Low-Energy Electron Diffraction and Imaging”为题近期发表在《Physical Review Letters》上。

图1 太赫兹表面波压缩概念图

研究背景

低能电子因具有大散射截面和对表面信息的超高灵敏度,被广泛应用于表面和低维系统探测。然而,随着电子能量降低,空间电荷效应引发的脉冲展宽现象会愈发显著。目前,产生飞秒级低能电子的方案大多基于单电子模式,对系统稳定性和重复频率要求极高,这极大地限制了其在超快成像及表面场探测中的应用。

研究创新点

本工作中,研究团队通过太赫兹表面波实现了电子的同步加速和压缩。该方案使表面波直接作用于电子发射阴极(发射源),最大限度地缩短了电子束的传输距离,从而显著抑制了空间电荷效应引起的脉冲展宽(图2)。基于此,团队在1.5 keV的加速电压下,成功产生了脉冲宽度为74 fs、电荷量为0.4 fC的电子脉冲,从而将亚keV低能多电子脉冲的脉宽推进至飞秒量级。该方法无需独立的压缩腔体,将电子束的产生、加速与压缩功能集成于一体化结构,形成了一种紧凑型多功能电子枪。

图2 太赫兹表面波增强的超快电子源

通过点投影成像与衍射实验,研究团队验证了该压缩方式能高度保持电子束流的品质。进而,团队将所研制的电子枪置于超快点投影成像模式下,开展了对金属表面等离子体流动超快动力学的研究。压缩后的电子束表现出显著增强的时间分辨率,充分证明了该技术的有效性与稳定性(图3)。

图3 a. 太赫兹表面波对电子的压缩;b. 不同电子能量下的压缩脉宽;c. 泵浦探测实验对表面场探结果;d. 不同探测位置处电子宽度变化。

总结与展望

该研究成功突破了低能电子探针因库伦排斥力所面临的时间分辨率瓶颈,创新性地提出了在电子发射源直接压缩的“源压缩”方案。相较于传统的“后压缩”技术,这一方法结构极为紧凑,实现了电子产生与压缩环节的高度集成。展望未来,这项工作为在飞秒尺度上研究表面声子、表面相变及弱场探测等物理现象提供了强大的新工具。

上海交通大学物理与天文学院博士生苏大策为本文第一作者,张东方副教授为指导老师。该研究获得了国家自然科学基金、上海市科委、国家重点研发计划以及阳阳基金的资助。

论文链接:https://journals.aps.org/prl/abstract/10.1103/ys1r-nns3?sessionid=

(上海交通大学)