存储技术是现代计算系统的核心,从基本的数据存储到更复杂的任务,例如用于人工智能(AI)和机器学习(ML)应用的“内存计算”(In-memory computing),都依赖于它们的支持。这些技术最初只是用于数据保留,但如今正逐步演进以适应新的计算范式,比如“内存计算”,即在存储阵列中直接进行数据处理。这种演进大幅提升了计算效率,因为它减少了处理器与存储器之间的数据传输,从而提高速度并降低能耗——这对于AI和ML等高负载任务尤为关键。正是这些苛刻的性能需求,正在推动技术革新突破传统互补金属氧化物半导体(CMOS)范式的限制。
新兴非易失性存储(eNVMs)代表了一类极具前景的技术,可用于替代或增强传统的易失性存储器(如随机访问存储器 RAM)。与断电即失去数据的RAM不同,eNVMs能够在断电或系统关闭的情况下依然保持数据完整性。本文综述了多种新兴存储材料和器件架构,包括电阻式随机存取存储器(ReRAM)、磁性随机存取存储器(MRAM)、铁电随机存取存储器(FeRAM)和相变存储器(PCM)。此外,还探讨了基于二维材料和有机材料的新型eNVMs,并讨论了从传统数字计算向类突触计算的转变,以及这种转变如何为解决人工智能在加速科研发现中面临的技术瓶颈带来新机遇。本文系统分析了当前的技术进展、发展轨迹以及仍需攻克的主要挑战。
在后CMOS微电子时代,一个广泛被关注的挑战是如何突破冯·诺依曼计算架构的限制(见图1)。当前急需一种能兼具多种优点的新型存储器,包括兼容现有CMOS工艺流程,并能突破静态随机存储器(SRAM)和闪存的规模瓶颈。具备这些特征的存储技术,将可适用于模拟与数字处理中的独立存储或嵌入式存储。根据2022年《国际器件与系统路线图(IRDS)》报告,这类技术有望引发计算架构的一场革命。
非易失性存储器的研究可追溯到20世纪60年代的电荷存储设备,其研究持续了几十年,直到2010年嵌入式半导体存储技术缩小到28纳米节点,但随后由于电荷泄漏问题,进一步的微缩发展遇阻。非易失性存储器的关键优势之一是其数据保持能力(非易失性程度),通常以可保持数据的时间长度来衡量。当前,闪存由于技术成熟度高、优化完善并拥有广泛的商业应用,被视为非易失性存储的基准技术
图1(a) 非易失性存储发展历程的可视化表示;(b) 技术发展的时间线;(c) 按成熟度划分的新兴存储器设备分类;(d) 到2035年的电路架构预测,其特点是集成多种为满足芯片功能需求而选择的新兴存储技术。
典型的存储技术如今已发展至具有商业可用性,并在文献中建立了完整的科学、技术和系统知识体系。由于电荷型存储器难以实现纳米级层厚,目前技术关注点已转向NAND闪存的三维堆叠结构及各类“新兴”存储器。图1c展示了六大类主要新兴存储技术,按成熟度从高到低依次为:新型磁性存储(MRAM)、铁电存储(FeRAM)、基于氧化物的电阻式存储(ReRAM),这些技术已展现出良好的特性,具备进入商用验证阶段的条件。而以下技术尚处于早期发展阶段,但仍具有较大的技术突破潜力:相变存储器(PCM或PRAM)、导电桥式存储器(CBRAM)、二维材料存储器(2D RAM)、有机和分子存储器。其中某些分子级存储技术,如莫特存储器和DNA数据存储,目前仍处于初步探索阶段。
由于具备非易失性、字节寻址、高密度、高可扩展性和接近零待机功耗等独特特性,基于存储的计算和处理将在未来计算系统中发挥不可替代的作用。随着类突触存储器的快速发展,未来将其与新兴存储器结合,有望彻底改变计算架构,提升系统性能、能效及处理能力,适用于从存储系统到边缘与云环境、数据库系统乃至区块链去中心化应用的各个层面。
新兴存储技术的多样性(如铁电存储器 FeRAM、氧化还原电阻式存储器 ReRAM、磁性存储器 MRAM、相变存储器 PCM,以及有机与分子存储器 OMRAM)为特定应用需求提供了多样化的选择,允许设计者根据所需的规格与运行环境进行灵活配置。每种技术都具备独特优势,如耐久性高、能效优良,以及适配特定环境或任务的能力。
针对高温环境下的非易失性存储器的研究,回应了在极端条件下对可靠运行的需求。这类研究弥补了现有技术市场中的重要空白,并拓展了存储器在恶劣环境下的潜在应用。例如,通过材料选择的创新与制造精度的提升,使得存储设备即使在高温、高辐射等极端条件下仍可稳定工作,这对航空航天与地热勘探等行业至关重要。
在快速发展的存储技术领域,二维材料(2D materials)因其独特的物理特性和良好的可扩展性,正成为一条极具前景的新路径。这些材料由于具有原子级的可设计性,并且能与现有技术兼容,有望彻底革新存储设备。二维材料的特性如原子级厚度与结构设计灵活性,使得它们能实现更快速、更节能的存储器,并与当前电子技术无缝集成,提升整个系统的性能。随着材料合成和转移工艺的不断进步,二维材料的规模化应用正逐渐成为现实,预示着新一代存储技术的发展将迎来一个全新阶段,足以满足未来计算和数据存储的需求。
与传统存储技术不同,ReRAM 与类突触存储器(Synaptic RAM)支持“内存计算”(In-Memory Computing),具备非易失性,能够实现低延迟、低能耗的数据处理。它们能够在存储阵列内部直接执行类比乘加操作,省去了传统冯·诺依曼架构中能耗巨大的“存储-处理器”数据传输瓶颈。这使得它们非常适合边缘计算系统,尤其是在实时推理、低功耗和紧凑型设计等关键要求下的应用场景。
这些存储技术特别适用于类脑计算和自适应系统。类突触RAM受生物突触的启发,能够实现如“脉冲时序依赖可塑性(STDP)”等学习机制,从而实现基于硬件的学习与在动态环境中的实时响应。这一能力对于自主学习的物联网设备(IoT)至关重要,使其无需持续连接云端即可感知并适应新环境。此外,xRAM(如 ReRAM、FeRAM、MRAM)或 PCM 的非易失特性,使物联网系统在断电后仍能保持操作状态,增强了系统的可靠性,并在受限供电或间歇供电环境中实现即时唤醒功能。
随着对智能、去中心化系统的需求日益增长,xRAM 和 Synaptic RAM 正成为实现可扩展、低功耗和高鲁棒性计算平台的重要技术路径。它们具有高密度、支持 3D 集成、可与 CMOS 电路单片集成等优势,在 AI 和 IoT 硬件架构演进中扮演着核心角色。这些技术为“分布式智能”愿景提供支撑,使计算系统能够在智能传感器、边缘分析等广泛场景中实现无缝、自治和具备上下文感知能力的运行。
图 2. 使用二维材料的三维集成类脑硬件路线图示意图。转载自 Kim, S.J. 等人,“基于二维材料的三维集成类脑硬件”,《NPJ 二维材料与应用》2024年第8卷,第70页,经Nature许可转载。
将非易失性存储器(NVM)技术集成到柔性基底上,近年来获得了广泛关注,主要受可穿戴电子设备、软体机器人以及分布式物联网(IoT)系统等新兴应用的驱动。这类系统不仅要求存储器具备断电数据保留能力,还需能承受弯曲、拉伸、扭转等机械形变。在众多NVM技术中,ReRAM 和 FeRAM 在柔性平台上的表现最为先进。
ReRAM 由于其金属-绝缘体-金属的简单结构和对低温工艺的良好兼容性,在聚合物基底(如 PET 和聚酰亚胺)上展现出优异的机械耐久性与数据保持能力。FeRAM(尤其是基于 P(VDF-TrFE) 或掺杂 HfO₂ 的器件)则具有低电压开关和稳定的极化状态,在经历数千次机械循环后仍保持可靠性。尽管更具挑战性,基于有机材料或二维磁性材料的柔性 PCM 和 MRAM 也已进入初步研究与演示阶段。
有机和分子存储技术也正迅速发展,在 AI 边缘计算和类生物设备中展现出巨大潜力。有机材料具备可调的分子结构以及相应的电学、光学、热学和化学性质,能在某些神经形态计算算法中替代传统忆阻器。这些材料及器件的易挥发性和动态电学特性,使其能够模拟生物神经元和突触的响应功能,包括脉冲时序依赖可塑性(STDP)、脉冲频率依赖可塑性、以及短期与长期可塑性等。
近年来,随着材料和制造技术的进步(如喷墨打印、转印技术和室温沉积工艺),人们已经能够在塑料基底上直接制造非易失性存储器,而不会破坏其机械完整性。基于二维材料和纳米结构电介质的混合材料系统进一步提升了设备在受应力条件下的性能表现。尽管取得了这些进展,仍存在挑战,例如:如何实现长期机械可靠性、在弯曲状态下保持数据、以及如何将柔性NVM与逻辑和传感元件集成,构建完整的柔性系统。未来的研究将聚焦于单片集成、整个存储阵列的增材制造,以及开发稳健的封装方法,以实现动态环境下的稳定运行。
随着上述障碍被逐步克服,柔性非易失性存储器(NVM)将成为可适应、贴合环境的电子设备的核心。这些柔性神经形态集成电路可以与有机和分子存储技术轻松结合。在这类应用中,神经网络模型可在中央高性能AI芯片上训练完成,之后模型被部署到柔性神经形态集成电路上,靠近生化传感器,用于本地化处理。这种模式特别适合可穿戴或植入式生物医学设备,将 AI 计算能力拓展到分布式计算与传感系统中。
制约新兴存储技术应用的关键知识空白包括:(a) 消除材料杂质与不均匀性,这些因素会导致写入耐久性差、寿命短;(b) 弄清楚非线性动态行为和模拟噪声对存储器在计算与处理中的影响;(c) 缩短存储器重编程所需时间,并降低写入过程的能耗。
新兴存储材料的制造往往需要在超高真空环境中进行沉积工艺。精密的制造设施能够确保存储器件具有极高的制备精度,并避免污染物引入。使用一体化的沉积与材料表征工具,可以在不同制造阶段实现无缝衔接,确保材料在整个流程中的纯净性和功能完整性。这些高端工具的使用不仅提升了存储器性能,还大幅延长了器件的工作寿命和运行可靠性。
理解用于存储器件中的材料的基本属性是至关重要的。在开发早期所犯的错误可能会在后续阶段引发严重的性能问题。将新兴存储技术用于存储应用时,需要实现快速且低能耗的开关,以在消耗最小能量的同时高效地进行数据写入和读取。相比之下,存储器件在编程之后必须保持稳定,以确保可靠的内存计算。一旦被编程,器件在计算过程中将被多次读取,因此在这些读取过程中展示出良好的重复性和耐久性,对于实现准确的处理至关重要。表征技术的改进,例如原位测量和跨器件区域的详细统计分析,有助于更深入地理解材料的行为和性能。这将带来更加一致和可靠的存储器件,这对于其在高风险行业中的应用至关重要。
用于新兴存储器件的多通道测试系统的发展促进了更加高效和精确的测试过程。这些测试系统对于设计和开发能够满足AI模型计算需求的节能硬件是必不可少的,能够显著降低这些技术的能耗。每一项进展都在应对存储技术领域中的特定挑战,为可能重新定义存储器件在各种技术平台中集成和使用方式的未来创新奠定基础。随着这些技术的演进,它们不断推动计算能力的边界,预示着一个速度更快、效率更高、可靠性更强的新时代的到来。存储技术的发展不仅揭示了潜在的创新和技术突破,也凸显了当前亟需解决的挑战。这些挑战可以归为五个类别:(a)材料合成、制造精度与表征;(b)器件可扩展性、寿命与可重复性;(c)材料与器件的多模态表征;(d)器件互连性及与现有和新型CMOS技术的兼容性;以及(e)封装与异构集成。
在材料合成方面,选择既能承受极端条件(例如高温和高密度)又能满足AI和ML应用计算需求的材料是具有挑战性的。此外,材料必须精确定义其组成成分,以确保其稳定性和功能性。开发AI/ML方法来选择新的复合材料可以加速合成过程。实现高质量材料需要制造过程中的精度控制,这对于避免可能降低存储性能的缺陷至关重要。这包括在薄膜沉积过程中维持超高真空状态,以防止污染。高质量的材料能够为器件提供稳定性、可重复性和可扩展性。
由于在原子尺度下具有独特的电学、机械和热学特性,二维(2D)材料对新兴非易失性存储(eNVM)技术的发展至关重要。其原子级薄度使其能突破传统半导体的缩放极限,实现超高密度和低功耗的存储集成。诸如石墨烯、过渡金属二硫族化物(例如MoS₂、WS₂)以及六方氮化硼等材料提供了高载流子迁移率、可调节带隙以及可通过缺陷工程实现的开关特性,非常适用于新兴非易失性存储(eNVM)器件中的电阻开关、铁电行为和电荷俘获机制。此外,其机械柔性和化学稳定性使其适用于柔性和可穿戴电子产品,在这些领域传统材料表现不佳。这些特性使得下一代存储器件的实现成为可能,这些器件具备快速切换速度、优异的耐久性和保持能力,而这些都是实现内存计算和AI应用所必需的。尽管这项技术在存储器件中具有巨大潜力,但二维材料也带来一系列独特的挑战。稳定生产大面积、高质量的单晶二维材料是一项必须克服的重要技术障碍,以实现其广泛应用。这些材料容易受到包括氧气和湿气在内的环境因素影响,这可能破坏其性能。开发有效的封装和保护策略对于实际使用这些材料至关重要。将二维材料与现有制造工艺(尤其是CMOS技术)集成,还需要在低温生长技术和无损转移方法方面实现创新。
为了满足商业可行性和制造精度所需的高标准,必须采用先进的表征技术。在不同器件区域实现表征结果的可重复性至关重要,但由于材料行为和缺陷的变异性,这一目标极具挑战性。实时原位测量对于理解器件运行过程中内部的动态交互是至关重要的,但这在技术上也带来了重大挑战,尤其是在改造如透射电子显微镜(TEM)这类工具以实现带电偏置的实时操作方面。开发能在极端温度下运行的存储技术也面临重要挑战:即如何创造出能够在反复的温度应力下保持数据完整性的材料。此外,要将这些存储技术与其他高温环境下可用的元件(如碳化硅SiC晶体管)集成,也带来了巨大的工程挑战,以确保整体的可靠性和性能。为了AI或类脑应用开发节能硬件,也需要测试系统能够处理新兴存储技术(如忆阻器)所要求的高并行度,这是一项复杂且具有技术挑战的任务。将具备内存计算能力的存储器件集成到AI硬件平台中,还必须克服系统架构和器件互操作性方面的重大障碍。
此外,开发能够支持如GPT-3等AI应用所需的密度和可扩展性的互连技术仍是一项艰巨的任务。先进的键合技术对于在不损害性能的前提下,将高密度忆阻器阵列与其他系统组件集成至关重要。这些技术在开发面向人工智能(AI)、机器学习(ML)和物联网(IoT)的下一代计算系统中扮演着变革性的角色。
现代计算系统构建在以速度、精度和逻辑确定性为优化目标的数字架构基础之上。虽然这些系统在传统任务中表现优异,但在应对人工智能(AI)、机器学习(ML)和物联网(IoT)等数据密集型应用的需求时正面临日益严重的压力。传统的冯·诺依曼架构存在“内存墙”问题,即内存与处理器之间数据传输所需的能耗与延迟成为影响系统整体性能的主导因素。这一“内存墙”问题引发了人们对类脑计算范式日益增长的兴趣,尤其是那些能够利用突触行为实现本地化与高能效计算的架构。
图 3. 具有流体离子导向纳米通道的类脑计算。转载自 Kamsma, T. M.,《纳米通道》,第121卷,第18期(2024),经PNAS许可转载。
从数字到类突触的转变是指从离散的、基于逻辑的数字运算逐步转向模拟或事件驱动的类突触行为,这些行为模仿生物计算的方式。在当前的混合系统中,模拟和数字输入被转换为类突触信号,如电流脉冲或电压波形,这些信号直接控制忆阻或类脑器件(如Intel)中的存储状态或神经元激活。这些转变已经在边缘AI设备、类脑协处理器和实验性的交叉阵列中显现出来,这些系统将存储和处理结合在单一的物理层中。这类架构通过生物启发机制(包括脉冲时序依赖可塑性STDP)实现内存计算和实时学习。然而,从模拟到数字、从数字到模拟脉冲的转换对系统提出了额外的能量需求,从而降低了系统的熵。
在信息以模拟形式接收的系统中,模拟信号直接转变为脉冲将促进完全类突触系统的发展,在这些系统中,处理和计算由稀疏、异步和局部交互主导,类似于人脑中的交互方式。未来的AI系统将越来越多地采用端到端的模拟计算,消除在许多任务中对集中式数字逻辑的需求。脉冲神经网络(SNN)和事件驱动架构有望成为主流,并与新型传感器(如动态视觉传感器DVS)集成,形成对真实世界刺激进行实时响应和适应的闭环系统。这些系统将在能效、响应速度和适应性方面提供显著提升,这对于自主智能体、智能传感器和可穿戴设备至关重要。
在信息以数字形式传输的系统中,从数字到类突触的转变标志着计算观念和实现方式的根本变化。数字逻辑不再作为核心计算引擎,而是作为管理和协调类突触过程的接口。随着材料、器件和算法方面的进步融合,类突触计算将促成新一代智能、分布式和自适应系统的实现,使AI、ML和IoT的能力超越现有的局限。
总而言之,本文所展示的技术机遇、材料以及集成挑战反映出在不同领域推进存储技术所面临的复杂性。每个领域都需要有针对性的研究与开发工作,以克服特定的技术、环境和操作难题。解决这些挑战对于推动存储技术的发展至关重要,而存储技术是未来计算、人工智能以及先进传感和成像应用的关键。为迅速增长的研究社区提供合适的仪器设备,将加速技术进步与创新,并对新材料、器件、产品和市场方案的开发产生深远影响。这将影响国家经济增长的全局,并确立美国在新兴技术领域的领导地位。
上世纪70年代、80年代和90年代,美国的微电子设施曾出现一轮繁荣,主要集中在主要行业研究中心及少数几所大学院校周围。在过去的25年中,国际市场的开放和微电子行业的全球化推动了全球范围内产业所需的制造与设计工具的发展,提供了面向全球的商业产品和技术解决方案。这种能力和产品的扩张也凸显出降低能源消耗、限制数据指数增长的迫切需求,同时也要应对对新技术方案日益增长的需求。我们要么扩展CMOS以外的能力,要么创造新的技术创新。这将需要新的材料、器件和存储技术的出现。这还要求开发专门用于制造和计量新兴材料的工具,并使这些工具对更广泛的研究社区开放。我们需要推动研究工具、数据和知识的民主化,赋能研究群体,加速该领域的创新。
我们只有通过建立一个涵盖专业知识、技术创新和人才发展的国家级资源,才能实现这一目标,从而支持所有相关社区的研究、培训和教育工作。