超越传统4200倍速,苏黎世联邦理工提出NOBLE,首个经人类皮层数据验证的神经元建模框架
4 小时前 / 阅读约13分钟
来源:36kr
苏黎世联邦理工学院等机构提出NOBLE深度学习框架,首个通过人类大脑皮层实验数据验证性能,实现直接从实验数据中学习神经元非线性动力学行为,模拟速度比传统数值求解器快4200倍。

苏黎世联邦理工学院、加州理工学院与阿尔伯塔大学等机构的联合团队提出了一种名为 NOBLE 的深度学习框架。它是首个通过人类大脑皮层实验数据来验证其性能的规模化深度学习框架,首次实现了直接从实验数据中学习神经元的非线性动力学行为,其模拟速度比传统数值求解器快出 4200 倍。

人脑如何通过数百种神经元构成的复杂回路塑造认知功能,至今仍是生命科学中一个深奥难解的谜题。过去十年来,随着电生理、形态学与转录组学等多模态数据的积累,科学家逐步揭示了人类神经元在基因表达、形态结构和电生理特性上的显著异质性。然而,这些差异究竟如何影响大脑的信息处理过程,例如特定基因表达与神经系统疾病之间的内在联系,就仍是一个悬而未决的难题。

传统上,研究者常借助基于三维多隔室偏微分方程(PDE)的模型来模拟神经元活动。这类模型虽然能够较好还原生物真实性,却存在一个致命缺陷:计算成本极其高昂。单个神经元的模型优化可能需要消耗约 60 万 CPU 核心小时,且参数稍有变动就容易导致模拟结果与实验数据严重偏离。更关键的是,这类确定性模型难以捕捉实验中所观察到的「内在变异性」,即便输入相同,同一神经元也可能产生不同的电生理响应。而人为引入随机性的方法,又常常带来非机制性的干扰,进一步削弱模型预测的可靠性。

面对这些挑战,来自苏黎世联邦理工学院、加州理工学院与阿尔伯塔大学等机构的联合团队提出了一种名为 NOBLE(Neural Operator with Biologically-informed Latent Embeddings) 的深度学习框架。

这一框架的创新之处在于,它是首个通过人类大脑皮层实验数据来验证其性能的规模化深度学习框架,首次实现了直接从实验数据中学习神经元的非线性动力学行为。其核心突破是构建了一个统一的「神经算子」,能够将神经元特征的连续潜在空间映射为电压响应的集合,而无需为每个模型单独训练替代系统。在针对小白蛋白阳性(PVALB)神经元数据集的测试中,NOBLE 不仅准确复现了 50 个已知模型及 10 个未见模型的亚阈值与放电动力学行为,其模拟速度更比传统数值求解器快出 4,200 倍。

相关研究成果以「NOBLE - Neural Operator with Biologically-informed Latent Embeddings to Capture Experimental Variability in Biological Neuron Models」为题,已入选 NeurIPS 2025。

  • 论文地址:https://go.hyper.ai/Ramfp

数据集:涵盖 60 个 HoF 模型、250 代进化优化、16 项生理指标

为验证 NOBLE 框架的有效性,研究团队构建了包含小白蛋白阳性(PVALB)神经元的专用数据集,该数据集来源于人类皮层神经元的生物逼真模型模拟结果。这些模型基于 NEURON 模拟环境构建,采用「活性(all active)」离子通道配置,通过多目标进化优化框架生成,旨在复现实验记录的电生理特征。

具体而言,数据集包含 60 个 HoF 模型,其中 50 个用于训练(分布内模型),10 个作为未见模型用于测试(分布外模型)。如下图所示,每个模型均经过 250 代进化优化(Evolutionary Optimization),采集不同代次的电压响应,然后通过空间离散化将电缆方程转化为耦合常微分方程组求解,最终选择能最小化模拟与实验特征平均 z 分数误差的参数组合。

对神经元进行进化优化过程

数据生成过程采用两阶段优化策略:先拟合被动亚阈值响应,再捕获尖峰阈值以上的活性动态及完整频率-电流曲线。时间序列数据以 0.02ms 时间步长采样 515ms 时长,经 3 倍时间子采样后保留 8583 个时间点,既避免混叠效应又降低计算负载。

如下图所示,除了电压变化曲线,数据集还标注了 16 个关键「生理指标」,包括显示形态(第一行)、实验电压走线(第二行)、模拟电压走线(第三行)、尖峰波形(第四行)和频率电流曲线(第五行)等,为评估 AI 模型提供了全面标准。这种设计让数据集既能训练 AI 预测神经元反应,又能评估预测质量,实现「教学练测」一体化。

各种抑制细胞类型的 HoF 模型样品

NOBLE:FNO 驱动+双输入嵌入的神经算子框架

NOBLE 框架的核心创新在于将神经算子与生物信息学中的潜在嵌入技术深度融合,构建了一个从神经元特征到电压响应的端到端映射系统,可形象地称为「神经信号翻译机」。该框架以傅里叶神经算子(FNO)为底层架构,其优势在于能够高效处理神经元电生理的时空序列数据。FNO 借鉴了音频信号处理的思路,通过快速傅里叶变换在频域中对等距采样的电生理信号进行分析,从而成为一类专为神经动态研究定制的计算工具。

模型的「翻译」能力源自两套关键输入嵌入设计:神经元特征(neuron features)嵌入与电流注入(current injection)嵌入。

NOBLE 的嵌入策略

前者选取了阈值电流(Ithr)和局部斜率(sthr)这两个具备明确生物可解释性的指标作为核心特征,先将其归一化至 [0.5, 3.5]² 区间,再通过 NeRF 风格的三角函数编码转化为时间序列堆栈,相当于为模型提供了一份神经元的「硬件参数手册」,清晰标定其关键电生理属性。后者则采用 K=9 的多频率编码策略,对应输入的电流激励参数。如下图所示,两套嵌入堆叠后形成的输入通道,使低维特征能够与 FNO 的频域处理方法有效对齐,显著增强了模型对神经信号高频动态的捕捉能力。

在 NOBLE 中嵌入指定的神经元特征和电流注入

在网络结构方面,NOBLE 包含 12 个隐藏层,每层设 24 个通道,并采用 256 个傅里叶模式,模型参数量约为 180 万,相当于构建了同等规模的模拟神经连接。训练过程借鉴了「因材施教」的策略:采用 Adam 优化器,初始学习率为 0.004,并配合 ReduceLROnPlateau 调度策略,以相对 L4 误差作为损失函数,使模型既能快速掌握基本规律,又能在训练瓶颈时自动调整学习节奏。与传统方法相比,NOBLE 无需为每个神经元单独训练代理模型,而是通过单一神经算子实现对整个神经元模型空间的连续映射。这使其能够通过潜在空间插值,生成具有生物真实性的新型神经响应。

此外,NOBLE 还具备「专项精进」的灵活扩展能力,支持针对特定电生理特征的物理知情微调。通过引入加权复合损失函数 L(λ),可为目标特征(如 sag 幅度)赋予更高权重,从而在不影响整体预测性能的前提下,精准提升关键指标的建模精度。

NOBLE 能正确捕捉多样化的神经元动力学,速度比传统求解器快 4200 倍

为系统评估 NOBLE 框架的综合性能,研究团队围绕五大核心方向设计了多维度实验,包括基础精度、泛化能力、计算效率、创新生成能力以及核心模块的有效性验证。实验以小白蛋白阳性(PVALB)神经元的 50 个 HoF 模型作为主要训练数据,模型预测准确性通过相对 L2 误差以及多项关键电生理指标进行量化。

在基础精度(分布内测试)方面,NOBLE 对未参与训练的电流注入信号仍表现出优异的预测能力,相对 L2 误差低至 2.18%。此外,如下图所示,研究人员进一步对比了在 0.1nA 与 -0.11nA 电流注入下,实验数据、PDE 模拟与 NOBLE 预测三者间的电压轨迹。结果显示,PDE 模拟与实验记录高度一致,而 NOBLE 预测与 PDE 模拟的差异极小,这表明 NOBLE 复现了数值求解器的精度,可靠地捕捉了关键的生理动力学。

NOBLE 预测的 F-I 曲线与实验数据/PDE/NOBLE 的电压轨迹

在泛化能力(分布外测试)评估中,NOBLE 在面对 10 个未见过的 HoF 模型时仍保持高精度预测。研究团队进一步将其应用于血管活性肠肽(VIP)中间神经元数据,同样获得稳定输出。这表明 NOBLE 并非简单地记忆训练集特征,而是真正掌握了跨细胞类型的电生理规律。

在计算效率方面,NOBLE 表现出突破性的速度优势。测试结果表明,其单条电压轨迹预测仅需 0.5 毫秒,而传统数值求解器完成相同模拟需 2.1 秒,速度提升约 4200 倍。这一效率提升为未来实时模拟百万级神经元网络奠定了基础,使得全脑尺度建模在计算上成为可能。

在创新生成能力方面,研究团队重点验证了 NOBLE 在已知神经元特征之间「插值创作」新神经元模型的潜力。通过在(Ithr, sthr)构成的潜在空间中随机插值 50 个点,NOBLE 成功生成对应的电压响应轨迹,其结果与真实实验记录高度一致,符合生物真实性。相比之下,传统方法直接对偏微分方程参数插值会产生明显的非生理性伪影,形成所谓「神经模型怪物」。这一对比凸显 NOBLE 已学习到神经元的底层生物物理规律,而非简单执行数据拟合。进一步通过集成预测实验验证,基于 50 个训练模型的并行推理所生成的电压分布与数值模拟结果高度一致,即便采样点扩展至 200 个,生成模型仍保持生物合理性。

50 个插值 HoF 模型的 F-I 曲线与实验数据/PDE/NOBLE 的结果比较

控制变量实验显示,去掉神经元特征编码后,预测误差从 2% 飙升到 12%,证明这种生物信息学嵌入是框架的「核心引擎」。

  • GitHub 链接:github.com/neuraloperator/noble

神经算子的学界突破与产业落地共振

神经算子与神经元建模的交叉融合,正在学术界与产业界激起深层共振,推动脑科学研究从理论探索走向产业应用。

在学术前沿,苏黎世联邦理工学院与卡内基梅隆大学联合提出的几何感知算子变换框架(GAOT),通过多尺度注意力机制与几何嵌入技术,突破了复杂几何域建模的瓶颈。该框架首次实现了 900 万节点工业级数据的全分辨率训练,在 28 个偏微分方程基准测试中表现优异,同时训练吞吐量提升 50%,推理延迟降低 15%-30%,为不规则神经回路的精准模拟扫清了障碍。

  • 论文标题:Geometry Aware Operator Transformer as an Efficient and Accurate Neural Surrogate for PDEs on Arbitrary Domains
  • 论文链接:https://arxiv.org/abs/2505.18781

与此同时,麻省理工学院开发的「多细胞整合脑」(miBrain)模型,在神经元实体构建方面取得重要进展。这一三维平台整合了人脑 6 种主要细胞类型,利用仿生水凝胶成功复现神经血管单元功能,并通过基因编辑揭示了阿尔茨海默病中胶质细胞的协同作用,为神经算子提供了更贴近生理实际的验证环境。

  • 论文标题:Engineered 3D immuno-glial-neurovascular human miBrain model
  • 论文链接:https://doi.org/10.1073/pnas.2511596122

产业界则致力于将学术成果工程化、实用化。英伟达推出的 Modulus 与 PhysicsNeMo 开源框架,构建了神经算子落地的核心基础,支持从生命科学到工程仿真的多领域应用,可实现 5000 万节点网格的大规模训练,已被多家工业企业用于数字孪生构建。

在医疗应用端,创新企业正将神经算子技术与临床需求深度结合。博灵脑机与浙江大学共同开发的上肢外骨骼康复系统,通过优化神经信号解析算法,提升了运动指令生成的准确度,已在多中心临床试验中帮助中风偏瘫患者恢复基本生活自理能力。

这种学术界与产业界的协同创新,加速形成了「基础研究-技术转化-产业落地」的完整闭环,其核心意义在于将抽象的算子理论与具象的神经元模型有机结合,既提升了神经模拟的计算效率与生理真实性,又拓展了工程应用的边界。

参考链接:

1.https://mp.weixin.qq.com/s/HWi9wNK3idpUSXCVN_nIZQ

2.https://mp.weixin.qq.com/s/YbqtmO0eU8Fn2Y-oRdBdWQ

3.https://mp.weixin.qq.com/s/UIi30fX81Xeh5dqBPxzMPQ