大脑和AI都会变形:研究发现维度拉伸是智能决策策略丨西湖大学交叉科学中心发表最新成果

大脑和AI都会变形:研究发现维度拉伸是智能决策策略丨西湖大学交叉科学中心发表最新成果

近日,西湖大学与洛斯阿拉莫斯国家实验室、麻省理工学院、伦敦大学学院等机构的研究人员合作发现,为了优化决策任务的表现,大脑会采用一种维度拉伸(dimensional stretching)的自适应策略,即在神经表征空间中主动拉伸任务相关维度的距离。该研究不仅在猕猴的全脑多区域活动记录中证实了这一现象,还在没有显式注意力机制的深度学习模型中发现了同样的注意力拉伸行为,揭示了智能系统(无论是生物还是人造)为适应任务目标而重构内部表征的普适原理。

这一成果以 “Adaptive stretching of representations across brain regions and deep learning model layers” 为题发表在 Nature Communications 上。

西湖大学理学院、交叉科学中心博士后张昕亚为本文第一作者及通讯作者。合作者包括洛斯阿拉莫斯国家实验室教授Bradley C. Love(共同通讯作者、曾任职于伦敦大学学院)、麻省理工学院教授Earl K. Miller、图宾根大学教授Markus Siegel、麻省理工学院研究员Scott L. Brincat、伦敦大学学院博士Sebastian Bobadilla-Suarez、伦敦大学学院博士Xiaoliang Luo以及塞浦路斯大学博士生Marilena Lemonari。

论文地址:https://www.nature.com/articles/s41467-025-65231-y

目标导向下的神经表征重构

在日常生活中,我们的注意力往往受目标驱动。例如,当你在杂乱的桌面上寻找车钥匙时,与钥匙形状或金属光泽相关的视觉特征会在大脑中被放大,而其他无关特征(如颜色)则被抑制。为了探究大脑如何在这一过程中动态重构神经表征,研究团队聚焦于视觉决策任务:猕猴需要根据提示线索,在颜色或运动方向两个维度中选择一个作为决策依据。

图1. 认知任务与计算模型架构。 (a-c) 猕猴根据线索关注颜色或运动方向并做出眼动决策的任务流程,而CNN-LSTM 模型使用与动物相同的视觉输入进行训练。(d) 任务刺激的神经表征差异矩阵(RDM)的示意图

通过分析全脑多个区域的神经活动,研究人员发现了一种普遍存在的维度拉伸现象。尽管前额叶皮层(PFC)通常被视为认知控制的核心,但这种拉伸效应实际上并不局限于此,而是广泛存在于包括视觉与运动皮层(如 V4、MT)在内的多个脑区。研究发现,当任务要求关注颜色时,神经群体对不同颜色刺激的区分度会显著增加,仿佛大脑内部的表征空间沿着颜色维度被主动拉长了,从而让与任务相关的信息更加突出。

图2. 不同脑区的任务相关注意力分配。(a) 全脑及各脑区在不同任务下的注意力权重分配。(b) 认知模型与基线模型的拟合效果对比。相比于混合了不同任务数据的基线模型(绿色),能针对特定任务优化注意力参数的认知模型(紫色)与神经数据的相关性更高

AI与大脑的殊途同归

为了验证这一拉伸策略是否是智能系统的共性,研究团队构建了一个包含卷积神经网络(CNN)和长短时记忆网络(LSTM)的深度学习模型,并让其学习完全相同的任务。值得注意的是,该模型并没有被预设显式的注意力模块。但研究发现,仅通过以最小化预测误差为目标的训练,AI模型内部层级自发涌现出了与生物脑高度一致的维度拉伸行为。这表明,为了优化任务表现,重构表征空间是一种跨越生物与机器的自适应策略。不过,研究也指出了两者的微妙差异:AI模型的层级重构更为彻底和灵活,而生物脑中特定的感觉皮层(如V4和MT)虽然也表现出拉伸效应,但仍受到较强的模态特异性约束(分别偏向颜色和运动处理)。

图3. 神经数据与模型中的维度拉伸现象。无论是生物脑(a-b)还是人工神经网络(c-d),当某维度的特征(如运动)与任务相关时,该维度上不匹配刺激之间的表征差异度会显著增大,体现了表征空间的动态拉伸

时间编码揭示决策细节

此外,该研究在神经编码机制上取得了重要发现。传统观点多关注神经元的发放率(Rate coding),但本研究发现,基于脉冲时间(Spike timing)的编码方式(如脉冲间隔 ISI)能更精确地捕捉这种任务相关的表征几何结构。这说明大脑在进行这种动态的思维变形时,神经元发放的时间模式起到了关键作用。

图4. 脉冲时间编码的优越性。(a-d) 相比于传统的发放率编码,基于脉冲间隔(ISI)的时间编码指标能更好地反映任务相关的刺激表征结构

研究意义与启发

该研究深入揭示了无论是生物大脑,还是基于梯度下降的人工神经网络,在面临复杂决策时,都会不约而同地采用表征拉伸这一策略来进行决策。这种跨越生物与机器的趋同性表明,认知控制机制可能并非必须依赖预设的模块,而是可以通过误差最小化在学习过程中自发涌现。同时,研究中发现的脉冲时间编码机制以及生物脑区特有的模态约束,也为未来开发兼具灵活性与生物合理性的下一代人工智能系统提供了关键的理论依据与启发。

相关推荐

365注册后怎么注销 坚果兄弟:中国30所大学同志数量统计

坚果兄弟:中国30所大学同志数量统计

365注册后怎么注销 英菲克网络盒子报价

英菲克网络盒子报价

365注册后怎么注销 配一把日产轩逸电子遥控钥匙要多少钱,哪里可以配

配一把日产轩逸电子遥控钥匙要多少钱,哪里可以配