@AnneliesGamble: https://x.com/AnneliesGamble/status/2066949973749755919
摘要
探索为什么绘制大脑连接组是有价值的,认为与AI系统不同(AI的设计在权重之外的代码中),大脑必须物理地编码所有设计,因此结构是理解的关键。
查看缓存全文
缓存时间: 2026/06/17 05:49
大脑里值得读取的是什么
我们能读取大语言模型中的每一个权重,却依然无法真正说明这个模型在做什么。既然如此,追踪大脑中的每一条连接——一个难度大得多的问题——又能告诉我们哪些更便宜地来自别处的信息呢?这听起来像是根本没必要费心去做大脑图谱绘制的理由。
@AdamMarblestone 认为恰恰相反。Adam 运营着 @Convergent_FROs,这是一家非营利组织,孵化它所谓的“聚焦研究组织”(FROs)——中等规模的科学项目,对学术实验室来说资本密集度和工程化程度太高,但一开始又距离产品太远,风险投资不会介入。
“很多 AI 领域的人或计算机科学家听到‘绘制连接组’,我猜他们听到的是‘我们要去绘制权重矩阵。我们要知道所有这些权重。’”他认为,这种想象方式是不对的,因为有趣的信息并不在权重那里。“权重在很大程度上取决于你训练它的数据,就像取决于系统的架构一样。所以我其实并不关心具体的权重。我关心的是架构。”
在训练好的权重之外
要理解为什么 Adam 不关心权重,不妨看看一个 AI 系统实际上是如何构建的。当你训练一个神经网络时,关于架构、它优化目标、以及它学习所依赖的数据的所有决策,都存在于研究者编写的代码中。
“我有一些 PyTorch 代码,用来搭建网络的架构。我在代码中写明了损失函数是什么。我喂给它数据。最后我得到一个位于这个盒子内部的权重矩阵。”如他所说,“研究者实际做的很多有趣的事情都不在权重矩阵里。”
但大脑的运作方式并非如此。没有独立的代码,它必须完全用神经元来构建一切:“学习信号就是神经元。基本架构就是神经元如何初始化以及它们如何连接。成本函数就是那些传递奖励信号的特定神经元。一切都与神经元有关。它没有独立的程序员。”
在一个 AI 系统中,设计存在于代码本身,在训练好的权重之外。在大脑中,并不存在“训练好的权重之外”这样的东西,因此所有的设计都必须物理地构建到细胞及其连接中。
Adam 在他的论文《神经科学的甜美一课》(The Sweet Lesson of Neuroscience) 中进一步阐述了这一点。文中他引用了 @steve47285 的工作,该工作将整个大脑重新诠释为两个交互系统:一个学习子系统和一个引导子系统。前者在动物的一生中从经验中学习。后者大部分是硬连线的,设定了塑造学习的目标、优先级和奖励信号。学习子系统负责学习,引导子系统则决定什么值得学习。关于这一点,这里有另一篇关于这两个子系统的很好的概述。
脊椎动物大脑拟议算法架构的简化草图:一个学习子系统(皮层、纹状体、小脑)在生命期内获取结构化模型,以及一个硬编码的引导子系统(下丘脑、脑干),为驱动行为的监督信号和控制信号提供来源。来自 Chen 和 Macosko 的《哺乳动物大脑中的细胞缩放定律》(Cellular Scaling Laws in the Mammalian Brain) (2026),基于 Steve Byrnes 的学习/引导框架。
脊椎动物大脑拟议算法架构的简化草图:一个学习子系统(皮层、纹状体、小脑)在生命期内获取结构化模型,以及一个硬编码的引导子系统(下丘脑、脑干),为驱动行为的监督信号和控制信号提供来源。来自 Chen 和 Macosko 的《哺乳动物大脑中的细胞缩放定律》(Cellular Scaling Laws in the Mammalian Brain) (2026),基于 Steve Byrnes 的学习/引导框架。
引导子系统的电路并非学习所得的记录。它们是设计本身,由进化硬连线而成,奖励信号直接写入细胞类型及其布线中。这就是为什么 Adam 关心读取引导子系统,而不是皮层已学习的权重。皮层的布线主要是其通过经验获得的值的一个快照。引导子系统的布线则是基因组自身的规格说明。@patrickmineault 写了一篇很好的文章,深入探讨了 Adam 在此问题上的思考。
Fei Chen (@insitubiology) 和 Evan Macosko (@macosko),来自 @broadinstitute 的 PI,他们发表了最初的全小鼠大脑转录组研究之一,在其工作《哺乳动物大脑中的细胞缩放定律》中找到了这一点的证据。数量最多、最独特的专用神经元类型位于古老深部结构——下丘脑和脑干。这些区域的神经元总数要少得多,但种类却丰富得多。皮层则相反。它体积庞大,但由少数重复模板的许多副本构建而成。
这与该框架的预测相符。皮层像神经网络一样工作,因此可以学习几乎任何东西,不需要专门的硬件。它只需要许多相同灵活单元的副本。引导子系统的工作则相反。它编码了特定的、硬连线的目标:饥饿、口渴、恐惧、交配的驱动力、呼吸的冲动。每一样都是基因组必须预先指定的,因为动物无法通过试错来学习它们。所以,如果引导子系统确实是大脑中硬连线的奖励函数,那么定制的细胞类型多样性也应该在那里堆积,在这些深部结构中,而不是皮层。而这正是研究所显示的。
根据神经元数量和小鼠大脑中分子定义的细胞类型数量绘制的大脑区域图。“学习中心”(皮层、海马体、小脑等)拥有大量神经元群体,但细胞类型相对较少。脑干、间脑和苍白球区域则相反:神经元较少,细胞类型多样性却大得多。来自 Chen 和 Macosko 的《哺乳动物大脑中的细胞缩放定律》(2026)。我使用 Claude 以更高分辨率重新创建了该图,因此可能与原图有细微差异。
根据神经元数量和小鼠大脑中分子定义的细胞类型数量绘制的大脑区域图。“学习中心”(皮层、海马体、小脑等)拥有大量神经元群体,但细胞类型相对较少。脑干、间脑和苍白球区域则相反:神经元较少,细胞类型多样性却大得多。来自 Chen 和 Macosko 的《哺乳动物大脑中的细胞缩放定律》(2026)。我使用 Claude 以更高分辨率重新创建了该图,因此可能与原图有细微差异。
Adam 十年前与麻省理工学院的 Ed Boyden (@eboyden3) 共同开启的一系列工作,帮助启动了使用膨胀显微镜和原位测序来读取神经回路。Adam 后来推广了 FROs 作为一种资助此类基础设施密集型科学的方式。实际的图谱绘制工作现在由 @E11BIO 推进,这是从他的 Convergent Research 中分离出来的第一个 FRO,该组织正试图将小鼠大脑连接组的成本从数十亿美元降至数千万美元。希望在于,以足够高的分辨率进行图谱绘制,将揭示大脑的设计:不是训练得到的值,而是产生这些值的具体东西。“一旦我们做到了这一点,我就不太关心具体的权重了,”他说。
绘制奖励函数
思路是,足够详细的图谱将揭示计算内部奖励的机制。“婴儿可能首先试图建立眼神交流,或者在试图寻找并关注新奇刺激之类的东西,而不是无聊的刺激,”Adam 说。“我是否在与父母进行眼神交流?我是否找到了新奇事物?我是否在控制我的环境?这些都是大脑很可能必须拥有某种检测和奖励方式的事情。”
在 @dwarkesh_sp 播客中,Adam 认为该领域一直倾向于忽视这些极其具体的奖励函数的作用。机器学习倾向于数学上简单的目标,比如预测下一个 token。他的直觉是进化做了相反的事,在大脑的奖励函数中构建了大量复杂性:不同区域有很多不同的奖励函数,在不同的发育阶段被激活。如果他是对的,那么大脑中的这些奖励函数每一个都会是一组你原则上可以指出的细胞。
详细的图谱是起点,但 Adam 真正想要的与其说是冻结的快照,不如说是生成它的过程:“我想理解那些驱动因素……它是如何开始的,然后在生命期内如何学习。”他承认,从静态图谱到“它试图做什么”的完整描述之间的转化将是困难的。“你能否真正在图谱和那些信息之间进行翻译?也许吧,”他说。“但就算不能,我仍然认为拥有这些图谱将成为整个神经科学进展速度的倍增器。”因此,即使在最悲观的情况下(布线无法直接给出算法),图谱仍然会加速其他一切。
为什么图谱绘制如此困难
2024 年 10 月,包括 Greg Jefferis (@gsxej) 团队以及剑桥大学、普林斯顿大学和佛蒙特大学合作者在内的 FlyWire 联盟,发布了首个成年果蝇大脑的完整接线图:大约 14 万个神经元和超过 5400 万个突触。生成它需要将一个果蝇大脑切成数千个超薄切片,用电子显微镜对每个切片成像,并使用机器学习将这些图像拼接成一个三维重建。一个果蝇大约有 10 万个神经元。而人类则接近 1000 亿个。
果蝇大脑的 FlyWire 图谱。人脑的神经元数量大约是其一百万倍。https://www.cambridgenetwork.co.uk/news/whole-brain-connectome-fruit-fly-most-complex-brain-ever-mapped
果蝇大脑的 FlyWire 图谱。人脑的神经元数量大约是其一百万倍。https://www.cambridgenetwork.co.uk/news/whole-brain-connectome-fruit-fly-most-complex-brain-ever-mapped
为了解决这个问题,E11 Bio 正在使全面的静态回路图谱更具可扩展性。核心赌注在于成像物理学的转变:“传统的静态回路图谱绘制方法,一直深入到神经元和突触层面,使用的是电子显微镜,它在空间上能看到的东西极其精确,但不易扩展……如果你能改用基于光的显微镜而不是基于电子的显微镜,那么更容易处理较厚的组织块,你可以基本上看穿它们,并且更容易操作。”
基于光的方法带来了第二个优势:它们可以读取分子。“它还带来了一个优势,那就是能够以叠加的方式看到分子——所以突触使用了哪些特定的受体和递质?”这一点很重要,因为大脑的连接并不像人工网络那样统一。
“与计算机不同,计算机中可能只有少数几种连接类型,而实际大脑中实际上有许多不同类型的连接,”Marblestone 说。兴奋性或抑制性,但在时间尺度以及它们如何适应和学习方面也各不相同。一个只记录哪个神经元连接到哪个神经元、而不读取每个突触处的受体和递质的接线图,会错过区分这些连接类型的大部分信息。因此,也会错过区分一种学习规则与另一种学习规则的大部分信息。
这正是 Adam 正在帮助催化的第二个 FRO——Meridial 的焦点,它从静态快照推向动态图谱。Meridial 预计不会像静态图谱那样全面,但目标是观察连接子集随时间的变化,从而理解突触如何变化的规则。“你不会得到每一个连接。但即使只看一个连接子集,能够理解它们变化的规则,我认为这对 AI 来说非常相关,”他说。
从大脑数据训练模型
如果布线编码了设计,那么可能存在一条路径,让你可以直接基于大脑活动来训练 AI 系统。这意味着模型将学会像大脑一样表征世界,而不仅仅像带标签的数据那样。“有些公司已经开始尝试基于大脑数据的训练了,”Adam 告诉我。
他说,问题在于大脑数据是否能告诉模型一些它自己无法弄清楚的东西。“增量是什么?拥有那些信息与仅仅拥有我们现在训练的关于世界的信息之间有什么区别?那些神经活动中是否有一些东西是我们无法从它看到的数据中预测出来的?”如果模型仅凭图像就能推断出大脑会如何对其做出反应,那么记录就毫无价值。只有在大脑数据携带了我们无法从其他类型数据中获取的信息时,它才值得收集。
关于表征对齐的一系列工作已经显示出,将人工网络向神经数据靠拢可带来可衡量的收益。将视觉模型与人类脑电图对齐,可以使它们的表征更类似大脑且更鲁棒。通过 fMRI 记录(人们听故事时的数据)来微调语音模型——Mariya Toneva (@mtoneva1) 及其同事称之为大脑调优——可以改善其下游性能,其中在需要语义理解的任务上收益最大。而 2025 年的一项研究发现,将听觉模型与个体 fMRI 记录对齐可改善下游任务性能,尤其是在训练数据稀缺时。
表征对齐在实际中是如何工作的。一个图像识别模型(CORnet)获得一个额外的编码模块,该模块预测一个人观看同一图像时产生的脑电图。训练同时最小化两个损失:类别分类和脑电图生成。因此,模型学会了更像人类大脑一样看东西。来自 Lu, Wang & Golomb (2024),《通过人类脑电图表征对齐实现更类似人类大脑的视觉》(Achieving more human brain-like vision via human EEG representational alignment)。
表征对齐在实际中是如何工作的。一个图像识别模型(CORnet)获得一个额外的编码模块,该模块预测一个人观看同一图像时产生的脑电图。训练同时最小化两个损失:类别分类和脑电图生成。因此,模型学会了更像人类大脑一样看东西。来自 Lu, Wang & Golomb (2024),《通过人类脑电图表征对齐实现更类似人类大脑的视觉》(Achieving more human brain-like vision via human EEG representational alignment)。
有迹象表明,大脑数据包含 AI 无法从世界中提取的信息,但仍有很多悬而未决的问题。正如 Adam 所说,“这是需要尝试的事情之一。”
为什么这个范式被跳过了
如果读取语言模型中的每一个权重都无法解释它,那为什么期望大脑图谱能做得更好呢?这个反对意见假设了你是在盯着它的权重。但 Adam 相信你会在盯着一个 LLM 从未拥有过的东西:设计本身。
Adam 大约在 2018 年到 2020 年期间在 Google DeepMind 的神经科学团队工作,那时该领域受大脑启发的直觉接近顶峰。“我当时研究的是记忆架构,我们关注的问题比如‘海马体作为记忆系统做什么?’‘它是否有某种压缩信息的方式?’”领先的研究项目依赖于强化学习,通过奖励和试错在一个精心设计的、受大脑启发的形式中训练系统,充满了 Adam 所谓的“花里胡哨”。
然后 LLM 爆发了,绕过了其中大部分。LLM 使用一种简化版的强化学习:奖励好的输出,调整,重复。它们没有内部的世界模型。而大脑被认为在做更丰富的事情。“大语言模型进行强化学习和后训练的方式
相似文章
约夏·巴赫:精准映射每一个神经元也无法产生心智
本文阐述了约夏·巴赫的观点,即复制大脑的物理连接无法产生类人意识,并强调心理状态源于信息处理过程,而非单纯的解剖结构映射。
@itsreallyvivek: https://x.com/itsreallyvivek/status/2062924410588406118
反思性帖子认为,要在前沿AI实验室取得成功,需要在没有地图的情况下运作,研究是关于应对不确定性,而工程则是将复杂系统压缩成有用的抽象概念。
我构建了一个将大脑激活反应映射到创意内容的工具,以下是我的发现
Neural Lens 是一款使用 Meta 的 Tribe v2 模型、Claude API 和 Hugging Face 将大脑激活反应映射到创意内容的工具,它提供神经学数据,展示内容如何在点击和观看之外与观众产生共鸣。
教导大脑自我发现
这篇博客探讨了机器学习与神经科学的交叉领域,特别关注利用多元分类技术分析神经影像数据,以理解大脑功能和行为。
@DamiDefi: https://x.com/DamiDefi/status/2067191008425595377
该文认为,大多数人正在构建“第二大脑”(仅仅是信息捕获系统),但更应该构建一个“第二自我”——一个了解用户思维方式并代表用户行动的推理系统。文章概述了二者的差异和所需条件,强调了需要具备记录的用户身份层、思考层以及能够自动呈现综合结果的自动化能力。