教导大脑自我发现
摘要
这篇博客探讨了机器学习与神经科学的交叉领域,特别关注利用多元分类技术分析神经影像数据,以理解大脑功能和行为。
<p><em>作者:Ruchir Baronia</em></p><a class="image-link image2" target="_blank" href="https://substackcdn.com/image/fetch/$s_!GyU1!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F90e900d2-4470-46c9-ae68-87b2e1102e5f_1200x630.png" data-component-name="Image2ToDOM"><div class="image2-inset"><picture><source type="image/webp" srcset="https://substackcdn.com/image/fetch/$s_!GyU1!,w_424,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F90e900d2-4470-46c9-ae68-87b2e1102e5f_1200x630.png 424w, https://substackcdn.com/image/fetch/$s_!GyU1!,w_848,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F90e900d2-4470-46c9-ae68-87b2e1102e5f_1200x630.png 848w, https://substackcdn.com/image/fetch/$s_!GyU1!,w_1272,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F90e900d2-4470-46c9-ae68-87b2e1102e5f_1200x630.png 1272w, https://substackcdn.com/image/fetch/$s_!GyU1!,w_1456,c_limit,f_webp,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F90e900d2-4470-46c9-ae68-87b2e1102e5f_1200x630.png 1456w" sizes="100vw"><img src="https://substackcdn.com/image/fetch/$s_!GyU1!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F90e900d2-4470-46c9-ae68-87b2e1102e5f_1200x630.png" data-attrs="{"src":"https://substack-post-media.s3.amazonaws.com/public/images/90e900d2-4470-46c9-ae68-87b2e1102e5f_1200x630.png","srcNoWatermark":null,"fullscreen":null,"imageSize":null,"height":null,"width":null,"resizeWidth":null,"bytes":null,"alt":null,"title":null,"type":null,"href":null,"belowTheFold":false,"topImage":true,"internalRedirect":null,"isProcessing":false,"align":null,"offset":false}" class="sizing-normal" alt="" srcset="https://substackcdn.com/image/fetch/$s_!GyU1!,w_424,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F90e900d2-4470-46c9-ae68-87b2e1102e5f_1200x630.png 424w, https://substackcdn.com/image/fetch/$s_!GyU1!,w_848,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F90e900d2-4470-46c9-ae68-87b2e1102e5f_1200x630.png 848w, https://substackcdn.com/image/fetch/$s_!GyU1!,w_1272,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F90e900d2-4470-46c9-ae68-87b2e1102e5f_1200x630.png 1272w, https://substackcdn.com/image/fetch/$s_!GyU1!,w_1456,c_limit,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F90e900d2-4470-46c9-ae68-87b2e1102e5f_1200x630.png 1456w" sizes="100vw" fetchpriority="high"></picture><div></div></div></a><p><strong>🡡</strong> <em>在这篇博客文章中,我们将深入探讨机器学习(ML)与神经科学的交叉领域。在此过程中,我们将熟悉一种对神经影像数据进行多元分类的方法,以识别行为、预测神经退行性疾病等。接下来将讨论通过机器学习进行神经影像分析的应用、实用性和伦理基础。</em></p><h1>引言</h1><p>人类大脑由 <em>860 亿</em> 个神经元组成 <a href="#fn-1"><sup>1</sup></a>,它们协同工作,形成我们的思想、情感和记忆。大脑可以学习语言、设计机器,并指导复杂的手术程序。然而,大脑一直无法处理它自身。经过几个世纪的研究,科学家几乎不了解我们大脑的真实运作方式。具有讽刺意味的是,人类大脑 <em>对自己而言仍是一个谜。</em> 但这即将发生改变。</p><p>如果通过分析大脑的单一图像,我们就能揭示其内部运作机制,甚至显露潜意识和隐藏的情感,那会怎样?这听起来像是科幻小说,但有一批研究人员正逐步接近实现这一目标。他们位于神经科学和机器学习的交汇处。他们正利用模拟大脑的技术来解析大脑。</p><h3>路线图</h3><p>本文提供了对神经成像领域及其相应的机器学习分类方法的全面介绍。讨论内容如下:</p><p><strong>1. 神经成像概览</strong></p><ul><li><p><em>强调该领域日益增长的人气,并介绍功能性磁共振成像(fMRI)。</em></p></li></ul><p><strong>2. 过去的创新</strong></p><ul><li><p><em>简要分析计算神经科学的历史,深入探讨非机器学习脑机接口。通过首先了解该领域传统设备的运作方式,我们可以更好地 appreciation 导致当前机器学习设备发展的历程,从而真正欣赏机器学习与神经科学的交叉点。</em></p></li></ul><p><strong>3. 机器学习方法</strong></p><ul><li><p>*继续讨论脑机接口,我们将聚焦于当下,介绍<strong>多体素模式分类(Multi-Voxel Pattern Classification)</strong>,这是一种用于大脑扫描数据的多元分析方法。本部分将包括对初学者关于<strong>分类原理的简要回顾。</strong>*</p></li></ul><p><strong>4. 分类分析:局限性与影响</strong></p><ul><li><p>*详细阐述<strong>多体素模式分类</strong>,包括对其局限性和影响的分析。*</p></li></ul><p><strong>5. 伦理基础</strong></p><ul><li><p><em>在对多体素模式分类有了高层次的理解后,我们将讨论其伦理影响。从某人大脑中提取思想在道德上是否错误?</em></p></li></ul><p><strong>6. 进步的永恒循环</strong></p><ul><li><p><em>讨论神经科学与机器学习之间相互强化的性质。</em></p></li></ul><p><strong>7. 结论</strong></p><ul><li><p><em>总结之前讨论的内容。</em></p></li></ul><h1>概览</h1><p>最近,工程师们开始将常见的机器学习算法应用于脑部成像数据,以发现我们思维和行为的模式。利用这些算法,研究人员现在能够通过分析大脑扫描数据来区分个体的认知过程,以及发现神经恶化的迹象。</p><h3>日益流行</h3><p>传统上,医务人员采取“手动”方法处理脑部扫描图像,即通过肉眼直接分析。然而,手动分析不仅繁琐,而且通常会产生约 3-5% 的每日错误率 <a href="#fn-15"><sup>15</sup></a>!因此,机器学习最近在此类分析中占据了主导地位。</p><blockquote><p>👨⚕️ 注意:这并不是说机器学习算法应该取代医务人员或神经科学家。相反,通过 potentially 提供更高的速度和准确性,这些算法可以补充专家的工作,使他们能够将手动注意力重新集中在更紧急的事项上。</p></blockquote><p>人们对神经科学与机器学习交叉领域的关注急剧增加。 <a href="#fn-16"><sup>16</sup></a></p><blockquote><p>🡡 <strong>认知状态</strong> 是指任何神经学体验,例如看一辆车或抬起一只手。我们在这篇文章中的最终目标
查看缓存全文
缓存时间: 2026/05/08 08:45
# 教会大脑认识自己
来源: https://mlberkeley.substack.com/p/neuro
*作者: Ruchir Baronia*
[](https://substackcdn.com/image/fetch/$s_!GyU1!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F90e900d2-4470-46c9-ae68-87b2e1102e5f_1200x630.png)**💡***在本文中,我们将深入探讨机器学习(ML)与神经科学的交叉领域。通过这种方式,我们将熟悉一种对神经影像数据进行多元分类的方法,以识别行为、预测神经退行性疾病等。以下内容将讨论通过机器学习进行神经影像分析的应用、可行性及伦理基础。*
人脑由 860 亿个神经元1 (https://mlberkeley.substack.com/p/neuro#fn-1)组成,它们协同合作,形成我们的思想、情感和记忆。它可以学习语言、设计机器,并指导复杂的外科手术。然而,大脑尚未能做到的一点是处理它自身。经过几个世纪的研究,科学家 barely 了解我们大脑的真实运作方式。讽刺的是,人脑*对自己而言仍是一个谜。*但这种情况即将改变。
如果通过分析单张大脑图像,我们就能揭示其内部运作,甚至揭示潜意识思想和隐藏的情感,那会怎样?这听起来像科幻小说,但有一整个研究人员群体正逐步接近实现这一目标。他们处于神经科学和机器学习的交叉点。他们正利用模仿大脑的技术来解析大脑。
本文提供了神经影像及其对应的机器学习分类方法的全面介绍。讨论顺序如下:
**1. 神经影像概述**
- *强调该领域日益增长的 popularity,并介绍 fMRI。*
**2. 过去的创新**
- *对计算神经科学进行简要的历史分析,深入探讨非机器学习的脑机接口(BCI)。通过首先了解该领域传统设备的运作方式,我们可以更好地理解导致当前 ML 设备的发展,从而真正 appreciation 机器学习与神经科学的交叉点。*
**3. 机器学习方法**
- *扩展我们对脑机接口的讨论,我们将聚焦于当下,介绍**多体素模式分类(Multi-Voxel Pattern Classification, MVPC)**,这是一种针对脑部扫描数据的多变量分析方法。对于初学者,这将包括一个关于**分类原理**的简要回顾。*
**4. 分类分析:局限性与影响**
- *全面阐述**多体素模式分类**,包括对其局限性和影响的分析。*
**5. 伦理基础**
- *在具备对多体素模式分类的高层次理解后,我们将讨论其伦理影响。从某人脑中提取思想在道德上是错误的吗?*
**6. 进步的永恒循环**
- *讨论神经科学与机器学习之间相互强化的性质。*
**5. 结论**
- *总结前述讨论内容。*
最近,工程师们开始将常见的机器学习算法应用于脑部影像数据,以发现我们思考和行为的模式。使用这些算法,研究人员现在能够通过分析脑部扫描数据来区分个体的认知过程,甚至发现神经退化的迹象。
传统上,医务人员在处理脑部扫描图像时采取“手动”方法,即仅仅通过视觉进行分析。然而,手动分析不仅繁琐,而且通常会产生每日约 3-5% 的错误率15 (https://mlberkeley.substack.com/p/neuro#fn-15)!因此,机器学习最近在 perform 此类分析中占据了主导地位。
> 👩⚕️ 注意:这并不是说机器学习算法应该取代医务人员或神经科学家。相反,通过可能提供更高的速度和准确性,这些算法可以通过让专家重新将手动注意力集中在更紧急的事项上,来 complement 专家。
人们对神经科学与机器学习交叉领域的关注急剧增加。16 (https://mlberkeley.substack.com/p/neuro#fn-16)
> 💡 **认知状态**是任何神经学体验,例如看汽车或抬手。我们在这个领域的最终目标是从脑部影像数据中提取**认知状态**。
**基于神经影像的分类**涉及为脑部扫描图像标记其相应的认知状态,并使用这些标记数据训练分类模型。这样做之后,模型应该能够从脑部扫描图像中分类认知状态(更详细的解释见**分类算法**或继续阅读)。因此,研究人员能够构建智能算法,仅通过分析相关的脑部扫描图像就能有效地解读个人的认知状态。
科学家们也开始使用深度学习算法从原始、未标记的数据中自动学习。然而,在本文中,我们将重点放在使用标记数据的较简单的子领域——*监督分类算法*。
> 💡 **监督学习**是机器学习的一项任务,即根据示例输入-输出对学习一个将输入映射到输出的函数。17 (https://mlberkeley.substack.com/p/neuro#fn-17)
我们将用来提取认知状态的标记脑部影像数据被称为**fMRI 数据**。
在深入探讨用于分析大脑的各种机器学习方法之前,介绍这些数据的表示方式至关重要。在本文中,我们将主要熟悉 fMRI 数据。
> 注意:fMRI 只是表示脑部影像数据的一种方式。有关不同神经影像模式的更多信息,请参阅此 review (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4651019/)。本文将专注于 fMRI。
🧠 **fMRI** 代表功能性磁共振成像,旨在“通过评估脑部循环的变化来推断脑部活动”2 (https://mlberkeley.substack.com/p/neuro#fn-2)
本质上,fMRI 扫描通过识别血流量差异的区域来映射脑部活动。更多的血流量通常与更大的神经活动相关,使研究人员能够 pinpoint 大脑的哪些部分与哪些行为相关。
*fMRI 数据的示例。2 (https://mlberkeley.substack.com/p/neuro#fn-2) 脑部扫描中的颜色代表血流量,显然与刺激差异相关。如果我们尝试分类具体是什么情况导致大脑的不同部分“亮起”呢?我们能读心吗?*
有关 fMRI 的更多信息,请在此阅读 (https://www.sciencedirect.com/topics/nursing-and-health-professions/functional-magnetic-resonance-imaging)。然而,就本文的范围而言,我们将把 fMRI 的具体细节视为抽象概念,纯粹关注基于 ML 分析的影响。
尽管机器学习在神经科学中的引入相当近期,但神经科学与计算的交叉并非如此。在讨论机器学习在神经影像数据中的应用之前,我们介绍了早期**脑机接口(BCI)**的历史概述。依靠更传统的计算形式,这些较旧的 BCI 适应旨在有效地*“读取个人的思想”*以改变物理设备的状态。
通过首先了解该领域传统设备的功能,我们可以更好地理解涉及机器学习的现代发展,从而真正 appreciation 机器学习与神经科学的交叉点。
> 💡 **脑机接口(BCI)**是大脑与另一设备之间的直接通路。它们旨在允许人类通过思维控制电子设备。BCI 有许多不同的应用,但此处的 BCI 一词用于描述不大量利用机器学习的早期 BCI。我们以这种方式适应该术语,以更好地 highlight 计算神经科学中关注点的 chronological shift。
这是如何可能的?本质上,用户*被训练*来控制其心智的特定部分,而不是解码用户正在思考什么。从根本上说,用户和 BCI 共同合作以传达信息。早期的 BCI 采用这种试错方法来教个人以某种方式思考,使得他们的大脑信号可以被设备识别。此类设备已被用于拼写单词、准确移动光标,甚至用机械臂执行动作。2, (https://mlberkeley.substack.com/p/neuro#fn-2,)4 (https://mlberkeley.substack.com/p/neuro#fn-4)
> 💡 **分类**,在此语境下,涉及在 fMRI 数据中寻找模式,并在这些模式与可区分的认知状态之间建立联系。用相应的心理状态对图像进行分类可以非正式地视为*读心术*。
有趣的是,历史上该领域的目标大致与现在我们使用新的机器学习分类分析所旨在做的*相反*。现代进步旨在训练模型从脑部扫描数据中分类认知状态,而 BCI 历史上已被开发以响应用户*有意识*地进入的预定义心理状态,通常是在被训练以某种方式思考之后。注意区别——在现代方法中,设备被训练,而在旧方法中,用户被训练。虽然这些早期的 BCI 很复杂且适用于计算神经科学领域,但它们未能广泛解释或分类心理状态或行为。相反,它们仅限于响应作为输入的特定大脑信号。
BCI 系统组件的解释。^2,^ (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3497935/) 大脑信号被数字化和翻译后,它们被用来控制另一设备,右侧显示了此类设备的示例。
> 💭 在这里,我们讨论早期的目标,不仅是为了提供神经科学与计算之前跨学科工作的历史分析,也是为了 highlight 传统计算方法——*通过早期 BCI 体现*——与现代计算方法——*通过新的机器学习分类算法体现*——之间方法的 clear juxtaposition。
在计算神经科学领域具备更多熟悉度后,我们终于可以讨论神经影像数据的机器学习分类器了。
> 🔑 分析神经影像数据时要回答的关键问题是,我们是否可以使用机器学习分类方法成功地 decipher 一个人的认知状态、心理行为或神经健康。
💡 **体素(Voxel):**脑部扫描的三维单位,类似于像素,嵌入大脑信号。将其视为一块脑组织。一个*容积像素*。
传统上,分析 fMRI 扫描涉及逐个查看单独的大脑体素,并识别认知行为与那些个体体素之间的模式。这种方法可称为单变量分析技术。
在这里,黄色方块代表单个体素,图表代表其激活情况。5 (https://mlberkeley.substack.com/p/neuro#fn-5)*
然而,大脑极其复杂且相互连接。因此,通常将其视为一个相互连接的项——或者更合理地说,几个主要相互连接项的集合——而不是各个独立、自给自足的部件的集合,这通常是有益的。这向我们介绍了单变量分析与多变量分析之间的区别。
在神经影像分析的背景下,**单变量**分析一次只考虑一个决策变量,例如脑部扫描图像中的单个体素。另一方面,**多变量**技术将查看整个图像中的模式,考虑到大脑的相互连接性以及多个体素的激活。
最近,科学家开始考虑大脑的“完整空间活动模式”,而不是遵循解释大脑各个区域的常规策略。4 (https://mlberkeley.substack.com/p/neuro#fn-4)这样做具有显著优势。简单来说,通过同时分析大量脑区,“每个位置可用的弱信息”可以以有效的方式积累,以形成完整的认知解释。4 (https://mlberkeley.substack.com/p/neuro#fn-4)单变量与多体素方法之间的区别不是本文的重点,但如果您对更详细的比较感兴趣,请参阅此 paper (https://www.sciencedirect.com/science/article/pii/S1364661306001847)。
> ”*从传统的基于位置的分析策略转向解码心理状态的关注点转移,可以揭示从大脑活动中提取信息的最合适方法。*”4 (https://mlberkeley.substack.com/p/neuro#fn-4)
显然,多变量分析对进行全面的脑部分析是有益的,但多变量分析具体是如何工作的呢?
> 基于模式的分类问题围绕以下问题展开:“大脑激活模式能够多大程度地可靠地指示或预测大脑参与的任务或实验参与者正在处理的刺激?”14 (https://mlberkeley.substack.com/p/neuro#fn-14)
像传统的分类问题一样,多体素模式分类通常分为四个基本步骤。这些步骤以及下面的相应图片在《认知科学趋势》的相关论文中进一步概述6 (https://mlberkeley.substack.com/p/neuro#fn-6)
1. **特征选择**:我们首先选择适合分类的体素。注意这里我们说的是体素*复数*,而不是体素,因为这是多体素模式分类。 - 这一步实际上非常重要,因为选择太多不相关的体素会给我们的数据增加噪声。选择太少相关的体素将使进行具体分类变得困难。有无数种方法可以选择正确的特征,例如执行次要的单体素分析以识别要在主要多体素分析中跟踪哪些体素。其他特征选择方法超出了本文的范围。
2. **模式组装**一旦我们知道要考虑哪些体素,是时候为脑部扫描标记其相应的认知状态了。本质上,这一步旨在通过将每个脑部扫描标记为其反映的认知状态,将影像数据分类到 bins 中。在对 fMRI 扫描围绕其各自的实验条件进行标记后,我们的标记数据准备好用于训练模型。
3. **分类器训练**我们现在将使用这些标记数据来训练我们的分类算法,以预测未来未见的脑部扫描数据。简单来说,这一步涉及*教会我们的计算机从脑部扫描中识别认知状态*。将标记数据输入分类算法后,它将产生一个预测函数,可以识别未见的脑部扫描所反映的认知状态。换句话说,我们正在构建一个可以通过推断引发它们的实验条件来识别不同体素模式的模型。
4. **泛化测试**然后我们在新的脑部活动模式上测试我们的分类器,看看它是否能确定与模式相对应的认知活动是什么。在这里,如果模型不符合我们的标准,我们可以调整我们的方法。 [](https://substackcdn.com/image/fetch/$s_!
相似文章
通过教学实现可解释的机器学习
OpenAI 提出了一种机器教学方法,其中教师神经网络学习选择最具代表性的示例来教导学生网络识别概念,通过将示例与人类可理解的特性相关联而不是任意的特征编码,产生可解释的结果。
@AnneliesGamble: https://x.com/AnneliesGamble/status/2066949973749755919
探索为什么绘制大脑连接组是有价值的,认为与AI系统不同(AI的设计在权重之外的代码中),大脑必须物理地编码所有设计,因此结构是理解的关键。
让AI更像人类一样观察世界
Google DeepMind在《自然》杂志发表了一篇论文,详细介绍了一种将AI视觉表征与人类认知结构对齐的方法,从而提升模型的鲁鲁棒性和可靠性。
元学习上下文学习实现无需训练的跨被试脑解码
# 论文页面 - 元学习上下文学习实现无需训练的跨被试脑解码 来源:[https://huggingface.co/papers/2604.08537](https://huggingface.co/papers/2604.08537) 作者:,,,,,,,,,,,,, ## 摘要 一种元优化方法通过少量图像-脑示例快速推断个体独特神经编码模式,无需跨被试及扫描仪微调,即可实现可泛化的语义视觉解码。[视觉解码](https://huggingface.co/papers?q
可解释的教学示例
研究表明,通过迭代训练师生神经网络,教师能学到可解释的教学策略,即选择或生成人类能够理解和有效学习的教学示例。