共享语义空间中的心理构念
摘要
本文提出一个框架,利用监督语义微分法将心理构念表示为共享词嵌入空间中的方向,从而实现不同测量工具和研究传统之间的比较。
arXiv:2605.26801v1 Announce Type: new
摘要:心理构念通常在不同的工具、数据集和研究传统中进行测量,这使得直接比较变得困难。本文提出一个框架,通过将心理构念表示并比较为共享词嵌入空间中的方向,使其在语义上具有可比性。利用监督语义微分法,我们从文本-结果关联中估计构念特定的语义梯度,并将其投影到理论驱动的参考轴上。作为初步测试案例,我们使用效价(Valence)、唤醒度(Arousal)和支配度(Dominance)作为情感坐标系统。首先,我们从英语词汇水平的情感规范中恢复出可解释的VAD方向。其次,我们将27个GoEmotions类别的语义梯度投影到该空间中,并恢复出预期的情感组织,尤其是沿效价和唤醒度维度。第三,我们将相同流程应用于基于IPIP-NEO-300项目-因素关联的大五人格领域和子域。领域层面的定位总体一致,而子域层面的结果更具探索性,因为它们依赖于稀疏的问卷文本。结果表明,只要语义定位经过稳定性和可解释性评估,嵌入空间可以支持原本不可通约的心理测量之间的构念层面比较。
查看缓存全文
缓存时间: 2026/05/27 09:11
# 共享语义空间中的心理建构
来源:https://arxiv.org/html/2605.26801
###### 摘要
心理建构通常在不同工具、数据集和研究传统中测量,这使得直接比较变得困难。本文提出了一个框架,通过将这些建构表示为共享词嵌入空间中的方向并进行比较,使它们在语义上具有可比性。利用有监督语义差异法,我们从文本-结果关联中估计建构特定的语义梯度,并将其投影到理论驱动的参考轴上。作为初步测试案例,我们使用效价、唤醒度和支配度(VAD)作为情感坐标系统。首先,我们从英语词汇级情感常模中恢复出可解释的VAD方向。其次,我们将27个GoEmotions类别的语义梯度投影到该空间,并恢复了预期的情绪组织,特别是在效价和唤醒度维度上。第三,我们将相同程序应用于源自IPIP-NEO-300项目-因素关联的大五人格域和子维度。域层面的定位大致一致,而子维度层面的结果更具探索性,因为它们依赖于稀疏的问卷文本。结果表明,只要语义定位经过稳定性和可解释性评估,嵌入空间可以在其他不可比的心理测量之间支持建构层面的比较。
## 1 引言
¹¹¹代码仓库:https://github.com/hplisiecki/construct_space
心理科学研究许多直觉上相关但经验上难以比较的现象。情绪、人格特质、态度、症状、价值观和情感状态通常使用不同的工具测量,在不同研究传统中发展,并在不可比的尺度上打分。因此,概念上可能接近的建构往往仅在单个问卷、数据集或理论框架的边界内进行分析。这限制了我们提出更广泛问题的能力,例如:人格子维度在语义上更接近焦虑、支配、好奇心还是积极情感?或者来自不同研究的建构如何占据一个共同的人类意义空间?
分布语义学为解决这个问题提供了一条途径。词嵌入提供了一个共享表示空间,在该空间中,词、文本和语义方向可以进行几何比较(Mikolov et al., 2013;Kozlowski et al., 2019)。我们在这里不是将嵌入仅作为预测特征,而是将其用作心理测量的共同语义基质。核心思想是,来自不同研究的建构可以表示为同一嵌入空间中的方向,即使它们原始测量来自不同的量表、语料库或研究传统,也能共同解释。
我们使用有监督语义差异法(SSD)来实现这一想法。这是一种近期方法,受心理语言学中关于内涵意义的研究启发(Osgood et al., 1957),从配对的文本表示和连续结果值中估计嵌入空间中的有监督方向(Plisiecki et al., 2025)。给定文档嵌入和一个结果变量,SSD拟合一个有监督线性模型,将拟合的系数向量反投影回原始嵌入空间,并通过其最近邻结构解释所得方向。在本文中,我们将SSD从单一建构解释扩展到跨建构比较,通过在同一嵌入空间中估计多个建构特定方向,并将其投影到共享参考轴上。
作为初步演示,我们使用情感意义作为参考框架。效价、唤醒度和支配度(VAD)是经过最充分验证的心理意义维度,在人类评分、情感理论和分布语义学中都有坚实依据(Warriner et al., 2013;Russell, 1980;Russell and Mehrabian, 1977)。因此,我们在固定的GloVe嵌入空间中估计VAD方向,并将其用作可解释的轴,其他建构梯度可以投影到这些轴上。重要的是,这项贡献并不仅限于情感:VAD作为一个理论上充分理解的测试案例,用于支持更广泛的论点,即嵌入空间可以支持心理现象的共享语义表示。
我们通过三个研究来展示该方法。研究1从Warriner等人的英语词汇级VAD常模(Warriner et al., 2013)中估计三个情感参考方向,在GloVe空间中生成单位向量 β̂_V、β̂_A 和 β̂_D。研究2通过将来自GoEmotions语料库(Demszky et al., 2020)的27个离散情绪类别映射到生成的VAD空间,并将恢复的组织结构与情感环状模型(Russell, 1980)的预测进行比较,来验证这些参考方向。研究3将相同框架应用于人格测量,通过从IPIP-NEO-300大五量表(Goldberg, 1999)的项目级响应中推导语义梯度,并将所有五个域和30个子维度投影到情感参考空间中。
## 2 相关工作
### 2.1 分布语义学作为共享表示几何
词嵌入将词汇意义表示为连续向量空间中的点,使得语义关系可以通过距离、邻域和方向来访问(Mikolov et al., 2013;Pennington et al., 2014)。尽管最初主要作为NLP系统的表示而开发,但这些空间也被用作分析对象。先前的工作使用嵌入几何来研究语义变化(Hamilton et al., 2016)、性别和种族刻板印象的历史变迁(Garg et al., 2018),以及文化概念如社会阶层的关联结构(Kozlowski et al., 2019)。相关的基于投影的工作表明,嵌入空间中的线性方向可以恢复人类对物体特征(如大小、危险性和湿度)的判断(Grand et al., 2022)。
这些结果表明,嵌入空间可以编码社会和心理学意义的可解释维度。然而,大多数现有工作研究的是单一的词汇对比、文化维度或历史轨迹。分析单位通常是词、词典或预定义对比。在本文中,分析单位是心理建构。我们询问的是,在不同数据集中测量的建构能否表示为一个共同嵌入空间中的方向,并在该共享几何内进行有意义的比较。
这种用例对表示提出了不同于标准预测或检索的要求。对于建构层面的测量,相关属性不仅是任务准确性,还包括空间是否支持稳定的线性方向、是否可投影到可解释的轴上,以及是否可以通过最近邻进行定性审计。这对应于以预测为导向和以测量为导向的意义表示之间的更广泛区别(Plisiecki, 2026)。静态嵌入在这里很有用,因为它们提供了一个固定的词汇坐标系,其中方向、投影和局部邻域可以直接检查。上下文模型可能编码更丰富的信息,但其层依赖性和语义、句法、表面形式信号的纠缠,使得它们不太适合作为当前线性测量工作流程的基质。
### 2.2 情感意义与语义差异法
本文中使用的情感参考轴受到内涵意义工作和情感维度理论的启发。语义差异法通过双极量表的评分来表示词的意义,并表明这种变化的大部分可以用少数维度概括,经典的是评价、潜力和活动(Osgood et al., 1957)。这些维度与情感理论组织情绪和内涵意义的方式相对应,即效价、唤醒度和支配度(Russell and Mehrabian, 1977;Russell, 1980)。效价捕捉意义的愉悦-不愉快维度;唤醒度捕捉激活水平,从平静到兴奋;支配度捕捉感知的力量或控制,从顺从到支配。大规模情感常模提供了数千个英语词条的这些维度的人类评分(Warriner et al., 2013)。
我们使用效价、唤醒度和支配度(VAD)作为参考轴,因为它们经过充分验证、低维且理论上可解释。这并非声称VAD穷尽了心理意义。相反,VAD为更广泛的框架提供了一个受控测试案例:如果建构可以表示为共享嵌入空间中的方向,那么它们可以投影到任何理论驱动的参考轴上,只要该轴在嵌入空间中有显著印迹。因此,该空间被用作比较建构梯度的一个可解释坐标系,而不是唯一可能的基空间。
### 2.3 心理建构与跨工具可比性
心理建构通常是在特定工具、评分规则和研究传统中操作化的。例如,人格研究通过分层特质模型来表示个体差异,包括广泛的大五模型域和更窄的子维度(McCrae and John, 1992;John et al., 2008)。公共领域的IPIP工具提供了这些域和子维度的项目级测量(Goldberg, 1999;Goldberg et al., 2006)。这些工具支持量表内的测量,但它们不提供可以直接比较来自不同工具或数据集的建构的共同表示。
近期工作已使用文本表示来解决建构可比性的相关问题,包括心理测量中的分类学不可比性(Wulff and Mata, 2025)。我们的方法在关注点上有所不同。我们不是仅仅通过项目相似性聚合来比较问卷,而是从项目-结果关联中估计建构特定的语义梯度,并将这些梯度置于一个共享嵌入空间中。这使得语义表示不仅依赖于项目措辞,还依赖于项目文本与所测量建构之间的经验关系。
### 2.4 有监督语义差异法
SSD从与连续结果变量配对的文本中估计一个语义梯度,并通过其最近邻结构来解释所得方向(Plisiecki et al., 2025)。在其标准形式中,SSD用于表征意义如何在一个数据集内随一个结果变化。本文将这一逻辑扩展到跨建构比较。我们在同一嵌入空间中估计多个建构梯度,将它们投影到共享参考轴上,并比较它们产生的坐标。这将SSD从单一建构解释方法转变为一个表示和分析心理建构语义的框架。
## 3 方法:有监督语义差异法
SSD假设一个文档集合 d_i 与连续结果 y_i 配对。每个文档通过SIF加权词嵌入(并移除第一主成分以减少各向异性)映射为密集向量 x_i ∈ ℝ^D(Mu et al., 2017)。向量通过PCA压缩为 x̃_i ∈ ℝ^K,并估计一个线性模型:
y_i = α + β^⊤ x̃_i + ε_i。
系数向量被归一化为单位长度以获得语义梯度 β̂,并反投影回 ℝ^D。PCA成分数量 K 通过联合可解释性-稳定性扫描(AUCK;Plisiecki et al., 2025)来选择。
所有分析使用GloVe 42B Common Crawl 300维嵌入(Pennington et al., 2014),经L2归一化并移除一个各向异性成分(Mu et al., 2017)。文本预处理使用spaCy en_core_web_lg(Montani et al., 2023),SIF加权参数 a=10^{-3}。
## 4 研究1:情感梯度
### 4.1 数据
我们使用 Warriner 等人(2013)的情感常模,该常模提供了13,915个英语词汇的效价、唤醒度和支配度评分(1-9量表)。每个词被视为一个单标记文档;由于 use_full_doc=True,文档向量直接等于词嵌入。不在GloVe中的词被排除。AUCK扫描范围为 K ∈ {2,4,...,120};研究2使用相同范围。
### 4.2 结果
表1报告了每个维度在扫描选择K处的回归统计量。所有三个轴都产生了高度显著的拟合(p < 10^{-10}),证实了三个情感维度在GloVe空间中具有清晰、可恢复的几何结构。效价拟合最强(r = 0.73),支配度居中(r = 0.67),唤醒度最弱(r = 0.58)。
表1:VAD轴校准的SSD回归结果(Warriner等人常模)。
附录A(表4)报告了三个校准轴每个极点的完整聚类结构。效价轴将两个积极聚类——美学卓越(*令人惊艳、美妙、精致*)和庆祝/灵感(*灵感、庆祝、创造*)——与两个消极聚类——犯罪/威胁(*指控、犯罪、暴力*)和道德谴责(*令人作呕、可憎、卑劣*)分开。唤醒度轴的积极侧更碎片化,聚类范围从狂乱强度(*愤怒、狂乱、尖叫*)到暴力恐怖(*可怕、恐怖、残忍*)再到犯罪暴力(*谋杀、攻击、绑架*),而消极侧则有两个紧凑的聚类,涉及家庭物品(*沙发*相似文章
语义空间的几何结构:离散与连续模型的比较研究
本文比较了深度学习向量嵌入(CamemBERT)和词汇共现图模型在法语“大国民辩论”语料库上引发的几何结构,发现局部拓扑相似但全局组织截然不同,凸显了两种方法的互补性。
代理预设:从语义嵌入到有效的社会测量
本文批评了自然语言处理(NLP)中的“代理预设”,即错误地将几何嵌入属性与社会构念等同起来。文章提出了结构效度协议(Construct Validity Protocol)和反事实中立化(Counterfactual Neutralization)方法,以确保对源自语义嵌入的社会测量进行严格的验证。
Embeddings 用于偏好,而非语义
本文介绍了一种新的 embedding 模型,旨在捕捉偏好相似性,而不仅仅是语义相似性,从而提高了集体决策系统中的偏好预测能力。
文本语义信息的几何轮廓:框架条件唯一性与标量摘要的权衡三角形
本文开发了一个几何框架,利用句子嵌入来衡量文本的语义内容,提出了一个三维语义轮廓(新颖性、广度、整合性)和一个标量权衡三角形,并在合成类别和小说中进行了验证。
学习者能动性与自主性的大规模语义映射揭示测量与生成式AI研究忽视的内容
本文利用对超过14,000篇出版物的大规模语义分析,绘制了学习者能动性与自主性的定义图谱,揭示了三个维度,并指出现有量表系统性地低估了社会文化维度。文章指出,当前教育领域的生成式AI研究过度聚焦于学习调控,从而窄化了为AI中介学习环境所设计的行为库。