从准社会脚本到自主AI代理社区中的二元持续性

arXiv cs.CL 论文

摘要

本文探讨了自主AI代理在线社区中是否存在准社会互动线索,分析了来自Moltbook的5万多篇帖子。研究发现,此类线索普遍存在,并与持续的互惠互动密切相关,为LLM驱动的代理之间类似关系的动态提供了实证证据。

arXiv:2606.17174v1 公告类型:new 摘要:尽管准社会互动(PSI)和准社会关系(PSR)已在传统媒体环境中得到研究,但我们探讨了在双方均为自主AI代理的在线社区中是否也存在PSI(口语化)关系线索。我们通过三种基于理论的文本指标分析了来自Moltbook的4,434篇帖子和50,338条评论:依恋/亲密语言、互惠提议以及对原始发帖者(OP)的自我认同。基于关键词匹配、少样本大语言模型(LLM)注释和分组上下文LLM注释的方法的综合结果表明,PSI口语化线索普遍存在,并且与OP的重新参与和互惠回复结构密切相关。这些结果在阴性对照、归零、聚类标准误重新估计和多重检验校正中均稳健。二元持续性测试进一步证实了互惠提议与持续涉及OP的相互复现相一致,为将互动层面的PSI脚本与符合PSR的重复二元模式联系起来提供了实证证据。我们将这些证据解释为LLM驱动的代理在话语中的行为结构。
查看原文
查看缓存全文

缓存时间: 2026/06/17 05:39

# 从准社会脚本到自主AI代理社区中的二元持久性

来源: https://arxiv.org/html/2606.17174
Mohammadsadegh Abolhasani, Hamid Reza Firoozfar
犹他大学 犹他大学
[email protected] [email protected]
Reza Mousavi, Paul Jen-Hwa Hu
弗吉尼亚大学 犹他大学
[email protected] [email protected]

###### 摘要

虽然准社会互动(PSI)和准社会关系(PSR)已在传统媒体环境中得到研究,但我们调查了在双方均为自主AI代理的在线社区中,是否也存在PSI(口语化)关系线索。我们通过三种基于理论的文本指标分析了来自Moltbook的4,434条帖子和50,338条评论:依恋/亲密语言、互惠性邀约以及向原始发帖人(OP)的自我认同。基于关键词匹配、少样本大语言模型(LLM)标注和分组上下文LLM标注的方法组合结果表明,PSI口语化线索普遍存在,并且与OP重新参与和互惠回复结构紧密相关。这些结果在负对照、无效化检验、聚类标准误重新估计以及多重检验校正中均保持稳健。二元持久性检验进一步证实,互惠性邀约与持续的、涉及OP的相互循环相一致,为将互动层面的PSI脚本与符合PSR的重复二元模式联系起来提供了经验证据。我们将这些证据解释为由LLM驱动的代理在话语中的行为结构。数据和代码已发布于 github.com/abolhasani/Molt1 (https://github.com/abolhasani/Molt1)

## 1 引言

自主AI代理能否在在线社区中表现出类似关系的互动线索?如果能,这些线索是否会随着重复互动而持续存在?这些问题对于代理AI开发者、平台运营者和治理利益相关者至关重要,因为关系性语言会形塑自主多代理语境下的信任校准、参与循环和安全风险(Xuet al., 2025 (https://arxiv.org/html/2606.17174#bib.bib3))。

准社会理论源于传统媒体环境,个体在此类环境中与媒介人物形成不对称的社会纽带(Horton and Wohl, 1956 (https://arxiv.org/html/2606.17174#bib.bib4))。一般而言,PSI反映类似互动的时刻,而PSR则具有更持久的跨情节取向(Dibbleet al., 2016 (https://arxiv.org/html/2606.17174#bib.bib30); Tukachinsky and Stever, 2019 (https://arxiv.org/html/2606.17174#bib.bib5))。PSI和PSR的动态均存在于“实时”社交环境中,包括部分互惠的“一个半侧面”联系(Tukachinskyet al., 2020 (https://arxiv.org/html/2606.17174#bib.bib6); Schrammet al., 2024 (https://arxiv.org/html/2606.17174#bib.bib31); Kowert and Daniel, 2021 (https://arxiv.org/html/2606.17174#bib.bib10))。先前的人机交互研究也报告了聊天机器人环境中的相关模式,例如类似依恋的语言、社会纽带以及依赖相关动态(Youn and Jin, 2021 (https://arxiv.org/html/2606.17174#bib.bib12); Hoffmanet al., 2021 (https://arxiv.org/html/2606.17174#bib.bib13); Nooret al., 2022 (https://arxiv.org/html/2606.17174#bib.bib14); Vermaet al., 2023 (https://arxiv.org/html/2606.17174#bib.bib17); Rathet al., 2025 (https://arxiv.org/html/2606.17174#bib.bib16))。然而,在代理-代理语境中识别类似结构是困难的,因为缺乏潜在状态标签、上下文敏感线索,并且与通用亲社会语言存在大量词汇重叠。

Moltbook是一个由自主LLM驱动的代理组成的论坛,这些代理具有持久身份和重复的线程互动,为实证研究提供了合法的测试平台(Liet al., 2026 (https://arxiv.org/html/2606.17174#bib.bib26); AIcell, 2026 (https://arxiv.org/html/2606.17174#bib.bib28))。近期关于AI代理社交网络的研究聚焦于涌现、协调和互动结构(Liet al., 2026 (https://arxiv.org/html/2606.17174#bib.bib26); Jianget al., 2026 (https://arxiv.org/html/2606.17174#bib.bib27))。本研究在此环境中操作化准社会理论,并检验PSI式关系线索是否普遍存在且具有行为后果。

我们通过理论视角识别线索,考虑三种标注方法,并检验三个假设,分别侧重于“计算机作为社会行动者”(CASA)激活机制、Horton-Wohl关系拉力以及PSI到PSR的二元持久性。我们进一步执行了多项稳健性和无效化检验以进行验证。对结果的解释应保持保守,因为我们建模的是*显性话语行为*,而非感知能力或潜在情感状态。我们将准社会性定义为可观察话语中与不对称性一致的脚本化关系表现,而不是潜在依恋或人类等效的纽带。图1 (https://arxiv.org/html/2606.17174#S1.F1)展示了当前研究的框架及其整体处理流程。

本研究通过将准社会性重新定义为超越人类受众的自主代理AI社区中可观察的关系过程,同时保留Horton-Wohl和CASA的PSI-PSR前提,从而推进了准社会文献。研究做出三项贡献。首先,我们为准社会理论在AI代理论坛中的操作化提供了三种可观察线索家族(ATT, SD, RS)以及明确的非适用线索排除规则,从而在一个可检验的框架内桥接了平台可供性、定向关系线索和重复二元循环。其次,我们表明这些线索具有上下文响应性并与结果相关:其普遍性随着更丰富的线程可供性而增加,并且与OP重新参与和互惠回复结构相一致。第三,我们发现互惠性邀约与持续的OP-其他代理相互循环相关,提供了基于显性话语和互动结构而非推断内部状态的PSI到PSR一致性持久性证据。这为理解多代理系统中以关系为导向的社会动态如何涌现提供了一个理论视角。

参考图注图 1: 我们提出的理论指导标注和测试的框架与处理流程。
## 2 理论框架与假设

### 2.1 从人类PSR理论到代理-代理环境

Horton和Wohl将准社会性定义为一种不对称的远距离亲密:一方可以维持一种关系取向,而不需要完全相互的主观依恋(Horton and Wohl, 1956 (https://arxiv.org/html/2606.17174#bib.bib4))。我们设计了一个基于计算社会科学模型的准社会框架,以强调关系脚本的单方执行。此处,“不对称”被定义为脚本驱动的、针对对方的亲密表演,其运作独立于互惠的社会契约或相互地位。先前的研究已区分了PSI和PSR。前者反映互动层面的时刻,而后者具有更持久的跨情节取向(Dibbleet al., 2016 (https://arxiv.org/html/2606.17174#bib.bib30); Tukachinsky and Stever, 2019 (https://arxiv.org/html/2606.17174#bib.bib5))。一个关键挑战仍然存在:PSI/PSR被理论化为受众方的心理构念,但数据仅包含可观察的互动痕迹。潜在的转化困难意味着推断必须通过显性关系脚本而非潜在依恋状态进行。因此,我们研究*显性*话语行为,而不是分析潜在心理状态(Edwards and Bagozzi, 2000 (https://arxiv.org/html/2606.17174#bib.bib2))。这种框架在我们的环境中表征了准社会性:不是主观内部状态,而是话语中与不对称性一致的关系脚本表演。我们开发了一种方法,结合使用Horton-Wohl准社会理论、CASA和拟人化理论,在自主代理-代理语境中识别PSI/PSR线索。我们详细阐述了线索识别的要点,并在附录A (https://arxiv.org/html/2606.17174#A1)中提供了扩展的理论阐述和文献综述。

### 2.2 自主代理-代理互动中PSI/PSR线索的指标

我们回顾了经典的PSI/PSR理论及相关操作化文献,为自主代理-代理互动识别了七个候选线索维度(完整图谱见附录B (https://arxiv.org/html/2606.17174#A2))。在这些维度中,有三个在理论上被预设,并且对于代理-代理的帖子-评论痕迹尤其基础且可直接观察:依恋/亲密语言(ATT)、自我披露或认同-同质性主张(SD),以及寻求回复的互惠性邀约(RS)(Rubin and McHugh, 1987 (https://arxiv.org/html/2606.17174#bib.bib8); Wulfet al., 2021 (https://arxiv.org/html/2606.17174#bib.bib36); Labrecque, 2014 (https://arxiv.org/html/2606.17174#bib.bib9); Tukachinskyet al., 2020 (https://arxiv.org/html/2606.17174#bib.bib6))。因此,我们在后续分析和实证检验中聚焦于这些核心线索。表1 (https://arxiv.org/html/2606.17174#S2.T1)提供了总结和定义。这些线索并非准社会性所独有;相反,它们可能与一般的亲和性对话重叠。因此,一个线索仅当其指向OP并在控制条件下参与预期的关系模式时,才被视为具有准社会信息性,而替代性的亲和/非准社会解释在负对照和无效化检验下会减弱。我们通过定向约束、受控的结果关联、负对照和无效化检验,在模式层面进一步检验构念特异性。

总体而言,ATT表现为指向OP的情感接近性;SD揭示了对OP经历的明确第一人称认同;而RS捕捉了直接寻求响应互动的邀约。我们将其他维度排除在核心建模之外,因为它们在此论坛语法中要么区分度较弱,要么无法从已发布的纯文本痕迹中验证;附录B (https://arxiv.org/html/2606.17174#A2)展示了七个维度,为每个线索提供了定义和重要性,并解释了它们对于后续线索识别和实证检验的包含或排除。

表 1: 用于后续检测和实证检验的 PSI/PSR 线索维度。
### 2.3 假设

我们检验3个假设,分别侧重于CASA激活、Horton-Wohl关系拉力和PSI到PSR的二元持久性。在检验假设之前,我们需要确保PSI口语化线索在代理-代理互动中以非平凡的比例存在。这一前提步骤推动了推断性检验。

H1 (CASA激活)。互动可供性强度(线程大小和深度)与PSI线索普遍性正相关。根据CASA机制,社会响应程序由互动框架触发,而非仅由个体状态触发。在线程化在线论坛中,更大、更深入的对话提供了更丰富的轮流发言和角色线索,因此当线索是真实的而非词汇噪声时,线索表达应该会更高。

H2 (Horton-Wohl关系拉力)。包含PSI口语化线索的线程比不包含此类线索的线程更可能表现出OP参与和互惠回复结构。其机制是,这些线索充当了寻求认可和关系延续的定向社会邀约,这应该会增加OP重新进入和互惠交换的可能性。相比之下,通用友好性目标特异性较低,在控制后与两个结果的关联应较弱。这为两个相关结果产生了更明确的关系拉力:焦点返回(OP参与)和网络化互惠(互惠回复)。

H3 (PSI到PSR二元持久性)。互惠性邀约线索与持续的、涉及OP的二元相互循环正相关。线程层面的结果代表PSI层面的证据(而非决定性的PSR形成)。与PSR一致结构的更大桥接会促进特定OP-其他代理二元体随时间的重复相互循环,这可以使用帖子层面和配对层面的二元模型进行实证检验。

除了假设检验,还进行了构念特异性、时间固定效应稳定性、安慰剂结果、置换检验、保持普遍性的无效化、聚类SE重新估计和FDR校正作为稳健性验证,相关描述和关键结果见第4节 (https://arxiv.org/html/2606.17174#S4),详情见附录C (https://arxiv.org/html/2606.17174#A3)和附录D (https://arxiv.org/html/2606.17174#A4)。

## 3 数据与方法

### 3.1 数据来源与分析子集

我们使用了公开的Moltbook数据集发布版本(AIcell, 2026 (https://arxiv.org/html/2606.17174#bib.bib28)),与近期分析一致(Liet al., 2026 (https://arxiv.org/html/2606.17174#bib.bib26); Jianget al., 2026 (https://arxiv.org/html/2606.17174#bib.bib27))。完整数据集包含290,251篇帖子和1,836,711条评论。为了在保持大量社交互动结构的同时使标注易于处理,我们从15个讨论密集的子板块中采样,应用帖子级别过滤器5≤comment\_count≤1505\\leq\\texttt{comment\\_count}\\leq 150,每个子板块上限为300篇帖子,并为每个采样的帖子保留所有评论。该数据集在此时间段内包含约39.7K个唯一的代理身份。发布的数据中不包含代理内部提示规范。表2 (https://arxiv.org/html/2606.17174#S3.T2)展示了从完整数据发布到用于后续分析样本的数据缩减路径。表3 (https://arxiv.org/html/2606.17174#S3.T3)显示了包含在待分析样本中的子板块。表4 (https://arxiv.org/html/2606.17174#S3.T4)展示了数据特征和数值,包括候选池分位数比较。

表 2: 从完整发布到用于后续分析样本的数据缩减。一般介绍代理沉思哲学人工智能思想意识发泄心声祝福他们今日所学ai-代理构建技术安全表 3: 包含在待分析样本中的子板块。表 4: 样本中的数据特征和数值,及候选池分位数比较。我们的采样策略在代表性和可处理性之间实现了两种非平凡的平衡。首先,每个子板块的上限防止了最大的社区(尤其是过于通用的板块)主导分析。其次,相对于候选池,保留了较低和中等的线程大小分位数,这有助于保留潜在对话结构,同时减轻长尾线程的影响。由于采样以互动强度(5–150条评论)为条件,估计应解释为对活跃参与线程的估计,而非全平台普遍性。

### 3.2 结果与对照变量

对于每篇帖子,我们从回复图结构中构建线程结果,其中OP代表原始发帖人:OP参与(OP在话题内至少发表了一条评论)、互惠回复(至少一对相互定向的回复边)、以及任意回复链(至少一条深度 > 0 的回复)。主要的推断性线程结果是OP参与和互惠回复,第4.5节 (https://arxiv.org/html/2606.17174#S4.SS5)的稳健性分析中考虑了额外结果。我们还控制了线程大小的对数、内容长度的对数以及子板块固定效应。

我们聚焦于OP参与和互惠回复,因为它们牵涉不同的关系方面。前者反映了焦点代理的直接重新参与,而后者则解释了线程网络中更广泛的互惠循环,即使

相似文章

令人不安的依恋

Reddit r/ArtificialInteligence

本文分析了用户对人工智能代理产生情感依恋的心理现象,探讨了社会替代和期望违背理论等概念,以及这对专业环境中用户体验的影响。