基于智能体的形态交替模式演化模型

arXiv cs.CL 论文

摘要

本文介绍了使用多智能体模拟语言中形态交替模式(如'go/went')的出现,并利用AI历史语言学家(基于大语言模型)评估演化形态相对于真实语言的合理性。

arXiv:2606.12748v1 公告类型:新 摘要:为什么英语中"go"的过去式是看似无关的"went"?这样的交替现象在语言中很常见。它们既无助于交流,也无助于可学习性,但却可以持续存在,跨越几个世纪甚至几千年。 我们提出了一种多智能体模拟,研究形态词干和屈折交替的出现。交替形式源于音系变化,或者像"go/went"那样,来自与部分人群关联的词汇替代形式。当一个智能体'听到'另一个智能体为一个词的词形变化表中的某个空位使用新形式(例如go的过去时),它将以一定概率采纳该形式,并可能将其使用扩展到词形变化表中原本共享相同形式的其他空位。因此,替代形式可以在人群中传播,并固化为词干或屈折标记的交替形式。与许多先前的计算研究不同,我们的系统允许自然主义的词汇形式、现实音系规则、包含数百或数千词条的词汇表,以及数十或数百个智能体群体。它支持多种网络拓扑结构、扩散模式和智能体采纳策略。 这类模拟的一个问题是评估:演化出的形态相对于真实语言的形态有多真实?我们引入了AI Historical Linguist,一种新颖的基于大语言模型的系统,模拟两位历史语言学家之间的辩论。我们用它来比较一组真实语言形态、伪装形态以及实验演化形态。结果表明,有利于更合理形态的因素包括无标度社交网络和形式的随机伯努利采纳。 我们还展示了三个建模已证实历史变化的案例研究,使我们能够测试如果历史不同可能会发生什么。 所有代码和数据均已发布。
查看原文
查看缓存全文

缓存时间: 2026/06/12 08:50

# 基于智能体的形态交替模式演化模型
来源:https://arxiv.org/abs/2606.12748
查看PDF (https://arxiv.org/pdf/2606.12748)

> 摘要:为什么英语中“go”的过去式是看似无关的“went”?这类交替现象在语言中十分常见。它们既无助于交流,也不利于学习,却能够持续存在,历经数百年甚至数千年之久。我们提出了一个多智能体模拟,用于研究形态词干与屈折交替现象的产生。交替形式源于音系变化,或者像“go/went”这样,源自人口子集所关联的词汇替代形式。当一个智能体“听到”另一个智能体使用某个词语范式中的某个空位(例如go的过去式)的新形式时,它会有一定概率采用该形式,并可能将其使用扩展到范式中原本共享同一原始形式的其他空位。这样一来,交替形式就能在人群中传播,并固化为词干或屈折标记的交替形式。与许多先前的计算研究不同,我们的系统支持自然的词汇形式、真实的音系规则、包含数百或数千条词条的词汇表,以及数十或数百个智能体的人口规模。它支持多种网络拓扑结构、扩散模式以及智能体采纳策略。这类模拟面临的一个问题是评估:与真实语言相比,生成的形态结构有多逼真?我们引入了“AI历史语言学家”,这是一个新颖的大型语言模型驱动系统,模拟两位历史语言学家之间的辩论。我们利用该系统比较了一组真实语言的形态结构、伪装后的形态结构以及实验演化出的形态结构。结果表明,无标度社交网络和随机伯努利形式采纳方式更有利于产生逼真的形态结构。我们还展示了三个案例研究,模拟了已知的历史变化,从而检验如果历史有所不同会发生什么。所有代码和数据均已公开。

## 提交历史

来自:Richard Sproat \[查看邮件 (https://arxiv.org/show-email/3a297006/2606.12748)\] **\[v1\]** 2026年6月10日星期三 23:26:44 UTC (5,283 KB)

相似文章

HawkesLLM:智能体文本模拟中的语义不确定性传播

arXiv cs.CL

本文介绍了HawkesLLM,一个通过结合用于时间影响和记忆选择的多变量Hawkes过程与用于文本生成的语言模型,对多步骤智能体文本模拟中的语义不确定性传播进行建模的框架。在GDELT新闻级联案例研究上的评估表明,在紧凑的提示-记忆约束下,后期语义对齐得到了改善。

自回归大语言模型正式与鱼共眠(Yann LeCun是对的)

Reddit r/AI_Agents

CETI项目使用大语言模型的架构解码抹香鲸的咔嗒声,揭示了其语音字母表,但也凸显出AI的统计模式匹配缺乏真正的理解。文章认为,AGI需要具身化、多模态的根基,而不仅仅是基于文本的模型扩展。

多智能体种群中有根据的组合语言的出现

OpenAI Blog

# 多智能体种群中有根据的组合语言的出现 来源: [https://openai.com/index/emergence-of-grounded-compositional-language-in-multi-agent-populations/](https://openai.com/index/emergence-of-grounded-compositional-language-in-multi-agent-populations/) ## 摘要 通过捕捉大型语料库中的统计模式,机器学习在自然语言处理领域取得了重大进展,包括在机器翻译、问答和情感分析方面的应用

PACE: 双时间尺度自进化小语言模型智能体

arXiv cs.LG

PACE 提出了一种双时间尺度框架,用于小语言模型智能体的自进化,协调低风险的提示精炼与高风险的控制器逻辑更新,在多个基准上实现了高达 +9.2% 的相对提升。