科学概念的计算概念史：从早期数字方法到大语言模型

arXiv cs.CL 2026/06/04 04:00 论文

llms computational-history semantic-change digital-humanities history-of-science concept-analysis nlp

摘要

本文将大语言模型置于科学史、科学哲学与科学社会学（HPSS）领域概念分析计算方法的宏观历史背景之中，系统回顾了词汇语义变化检测的方法论挑战与基于大语言模型的案例研究，涵盖前大语言模型时代与大语言模型时代工作流程中的语料库构建、操作化及评估方法。

arXiv:2606.04118v1 公告类型：新论文摘要：本文将大语言模型（LLMs）置于科学史、科学哲学与科学社会学（HPSS）领域概念分析计算方法的更长历史脉络之中。我们考察了LLMs对现有方法的增益、其所继承的长期性问题，并回顾了近期相关案例研究。在第一部分，我们通过整合三条研究脉络，重构了前LLM时代的计算概念史：HPSS中的早期数字方法、来自数字史学及相关研究的分布式方法，以及词汇语义变化检测。我们概述了主要挑战与机遇，重点关注语料库构建、操作化与建模选择，以及评估与解释等问题。在第二部分，我们转向LLM时代，先对LLMs作简要介绍，随后回顾基于LLM的词汇语义变化检测工作及HPSS中的相关案例研究。最后，我们重新审视此前的方法论问题，阐明语料库构建、模型选择与训练数据、操作化权衡，以及评估与解释等议题在基于LLM的工作流程中的具体呈现。

查看原文

查看缓存全文

缓存时间: 2026/06/05 02:12

# 科学概念的计算概念史：从早期数字方法到大语言模型

来源：https://arxiv.org/abs/2606.04118
查看PDF (https://arxiv.org/pdf/2606.04118)

> 摘要：本文将大语言模型（LLMs）置于科学史、科学哲学与科学社会学（HPSS）领域概念分析计算方法的更长历史脉络中加以审视。我们探讨了LLMs在现有方法基础上的新贡献、它们所继承的长期存在的问题，并对采用LLMs的近期案例研究进行了综述。在第一部分，我们通过汇聚三条研究脉络来重建LLMs出现之前的计算概念史：HPSS中的早期数字方法、数字历史及相关研究中的分布式方法，以及词汇语义变化检测。我们概述了主要的挑战与机遇，重点关注语料库构建、操作化与建模选择，以及评估与解释。在第二部分，我们转向LLMs时代，先对LLMs作简要介绍，再综述基于LLMs的词汇语义变化检测工作及HPSS中的相关案例研究。随后，我们重新审视早期的方法论问题，阐明语料库构建、模型选择与训练数据、操作化权衡，以及评估与解释等问题在基于LLMs的工作流程中的具体表现。

## 提交历史

提交者：Michael Zichert \[查看邮箱 (https://arxiv.org/show-email/a4714919/2606.04118)\] **\[v1\]** 2026年6月2日（周二）18:28:29 UTC（275 KB）

科学概念的计算概念史：从早期数字方法到大语言模型

相似文章

大语言模型中的元认知：基础、进展与机遇

利用具备上下文学习能力的 LLM 进行算法理论物理研究

大语言模型作为语言学中的模态模型

它们在思考什么？大语言模型中概念的界定、探测与追踪

@pmddomingos: 你可以阅读数百篇充满炒作的大语言模型文章，却仍然不知道它们是如何工作的。或者，你可以阅读这篇，然后...

提交意见反馈