科学概念的计算概念史:从早期数字方法到大语言模型

arXiv cs.CL 论文

摘要

本文将大语言模型置于科学史、科学哲学与科学社会学(HPSS)领域概念分析计算方法的宏观历史背景之中,系统回顾了词汇语义变化检测的方法论挑战与基于大语言模型的案例研究,涵盖前大语言模型时代与大语言模型时代工作流程中的语料库构建、操作化及评估方法。

arXiv:2606.04118v1 公告类型:新论文 摘要:本文将大语言模型(LLMs)置于科学史、科学哲学与科学社会学(HPSS)领域概念分析计算方法的更长历史脉络之中。我们考察了LLMs对现有方法的增益、其所继承的长期性问题,并回顾了近期相关案例研究。在第一部分,我们通过整合三条研究脉络,重构了前LLM时代的计算概念史:HPSS中的早期数字方法、来自数字史学及相关研究的分布式方法,以及词汇语义变化检测。我们概述了主要挑战与机遇,重点关注语料库构建、操作化与建模选择,以及评估与解释等问题。在第二部分,我们转向LLM时代,先对LLMs作简要介绍,随后回顾基于LLM的词汇语义变化检测工作及HPSS中的相关案例研究。最后,我们重新审视此前的方法论问题,阐明语料库构建、模型选择与训练数据、操作化权衡,以及评估与解释等议题在基于LLM的工作流程中的具体呈现。
查看原文
查看缓存全文

缓存时间: 2026/06/05 02:12

# 科学概念的计算概念史:从早期数字方法到大语言模型

来源:https://arxiv.org/abs/2606.04118
查看PDF (https://arxiv.org/pdf/2606.04118)

> 摘要:本文将大语言模型(LLMs)置于科学史、科学哲学与科学社会学(HPSS)领域概念分析计算方法的更长历史脉络中加以审视。我们探讨了LLMs在现有方法基础上的新贡献、它们所继承的长期存在的问题,并对采用LLMs的近期案例研究进行了综述。在第一部分,我们通过汇聚三条研究脉络来重建LLMs出现之前的计算概念史:HPSS中的早期数字方法、数字历史及相关研究中的分布式方法,以及词汇语义变化检测。我们概述了主要的挑战与机遇,重点关注语料库构建、操作化与建模选择,以及评估与解释。在第二部分,我们转向LLMs时代,先对LLMs作简要介绍,再综述基于LLMs的词汇语义变化检测工作及HPSS中的相关案例研究。随后,我们重新审视早期的方法论问题,阐明语料库构建、模型选择与训练数据、操作化权衡,以及评估与解释等问题在基于LLMs的工作流程中的具体表现。

## 提交历史

提交者:Michael Zichert \[查看邮箱 (https://arxiv.org/show-email/a4714919/2606.04118)\] **\[v1\]** 2026年6月2日(周二)18:28:29 UTC(275 KB)

相似文章

LLM Wiki v2(16分钟阅读)

TLDR AI

本文介绍了一种利用LLM构建个人知识库的模式,为在大语言模型辅助下进行知识管理提供了结构化方法。

学习如何让大语言模型进行推理

OpenAI Blog

OpenAI 发布了一篇文章,通过密码破译示例探索大语言模型的推理技术,展示了语言模型的逐步问题求解和模式识别能力。