标签
本文将大语言模型置于科学史、科学哲学与科学社会学(HPSS)领域概念分析计算方法的宏观历史背景之中,系统回顾了词汇语义变化检测的方法论挑战与基于大语言模型的案例研究,涵盖前大语言模型时代与大语言模型时代工作流程中的语料库构建、操作化及评估方法。
本文介绍Lepton,一个微调的BERT分类器,用于预测古典中文文集目录中的标题是私人信件还是序言(尤其是易混淆的赠序)。该模型利用了来自明末清初三十三位文人的5,438条手工标注标题。
介绍PaliBench,一个用于巴利语到英语翻译的多参考基准,采用多位学者的独立翻译,并提供一种可复用的方法论,用于为古典语言创建类似的基准测试。