标签
介绍 DiscoExplorer,一个用于搜索和可视化跨16种语言的篇章关系数据集的开源网络接口,使 DISRPT 共享任务数据可公开访问。
本文提出了一种比较局部语法共现结果的方法,旨在优化葡萄牙语人名命名实体识别,并在 HAREM 数据集上取得了更高的 F-measure 分数。
本文介绍了麻省理工学院大四学生奥利维亚·哈尼卡特(Olivia Honeycutt),重点展示了她在语言学、计算和认知科学交叉领域的跨学科研究,尤其关注人类语言处理与大语言模型的比较。
研究者用四态马尔可夫链对普希金《叶甫盖尼·奥涅金》及其意大利译本中的元音/辅音模式建模,揭示结构不对称与叙事相关的音韵线索。
本文介绍了STELA,一个语言学感知的LLM水印框架,通过POS n-gram的句法可预测性来平衡文本质量和检测鲁棒性。该方法无需访问模型logits即可实现公开可验证的水印检测,在类型学多样化的语言(英语、中文、韩语)上展示了优异性能。