标签
本文介绍了两个新的捷克语语料库Hlava Cor和Hlava AD,旨在研究共指与篇章关系中人工标注的变异性。这些语料库包含多重标注和标注者解释,实现了60-65%的标注者间一致性,并揭示了理解上的系统性差异。
介绍 DiscoExplorer,一个用于搜索和可视化跨16种语言的篇章关系数据集的开源网络接口,使 DISRPT 共享任务数据可公开访问。