treebank

标签

Cards List
#treebank

认识UD_Czech-PDTC:通用依赖框架下的大型、体裁丰富的树库

arXiv cs.CL · 昨天 缓存

本文介绍了UD_Czech-PDTC,这是通用依赖框架下捷克语的一个大型、体裁多样的树库,源自Prague Dependency Treebank-Consolidated。文章描述了转换过程以及两种标注方案之间的差异。

0 人收藏 0 人点赞
#treebank

Prague Dependency Treebank -- 整合版 2.0:丰富复杂标注方案

arXiv cs.CL · 昨天 缓存

我们介绍了Prague Dependency Treebank的第二个整合版本,这是一个400万词的人工多语言标注资源,涵盖形态、句法、语义、共指和话语,以及兼容的词典。

0 人收藏 0 人点赞
#treebank

AthDGC:一个开放的历时希腊语树库,具有印欧语平行语料

arXiv cs.CL · 2026-06-16 缓存

本文介绍了AthDGC,这是首个获得公开许可的依存句法分析希腊语树库,跨越八个历时时期,并使用Stanza、LaBSE和多语言BERT等NLP工具与四种古代印欧语进行了诗句级别的交叉对齐。

0 人收藏 0 人点赞
#treebank

AfriSUD: 用于评估模型的非洲语言依存树库集合

arXiv cs.CL · 2026-06-12 缓存

AfriSUD是一个新的非洲语言依存树库集合,遵循表层句法通用依存(SUD)框架,旨在评估NLP模型在Naija、Wolof和Yorùbá等语言上的表现。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈