ArabiGEE:阿拉伯语语法错误解释的分层分类法

arXiv cs.CL 论文

摘要

介绍ArabiGEE,这是首个全面的阿拉伯语语法错误解释分类法,采用分层结构,涵盖拼写、形态、句法和词汇维度,包含27种错误类型、140种修正类型和324个解释。

arXiv:2606.10765v1 Announce Type: new 摘要:我们介绍了ArabiGEE,这是首个基于明确错误类型的全面阿拉伯语语法错误解释(GEE)分类法。与现有将解释生成视为自由文本的GEE方法不同,ArabiGEE通过分层结构组织语法解释,涵盖拼写、形态、句法和词汇维度。该分类法包含27种错误类型、140种修正类型和324个相关解释。我们应用ArabiGEE手动标注了现有阿拉伯语语法错误修正语料库的部分内容,并展示了结构化语法解释如何支持对LLMs在阿拉伯语GEE上的自动评估。我们的代码和数据已公开。
查看原文
查看缓存全文

缓存时间: 2026/06/10 06:12

# ArabiGEE:面向阿拉伯语语法错误解释的分层分类体系
来源:https://arxiv.org/abs/2606.10765
查看PDF (https://arxiv.org/pdf/2606.10765)

> 摘要:我们提出了ArabiGEE,这是首个基于显式错误类型的阿拉伯语语法错误解释(GEE)综合分类体系。与将解释生成视为自由文本的现有GEE方法不同,ArabiGEE通过一个涵盖正字法、形态学、句法和词汇维度的分层结构来组织语法解释。该分类体系包含27种错误类型、140种更正类型以及324个关联解释。我们将ArabiGEE应用于对现有阿拉伯语语法纠错语料库的部分内容进行人工标注,并展示了结构化语法解释如何支持对LLM在阿拉伯语GEE任务上的自动评估。我们的代码和数据已公开提供。

## 提交历史

来自:Bashar Alhafni [查看邮箱 (https://arxiv.org/show-email/733615be/2606.10765)] **\[v1\]** 2026年6月9日星期二 12:16:55 UTC(991 KB)

相似文章

词根与模式屈折形态学:阿拉伯语破碎复数

arXiv cs.CL

提出了一种新颖的词根与模式模型来描述阿拉伯语名词的屈折形态,重点关注破碎复数,包含160个类别的分类法以及应用于3200个词条的编码方案,旨在改进计算语言资源。

优化基于词的L2韩语语法错误标注

arXiv cs.CL

本文通过解决现有资源中的问题(包括表面目标实现和单一参考评估),优化了L2韩语的基于词的语法错误标注,并展示了使用基于KoBART的纠错方法所取得的改进。