标签
本文介绍了QuechuaTok,一个用于评估南克丘亚语分词策略的基准,并引入了形态边界准确率(MorphAcc)作为必要指标。结果表明,BPE实现了低碎片率但形态准确性差,而基于形态感知的PRPE分词器达到了83%的MorphAcc,表明仅凭碎片率不足以评估黏着型语言的分词器。
本文提出了一种基于深度学习的聊天机器人系统,用于解答大学中的阿姆哈拉语常见问题,利用TensorFlow和Keras实现神经网络,达到了91.55%的准确率。该系统解决了阿姆哈拉语特有的语言挑战,包括形态变化和词汇缺口,并通过Heroku部署在Facebook Messenger上。