词典语法表到LMF的转换:以法语为例
摘要
描述了将法语动词词典语法表转换为词典标记框架(LMF)格式的过程,以提高自然语言处理词典的互操作性和标准化水平。
arXiv:2605.14816v1 公告类型:新
摘要:我们描述了首次将法语动词词典语法表转换为词典标记框架(LMF)格式的实验。法语的词典语法目前是法语词汇和句法信息的主要来源之一。根据LMF标准将其转换为可互操作的表示格式,使其能够在不同上下文中使用,从而有助于自然语言处理词典的标准化和互操作性。我们简要介绍了词典语法及其衍生词典;分析了转换过程中面临的主要困难;并描述了最终生成的资源。
查看缓存全文
缓存时间: 2026/05/15 06:24
# 从词汇-语法表到LMF的转换:以法语为例 来源:https://arxiv.org/abs/2605.14816 查看 PDF (https://arxiv.org/pdf/2605.14816) > 摘要:我们描述了首次将法语动词的词汇-语法表转换为词汇标记框架(LMF)格式的实验。法语词汇-语法当前是法语词汇和句法信息的主要来源之一。将其按照LMF标准转换为可互操作的表示形式,使其能够在不同场景下使用,从而促进自然语言处理词典的标准化和互操作性。我们简要介绍了词汇-语法及其衍生的词典;分析了转换过程中面临的主要困难;并描述了最终生成的资源。 ## 提交历史 来自:Eric Laporte [查看邮件 (https://arxiv.org/show-email/d4eef2af/2605.14816)] **[v1]** 2026年5月14日 星期四 13:28:24 UTC (789 KB)
相似文章
基于句法词典的词聚类方法增强的法语解析
本文评估了将法语句法词典Lexicon-Grammar中的数据整合到概率解析器中的效果,通过对动词进行词聚类方法,提高了法语的解析准确率。
从词汇到AI:面向低资源语言专业对话系统的结构化数据流水线
提出了一种系统方法论,将印地语WordNet转换为125万条指令-响应对,并利用LoRA对12B参数语言模型进行微调,展示了在低资源语言专业对话系统中教学效果的显著提升。
使用ISO语言标记框架和TEI Lex-0分析并编码Al-Mawrid阿拉伯语-英语词典
本文介绍了一种使用ISO LMF和TEI Lex-0标准对Al-Mawrid阿拉伯语-英语词典进行数字化的方法,实现了高解析准确率和精确度,填补了阿拉伯语词汇基础设施的空白。
实际环境中的多语言多模态大语言模型:面向低资源语言的构建
本教程论文概述了如何为低资源语言构建多语言多模态大语言模型,涵盖数据创建、模型对齐、微调和评估,重点提供实用方案和动手资源。
LiquidAI/LFM2.5-ColBERT-350M
LiquidAI 发布 LFM2.5-ColBERT-350M,这是一种后期交互多语言检索模型,同时还有一个密集双编码器变体,两者均基于 LFM2.5-350M-Base,支持 11 种语言,并设计为 RAG 管道的即插即用替代品。