定义上的忠实:通过自然语义元语言解释进行情感分析
摘要
本文提出了一种使用自然语义元语言(NSM)的情感分析界面,为情感分类生成忠实且可解释的说明,以轻微的准确度换取可验证性。
arXiv:2607.00661v1 公告类型:新
摘要:情感分类器的解释通常是事后产生的,无法保证它们反映标签背后的计算过程。我们提出了一种用于基于事件的情感分析的解释界面。解析器将输入文本映射为一种解释,这是一种使用自然语义元语言封闭词汇编写的简短脚本,组织成12个类型化槽位;同时,一个固定的决策规则列表(根据已发表的语义定义转录)仅根据该解释计算标签。因此,忠实性保证是因果性和定义性的,而所有经验风险都存在于学习到的解析器中,通过逐行蕴含界面使其可针对输入进行审计。在众包事件描述上,我们微调的解析器在一个小型保留集上达到了0.33的准确率和0.48的选择性准确率,表明该界面以与黑盒模型相比可忽略的准确度差异,换取了用于第一人称基于事件的情感分析的可验证、可检查的决策基础。我们还发布了EmoExpl-1200,包含逐行验证元数据和完整的规则集。
查看缓存全文
缓存时间: 2026/07/02 05:38
# 忠于定义:通过自然语义元语言阐释进行情感分析 来源:https://arxiv.org/abs/2607.00661 查看PDF(https://arxiv.org/pdf/2607.00661) > 摘要:情感分类器的解释通常是在事后生成的,无法保证它们反映了标签背后的计算过程。我们提出了一种面向基于事件的情感分析的阐释界面。解析器将输入文本映射为阐释(一种使用自然语义元语言封闭词汇编写的简短脚本,组织成十二个类型化槽位),并通过一组固定的决策规则列表(从已发表的语义定义中转录而来)仅根据阐释计算标签。因此,保真度保证是因果性和定义性的,而所有经验风险都存在于经过学习的解析器中,该解析器通过逐行蕴涵界面可针对输入进行审计。在众包事件描述上,我们微调后的解析器在小型保留集上达到了0.33的准确率和0.48的选择性准确率,这表明该界面以与黑箱模型相差不大的准确率,换来了对第一人称基于事件的情感分析而言可验证、可检查的决策基础。我们还发布了带有逐行验证元数据和完整规则集的EmoExpl-1200。 ## 提交历史 来自:Frank Xing [查看邮件](https://arxiv.org/show-email/da38cbf4/2607.00661) **[v1]** 2026年7月1日星期三 09:10:14 UTC(100 KB)
相似文章
大型语言模型中的情绪概念及其功能
Anthropic 发布研究论文,分析了 Claude Sonnet 4.5 的内部机制,揭示了影响模型行为和安全性的功能性情绪相关表征。
超越编译:评估自然语言到Lean语句的忠实形式化
本文提出了一个用于自然语言到Lean语句忠实形式化的基准测试和评估协议,揭示了编译通过与共识忠实性之间29个百分点的差距,并分解了专家起草、上下文搜索和细化反馈的效果。
连接法律解释与形式逻辑:忠实性、假设与人工智能法律推理的未来
本文指出了人工智能法律推理中法律解释与形式逻辑之间的系统性鸿沟,提出了一种神经符号方法来弥合这一鸿沟,并展示了在严格形式蕴含条件下重新标注法律自然语言推理数据时出现的显著标签偏移。
忠实性度量并不衡量忠实性:基于真实标注的元评估
本文介绍了BonaFide基准,包含来自13个任务和10个模型的3,066个标注的思维链示例,并系统评估了忠实性度量,结果表明大多数度量表现接近随机,且在可靠性和效率方面存在显著局限。
EmoS:面向细粒度流式情感理解的高保真多模态基准
本文介绍了 EmoS,这是一个专为细粒度流式情感理解设计的高保真多模态基准,旨在解决现有数据集中存在的生态效度不足和标注可靠性低的问题。