evaluation-matrix

标签

Cards List
#evaluation-matrix

信号-覆盖矩阵:对语句自动形式化中的类型和语义错误进行分层

arXiv cs.CL · 2天前 缓存

本文介绍了一种信号-覆盖矩阵,它将自动形式化中的类型正确性改进分解为四个层级,揭示了LLM改进背后的机制,并表明标题指标可能掩盖实际解决了哪些错误。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈