hypothesis-testing

标签

Cards List
#hypothesis-testing

面向可靠LLM判断的边际自适应置信度排序

arXiv cs.LG · 21小时前 缓存

本文提出了一种针对LLM作为评判系统的基于边际的置信度排序方法,通过学习专用估计器来确保置信度与人类分歧风险之间的单调性,具有泛化保证,并在多个数据集上提高了排序准确性。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈