rubrics

标签

Cards List
#rubrics

PReMISE:将策略规则作为LLM评估者的度量规范

arXiv cs.AI · 3天前 缓存

介绍了PReMISE,一个用于发现和审计LLM评估者策略级规则的框架,涵盖四个维度:结构充分性、可靠性、偏好匹配度和对抗鲁棒性。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈