rubric-generation

标签

Cards List
#rubric-generation

面向LLM-as-a-Judge的动态评估准则生成与优化

arXiv cs.CL · 2026-06-01 缓存

本文提出了一种无需训练的方法,可以在无需人工标注的情况下自动生成细粒度的评估准则用于LLM-as-a-Judge,并进一步介绍了一种迭代微调策略,使准则生成器的性能超过更大的专有模型。

0 人收藏 0 人点赞
#rubric-generation

SCOPE:通过共同进化策略进行开放式任务的自我对弈

Hugging Face Daily Papers · 2026-05-29 缓存

SCOPE是一个用于开放式任务的自我对弈框架,它共同进化挑战者(Challenger)和求解器(Solver)策略,在没有外部监督的情况下,在基准测试上取得了高达+10.4分的提升。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈