BitTide
首页
最新
模型
工具
新闻
产品
论文
事件
今日日报
搜索
订阅
English
登录
evaluation-skills
标签
Cards
List
#evaluation-skills
超越评分准则:面向奖励建模的探索引导评估技能
arXiv cs.CL
↗
· 2026-06-08
缓存
Eval-Skill 是一种探索引导方法,可合成为奖励建模的可复用评估技能,在 RewardBench 2 上相比现有骨干模型取得了显著提升。
0 人收藏
0 人点赞
← 返回首页
意见反馈
×
提交意见反馈
感谢您的反馈!
提交