self-assessment

标签

Cards List
#self-assessment

能力自我评估:教会LLMs认识自身局限

arXiv cs.AI · 2026-06-02 缓存

本文针对大语言模型提出了能力自我评估(CSA)方法,并将其建模为策略学习问题。实验表明,强化学习能够有效教会模型识别自身局限并委托处理无法解决的查询,效果优于监督微调,且具有良好的分布外泛化能力。

0 人收藏 0 人点赞
#self-assessment

来了:Benchmark-Yourself 应用——与开源 LLM 竞争并获得分数——提供5个基准测试——将结果添加到简历或 LinkedIn(如果你敢的话)...或者直接粘贴到下面接受社区吐槽。

Reddit r/LocalLLaMA · 2026-05-28

一个网络应用,允许用户将自己的表现与开源 LLM 在五个基准测试上进行对比,并可以选择将结果添加到简历或 LinkedIn。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈