control-harness

标签

Cards List
#control-harness

LLMs知道自己知道,但并未据此行动:一种用于测试时扩展的元认知框架

arXiv cs.LG · 3天前 缓存

本文提出一种元认知框架,将LLMs中的监控与推理分离,利用解决前的已知感(feeling-of-knowing)和解决后的学习判断(judgment-of-learning)信号来控制何时信任、重试或聚合答案,在不更新参数的情况下提升文本、代码和多模态基准测试的准确率。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈