self-verification

标签

Cards List
#self-verification

FineVerify:通过细粒度自我验证扩展智能搜索的测试时计算

Hugging Face Daily Papers · 2026-05-30 缓存

FineVerify是一个针对智能搜索的自我验证框架,它将问题分解为子问题,验证采样候选,并选择最佳候选,在多个基准测试上取得了相对于基线的显著准确率提升,包括使GPT-5-mini在BrowseComp-Plus上超越GPT-5。

0 人收藏 0 人点赞
#self-verification

Self-Verified Distillation:你的语言模型实则就是它自己的合成数据流水线

arXiv cs.CL · 2026-05-27 缓存

提出了Self-Verified Distillation方法,该方法让LLM从无标注的种子问题中生成候选解决方案,并通过基于提示的自我验证进行筛选,然后在过滤后的数据集上进行训练,从而在Qwen3模型的数学、科学和编程基准测试上取得了显著提升。

0 人收藏 0 人点赞
#self-verification

解码大型推理模型中的批判机制

Hugging Face Daily Papers · 2026-05-22 缓存

本文研究大型推理模型如何在内部检测并纠正自身错误,识别出一个高度可解释的批判向量,该向量无需额外训练即可增强错误检测能力,并提升测试时扩展性能。

0 人收藏 0 人点赞
#self-verification

@RLanceMartin:自我验证(Outcomes)和自我学习(Dreaming)是我们在 Code 分享的最有趣的新功能……

X AI KOLs Timeline · 2026-05-11 缓存

RLanceMartin 强调了在 Code With Claude 活动中讨论的 Claude 的新功能:自我验证(Outcomes)和自我学习(Dreaming)。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈