training-signal

标签

Cards List
#training-signal

BenchEvolver: 基于解决方案进化的前沿任务合成

Hugging Face Daily Papers · 2026-05-31 缓存

BenchEvolver 是一个进化框架,能够自动从现有编程问题中生成更难的题目,创建保持有效性和多样性的挑战性基准,同时支持模型自我改进和提升训练性能。

0 人收藏 0 人点赞
#training-signal

通过迭代放大学习复杂目标

OpenAI Blog · 2018-10-22 缓存

OpenAI 提出了迭代放大方法,用于训练 AI 系统处理复杂任务,通过递归地将任务分解为人类可以判断和解决的更小子任务,从零开始通过迭代组合构建训练信号。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈