hybrid-mode

标签

Cards List
#hybrid-mode

Hybrid Open-Ended Tri-Evolution 打造更好的深度研究者

arXiv cs.AI · 3天前 缓存

本文提出混合开放式三方进化(HOTE)框架,该框架使用混合模式强化学习协同进化提议者、求解者和评判者,用于深度研究任务,以8B模型实现了超越更大静态模型的最优结果。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈