agentic-rl

标签

Cards List
#agentic-rl

DR-Venus:仅用1万开源数据打造边缘级前沿深度研究智能体

Hugging Face Daily Papers · 2026-04-21 缓存

DR-Venus-4B 是一个40亿参数的深研智能体,仅利用1万条开源样本,通过「智能体SFT+回合级奖励RL」训练,在多项研究基准上超越以往90亿以下模型,逼近300亿级系统,且可部署于边缘设备。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈