active-sampling

标签

Cards List
#active-sampling

@dbreunig: 优秀的教师会设计出学生自己就能搭建的示范。

X AI KOLs Following · 2026-05-14 缓存

Souradip Chakraborty的一条推文提出,在强化学习中使用特权信息主动采样展开(rollouts),与传统盲采样方法形成对比。该推文以一句关于优秀教师设计学生自己就能搭建的示范的引言开头。

0 人收藏 0 人点赞
#active-sampling

@NoahZiems: 我们最近关于Pedagogical RL的工作发表了!

X AI KOLs Following · 2026-05-14 缓存

一篇关于Pedagogical RL的研究论文的公告,该论文提出利用特权信息主动采样强化学习算法通常忽略的轨迹。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈