model-exploitation

标签

Cards List
#model-exploitation

不完善的世界模型是可被利用的

arXiv cs.AI · 2026-05-18 缓存

本文形式化了强化学习中的模型利用问题,证明在大策略集中该问题不可避免,并在奖励破解与模型利用之间建立了理论桥梁。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈