boolean-algebra

#boolean-algebra

布尔任务代数中任务组合的目标集刻画

arXiv cs.LG ↗ · 2026-06-04 缓存

本文重新审视了强化学习中用于零样本任务组合的布尔任务代数（BTA），证明了在确定性MDP中，所有最优扩展Q函数可归结为两个分量（全局任务和空任务），使得原始BTA中提出的对数基任务集变得多余。作者引入了一种基于目标集的组合方法，在保持策略性能的同时降低了学习成本和组合时间，并在多个实验域中验证了其有效性。

0 人收藏 0 人点赞

boolean-algebra

布尔任务代数中任务组合的目标集刻画

提交意见反馈