标签
本文通过有限理性决策理论的视角研究学习中的泛化问题,其中学习者的响应规律在训练损失和样本依赖性之间产生权衡。作者表明这种权衡由 f-散度正则化器控制,并且泛化可以从学习者的对冲行为中得到验证。
本文提出了一种注意力引导的决策框架,用于医院药剂师管理药品短缺,通过将药品动态分解为紧急子集和监控子集来对有限理性进行建模,并表明选择性注意力可以在不进行完整状态推理的情况下实现稳定的决策。