标签
本文为基于轨迹级结果监督的离线强化学习建立了统计理论,提出了OPAC算法,并刻画了在此类监督下何时能够实现高效学习,以及何时存在根本性障碍。
本文开发了一个框架,用于评估欧洲AI法案下数据驱动系统的推理能力,以信用评分为案例,说明推理发生的位置以及哪些方面需要更清晰的监管规定。
本文提出了一个计算框架,用于测试儿童句法发展中相互竞争的成熟理论,特别是利用统计语法归纳法比较自下而上(bottom-up)与向内(inward)的理论解释。
本文提出了在线局部化共形预测(OLCP),旨在解决在线学习和时间序列设置中的协变量异质性问题。文章引入了用于带宽选择的 OLCP-Hedge 算法,并证明与现有基线相比,该方法在获得更窄预测集的同时,仍能保持有效的长期覆盖率。