statistical-learning

#statistical-learning

轨迹级监督何时允许高效离线强化学习？

Hugging Face Daily Papers ↗ · 2026-06-16 缓存

本文为基于轨迹级结果监督的离线强化学习建立了统计理论，提出了OPAC算法，并刻画了在此类监督下何时能够实现高效学习，以及何时存在根本性障碍。

0 人收藏 0 人点赞

#statistical-learning

arXiv cs.AI ↗ · 2026-06-11 缓存

本文开发了一个框架，用于评估欧洲AI法案下数据驱动系统的推理能力，以信用评分为案例，说明推理发生的位置以及哪些方面需要更清晰的监管规定。

0 人收藏 0 人点赞

#statistical-learning

arXiv cs.CL ↗ · 2026-05-12 缓存

本文提出了一个计算框架，用于测试儿童句法发展中相互竞争的成熟理论，特别是利用统计语法归纳法比较自下而上（bottom-up）与向内（inward）的理论解释。

0 人收藏 0 人点赞

#statistical-learning

arXiv cs.LG ↗ · 2026-05-08 缓存

本文提出了在线局部化共形预测（OLCP），旨在解决在线学习和时间序列设置中的协变量异质性问题。文章引入了用于带宽选择的 OLCP-Hedge 算法，并证明与现有基线相比，该方法在获得更窄预测集的同时，仍能保持有效的长期覆盖率。

0 人收藏 0 人点赞