mmd

#mmd

Moment Matching Q-Learning

arXiv cs.LG ↗ · 6d ago Cached

Moment Matching Q-Learning (MoMa QL) uses maximum mean discrepancy to match all moment statistics for distribution-level convergence in offline RL, achieving computational efficiency and strong performance on D4RL tasks.

0 favorites 0 likes

#mmd

MMD-Balls as Credal Sets: A PAC-Bayesian Framework for Epistemic Uncertainty in Test-Time Adaptation

arXiv cs.LG ↗ · 2026-05-22 Cached

This paper develops a PAC-Bayesian framework for test-time adaptation that uses MMD-balls as credal sets, providing formal generalization bounds and separating epistemic from aleatoric uncertainty under distribution shift.

0 favorites 0 likes

mmd

Moment Matching Q-Learning

MMD-Balls as Credal Sets: A PAC-Bayesian Framework for Epistemic Uncertainty in Test-Time Adaptation

Submit Feedback