importance-weighting

#importance-weighting

DRIFT: 解耦轨迹展开与重要性加权微调以实现高效多轮优化

Hugging Face Daily Papers ↗ · 6天前缓存

本文提出DRIFT框架，该框架结合离线轨迹与重要性加权监督微调，高效实现与强化学习相当的多轮交互学习性能。

0 人收藏 0 人点赞

#importance-weighting

arXiv cs.LG ↗ · 2026-05-15 缓存

TILT提出了一种新颖的目标函数，用于在协变量偏移下进行无监督域适应，该函数对未标记目标数据上的辅助组件施加惩罚，隐式实现了具有有界估计量的自定位重要性加权。理论保证和在偏移CIFAR-100上的实验表明，目标域性能优于基线方法。

0 人收藏 0 人点赞