importance-weighting

标签

Cards List
#importance-weighting

DRIFT: 解耦轨迹展开与重要性加权微调以实现高效多轮优化

Hugging Face Daily Papers · 6天前 缓存

本文提出DRIFT框架,该框架结合离线轨迹与重要性加权监督微调,高效实现与强化学习相当的多轮交互学习性能。

0 人收藏 0 人点赞
#importance-weighting

TILT: 协变量偏移下的目标诱导损失倾斜

arXiv cs.LG · 2026-05-15 缓存

TILT提出了一种新颖的目标函数,用于在协变量偏移下进行无监督域适应,该函数对未标记目标数据上的辅助组件施加惩罚,隐式实现了具有有界估计量的自定位重要性加权。理论保证和在偏移CIFAR-100上的实验表明,目标域性能优于基线方法。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈