co-training

#co-training

超越可教知识的搜索：发展智能体视觉生成中的知识边界

Hugging Face Daily Papers ↗ · 2026-07-09 缓存

本文通过引入SearchGen-20K基准和SearchGen-Corpus-1M语料库，解决了视觉生成中的知识边界问题，并提出了一种先教后搜索的协同训练框架，以处理超出生成器训练数据的、不断演化的长尾用户请求。

0 人收藏 0 人点赞

#co-training

语言代理的策略与世界模型协同训练

Hugging Face Daily Papers ↗ · 2026-06-01 缓存

本文介绍PaW，一种协同训练框架，在在线策略强化学习（on-policy RL）轨迹中向策略学习添加辅助世界模型监督，无需额外计算开销即可改进语言代理的训练。

0 人收藏 0 人点赞

#co-training

CoHyDE：面向工具检索的LLM改写器与稠密编码器迭代协同训练

arXiv cs.AI ↗ · 2026-05-29 缓存

CoHyDE提出了一种LLM改写器与稠密编码器的迭代协同训练过程，以提升从大型API目录中的工具检索性能。通过使用InfoNCE和DPO联合训练两个组件，它在模糊查询上显著优于单一组件基线。

0 人收藏 0 人点赞

#co-training

互惠协同训练（RCT）：通过强化学习耦合基于梯度与不可微模型

arXiv cs.CL ↗ · 2026-04-21 缓存

# 互惠协同训练（RCT）：通过强化学习耦合基于梯度与不可微模型来源：[https://arxiv.org/html/2604.16378](https://arxiv.org/html/2604.16378) Yunshuo Tian¹, Akayou Kitessa¹, Tanuja Chitnis², 和 Yijun Zhao¹ 1 纽约市福特汉姆大学计算机与信息科学系 2 马萨诸塞州波士顿市Mass General Brigham医院神经科 ###### 摘要大型语言模型 \(LLMs\) 与经典机器学习方法提供互补...

0 人收藏 0 人点赞

co-training

超越可教知识的搜索：发展智能体视觉生成中的知识边界

语言代理的策略与世界模型协同训练

CoHyDE：面向工具检索的LLM改写器与稠密编码器迭代协同训练

互惠协同训练（RCT）：通过强化学习耦合基于梯度与不可微模型

提交意见反馈