intermediate-supervision

标签

Cards List
#intermediate-supervision

OmniISR: 一种通过中间监督与正则化实现集中式与联邦学习的统一框架

arXiv cs.LG · 2026-05-21 缓存

OmniISR提出了一种统一框架,通过在隐藏层引入中间监督与正则化,将集中式学习和联邦学习相结合,提供了理论收敛保证,并将CL-FL差距缩小了22.60%。

0 人收藏 0 人点赞
#intermediate-supervision

利用知识图谱路径作为自进化搜索代理的中间监督

arXiv cs.AI · 2026-05-08 缓存

本文介绍了一种利用知识图谱路径作为中间监督来提升自进化搜索代理性能的方法。该方法通过将问题构建建立在关系上下文之上,并引入航点覆盖奖励(Waypoint Coverage Reward)以实现分级部分奖励,从而解决了搜索自博弈(Search Self-Play)中的瓶颈问题。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈