active-interaction

标签

Cards List
#active-interaction

ProactiveLLM: 学习主动交互的流式大语言模型

arXiv cs.CL · 2026-06-02 缓存

ProactiveLLM 提出了一种方法,使流式大语言模型能够基于内源性线索主动决定何时生成输出,通过基于掩码的流式建模和同步特权自蒸馏,在无需外部标注的情况下降低延迟。

0 人收藏 0 人点赞
#active-interaction

AIPO:通过与主动交互学习推理

arXiv cs.CL · 2026-05-12 缓存

本文介绍了 AIPO,一种强化学习框架,通过允许模型在探索过程中主动咨询协作智能体,从而克服能力边界,提升大语言模型的推理能力。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈