active-interaction

#active-interaction

ProactiveLLM: 学习主动交互的流式大语言模型

arXiv cs.CL ↗ · 2026-06-02 缓存

ProactiveLLM 提出了一种方法，使流式大语言模型能够基于内源性线索主动决定何时生成输出，通过基于掩码的流式建模和同步特权自蒸馏，在无需外部标注的情况下降低延迟。

0 人收藏 0 人点赞

#active-interaction

arXiv cs.CL ↗ · 2026-05-12 缓存

本文介绍了 AIPO，一种强化学习框架，通过允许模型在探索过程中主动咨询协作智能体，从而克服能力边界，提升大语言模型的推理能力。

0 人收藏 0 人点赞