reliability-monitoring

标签

Cards List
#reliability-monitoring

令牌统计揭示多轮大语言模型交互中的对话漂移

arXiv cs.CL · 2026-04-20 缓存

本文提出双可预测性(P)和信息数字孪生(IDT),一种使用令牌频率统计来监控多轮LLM交互中对话一致性的轻量级方法,无需使用嵌入或模型内部信息。该方法在检测矛盾和话题转换时达到100%的敏感度,同时为扩展LLM部署建立了实用的监控框架。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈