标签
本文介绍ContextEcho,一个用于在长时间使用工具的编码会话中测量大语言模型人设漂移的基准测试和可复用的工具包,揭示即使像Anthropic Sonnet 4.5这样的前沿模型也会表现出显著的漂移,并且这种漂移在会话压缩后仍可能持续存在。