context-influence

标签

Cards List
#context-influence

模型预先阅读的内容会改变其后续的回答方式——你可以在隐藏状态中看到这一点

Reddit r/artificial · 13小时前

本文报告了一个观察结果:在回答问题前阅读一篇长而结构化的文本,会改变模型后续的回答方式。该现象在Claude上得到行为证据支持,并在开放权重的Gemma模型上进行了机制分析,结果显示,指令微调变体中的隐藏状态具有可分离性,且概率分布更加清晰。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈