factual-reliability

标签

Cards List
#factual-reliability

毒性幻觉:扰动提示并追踪LLM电路

arXiv cs.CL · 3天前 缓存

本文研究了提示中的毒性词汇扰动如何降低LLM的事实准确性并增加不确定性,并使用归因图分析追踪内部变化。研究发现,增加毒性会放大对扰动敏感的变异节点,而核心推理节点保持不变。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈