counterfactual

标签

Cards List
#counterfactual

WorldKernel: 世界模型是可行可能世界的耦合核

arXiv cs.AI · 昨天 缓存

本文识别了一种故障模式,其中预测器在未识别的反事实耦合上坍缩为一点,并提出了一个使用正半定耦合核来约束反事实的框架,表明预测无法表示跨世界耦合的不确定性,且施加核约束可产生可处理的边界。

0 人收藏 0 人点赞
#counterfactual

决策感知记忆卡:面向工具使用LLM代理的反事实启发式上下文选择与压缩

arXiv cs.AI · 2天前 缓存

介绍了CICL,一种决策感知上下文层,通过将上下文视为决策时刻的干预,使用反事实启发式评分和类型化记忆卡(受令牌预算限制),为工具使用的LLM代理选择和压缩证据。在SWE-bench和RepoBench上的实验显示,在检索准确性和行动关键性方面取得了实际提升。

0 人收藏 0 人点赞
#counterfactual

反事实评估揭示临床大语言模型和智能体的隐藏能力画像

arXiv cs.LG · 2026-06-01 缓存

本文介绍了因果敏感性得分(CSS),一种干预性指标,用于评估临床大语言模型和智能体在患者输入沿临床意义维度变化时,是否适当地更新其建议。该指标揭示了标准覆盖度指标未能捕捉的隐藏能力画像,暴露了安全盲点和结构性响应能力缺陷。

0 人收藏 0 人点赞
#counterfactual

COFT:面向大型语言模型公平思维链推理的反事实-共形解码

arXiv cs.CL · 2026-06-01 缓存

COFT是一种无需训练的解码方法,通过应用令牌级公平控制和共形校准来减少大型语言模型思维链推理中的偏见,以最小的计算开销实现30-55%的偏见降低。

0 人收藏 0 人点赞
#counterfactual

从像素到概念:分割模型真的理解它们分割的内容吗?

Hugging Face Daily Papers · 2026-05-10 缓存

介绍了CAFE,一种通过反事实属性操作来评估可提示分割模型是否真正理解概念的基准,揭示了精确的掩码预测并不能保证忠实的语义基础。

0 人收藏 0 人点赞
#counterfactual

CiPO:通过迭代偏好优化实现大型推理模型的反事实遗忘

arXiv cs.CL · 2026-04-20 缓存

CiPO是一种新颖的机器遗忘框架,用于大型推理模型,它利用迭代偏好优化和反事实推理轨迹,在保持推理能力的同时选择性移除不想要的知识。该方法通过生成逻辑上有效的替代推理路径,解决了依赖于链式思维推理的模型中的遗忘挑战。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈