标签
本文介绍了一种因果智能框架COAST,用于设计约束感知干预,驱动复杂系统在状态间转换。该框架整合了因果发现、因果建模和多目标优化,以识别具有机制解释的最小有效干预策略。
CausaLab 是一个可扩展的环境,用于评估LLM智能体在交互式因果发现中的表现,同时衡量预测准确性和对潜在因果机制的忠实复现。实验揭示了预测与机制复现之间的差距,突显了当前LLM智能体作为实验性因果推理者的局限性。
本文介绍了 ReplaySCM,这是一个旨在评估语言模型从干预证据中归纳可执行因果机制能力的基准测试,重点关注语义重放行为而非语法匹配。