标签
本文研究了如何将因子化规划任务(FTS)编码为SAT,提出了多种编码策略,并分析了任务转换对基于SAT的规划性能的影响。其目的是将SAT求解扩展到比启发式搜索更紧凑的规划表示。
本文对七个LLM反馈代理在命题逻辑辅导中进行基准测试,发现它们在最优步骤上表现良好,但系统性地未能正确诊断有效的次优和错误解决方案,凸显了自适应辅导的局限性。
重现第一个公开发布版本(1956年,IPL-I)的逻辑理论家定理证明器,这是Newell、Shaw和Simon开创性的人工智能程序,附带可运行的Python代码和文档。