标签
介绍 ReasoningFlow,一个将大语言模型推理轨迹的篇章结构捕获为有向无环图的框架,从而能够细粒度分析推理行为(如自我反思和回溯)。基于对数千条轨迹的手动和自动标注,揭示了模型之间的结构相似性,并且大多数错误步骤并不贡献于最终答案。
Yacine进行了一次1.5小时的深度访谈,与Paradigma创始人讨论如何将DAG(有向无环图)作为自主科研的底层基础设施,涵盖Agent运行、大型公开DAG构建、避免坏DAG等核心主题。
访谈讨论了使用DAG进行自动研究的基础设施,包括智能体如何执行DAG以及如何构建大型公共DAG。
PACER 是一个新的可扩展框架,用于从大规模干预数据中进行因果发现,其设计保证了无环性,在包含数千个变量的基准测试中,比基于惩罚的方法实现了高达两个数量级的加速。
GraphBit是一种基于图的代理框架,采用Rust引擎实现确定性DAG编排,消除了幻觉和无限循环。在GAIA基准测试中,它达到了67.6%的准确率,且零框架诱导错误、低延迟。
SPIN 是一个规划包装器,确保结构有效的有向无环图(DAG)规划,并使用基于前缀的执行控制来减少工业 LLM 代理系统中的任务步骤和工具调用,从而提高规划的有效性和效率。