标签
提出一种神经符号框架,通过可微自动机表示和基于逻辑的损失函数,将LTLf约束注入基于Transformer的强化学习策略中,在保持竞争性回报的同时提高约束满足度。
本文介绍了A4D,一个将视觉观察映射到围绕可供性(例如“可移动”)构建的共享潜在空间中的框架,用于机器人规划。它在现有可供性上实现了94%的推理准确率,比现有最优方法高出15%,并且实现了100倍的推理速度提升,对未见过的物体功能具有更强的泛化能力。
本文提出了一种从大语言模型中蒸馏答案集编程规则的方法,以增强神经符号视觉问答,结果表明仅需少量示例即可生成正确的规则。
本文提出测地线流匹配(Geodesic Flow Matching),一种在环面流形上对空间语义指针(SSP)进行去噪的黎曼传输方法,并在脉冲神经SLAM系统中实现了72%的跟踪误差降低和40%的效率提升。
ImProver 2 是一个用于 Lean 4 中自动证明优化的神经符号框架,它利用专家迭代流程和脚手架来训练一个 7B 参数模型,其性能优于比它大得多的模型,并展示了小型模型能够有效重构研究级别的证明。
NeuroNL2LTL 是一个神经符号框架,它使用带有验证器在环训练的两阶段架构,将自然语言翻译为线性时序逻辑(LTL),从而为安全关键规范提供改进的正确性保证。
本文介绍了使用三元组损失生成用于Horn逻辑推理的高质量嵌入的新方法,包括平衡训练样本生成和困难样本强调的技术,这些方法提高了下游逻辑推理的效率。
本文介绍了Constrained Diffusion for Code (CDC),这是一种无需训练的神经符号推理框架,它将约束满足直接集成到离散扩散模型的逆向去噪过程中,用于代码生成。CDC在功能正确性、安全性和语法方面持续提升约束满足率,在多个基准测试中优于现有的扩散模型和自回归基线。