constraints

#constraints

从混合机理-数据驱动建模到神经符号人工智能：是什么、为什么以及如何实现

arXiv cs.LG ↗ · 昨天缓存

本文介绍了Hybrid-to-NeSy (H2N)框架，该框架系统地将混合机理-数据驱动模型转化为神经符号人工智能设计，从而能够推导出结构违规率和信念离散度等指标，作为机理部分认知不确定性的度量。

0 人收藏 0 人点赞

#constraints

我构建了一个架构技能，明确处理假设、证据和约束。正在寻找智能体生成的失败案例。

Reddit r/AI_Agents ↗ · 2026-07-20

一位开发者构建了一个明确处理假设、证据和约束的架构技能，现在正在寻找智能体生成的失败案例来测试它。

0 人收藏 0 人点赞

#constraints

我花了不少时间尝试让LLM制作出真正值得听的播客。难点不在模型本身。

Reddit r/artificial ↗ · 2026-07-07

一位开发者分享了让LLM生成的播客听起来更自然的技术，包括使用约束条件迫使产生分歧，以及在生成前预先编辑内容。

0 人收藏 0 人点赞

#constraints

CombEval: 评估大语言模型中组合计数能力的框架

arXiv cs.AI ↗ · 2026-06-20 缓存

CombEval 是一个动态基准测试，用于评估大语言模型中的组合计数能力，通过类型化规范生成带有求解器验证答案的问题。它在直接设置和代码增强设置下测试了11种大语言模型，并发现模型在处理有序对象、不可区分元素、相对约束和嵌套依赖时存在脆弱性。

0 人收藏 0 人点赞

#constraints

AI代理基准测试是否应区分“安全成功”与“不安全成功”？

Reddit r/AI_Agents ↗ · 2026-06-14

本文讨论了AI代理基准测试中的“验证者税”概念，区分了安全成功（完成任务且不违反约束）与不安全成功（完成任务但违反约束），并质疑在考虑安全权衡的情况下如何正确衡量代理性能。

0 人收藏 0 人点赞

#constraints

在自回归强化学习策略中注入LTLf约束的神经符号方法

arXiv cs.AI ↗ · 2026-06-09 缓存

提出一种神经符号框架，通过可微自动机表示和基于逻辑的损失函数，将LTLf约束注入基于Transformer的强化学习策略中，在保持竞争性回报的同时提高约束满足度。

0 人收藏 0 人点赞

#constraints

AdaPlanBench：在世界和用户约束下评估大型语言模型智能体的自适应规划能力

Hugging Face Daily Papers ↗ · 2026-06-04 缓存

AdaPlanBench是一个动态基准测试，用于评估LLM智能体在多轮交互中根据逐步显现的世界和用户约束进行自适应规划的能力。实验表明，当前模型尤其难以应对用户约束。

0 人收藏 0 人点赞

#constraints

对齐：高阶优先于约束 [R]

Reddit r/MachineLearning ↗ · 2026-05-23

一篇非正式的研究笔记，描述了Transformer中的一种行为：模型的固有“清晰性寻求”向量在讨论高阶主题时可以绕过约束，这可能与对齐和安全研究相关。

0 人收藏 0 人点赞

#constraints

停止构建自主电子邮件代理

Reddit r/AI_Agents ↗ · 2026-05-18

作者基于实际失败案例，反对构建完全自主的电子邮件代理，主张采用受限的“提议-批准”工作流，即AI准备上下文和草稿，但由人类最终批准发送。

0 人收藏 0 人点赞

#constraints

无需规范的细化

Hillel Wayne — Computer Things ↗ · 2026-01-20 缓存

一篇博客文章，解释如何使用细化映射在数据库模式更改期间保留外部属性，并通过将布尔列迁移到可空时间戳再到事件溯源的例子进行说明。

0 人收藏 0 人点赞

constraints

提交意见反馈