constraints

标签

Cards List
#constraints

AdaPlanBench:在世界和用户约束下评估大型语言模型智能体的自适应规划能力

Hugging Face Daily Papers · 3天前 缓存

AdaPlanBench是一个动态基准测试,用于评估LLM智能体在多轮交互中根据逐步显现的世界和用户约束进行自适应规划的能力。实验表明,当前模型尤其难以应对用户约束。

0 人收藏 0 人点赞
#constraints

对齐:高阶优先于约束 [R]

Reddit r/MachineLearning · 2026-05-23

一篇非正式的研究笔记,描述了Transformer中的一种行为:模型的固有“清晰性寻求”向量在讨论高阶主题时可以绕过约束,这可能与对齐和安全研究相关。

0 人收藏 0 人点赞
#constraints

停止构建自主电子邮件代理

Reddit r/AI_Agents · 2026-05-18

作者基于实际失败案例,反对构建完全自主的电子邮件代理,主张采用受限的“提议-批准”工作流,即AI准备上下文和草稿,但由人类最终批准发送。

0 人收藏 0 人点赞
#constraints

无需规范的细化

Hillel Wayne — Computer Things · 2026-01-20 缓存

一篇博客文章,解释如何使用细化映射在数据库模式更改期间保留外部属性,并通过将布尔列迁移到可空时间戳再到事件溯源的例子进行说明。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈