constrained-optimization

#constrained-optimization

人类效用因子：将人工智能治理重构为约束优化问题的可计算福利指标

arXiv cs.AI ↗ · 2天前缓存

本文介绍了人类效用因子（HUF），一种可计算的福利指标，它将人工智能治理重构为一个约束优化问题，并为自动化深度、再分配和就业覆盖率提供了可衡量的杠杆，并通过多智能体模拟进行了验证。

0 人收藏 0 人点赞

#constrained-optimization

EXHOLD：滴滴大规模网约车匹配中基于体验感知的实时保持控制

arXiv cs.LG ↗ · 2026-07-13 缓存

EXHOLD是一个两阶段框架，用于大规模网约车匹配中的实时保持控制，提升乘客与司机的体验及市场效率。该框架已在滴滴巴西市场部署，通过体验感知的配对评估和约束优化，降低取消率并提高行程完成率。

0 人收藏 0 人点赞

#constrained-optimization

通过拉格朗日奖励增强实现安全的推理时对齐

arXiv cs.LG ↗ · 2026-07-07 缓存

提出了LARA框架，用于安全的推理时对齐。该框架通过拉格朗日对偶化，从单独的奖励和成本模型中推导出增强奖励，从而在不重新训练的情况下改善有用性-无害性权衡。

0 人收藏 0 人点赞

#constrained-optimization

Autoresearch、Claude 与约束优化（13 分钟阅读）

TLDR AI ↗ · 2026-07-03 缓存

这篇文章描述了一个实验，使用 Claude Code 自主开发一个带有约束优化的文件压缩算法，评估 AI 代理在无监督问题解决中的可行性。

0 人收藏 0 人点赞

#constrained-optimization

PoseShield：人体自碰撞解决的神经碰撞场

Hugging Face Daily Papers ↗ · 2026-06-29 缓存

PoseShield 在 SMPL 姿态空间中引入神经碰撞约束，用于解决人体姿态估计中的自碰撞问题，在新基准上实现了 95.8% 的成功率。

0 人收藏 0 人点赞

#constrained-optimization

反思优化

Hacker News Top ↗ · 2026-06-26 缓存

一篇博客文章，讨论针对受约束的分类概率分布的优化技术，使用softmax重参数化和log barrier方法，应用于蛋白质结合剂设计。

0 人收藏 0 人点赞

#constrained-optimization

大型语言模型中记忆缓解的输出向量编辑

arXiv cs.CL ↗ · 2026-06-18 缓存

提出输出向量编辑，一种约束优化的权重编辑方法，通过修改MLP神经元的输出向量而不是将激活归零来缓解LLM中的记忆化，实现了高达87.9%的抑制效果，且局部性失败极少。

0 人收藏 0 人点赞

#constrained-optimization

PSyGenTAB: 一种通过约束优化生成合成临床表格数据的隐私保护框架

arXiv cs.LG ↗ · 2026-06-18 缓存

PSyGenTAB是一种隐私保护框架，使用约束优化生成合成临床表格数据，平衡隐私与实用性，同时保留临床关系和少数类模式。

0 人收藏 0 人点赞

#constrained-optimization

基于时变需求的约束赌博机在线LLM选择

arXiv cs.LG ↗ · 2026-06-17 缓存

本文提出了一种约束随机赌博机算法，用于在时变任务需求以及异构的准确性、延迟和成本配置下在线选择大型语言模型，并在遗憾和约束违反方面提供了理论保证。

0 人收藏 0 人点赞

#constrained-optimization

Optuna的约束树形帕森估计器是c-TPE的联合密度推广

arXiv cs.LG ↗ · 2026-06-10 缓存

本文证明Optuna的约束树形帕森估计器（TPE）是c-TPE算法的联合密度推广，展示了其对约束重复的不变性，而独立的c-TPE则会退化。作者概述了实际权衡以及未来研究方向。

0 人收藏 0 人点赞

#constrained-optimization

学会记住什么：面向长时域语言代理的基于约束优化的可观测性安全记忆保留

arXiv cs.AI ↗ · 2026-06-10 缓存

本文将为长时域语言代理的记忆保留公式化为一个约束随机优化问题，提出了OSL-MR框架，该框架通过混合评分启发式强制实施可观测性安全学习。实验表明，在严格记忆预算下，该方法始终优于现有的启发式基线。

0 人收藏 0 人点赞

#constrained-optimization

面向长程语言智能体可验证强化学习的策略条件化反事实信用

arXiv cs.LG ↗ · 2026-06-05 缓存

提出了CVT-RL，一种带有策略条件化反事实贡献估计和可验证奖励的约束策略梯度算法，提高了长程语言智能体的可靠性并减少了奖励篡改。

0 人收藏 0 人点赞

#constrained-optimization

推理的影子价格：LLM最优预算分配的经济学视角

arXiv cs.AI ↗ · 2026-06-03 缓存

本文将LLM推理预算分配形式化为一个约束优化问题，提出CLEAR方法，将资源从低效用查询重新分配到接近涌现阈值的查询，在预算紧张的情况下实现了高达3倍的准确率提升。

0 人收藏 0 人点赞

#constrained-optimization

约束流优化：基于序列微调的分子设计方法

arXiv cs.LG ↗ · 2026-06-01 缓存

介绍了约束流优化（CFO）框架，该框架通过微调生成流模型，在分子设计中最大化奖励的同时满足约束，具有理论保证和实验验证。

0 人收藏 0 人点赞

#constrained-optimization

可扩展的约束多智能体强化学习：通过状态增强与一致性实现可分离动力学

arXiv cs.LG ↗ · 2026-06-01 缓存

本文提出了一种分布式方法，用于约束多智能体强化学习，该方法采用状态增强策略学习和对偶变量上的邻居间一致性，以在满足全局资源约束的同时实现智能体数量线性扩展。在智能电网需求响应上的实验表明，一致性协调对可行性至关重要：与集中式训练方法不同，它能够扩展到数千个智能体。

0 人收藏 0 人点赞

#constrained-optimization

超越单槽位：多槽位保量展示广告的联合优化

arXiv cs.LG ↗ · 2026-05-22 缓存

提出了一种针对多槽位保量展示广告的联合优化框架，通过二分图匹配和合约轮盘机制解决槽位冗余和合约不平衡问题。在美团上的在线A/B测试显示，收入与合约履行显著提升。

0 人收藏 0 人点赞

constrained-optimization

提交意见反馈