标签
本文提出了一种决策支持框架,用于优化权益证明区块链中的验证者选择,通过多目标优化和交互式偏好学习,平衡投资组合的质量与分散化。
R-APS(反思性对抗帕累托搜索)是一种面向约束设计任务的新方法,通过跨三个时间尺度的推理模式分解,解决了基于LLM的智能体系统中的三类结构性缺陷——错误传播、鲁棒性评估与知识失效,且无需微调。在平面机构综合任务上的评估结果表明,与基线方法相比,R-APS实现了3.5倍更紧的鲁棒性证书、46%更快的首次准入迭代速度,以及2.1倍的Chamfer距离缩减。
ATOM是一个多智能体框架,将分子优化建模为树状搜索,沿路径布置专门化的智能体,从而能够探索替代分子轨迹并在多目标基准测试中提高帕累托覆盖率。
本文提出了设计和优化实用智能体LLM系统的原则性方法,引入了一个包含伪工具和固定工作流的框架,以提高模块化、成本效益和跨多种任务的准确性。
本文提出了一个多目标优化中梯度聚合的统一理论框架,建立了收敛到帕累托平稳性的速率。作者引入了一个充分对齐条件,并展示了其在现有算法和新算法(如 capped MGDA)中的应用。
本文针对Baymex算法引入了并行化策略和自适应引导机制,以高效学习用于临床数据的离散化贝叶斯网络分类器,在16核CPU上实现了超过54倍的加速,并在保持可解释性的同时,获得了与传统模型相当或更优的预测性能。
本文介绍了一种因果智能框架COAST,用于设计约束感知干预,驱动复杂系统在状态间转换。该框架整合了因果发现、因果建模和多目标优化,以识别具有机制解释的最小有效干预策略。
本文识别了在使用文本梯度进行LLM裁判的多目标提示优化中的两种失败模式:优化过程中的梯度稀释和推理过程中的指令干扰,表明联合梯度处理会丢失特定于标准的信息。
MOCHA 提出了一种面向 LLM 智能体技能的多目标优化方法,通过切比雪夫标量化和指数退火策略来应对严格的平台约束,发现帕累托最优变体,相较于现有优化器取得了显著改进。
本文提出了GESD,一种面向过程的公平性度量,用于衡量不同子组之间解释稳定性的差异,并将其集成到一个多目标优化框架中,以联合优化效用、结果公平性和解释公平性。
Lean Refactor 提出了一种检索增强的智能体框架,用于对 Lean 证明进行多目标、可控且鲁棒的版本重构,实现了显著的压缩和编译时间减少。
ToolMol是一个进化式智能体框架,结合了多目标遗传算法和基于LLM的操作符,用于设计小分子药物,在多个蛋白质靶点上实现了最先进的结合亲和力和类药性。