标签
北京航空航天大学与百度的研究人员提出"约束注入"方法——一种用于基于 LLM 的优化建模的双重验证机制,能够检测超出目标等价性范围的虚假约束或遗漏约束。他们开发了 VRPCoder,这是一个 80 亿参数的模型,专门用于将自然语言描述的车辆路径问题转化为 Gurobi 脚本,平均 Pass@1 达到 93%,大幅超越 Claude Sonnet 及此前的运筹学 LLM。
本文介绍了一种基于对齐的全幺模线性规划重构方法,用于一致性检查。该方法通过为具有偏差的长轨迹提供加速,补充了A*搜索。该方法实现了平均38.6%的运行时间节省,选择准确率达到96%。
文章指出当前约束获取的基准测试存在不足,并介绍了MPMMine——一个旨在评估利用多样化领域知识工件发现、验证和增强数学规划模型的算法的基准测试套件。
OR-Space是一个基准测试,用于评估大语言模型代理在工业运筹工作流中的表现,重点关注多阶段任务生命周期和超越简单文本生成的持久工作空间。
TriVAL 引入了一个三重验证框架,在自动优化建模的三个阶段(语义规范、数学公式、代码生成)执行显式验证以提高忠实性,并提出了 NL4COP,一个用于组合优化问题的新基准。
本文提出了一种结合动态规划和约束规划的混合方法来解决部分车间调度问题,证明了尽管未超越纯CP求解器,但整合两种范式的可行性。
本文介绍了Text2Opt-Bench,一个可扩展的文本到优化基准,并发现大语言模型在“绑定”(问题数据接地)方面存在困难,而非“建模”(选择优化结构)。作者提出了BIND,一种简单的推理时方法,将数值数据外部化,显著提高了各模型的准确率。
本文提出了一种约束规划方法,通过树搜索和预处理技术,以$n$日前瞻的方式确定NHL季后赛锁定场景。
本文探讨了如何使用 Google OR-Tools CP-SAT 求解器来优化 Akamai 云基础设施的维护调度,解决了涉及容量和并发等复杂约束的问题。
麻省理工学院教授 Dimitris Bertsimas 荣获第54届 James R. Killian 教职成就奖,并发表演讲,介绍其运筹学与 AI 研究如何切实推动物流、医疗、教育和农业等领域的现实改进。他提出的鲁棒优化方法已带来诸多实际应用价值,例如提升医院患者周转效率以及优化巴拿马运河的船舶调度安排。