标签
北京航空航天大学与百度的研究人员提出"约束注入"方法——一种用于基于 LLM 的优化建模的双重验证机制,能够检测超出目标等价性范围的虚假约束或遗漏约束。他们开发了 VRPCoder,这是一个 80 亿参数的模型,专门用于将自然语言描述的车辆路径问题转化为 Gurobi 脚本,平均 Pass@1 达到 93%,大幅超越 Claude Sonnet 及此前的运筹学 LLM。
COAgents是一个合作式多智能体框架,用于解决车辆路径问题,它将搜索过程建模为图,使用专门智能体进行节点选择、移动选择和跳跃以逃离局部最优。在CVRP和VRPTW基准测试上取得了最先进的结果,相比先前的基于学习的方法,将最佳已知解差距最多缩小了44%。
本文提出了一种统一的知识嵌入强化学习框架,用于广义容量车辆路径问题,结合了先路线后聚类的启发式方法与动态规划,以实现优越的解决方案质量和跨多种变体的强泛化能力。