EvoOptiGraph:基于图结构生成的弱点驱动共同进化方法用于优化建模
摘要
EvoOptiGraph是一个框架,用于从自然语言自动进行优化建模,使用基于图的进化生成来创建多样化的训练数据,并通过弱点驱动的强化学习共同进化模型,在多个基准测试上取得了最先进的结果。
arXiv:2606.26578v1 公告类型:新
摘要:使用大型语言模型(LLM)从自然语言自动进行优化建模面临两个关键挑战。首先,训练语料库缺乏结构多样性。其次,数据生成流程保持静态且与模型学习脱节。为了解决这些挑战,我们提出了EvoOptiGraph,这是一个新颖的框架,其中数据和模型在模型弱点的驱动下共同进化。EvoOptiGraph将每个混合整数线性规划(MILP)表示为一个带属性的二分图,并应用保留有效性的进化算子来生成结构多样的实例。进化后的图通过确定性编译和验证的反向翻译转换为求解器代码和自然语言。训练分为两个阶段:在初始数据集上进行监督微调(SFT),然后进行具有可验证奖励的强化学习(RLVR),其中基于图的弱点信号指导生成针对模型失败的新实例。这形成了一个持续更新训练分布的闭环。在六个公开数据集上的实验结果表明,EvoOptiGraph在准确性、可执行性和泛化能力上显著优于更大的通用模型、智能体方法和专门基线。这些结果证明,有目标的数据-模型共同进化是提高LLM在优化建模任务上性能的有效策略。
查看缓存全文
缓存时间: 2026/06/26 05:13
# EvoOptiGraph:基于图结构生成的弱点驱动协同进化优化建模 来源:https://arxiv.org/abs/2606.26578 查看 PDF(https://arxiv.org/pdf/2606.26578) > **摘要:**使用大语言模型(LLMs)从自然语言自动进行优化建模面临两个关键挑战。首先,训练语料缺乏结构多样性。其次,数据生成流程仍是静态的,且与模型学习相脱节。为解决这些挑战,我们提出 EvoOptiGraph——一个新颖的框架,其中数据与模型在模型弱点的驱动下共同进化。EvoOptiGraph 将每个混合整数线性规划(MILP)表示为属性二分图,并应用保持有效性的进化算子生成结构多样的实例。通过确定性编译和验证性反向翻译,进化后的图被转换为求解器代码和自然语言。训练分两个阶段进行:首先在初始数据集上监督微调(SFT),随后进行基于可验证奖励的强化学习(RLVR),其中图导出的弱点信号指导生成针对模型失败的新实例。这形成了一个持续更新训练分布的闭环。在六个公开数据集上的实验结果表明,EvoOptiGraph 在准确性、可执行性和泛化能力上显著优于更大的通用模型、智能体方法以及专门基线。这些结果表明,有针对性的数据-模型协同进化是提升 LLMs 在优化建模任务上性能的有效策略。 ## 提交历史 来自:Mingyang Liu [查看邮箱(https://arxiv.org/show-email/60d4af40/2606.26578)] **[v1]** 2026年6月25日星期四 03:57:07 UTC(3,473 KB)
相似文章
MetaEvo: 一种用于经验驱动型智能体持续进化的元优化框架
MetaEvo 提出了一种两阶段框架,用于基于LLM的智能体的持续进化,利用基于偏好的优化来增强原则抽象和用于经验重用的模块化架构,在推理基准测试上优于强基线。
通过进化程序性瓶颈解读神经组合优化
介绍进化程序性瓶颈(EPB),一种通过LLM驱动的进化将黑箱模型蒸馏为人类可读的程序组合以解读神经组合优化策略的框架。
Solvita:通过智能体进化增强大型语言模型在竞赛编程中的能力
Solvita是一个智能体进化框架,通过强化学习更新图结构知识网络,实现代码生成中的持续学习,在竞赛编程基准测试中达到了最先进的性能。
Verilog-Evolve: 反馈驱动与技能演进的Verilog生成
Verilog-Evolve 是一个反馈驱动的框架,通过迭代优化大型语言模型生成的 Verilog 代码,利用功能仿真、综合和时序指标促进更优候选方案的选出,并跨任务演进可复用的修复技能。
EvoMap/evolver
Evolver 是一个由 GEP 驱动的 AI 代理自演化引擎,可自动化提示词优化并创建可审计、可复用的演化资产。该项目正从完全开源过渡到源代码可用,同时保持与现有 MIT 和 GPL-3.0 版本的向后兼容性。