什么让大模型成为优秀优化器？——LLM引导演化搜索的轨迹分析

Hugging Face Daily Papers 2026/04/21 00:00 论文

摘要

对15个大模型在8项任务上的大规模研究表明，优化成功的关键在于保持局部化搜索轨迹，而非初始解题能力或解的新颖性。

近期研究已展示将大语言模型（LLM）嵌入演化和智能体优化系统的潜力，然而驱动这些优化收益的机制仍不清楚。本文对LLM引导的演化搜索开展大规模研究，收集15个LLM在8项任务上的优化轨迹。尽管零样本解题能力与最终优化结果相关，却只能解释部分方差：初始能力相近的模型往往产生截然不同的搜索轨迹与结果。通过分析这些轨迹，我们发现强大的LLM优化器表现为局部精炼器，频繁带来增量改进，同时在语义空间中逐步局部化搜索。相反，弱优化器表现出大幅语义漂移，偶现突破后随即停滞。值得注意的是，各种解的新颖性指标均无法预测最终性能；只有当搜索充分局部化在高性能解空间区域时，新颖性才有益。研究结果强调轨迹分析对理解和改进基于LLM的优化系统的重要性，并为其设计与训练提供可行见解。

查看原文导出为 Word 导出为 PDF

查看缓存全文

缓存时间: 2026/04/22 14:41

论文页面 - 是什么让 LLM 成为优秀优化器？LLM 引导进化搜索的轨迹分析

来源：https://huggingface.co/papers/2604.19440

摘要

LLM 引导的进化搜索表明，优化成功取决于搜索轨迹特征，而非仅靠初始解题能力；强优化器局部精修，弱优化器则出现语义漂移。

近期研究已展示在进化和智能体优化系统中编排大语言模型（https://huggingface.co/papers?q=large%20language%20models）（LLM）的潜力。然而，驱动这些优化增益的机制仍不清楚。本工作对 LLM 引导的进化搜索（https://huggingface.co/papers?q=evolutionary%20search）开展大规模研究，在 8 项任务中收集 15 个 LLM 的优化轨迹（https://huggingface.co/papers?q=optimization%20trajectories）。尽管零样本解题能力与最终优化结果相关，它仅能解释部分方差：初始能力相近的模型往往诱导出截然不同的搜索轨迹与结果。通过分析这些轨迹，我们发现强 LLM 优化器表现为局部精修器，频繁产生增量改进，同时在语义空间（https://huggingface.co/papers?q=semantic%20space）中逐步聚焦搜索。相反，弱优化器表现出大幅语义漂移（https://huggingface.co/papers?q=semantic%20drift），偶现突破后便陷入停滞。值得注意的是，各种解的新颖性（https://huggingface.co/papers?q=solution%20novelty）指标均无法预测最终性能；仅当搜索足够聚焦于解空间的高性能区域时，新颖性才有益。我们的结果凸显轨迹分析（https://huggingface.co/papers?q=trajectory%20analysis）对理解和改进基于 LLM 的优化系统的重要性，并为其设计与训练提供可行洞见。

查看 arXiv 页面（https://arxiv.org/abs/2604.19440）查看 PDF（https://arxiv.org/pdf/2604.19440）项目页面（https://xinhao-zhang.github.io/traj_evo_search/）GitHub0（https://github.com/XINHAO-ZHANG/LLMEvo_Eval）添加到收藏（https://huggingface.co/login?next=%2Fpapers%2F2604.19440）

在您的智能体中获取该论文：

hf papers read 2604\.19440

尚未安装最新 CLI？curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用该论文的模型 0

暂无模型链接此论文

在模型 README.md 中引用 arxiv.org/abs/2604.19440 即可在此页面显示链接。

引用该论文的数据集 0

暂无数据集链接此论文

在数据集 README.md 中引用 arxiv.org/abs/2604.19440 即可在此页面显示链接。

引用该论文的 Spaces 0

暂无 Space 链接此论文

在 Space README.md 中引用 arxiv.org/abs/2604.19440 即可在此页面显示链接。

收录该论文的合集 0

暂无合集收录此论文

将该论文添加到合集（https://huggingface.co/new-collection）即可在此页面显示链接。

什么让大模型成为优秀优化器？——LLM引导演化搜索的轨迹分析

论文页面 - 是什么让 LLM 成为优秀优化器？LLM 引导进化搜索的轨迹分析

摘要

引用该论文的模型 0

引用该论文的数据集 0

引用该论文的 Spaces 0

收录该论文的合集 0

相似文章

评估 LLM 在受控实验中作为人类代理的可靠性

通过世界知识探索训练LLM智能体实现自发、无奖励的自我进化

LLM 排名并非阶梯：来自传递性基准图的实验结果 [D]

本地LLM实战测试：代码生成、质量与速度权衡

跨异构任务的自演化LLM记忆抽取

提交意见反馈