刻意进化：基于智能体推理的样本高效符号回归与大语言模型

arXiv cs.CL 2026/06/04 04:00 论文

摘要

刻意进化（DE）是一个智能体框架，通过将候选生成与搜索控制解耦，并结合自适应算子、结构诊断工具和反思性记忆，显著提升了基于大语言模型的符号回归效果，仅需标准样本预算的40%即可取得更优结果。

arXiv:2606.04360v1 公告类型：新论文 **摘要：** 符号回归（SR）旨在从数据中发现紧凑的数学表达式，然而近期基于大语言模型（LLM）的进化方法由于主要依赖均方误差（MSE）等标量反馈，样本利用效率依然较低。我们指出了其核心局限：现有方法将候选方案生成与搜索引导混为一谈，要求 LLM 仅凭单一评分来推断如何演化表达式、诊断其错误并复用历史经验。为此，我们提出刻意进化（DE）——一个将符号生成与搜索控制解耦的智能体框架。DE 通过自适应算子引导搜索方向、借助分析工具进行结构诊断、并利用反思性记忆积累轨迹级经验，从而有效指导 LLM 的方案生成。在 LLM-SRBench 上的实验表明，DE 在多个科学领域中持续优于具有代表性的基于 LLM 的 SR 基线方法，且仅需标准样本预算的 40%。

查看原文

查看缓存全文

缓存时间: 2026/06/05 02:13

# 深思进化：面向样本高效符号回归的智能体推理与大语言模型

来源：https://arxiv.org/abs/2606.04360
查看 PDF (https://arxiv.org/pdf/2606.04360)

> 摘要：符号回归（SR）能够从数据中发现紧凑的数学表达式，然而近期基于 LLM 的进化方法由于主要依赖均方误差（MSE）等标量反馈，样本效率依然较低。我们识别出一个核心局限：现有方法将候选方案生成与搜索引导混为一谈，要求 LLM 仅凭单一分数来推断如何演化表达式、诊断其误差并复用历史经验。为此，我们提出了**深思进化（Deliberate Evolution，DE）**——一个将符号生成与搜索控制解耦的智能体框架。DE 通过自适应算子提供搜索方向引导、借助分析工具进行结构诊断，并利用反思性记忆积累轨迹级经验，从而引导 LLM 生成更优质的候选表达式。在 LLM-SRBench 上的实验表明，DE 在多个科学领域上持续优于具有代表性的基于 LLM 的 SR 基线方法，且仅使用标准样本预算的 40%。

## 提交历史

提交人：Xinyu Pang \[查看邮箱 (https://arxiv.org/show-email/4ae232aa/2606.04360)\] **\[v1\]** 2026 年 6 月 3 日（周三）02:22:16 UTC（4,845 KB）

刻意进化：基于智能体推理的样本高效符号回归与大语言模型

相似文章

@Kevin_GuoweiXu: 在训练后和推理阶段，对于直接 rollout 很少产生正确答案的困难推理问题，LLM 应如何采样？…

AlgoEvolve: LLM驱动的算法交易程序元进化

EvoMD-LLM：学习反应性分子动力学中物种演化的语言

MetaEvo: 一种用于经验驱动型智能体持续进化的元优化框架

CoEvolve：通过智能体-数据互进化训练LLM智能体

提交意见反馈