DEI:进化推断中的多样性用于质量-多样性搜索
摘要
DEI引入了一种分布式质量-多样性搜索框架,使用异构大语言模型(LLMs)作为变异算子,表明模型多样性相比同构并行方法能提升性能。在Core War领域上的评估显示,一个四节点异构集成在QD-Score和覆盖率上取得了显著提升。
查看缓存全文
缓存时间: 2026/06/10 00:12
论文页面 - DEI:进化推理中的多样性助力质量-多样性搜索
来源:https://huggingface.co/papers/2605.27130
摘要
一个分布式质量-多样性搜索框架利用异构大语言模型作为变异算子来增强进化推理,证明了模型多样性相比同质并行方法能提升性能。
我们提出DEI:进化推理中的多样性(DEI:Diversity in Evolutionary Inference)(https://huggingface.co/papers?q=Evolutionary%20Inference),这是一个分布式质量-多样性(https://huggingface.co/papers?q=Quality-Diversity)(QD)搜索框架,它将异构大语言模型(https://huggingface.co/papers?q=heterogeneous%20large%20language%20models(LLMs)指定为变异算子(https://huggingface.co/papers?q=mutation%20operators),分布在对等节点(https://huggingface.co/papers?q=peer%20nodes)上,并通过非阻塞集体操作(https://huggingface.co/papers?q=non-blocking%20collective%20operations)进行通信。与同质并行搜索(在所有工作节点上复制单一模型的归纳偏差)不同,DEI将每个LLM独特的创造性先验视为行为新颖性的互补来源。通过将数字红皇后框架(Digital Red Queen framework)(https://huggingface.co/papers?q=Digital%20Red%20Queen%20framework)与DEI扩展,节点在每轮结束时共享局部最优解(https://huggingface.co/papers?q=local%20optimal%20solutions),为下一轮种群播种。这产生了跨模型对抗压力(https://huggingface.co/papers?q=cross-model%20adversarial%20pressure),推动鲁棒性超越模型内自我对弈。在Core War(https://huggingface.co/papers?q=Core%20War)领域(一个竞争性编程基准,其中Redcode战士程序(https://huggingface.co/papers?q=Redcode%20warrior%20programs)在模拟机器中战斗)上评估,一个四节点异构集成(GPT-5.4-mini, Claude Sonnet 4.6, GPT-5.2, 和 Claude Haiku 4.5)在相同总LLM调用预算下,相比单节点基线,实现了124%更高的合并存档QD-Score(https://huggingface.co/papers?q=QD-Score)(45.90对20.46)和28%更高的覆盖率(https://huggingface.co/papers?q=coverage)(80.6%对63.0%的单元)。该异构集成在QD-Score(https://huggingface.co/papers?q=QD-Score)、覆盖率(https://huggingface.co/papers?q=coverage)和保留解泛化性(https://huggingface.co/papers?q=held-out%20solution%20generality)方面也优于同等预算的同质集成,且跨越所有四个模型系列。这些结果提供了首个经验证据,表明模型多样性(而非仅仅是并行性)是分布式基于LLM的QD搜索增益的关键驱动因素。
查看arXiv页面(https://arxiv.org/abs/2605.27130)查看PDF(https://arxiv.org/pdf/2605.27130)GitHub2(https://github.com/gensyn-ai/dei)加入收藏(https://huggingface.co/login?next=%2Fpapers%2F2605.27130)
在你的agent中获取此论文:
hf papers read 2605.27130
没有最新的CLI?curl -LsSf https://hf.co/cli/install.sh | bash
引用此论文的模型0
没有模型链接到本论文
在模型的README.md中引用arxiv.org/abs/2605.27130,即可从本页链接。
引用此论文的数据集0
没有数据集链接到本论文
在数据集的README.md中引用arxiv.org/abs/2605.27130,即可从本页链接。
引用此论文的Spaces0
没有Space链接到本论文
在Space的README.md中引用arxiv.org/abs/2605.27130,即可从本页链接。
包含此论文的收藏集0
没有收藏集包含本论文
将此论文添加到收藏集(https://huggingface.co/new-collection)中,即可从本页链接。
相似文章
多样性注入的位置至关重要:面向多样化生成的统一框架
本文提出了一个用于大型语言模型测试时多样化生成的统一框架,根据多样性注入的位置(表面级 vs. 规范级)对方法进行分类。它提出了规范级方法,首先生成多样化的中间规范,然后基于这些规范生成最终响应。在五个开放任务和四个骨干模型上,规范级注入在保持质量的同时提升了输出多样性。
基于大语言模型定性及定量评估的常微分方程发现方法
本文介绍了 DoLQ,这是一个多智能体框架,利用大语言模型执行定性和定量评估,从而从观测数据中发现常微分方程。
刻意进化:基于智能体推理的样本高效符号回归与大语言模型
刻意进化(DE)是一个智能体框架,通过将候选生成与搜索控制解耦,并结合自适应算子、结构诊断工具和反思性记忆,显著提升了基于大语言模型的符号回归效果,仅需标准样本预算的40%即可取得更优结果。
推理还是记忆?LLM强化学习中的方向感知多样性探索
本文介绍了DiRL,一种方向感知的强化学习框架,能够在LLM探索中区分推理驱动的多样性和记忆驱动的多样性。它从模型表示中提取内在的推理-记忆方向,并塑造奖励以优先考虑与推理一致的探索,在数学和通用推理基准上表现出改进。
进化搜索中的计算分配:从深度-广度到多臂老虎机
本文研究了LLM引导的进化搜索中的计算分配问题,识别了经验规律,并提出了BaSE——一种多臂老虎机算法,该算法在多个模型和任务上提高了平均适应度和可靠性。