面向多样化科学假设搜索的大语言模型方法

Hugging Face Daily Papers 2026/06/09 08:52 论文

摘要

本文提出了一种受并行回火启发的进化框架，该框架利用多温度采样和信息交换，提高了大语言模型生成科学假设的多样性和质量，并在分子发现、方程发现和算法发现等领域中得到了验证。

大语言模型（LLMs）正在加速科学发现，尤其是在生成有效科学假设等高级任务中。然而，在许多发现场景中，目标并非找到单个最佳假设，因为验证可能充满噪声且成本高昂，科学家们更希望获得一组高质量替代假设，以应对下游不确定性，从而找到最优解。然而，常用的进化搜索策略在假设生成中倾向于优先优化而非探索，导致搜索过程中的选择压力引发多样性崩溃。受这些局限性的启发，我们将假设搜索定义为采样问题，目标是在固定验证预算下高效生成多样化、高质量的假设。基于这一视角，我们提出了\ours，一种受经典并行回火算法启发的进化框架，该框架在多个温度级别搜索假设，并实现跨温度的原则性信息交换，从而在不破坏收敛性的情况下提升探索能力。在分子发现、方程发现和算法发现等多个领域中，我们的方法在相同验证预算下持续提升了假设的质量和多样性，并且生成的候选假设在更昂贵的下游计算验证中仍保持稳健。

查看原文

查看缓存全文

缓存时间: 2026/06/11 17:35

论文页面 - 利用大型语言模型实现多样化的科学假设搜索

来源：https://huggingface.co/papers/2606.10587

摘要

一种用于假设生成的进化框架，通过多温度采样和跨搜索层级的信息交换，提升多样性与质量。

大型语言模型（LLMs）正被越来越多地用于加速科学发现，最近在生成有效科学假设等高级任务中也有应用。然而，在许多发现场景中，目标并非找出单一最佳假设，因为验证过程可能带有噪声且成本高昂，而科学家们受益于一组高质量备选假设，这些假设能够对冲下游不确定性，从而找到最优解决方案。尽管如此，常用的进化搜索（https://huggingface.co/papers?q=evolutionary%20search）方法往往更偏向优化而非探索，在假设生成（https://huggingface.co/papers?q=hypothesis%20generation）过程中，由此产生的选择压力导致了多样性崩溃（https://huggingface.co/papers?q=diversity%20collapse）。受这些局限性启发，我们将假设搜索形式化为一个采样问题（https://huggingface.co/papers?q=sampling%20problem），其目标是在固定的验证预算（https://huggingface.co/papers?q=validation%20budget）下高效地生成多样化、高质量的假设。基于这一视角，我们提出了\ours，这是一种受经典并行回火（https://huggingface.co/papers?q=parallel%20tempering）算法启发的进化框架，它在多个温度层级上搜索假设，并实现了跨温度的原则性信息交换，从而在不干扰收敛的情况下提升探索能力。在分子发现、方程发现和算法发现等多个领域，我们的方法在相同验证预算（https://huggingface.co/papers?q=validation%20budget）下持续提升了假设的质量和多样性，并且生成的候选假设在更昂贵的下游计算验证（https://huggingface.co/papers?q=computational%20validation）中依然保持稳健。

查看 arXiv 页面（https://arxiv.org/abs/2606.10587）查看 PDF（https://arxiv.org/pdf/2606.10587）添加到收藏（https://huggingface.co/login?next=%2Fpapers%2F2606.10587）

在你的 agent 中获取这篇论文：

hf papers read 2606\.10587

没有最新的 CLI？curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型0

无模型链接此论文

请在模型 README.md 中引用 arxiv.org/abs/2606.10587，以便从此页面链接。

引用此论文的数据集0

无数据集链接此论文

请在数据集 README.md 中引用 arxiv.org/abs/2606.10587，以便从此页面链接。

引用此论文的 Spaces0

无 Space 链接此论文

请在 Space README.md 中引用 arxiv.org/abs/2606.10587，以便从此页面链接。

包含此论文的收藏集0

无收藏集包含此论文

请将此论文添加到收藏集（https://huggingface.co/new-collection）中，以便从此页面链接。

面向多样化科学假设搜索的大语言模型方法

论文页面 - 利用大型语言模型实现多样化的科学假设搜索

摘要

引用此论文的模型0

引用此论文的数据集0

引用此论文的 Spaces0

包含此论文的收藏集0

相似文章

通过大型模型的演化

DEI：进化推断中的多样性用于质量-多样性搜索

借助大语言模型发现强化学习接口

多样性注入的位置至关重要：面向多样化生成的统一框架

Darwin Family：基于MRI信任加权的进化合并方法，实现语言模型推理的无训练扩展

提交意见反馈