通过大型模型的演化

OpenAI Blog 论文

摘要

本论文证明了在代码上训练的大型语言模型可以显著增强遗传编程的变异算子,使得能够在 Sodarace 领域中生成数十万个功能性 Python 程序用于机器人设计,且无需预训练数据。该方法称为演化通过大型模型(ELM),将 LLM 与 MAP-Elites 相结合,为上下文特定的制品生成引导新的条件模型。

暂无内容
查看原文
查看缓存全文

缓存时间: 2026/04/20 14:44

# 通过大型模型的演化 来源:https://openai.com/index/evolution-through-large-models/ OpenAI ## 摘要 本论文的核心观点是,经过训练用于生成代码的大型语言模型(LLMs)可以大幅提高遗传编程(GP)中应用于程序的变异算子的有效性。由于这些 LLMs 从包含顺序变更和修改的训练数据中受益,它们能够近似人类可能进行的合理改变。为了突出通过大型模型进行演化(ELM)的广泛影响,在主要实验中,ELM 与 MAP-Elites 相结合,生成了数十万个功能性 Python 程序示例,这些程序在 Sodarace 域中输出可行走的机器人,而原始 LLM 在预训练中从未见过这些内容。这些示例随后帮助引导训练一个新的条件语言模型,该模型可以为特定地形输出合适的行走机器人。在以前没有任何训练数据的领域中,引导新模型为给定的上下文输出适当工件的能力,对开放性、深度学习和强化学习都有重大影响。这些影响在此深入探讨,希望能激发由 ELM 所开启的新研究方向。

相似文章

面向多样化科学假设搜索的大语言模型方法

Hugging Face Daily Papers

本文提出了一种受并行回火启发的进化框架,该框架利用多温度采样和信息交换,提高了大语言模型生成科学假设的多样性和质量,并在分子发现、方程发现和算法发现等领域中得到了验证。

大型语言模型的高效引导生成

Papers with Code Trending

本文介绍了一种高效的方法,利用正则表达式和上下文无关文法引导LLM文本生成,开销极小,并在开源Python库Outlines中实现。

借助大语言模型发现强化学习接口

Hugging Face Daily Papers

本文介绍了 LIMEN,这是一个由大语言模型引导的演化框架,能够通过联合优化原始模拟器状态的观测映射与奖励函数,自动发现强化学习接口。该方法有效降低了人工设计成本,并证明了观测与奖励的协同设计优于单独优化其中任意单一组件。