基于大语言模型引导树搜索的优化三维光伏结构
摘要
本文介绍了一个案例研究,使用大语言模型驱动的树搜索算法(ERA)结合编码代理(AntiGravity)自主生成高效三维光伏结构,克服了中纬度地区平板太阳能电池板的局限性。工作流程包括迭代修补以消除奖励黑客行为,并在各种约束条件下发现改进的设计。
arXiv:2605.16191v1 公告类型:新
摘要:我们展示了一个案例研究,说明如何利用AI编码系统生成新颖的科学假设。我们将通用编码代理(Google的AntiGravity)与基于大语言模型的树搜索算法(实证研究助手/ERA)相结合,自主生成高效的三维光伏(3DPV)结构,这些结构克服了中纬度地区平板太阳能电池板因损失而受限的问题。这些结构通过全天向太阳呈现有利角度来工作,为说明目的,我们专注于优化单个太阳日的性能。我们的工作流程首先使用AntiGravity复现计算\cite{bernardi2012solar},表明3DPV的能量密度可以远高于固定平板光伏板。我们将这些初始设计作为大规模树搜索的起点,寻找改进的解决方案并根据其昼间产量进行评分。初始树搜索产生了名义上更高效的解决方案,但这些方案是由算法奖励黑客行为引起的,源于非物理设计特征,例如结构上悬浮的断开层以及对光学求解器中离散化的利用。为应对这一问题,我们开发了一个工作流程,其中编码代理通过迭代修补物理引擎并加入约束条件来消除奖励黑客行为。在消除奖励黑客行为后,ERA发现了一系列具有不同约束条件和改进性能的设计,包括具有不同固定收集器面积的优化设计、优化天顶跟踪以及避免自阴影。
将编码代理与树搜索(ERA)相结合,为科学发现提供了一个强大的平台,适用于那些解决方案可以通过评分函数进行经验评估的问题。
查看缓存全文
缓存时间: 2026/05/18 06:37
# 基于LLM指导的树搜索优化的三维光伏结构
来源:https://arxiv.org/html/2605.16191
\\uselogo
Lizzie DorfmanGoogle ResearchJohn C\. PlattGoogle Research
(2026年5月15日)
###### 摘要
我们展示了一个案例研究,说明如何利用AI编码系统生成新的科学假设。我们将通用编码代理(Google的AntiGravity)与LLM驱动的树搜索算法(实证研究辅助/ERA)相结合,自主生成高效的三维光伏(3DPV)结构,以克服在中纬度地区限制平板太阳能电池板的损失。这些结构通过在全天呈现有利于太阳的角度来工作,为说明起见,我们专注于优化单个太阳日的性能。我们的工作流程首先使用AntiGravity重现Bernardi等人[2012 (https://arxiv.org/html/2605.16191#bib.bib2)]的计算,表明3DPV的能量密度可远高于固定平板光伏板。我们以这些初始设计作为大规模树搜索的起点,寻找改进的解决方案,并根据其日产量进行评分。初始树搜索得到了名义上更高效的解决方案,但这些方案是由算法奖励黑客(reward hacking)引起的,源于非物理的设计特征,例如结构上悬浮的断开层级以及对光学求解器中离散化的利用。为应对这一问题,我们开发了一个工作流程,其中编码代理通过添加约束条件迭代地修补物理引擎,以消除奖励黑客行为。消除奖励黑客后,ERA发现了一系列具有不同约束条件和改进性能的设计,包括具有不同固定收集面积的最优设计、优化天顶角跟踪以及避免自阴影。将编码代理与树搜索(ERA)相结合,为解决可通过评分函数进行经验评估的科学问题提供了一个强大的科学发现平台。
## 1 引言
自主AI系统在执行科学问题的复杂分析、加速非常规想法的探索方面具有巨大潜力。为展示这一能力,本文通过一个案例研究说明我们如何将实证研究辅助(ERA)——一种自主的LLM驱动树搜索算法——与编码代理(Google的Antigravity)相结合,以解决三维光伏(3DPV)设计中的复杂优化问题。
传统的平板光伏装置是住宅或商业建筑上收集太阳能的主要方法,但在中高纬度地区,其性能受到一个基本几何限制的影响:太阳直射光在面板表面的余弦投影。在北纬42.36°(马萨诸塞州波士顿)夏至日早上7:00,太阳高度角约为20°,cos(70°)≈0.34。这意味着水平放置的平板面板仅能捕获约三分之一的可用法向直射辐照度。在全天平均下,这种余弦损失将大部分能量产生集中在正午前后约4小时的窄窗口内,而清晨和傍晚的通量基本未被收集。公用事业光伏可采用跟踪系统来适应太阳位置,使发电性能提高1.2-1.8倍(Bernardi等人,2012 (https://arxiv.org/html/2605.16191#bib.bib2)),但这种跟踪系统对于住宅和商业业主而言并不实用。
Bernardi等人[2012 (https://arxiv.org/html/2605.16191#bib.bib2)]提出了一个有趣的建议:三维光伏(3DPV)结构可以通过将太阳能电池排列在非共面表面上,从而在全天呈现有利于太阳的角度,来解决几何限制问题。通过数值计算和实验,Bernardi等人[2012 (https://arxiv.org/html/2605.16191#bib.bib2)]证明,根据具体几何形状和高度与占地面积之比,3D结构每单位基础面积可产生比平板面板多几倍的能量。该研究假设3DPV将建造在固定面积的平屋顶上:目标是最大化在该约束下产生的能量。研究还假设只有直射辐照会产生电能。
受其研究启发,我们探索现代编码代理能否高效生成3DPV结构的改进设计和假设。我们的工作流程首先为编码代理(Google的Antigravity)提供Bernardi等人[2012 (https://arxiv.org/html/2605.16191#bib.bib2)]的PDF,并要求其重现主要结果。系统自主识别了用于执行原始计算的GitHub仓库,解决了遗留依赖问题,并再现了原始2012年研究中平面阵列和人工设计的“开口立方体”结构的基线能量极限。随后,我们要求ERA最大化3DPV结构的总能量产量。系统响应时发现了如何利用渲染代码,找到了一些违反物理定律的增加产量的方法。例子包括:悬浮的断开式太阳能阵列解决方案,可在不产生自阴影惩罚的情况下最大化地面视角的日光捕获;将结构推出地理边界框以完全避开阴影;以及利用浮点数离散化极限。为遏制这些利用行为,我们开发了一个工作流程,通过编码代理迭代地修补物理代码和评分函数。在适当约束下,系统能够找到一系列性能优越的有效3DPV架构,并遵守不同的设计约束集。总体而言,该系统表明,将编码代理与树搜索相结合是高效发现新假设的强大工具。
## 2 数学模型
Bernardi等人原始模拟代码使用经典的薄膜菲涅耳光学计算通过平面封装材料的透射,并在子电池分辨率下追踪面板之间的阴影。我们基于作者带有原始代码的Github仓库构建我们的分析¹。为明确起见,他们将计算聚焦于单一日期:2011年6月21日,马萨诸塞州波士顿,坐标(42.36°N, 71.09°W)。该算法使用太阳位置算法(SPA)(Reda和Andreas, 2004 (https://arxiv.org/html/2605.16191#bib.bib3))计算太阳位置,得出太阳天顶角θ_z和方位角φ_s作为时间、日期和地理坐标的函数。在该地点该日期,天顶角范围从90°(日出/日落)到约19°(正午)。我们使用AntiGravity对代码进行分析,发现了几个小错误并在我们的实现中进行了修正:例如,在计算次级反射的斯涅尔透射角时,在更新折射率比值以匹配目标表面前就进行了计算,导致偏振参数不正确。我们还消除了单面面板吸收直射光的能力。
在我们的模型中,候选的3DPV结构由三角形太阳能电池板组成,嵌入在平屋顶上方一个20×20×10米的边界框内。每个三角形T_k由三个顶点v_{k,1}, v_{k,2}, v_{k,3}∈R³定义,满足0≤x,y≤20米,0≤z≤10米。为明确起见,我们将总面板表面积约束如下:
A_total = Σ_{k=1}^{N} 1/2 ||(v_{k,2} - v_{k,1}) × (v_{k,3} - v_{k,1})|| ≤ 800 m² (1)
对于光线追踪,每个面板被细分为子电池。在每个时间步(从日出到日落每6分钟一次),模拟执行以下操作:
1. 计算太阳方向向量ŝ(θ_z, φ_s)。
2. 对于每个子电池中心点p,向太阳方向追踪一条光线,并测试与所有其他面板的交点,以确定阴影状态。
3. 计算ŝ与面板外法线向量n̂_k之间的入射角θ_i。
4. 使用模型特定的光学模型(见下文)计算透射(吸收)和反射功率。
5. 追踪反射光线以进行二次吸收(一次反射)。
然后通过梯形积分计算所有时间步的总日能量:
E = ∫₀ᵀ P(t) dt ≈ Σ_{i=0}^{M-1} (P(t_i) + P(t_{i+1}))/2 · (t_{i+1} - t_i) (2)
其中P(t_i)是时刻t_i所有面板的总瞬时功率。注意,此计算侧重于理想的理论光学极限,并未考虑组件级别的电学失配损失。
在每个时间步,模拟追踪朝向绝对太阳对准状态的直接光学向量。我们将每个面板视为一个单面集热器,后面有一个平坦的透明覆盖层,折射率为n₂=2.2(相对于空气n₁=1.0),与Bernardi等人[2012 (https://arxiv.org/html/2605.16191#bib.bib2)]的参数匹配。方程(3)规定直接法向太阳辐照度遵循真实大气质量衰减的太阳变量:
I_legacy = 1488 W/m² × 0.7^(AM) (3)
其中AM = (1/cos θ_z)^0.678。当非偏振光以入射角θ_i照射到面板界面时,斯涅尔定律规定透射角θ_t满足n₁ sin θ_i = n₂ sin θ_t,而菲涅耳方程给出了s和p偏振的反射率R_s、R_p的大小以及透射率T:
R_s = ((n₁ cos θ_i - n₂ cos θ_t) / (n₁ cos θ_i + n₂ cos θ_t))² (4)
R_p = ((n₁ cos θ_t - n₂ cos θ_i) / (n₁ cos θ_t + n₂ cos θ_i))² (5)
R = (R_s + R_p)/2 (6)
T(θ_i) = 1 - R (7)
综合起来,我们可以计算无阴影情况下的收集功率为:
P_k^(legacy) = T(θ_i) I_legacy cos θ_i · A_net,k · η (8)
其中η=0.12固定了原始的静态传统电池效率。
Bernardi等人[2012 (https://arxiv.org/html/2605.16191#bib.bib2)]使用这一形式计算了不同设计的功率随时间变化的光曲线。图1重现了这些结果,比较了平板与立方体的响应。
参见图注
图1:在真实传统物理条件下,基线和优化几何形状的统一比较光曲线,包括来自Bernardi等人[2012 (https://arxiv.org/html/2605.16191#bib.bib2)]的平板和开口立方体设计,以及我们在本文中开发的最优设计:包括高桌、倾斜锯齿、开口南腔和倾斜华夫。
## 3 实证研究辅助树搜索
我们的目标是使用LLM引导的树搜索找到优于这些初始想法的设计。实证研究辅助(ERA)是一个LLM驱动的树搜索系统,旨在优化基于代码的科学问题(Aygün等人,2025 (https://arxiv.org/html/2605.16191#bib.bib1))。与传统的对参数向量进行突变的进化算法不同,ERA直接操作于*源代码*:大型语言模型读取候选程序,分析其性能,并提出一个旨在改进目标的修改版本。这使得ERA天生适用于组合设计问题,其中搜索空间由生成几何的代码定义,而非固定维度的参数向量。
我们设置了一个ERA提示,用于设定问题并要求LLM生成设计的几何形状。然后,通过使用物理模拟器计算总日太阳能产量来对设计进行评分。具体来说,我们提示LLM实现以下函数:
def generate_geometry(params: dict) -> str:
"""
生成定义三维太阳能电池网格几何形状的字符串内容。
参数:
params: 可配置几何超参数的字典,用于调优。
返回:
符合solar3d自定义形状描述符格式的格式化字符串。
格式规则:
- 仅返回一个浮点数序列。
- 不要在几何字符串前加上三角形数量!评估器会自动检测三角形数量。
- 每个三角形由恰好9个空格分隔的浮点数定义,这些浮点数表示三个顶点(x,y,z):"x1 y1 z1 x2 y2 z2 x3 y3 z3"
- 三角形可以用空格或换行符分隔。
- 重要安全规则:所有坐标必须严格位于边界框内:X[0.0, 20.0], Y[0.0, 20.0], Z[0.0, 20.0]。评估器将严格执行此规则,如果有任何坐标违规,则返回0.0 kWh。
"""
pass
我们使用与Bernardi等人[2012 (https://arxiv.org/html/2605.16191#bib.bib2)]相同的物理模拟器(已修正上述小错误)对此函数进行评分。此外,在进行优化时,我们施加约束:一个自然约束是固定太阳能电池的总面积,因为这与其成本密切相关。我们考虑三种不同的面积约束:允许3DPV的面积是初始平板集热器的3倍或5倍,以及一个更无约束的设计,允许面积高达初始集热器的20倍。我们强调,这种方法的一个优点是灵活性:可以轻松修改模拟器以适应其他模型,例如来自纳米纹理涂层的角度相关反射率、漫射辐照等,同样可以轻松修改约束条件。
## 4 发现并抑制算法利用
我们初始的LLM引导树搜索运行产生了极高的分数,但这是通过识别违反物理定律的策略实现的。这些利用包括结构上悬浮的断开层级以及利用光学模拟器的离散性。为解决此问题,我们采用了一个工作流程:使用给定的评分函数迭代运行树搜索;分析得到的解决方案,判断它们是否违反物理约束,然后更新评分函数或可能更新物理模拟器以处理这些约束(图2)。我们使用Antigravity来揭示这些违规行为并建议对评分函数进行更新。下面我们依次描述每种利用行为及其解决方案。
消除奖励黑客行为的工作流程
1. ERA提出几何形状。
2. ERA探索非直观、复杂的结构排列,专门优化以挑战集成边缘情况。相似文章
基于分布感知的算法设计与LLM代理
本文介绍了一种分布感知算法设计框架,其中LLM代理学习生成针对目标分布特化的求解器代码,实现了高求解质量,并相比标准求解器取得了显著的加速效果。
LEAP: 用于钙钛矿前驱体添加剂发现的闭环框架
LEAP框架将领域专业化的大语言模型与主动学习相结合,高效地对钙钛矿太阳能电池的前驱体添加剂进行优先级排序,在实验验证中实现了功率转换效率的提升。
SOLAR: 一种自我优化的开放式自主代理,用于终身学习与持续适应
SOLAR提出了一种自我优化的自主代理,利用参数级元学习和多层次强化学习,使LLMs能够对非平稳数据流进行终身适应,在推理任务上超越基线。
重根Levin树搜索中的结构诱导信息
本文针对Levin树搜索提出了三种重根器设计,利用状态空间结构和学习启发式方法,无需显式子目标生成即可提升搜索效率,实现了当前最优的在线训练效率。
EnergyLens: 面向多GPU大语言模型推理优化的预测性能耗感知探索
EnergyLens是一个端到端的框架,用于多GPU大语言模型推理的预测性能耗感知优化,在Llama3和Qwen3-MoE上验证,平均绝对百分比误差在9.25%至13.19%之间,并揭示了不同配置之间显著的能耗差异。