用于三维框架系统自动化结构分析的智能体大语言模型
摘要
本文提出了一种基于自然语言输入的三维框架系统自动化结构分析的智能体大语言模型框架,通过多智能体流水线在十个代表性三维框架上实现了90%的准确率。
arXiv:2606.06525v1 Announce Type: cross
摘要:大型语言模型(LLMs)已成为跨领域具有强大推理能力的基础模型。除了反应式文本生成,智能体LLMs通过模块化任务分解和协调工具使用实现自主工作流执行。在结构工程中,最近的研究开发了用于平面框架自动化分析的智能体LLMs。然而,由于不规则几何表示、拓扑一致性和长程推理等挑战,它们向三维框架的扩展尚未充分探索。本文提出了一种从自然语言输入进行三维框架自动化结构分析的智能体LLM框架。不规则三维框架通过投影到二维平面来表示,其中正交网格线定义空间坐标,楼层数矩阵编码每个网格单元的垂直拉伸。基于这种表示,框架建立了一个多智能体流水线:问题分析智能体将输入解析为结构化JSON;楼层分解智能体推导出每层的空间布局;节点、主梁、楼板和柱智能体组装三维几何;支撑和荷载智能体分配边界和荷载条件;代码翻译智能体生成可执行的SAP2000脚本。在十个代表性三维框架上的评估表明,所提出的框架在重复试验中平均准确率达到90%,表现出一致且可靠的性能。
查看缓存全文
缓存时间: 2026/06/08 09:16
# 基于智能体大语言模型的三维框架系统自动化结构分析 来源:https://arxiv.org/html/2606.06525 Ziheng Geng¹, Ian Franklin¹, Santiago Martinez², Jiachen Liu³, Yunhe Zhao⁴, Minghui Cheng¹,²† ¹迈阿密大学土木与建筑工程系,科勒尔盖布尔斯,佛罗里达州 33146,美国 ²迈阿密大学建筑学院,科勒尔盖布尔斯,佛罗里达州 33146,美国 ³HBC Engineering Company,多拉尔,佛罗里达州 33178,美国 ⁴迈阿密大学电气与计算机工程系,科勒尔盖布尔斯,佛罗里达州 33146,美国 †通讯作者:minghui\.cheng@miami\.edu ###### 摘要 大型语言模型(LLMs)已成为具备跨领域强大推理能力的基础模型。除了反应式文本生成,智能体 LLM 能够通过模块化任务分解和协调工具使用来实现自主工作流执行。在结构工程领域,近期研究已开发出用于平面框架自动化分析的智能体 LLM。然而,由于不规则几何表示、拓扑一致性和长程推理等方面的挑战,其在三维框架中的扩展仍有待探索。本文提出一种基于智能体 LLM 的框架,用于从自然语言输入自动化分析三维框架。不规则三维框架通过投影到二维平面来表示,其中正交网格线定义空间坐标,一个层数矩阵(MNS)对每个网格单元的竖向拉伸进行编码。基于此表示,该框架建立了一个多智能体流水线:问题分析智能体将输入解析为结构化 JSON;楼层分解智能体推导出每层的空间布局;由节点、主梁、楼板和柱智能体组装三维几何体;支座和荷载智能体分配边界和荷载条件;代码翻译智能体生成可执行的 SAP2000 脚本。在十个代表性三维框架上评估,所提出的框架在重复试验中平均准确率达到 90%,展现出稳定可靠的性能。 > 关键词:大型语言模型;智能体 LLM;多智能体架构;自动化结构分析;框架系统;SAP2000 ## 1 引言 大型语言模型(LLMs),如 GPT(OpenAI,2026 (https://arxiv.org/html/2606.06525#bib.bib1))、Gemini(Google DeepMind,2026 (https://arxiv.org/html/2606.06525#bib.bib2))和 Claude(Anthropic,2026 (https://arxiv.org/html/2606.06525#bib.bib3)),正在成为自然语言理解、推理和生成方面强大的基础模型。通过多阶段训练流程(包括预训练、微调和对齐后训练)开发,最先进的 LLM 已在指令遵循(Zeng et al.,2024 (https://arxiv.org/html/2606.06525#bib.bib4);Qin et al.,2024 (https://arxiv.org/html/2606.06525#bib.bib5))、上下文理解(Bai et al.,2024 (https://arxiv.org/html/2606.06525#bib.bib6);Cheng et al.,2026 (https://arxiv.org/html/2606.06525#bib.bib7))、逻辑推理(Parmar et al.,2024 (https://arxiv.org/html/2606.06525#bib.bib8);Cheng et al.,2025 (https://arxiv.org/html/2606.06525#bib.bib9))、符号推理(Xu et al.,2024 (https://arxiv.org/html/2606.06525#bib.bib11);Mirzadeh et al.,2025 (https://arxiv.org/html/2606.06525#bib.bib10))和代码生成(Jimenez et al.,2024 (https://arxiv.org/html/2606.06525#bib.bib12);Jain et al.,2025 (https://arxiv.org/html/2606.06525#bib.bib13))方面展现出强大能力。这些能力使 LLM 能够理解用户意图,并在广泛任务中生成连贯响应。然而,普通 LLM 主要作为反应式文本生成器:它们接收提示并产生响应。为增强其实用性,智能体 LLM 应运而生,这是一种变革性范式,将 LLM 扩展到能够规划、推理和执行复杂工作流的自主系统(Wang et al.,2024 (https://arxiv.org/html/2606.06525#bib.bib14))。借助思维链提示(Wei et al.,2022 (https://arxiv.org/html/2606.06525#bib.bib15);Wang et al.,2022 (https://arxiv.org/html/2606.06525#bib.bib16))、工具增强推理(Yao et al.,2022 (https://arxiv.org/html/2606.06525#bib.bib17);Schick et al.,2023 (https://arxiv.org/html/2606.06525#bib.bib18))和检索增强生成(Borgeaud et al.,2022 (https://arxiv.org/html/2606.06525#bib.bib19);Gao et al.,2023 (https://arxiv.org/html/2606.06525#bib.bib20))等技术,这些系统能够将复杂目标分解为模块化子任务、编排外部工具、融入领域特定知识,并在最少人工干预下完成多步骤执行。因此,这种智能体范式在自动化需要大量人工和专门领域知识的科学和工程任务方面引起了越来越多的兴趣。 结构工程正是这样一个自动化具有显著实用价值的领域。在实践中,工程师将设计意图转化为有限元(FE)模型以进行结构分析。尽管商业平台如 SAP2000(Computers and Structures, Inc.,2025b (https://arxiv.org/html/2606.06525#bib.bib21))和 ETABS(Computers and Structures, Inc.,2025a (https://arxiv.org/html/2606.06525#bib.bib22))提供了强大的仿真环境,但有限元模型的构建仍然主要依靠人工。工程师需要定义节点坐标和单元连接以组装结构几何体,然后将边界条件、材料属性和荷载模式分配给相应构件。这些操作通常通过图形用户界面(GUIs)进行,涉及重复的导航、选择和验证。随着结构系统规模和几何复杂度的增加,这种建模负担显著增加。因此,当前的手动工作流程耗时、易错且难以扩展,成为结构设计和分析流程中的关键瓶颈。 最近的研究开始开发用于自动化结构设计和分析的智能体 LLM。初步尝试揭示了通用 LLM 在进行结构分析方面的显著局限性(Wan et al.,2025 (https://arxiv.org/html/2606.06525#bib.bib31))。为应对这些局限性,Liu et al.(2026 (https://arxiv.org/html/2606.06525#bib.bib23))将结构分析重新定义为代码生成任务,并开发了一个 LLM 智能体,能够可靠地为梁分析生成 OpenSeesPy 脚本,并在不同边界和荷载条件下具有稳健的泛化能力。随着范围扩展到二维框架系统,空间推理和长程可靠性成为关键瓶颈。后续工作通过开发领域特定提示以约束空间推理(Liang et al.,2025a (https://arxiv.org/html/2606.06525#bib.bib24))、将几何组装分解为逐步计划以增强拓扑一致性(Geng et al.,2025 (https://arxiv.org/html/2606.06525#bib.bib25)),以及引入验证机制以减轻多步建模中的错误累积(Geng et al.,2026a (https://arxiv.org/html/2606.06525#bib.bib26)),应对了这些挑战。并行的工作已将智能体 LLM 的适用性扩展到多个软件平台:Geng et al.(2026b (https://arxiv.org/html/2606.06525#bib.bib27))开发了一个两阶段流水线,用于使用 OpenSees、SAP2000 和 ETABS 进行自动化二维框架分析。将范围从结构分析扩展到设计,最新研究证明了多智能体协调在符合规范的钢筋混凝土设计(Chen and Bao,2025 (https://arxiv.org/html/2606.06525#bib.bib28))和超高性能混凝土梁优化设计(Chen and Bao,2026 (https://arxiv.org/html/2606.06525#bib.bib29))中的有效性。Liang et al.(2025b (https://arxiv.org/html/2606.06525#bib.bib30))引入了 MASSE,这是一个多智能体系统,通过集成代码检索、结构响应模拟和安全验证来复制结构设计工作流程。总体而言,这些研究证明了智能体 LLM 在连接自然语言问题描述和可执行结构工程工作流方面的潜力。 尽管取得了这些进展,现有的用于结构分析的智能体 LLM 仍然主要局限于平面梁和框架系统,这些系统仅捕捉了现实建筑结构的简化表示。将这些框架扩展到三维框架系统并非易事,并引入了三个主要挑战。首先,不规则的三维框架几何体需要一种语义明确的表示,使 LLM 能够可靠解释。这些框架可能涉及平面不对称性、跨楼层的布局变化以及不同的层高,所有这些都必须明确定义,以避免 LLM 推理过程中的歧义。其次,拓扑一致性变得更加难以维持。即使在二维设置中,LLM 也缺乏对结构连接概念(如共享节点和单元)的基本理解,导致节点重复、构件缺失和无效连接(Geng et al.,2025 (https://arxiv.org/html/2606.06525#bib.bib25))。这个问题在三维框架中进一步放大,因为节点、主梁、楼板和柱必须在每个楼层平面内以及跨楼层之间进行协调。第三,构建三维结构模型需要比二维模型更长的推理链。三维框架涉及更多结构构件,材料分配和荷载施加等建模操作变得更加复杂,因为它们必须映射到这个语义密集模型空间中的相应构件。这种长程推理步骤增加了模型生成过程中产生幻觉和错误累积的风险。 本文通过提出一种用于三维框架系统自动化结构分析的智能体 LLM 框架来应对这些挑战。首先,引入了一种结构化几何表示方案,其中三维框架投影到二维平面上。通过利用正交网格线定义平面坐标,以及层数矩阵(MNS)指定每个网格单元的竖向拉伸,这种表示使得不规则的三维几何体能够以简洁且语义清晰的形式进行描述。基于此表示,开发了一个多智能体流水线,将文本问题描述转换为可执行的结构建模脚本。工作流从问题分析智能体开始,它将输入解析为结构化 JSON 格式。接下来,楼层分解智能体从 MNS 推导出每层的空间布局。在每层内,节点、主梁和楼板智能体并行操作以生成节点坐标和平面内连接,而柱智能体建立层间连接。支座和荷载智能体将边界条件和外部荷载分配给相应的结构构件,代码翻译智能体将组装的模型信息转换为 SAP2000 脚本。在十个具有不同几何配置的代表性三维框架上评估了智能体 LLM。结果表明,所提出的框架在重复试验中平均准确率达到 90%,显著优于最先进的通用 LLM。它还展现出高计算效率和成本效益,平均运行时间不到三分钟,每次运行成本低于 0.20 美元。 ## 2 几何表示与基准设计 ### 2.1 结构化文本描述模板 为了实现从自然语言输入对三维框架系统进行自动化结构分析,本研究首先建立了一种结构化几何表示,使 LLM 能够一致解释。如图 1 (https://arxiv.org/html/2606.06525#S2.F1) 所示,三维框架通过将其几何体投影到二维平面来表示。得到的配置使用两个组件描述:正交网格线系统和层数矩阵(MNS)。网格线定义了 X-Y 平面上的坐标系,它们的交点和包围的矩形单元格为定位结构构件(包括柱、主梁和楼板)提供了一致参考。基于此平面布局,MNS 为每个网格单元分配一个标量整数,以指定该位置存在的层数。例如,值 0 表示空洞或中庭,而值 3 表示相应单元格竖向延伸三层。结合指定的层高,MNS 能够从二维平面重建框架的竖向拉伸。这种表述将复杂的三维拓扑转化为与 LLM 的解析和推理能力高度兼容的结构化表示。 图注文字图 1:用于三维框架系统自动化结构分析的文本描述模板。除了几何体,文本描述模板还定义了结构分析所需的边界、荷载和材料参数,如图 1 (https://arxiv.org/html/2606.06525#S2.F1) 所示。具体来说,边界条件指定了支座的位置和类型。默认情况下,所有支座在基础处固定。荷载条件包括两个部分:作用于每块楼板向下的均布面荷载以模拟重力荷载,以及作用于左侧外立面的侧向集中荷载以模拟风荷载效应。材料属性分别为主梁和柱指定,包括弹性模量、横截面积、强轴和弱轴惯性矩以及扭转常数。楼板由单元类型和均匀厚度定义。这些几何、边界、荷载和材料描述共同构成了一个完整且明确的问题规范,作为所提出的智能体 LLM 的自然语言输入。 图注文字图 2:包含十个具有不规则几何配置的代表性三维框架系统的基准问题。 ### 2.2 基准数据集 为评估所提出的智能体 LLM 在长程三维结构建模中的能力,开发了一个包含十个代表性三维框架系统的基准数据集,如图 2 (https://arxiv.org/html/2606.06525#S2.F2) 所示。基准案例旨在涵盖工程实践中常见的三种主要几何复杂性类型:高度不规则性、平面不对称性和不连续布局。平面网格范围从 3×3 到 4×6,跨网格单元的层数从 0 到 7 变化。代表性配置包括阶梯式退台、内部空洞以及如 L 形、U 形和十字形平面等不对称布局。还纳入了非均匀网格间距,以评估框架在常规网格系统之外的泛化能力。总体而言,这些配置构成了一个全面且具有挑战性的测试平台,用于评估从自然语言输入进行自动化三维结构建模的能力。 对于每个基准问题,使用图 1 (https://arxiv.org/html/2606.06525#S2.F1) 中介绍的模板制定文本描述。几何信息由图 2 (https://arxiv.org/html/2606.06525#S2.F2) 中所示的相应网格线系统和 MNS 定义,而边界条件、荷载模式和材料属性在所有问题中保持不变,并遵循图 1 (https://arxiv.org/html/2606.06525#S2.F1) 中的示例设置。每个基准问题使用相同的输入描述进行十次重复试验评估。在每次试验中,LLM
相似文章
一种多AI智能体框架实现固体力学问题的端到端有限元分析
本文提出了AbaqusAgent,一个利用大语言模型实现固体力学有限元分析自动化的多智能体框架。在50个问题上实现了86%的成功率,降低了入门级用户的使用门槛,实现了人机仿真交互。
大语言模型中的语言习得装置
本文提出了一种受LAD启发的预预训练方法,使用一种名为MP-Struct的形式语言,该语言编码了类自然语言结构。研究表明,这种方法提高了token效率,并赋予了模型类似人类的对结构不合理语言的抵抗力,挑战了先前关于有效预预训练语言的假设。
使用开源权重的大型语言模型从脑部MRI报告中自动提取结构化信息
本文评估了开源权重的大语言模型LLaMA 3.1在从荷兰语脑部MRI报告中自动提取结构化数据方面的表现。该模型在视觉评分方面取得了高性能,并准确检测了发现结果,而少样本提示改进了对数值变量的提取。
一种结合大语言模型和思维链的自主AI框架,用于无人机辅助物流调度与移动边缘计算
本文提出了一种自主AI框架,利用大语言模型和思维链推理来优化无人机辅助的物流调度与移动边缘计算,旨在提高制造物流中的效率和资源分配。
科学领域的代理型AI实验
本文介绍了两个代理型AI框架:DeepTS/DeepCollector和DeepScribe,它们利用混合本地-云端架构和大语言模型,自动化科学工作流程,包括时间序列数据整理以及将物理讲座转化为结构化报告。