面向CAD生成的记忆增强强化学习智能体
摘要
本文提出了一种用于CAD生成智能体的记忆增强强化学习框架,该框架集成了几何内核工具链、双轨记忆和动态效用检索,以处理具有长操作序列和几何约束的复杂CAD模型,从而提升了成功率和几何一致性。
arXiv:2605.19748v1 Announce Type: new
摘要:计算机辅助设计(CAD)模型的自动生成是实现先进制造智能化的核心技术。现有基于大语言模型(LLM)的生成方法在处理具有长操作序列、多样操作类型和强几何约束的复杂CAD模型时往往表现不足,主要原因在于推理链断裂且缺乏有效的纠错机制。为解决这一问题,本文提出了一种用于CAD生成智能体的记忆增强强化学习框架。该框架将底层几何内核封装为智能体可调用的结构化工具链,并构建了设计意图理解、全局规划、执行和多维验证的闭环机制。同时,设计了由案例库和技能库组成的双轨记忆模块,并提出了动态效用检索算法。通过将强化学习引入检索和策略优化,智能体能够有效避免示例语义相似但几何不可行的检索陷阱,从而在无需额外大规模标注数据的情况下实现在线自我修正和持续进化。实验表明,所提方法在复杂CAD模型生成任务上显著提升了成功率和几何一致性。
相似文章
基于有限元分析反馈的自我改进CAD生成代理
本文提出了一种新的CAD生成任务形式,将有限元分析作为反馈,并结合了改进的监督信号,如纯文本蓝图方案和多视角图像渲染器,从而在基准测试中实现了更好的几何重建。
工具增强代理:闭环优化、仿真与建模编排
本文介绍了COSMO-Agent,一个工具增强的强化学习框架,用于训练LLM执行闭环CAD-CAE优化,迭代生成参数化几何体并运行仿真直到满足约束条件,并包含一个多约束奖励和新的行业对齐数据集。
PR-CAD:利用大语言模型渐进式优化,实现统一、可控且高保真的文本到 CAD 生成
PR-CAD 提出基于大语言模型的统一框架,通过强化学习与高质量数据集,实现文本到 CAD 的迭代生成与编辑,在可控性与保真度上达到 SOTA。
从多模态经验中学会学习
本文介绍了AutoMMemo,一个使多模态智能体能够自动设计记忆机制(可表达为可执行的备忘录程序)以从多模态交互轨迹中学习的框架,在GUI/Web导航和视觉推理基准上优于无记忆和固定记忆基线。
GenCAD
GenCAD 引入了一种图像条件模型,该模型利用 transformers 和扩散先验生成完整的参数化 CAD 命令历史,从而实现从图像中进行精确且可修改的 3D 建模。