基于强化学习的折纸超材料逆向结构设计与快速激光切割原型制作
摘要
本文介绍了 RL-Kirigami,这是一个结合最优传输条件流匹配和强化学习的框架,用于解决折纸超材料的逆向设计问题,实现了高精度并支持快速的激光切割原型制造。
arXiv:2605.08098v1 公告类型:新文章
摘要:折纸(Kirigami)是一种日益重要的制造方法,用于生产形状可编程的超材料结构。然而,逆向设计仍然具有挑战性,因为其展开过程是非线性的,且可行的切割布局必须满足离散兼容性规则、避免重叠,并将目标形状映射到有效的设计方案。我们提出了 RL-Kirigami,一个逆向设计框架,结合最优传输条件流匹配(OT-CFM)与强化学习,为紧凑型可重构平行四边形四边形折纸生成兼容的比例场。通过行进解码器确保全局几何兼容性,并利用群组相对策略优化(GRPO)使生成器与非可微奖励对齐,以实现轮廓匹配、可行性及比例场正则化。在程序生成的目标形状实例中,仅从预训练的 OT-CFM 先验模型中抽取一个样本即达到了 94.2% 的 sIoU,优于求解器基线方法,并将前向模拟器评估次数从数百次减少至 1 次。GRPO 将准确率提升至 94.91% sIoU;在引入正则化后,TV(\mathbf{x}) 从 0.95 降至 0.81,同时保持 94.83% 的 sIoU。生成的布局导出为 DXF 格式,并在 50 \mu\mathrm{m} 厚的聚合物片材上进行激光切割,每部件仅需 8.0 \pm 1.0 分钟即可制作出可展开原型。这些结果支持在严格的几何可行性约束下,开展面向制造的折纸超材料逆向设计工作流。
查看缓存全文
缓存时间: 2026/05/12 06:40
# 面向剪纸(Kirigami)原型逆向结构设计与快速激光切割的强化学习
来源:https://arxiv.org/html/2605.08098
\\credit
概念化、方法论、软件、验证、形式分析、调查、数据整理、可视化、写作 - 初稿\\credit调查、验证、资源\\cormark\[1\]\\credit概念化、监督、写作 - 审稿与编辑
aff1\]organization=电气工程与计算机科学系, 英属哥伦比亚大学, addressline=5500-2332 Main Mall, city=温哥华, state=BC, postcode=V6T 1Z4, country=加拿大 aff2\]organization=生物医学工程学院, 生物医学研究中心, 英属哥伦比亚大学, addressline=2222 Health Sciences Mall, 251室, city=温哥华, state=BC, postcode=V6T 1Z3, country=加拿大 aff3\]organization=骨科系, Gordon and Leslie Diamond 医疗中心, 英属哥伦比亚大学, addressline=2775 Laurel Street, 11楼, city=温哥华, state=BC, postcode=V5Z 1M9, country=加拿大 aff4\]organization=修复发现国际协作组 (ICORD), Blusson 脊髓中心, addressline=818 West 10th Avenue, city=温哥华, state=BC, postcode=V5Z 1M9, country=加拿大
\\cortext
\[cor1\]通信作者。电话:+1 604 875 4992。
###### 摘要
剪纸(Kirigami)是一种日益有用的制造方法,用于生产形状可编程的超材料结构。然而,逆向设计仍然具有挑战性,因为展开过程是非线性的,且可行的切割布局必须满足离散的兼容性规则、避免重叠,并将一个目标形状映射到有效的设计中。我们提出了 RL-Kirigami,这是一种逆向设计框架,结合了最优输运条件流匹配(OT-CFM)与强化学习,以生成紧凑的可重构平行四边形四元剪纸的兼容比率场。行进解码器(Marching decoder)强制实施全局几何兼容性,而群体相对策略优化(GRPO)使生成器与用于轮廓匹配、可行性及比率场正则性的不可微奖励对齐。在程序生成的目标形状实例中,来自预训练 OT-CFM 先验的单个样本达到了 94.2% 的 sIoU,优于求解器基线,并将正向模拟器的评估次数从数百次减少到 1 次。GRPO 将精度提高至 94.91% sIoU,并在包含正则性后,在保持 94.83% sIoU 的同时,将 TV(x)\mathrm{TV}(\mathbf{x}) 从 0.95 降低到 0.81。生成的布局被导出为 DXF 格式,并在 50μm50~\mu\mathrm{m} 厚的聚合物片材上进行激光切割,每个部件在 8.0±1.08.0\pm 1.0 分钟内生产出可部署的原型。这些结果支持了在严格的几何可行性约束下,针对可部署剪纸超材料的制造感知逆向设计工作流。
###### 关键词:
逆向设计\\sepp剪纸\\sepre强化学习\\sep流匹配\\sep机械超材料\\sepl激光切割
## 1 引言
剪纸是日本的切割和折叠纸张的艺术。在薄板力学中,受控的切割可以产生巨大且可控的变形\(bertoldi2017flexible\)。通过设计切割图案的布局和几何形状,平坦的薄片可以展开成复杂的 2D 和 3D 形状,并实现具有受控稳定性的预定展开状态,包括双稳态或多稳态行为,即在零载荷下存在两个或更多稳定构型\(choi2019programming;yang2018multistable\)。此外,剪纸切割图案设计适用于从原子厚薄膜到米级尺度的不同长度尺度\(blees2015graphene;wang2022kirigami\)。
结合剪纸提供的不同特性,这种方法已成为不同领域广泛使用的制造方法\(zhai2021mechanical;wei2024revolutionizing;bliah2025fabrication\)。剪纸还使功能性薄膜能够在微观尺度上适应大应变\(blees2015graphene\)。例如,用于软机器人的剪纸图案皮肤可以将简单的充气或弯曲转化为方向性摩擦和运动\(rafsanjani2018kirigami;branyan2022curvilinear;tirado2025multimodal\)。在生物医学系统中,剪纸图案植入物已被用于微创递送至体内,然后在放置后展开\(babaee2021kirigami;kim2018shape\)。相关的裂口图案设计思想也出现在重建外科中。在网格化分层皮片移植中,采集的自体皮肤被图案化为裂口行并展开以覆盖更大的伤口,最近的研究使用受超材料启发的框架分析了这些展开极限\(yu2025meshed\)。更广泛地说,诸如大腿前外侧皮瓣重建大面积面部皮肤缺损等重建程序凸显了具有几何感知的组织覆盖和形状匹配的重要性\(mureau2005anterolateral\)。在能源应用中,剪纸切割片可以提供集成的太阳能追踪,而对于可部署结构,它们可以紧凑折叠并展开为平坦表面\(lamoureux2015dynamic;wang2022kirigami\)。剪纸切割架构也已被用于调节波传播\(khosravi2022tunable\)、电子响应\(won2019stretchable\)和传感性能\(sun2018kirigami\)。最近关于折纸和剪纸超材料、可穿戴电子制造以及软机器人制造的综述进一步展示了应用的广度\(zhai2021mechanical;wei2024revolutionizing;bliah2025fabrication\)。因此,剪纸已成为一种通用的制造方法论。它也处于数据驱动和可编程超材料的更广泛背景中\(cerniauskas2024machine;zheng2023deep\)。尽管剪纸具有多功能性,但一个主要考虑因素仍然存在:为期望的展开形状或机械响应配置可行的切割图案。
解决剪纸逆向设计问题仍然是一个瓶颈\(dudte2023additive;ying2025inverse\)。在解决这个问题时,重要的是要考虑由许多耦合的、近乎刚性的面板通过细韧带(相邻切割之间留下的狭窄材料桥)连接而产生的整体结构的展开响应。韧带可以表现出弹性失稳以及强烈的几何非线性\(choi2019programming;yang2018multistable;zheng2022continuum\)。响应通常与设计、片材厚度、尺度和边界条件以及材料特性有关\(choi2019programming;yang2018multistable;zheng2022continuum\)。即使在一个镶嵌家族内,微小的几何变化也会改变稳定性、载荷路径以及可以达到的展开构型。因此,局部几何变化会影响远处区域,从而引入非局部耦合。这种非局部耦合使得手动调整变得困难,并迅速增加了设计选项的数量\(choi2019programming;dudte2023additive\)。连续体和粗粒化模型表明,即使对于平面薄片,兼容性限制仍然具有强烈的非线性\(zheng2022continuum\)。几何方法表明,旋转单元的形状可以控制展开形状和内部轨迹\(qiao2025inverse\)。实际方法必须在所需的边界条件和可部署性约束下产生期望的展开形状\(dudte2023additive;ying2025inverse\)。此外,对于形状变换,切割图案必须从紧凑构型变换为展开构型,同时避免重叠并保持几何兼容性\(choi2019programming;dudte2023additive;ying2025inverse\)。
类似地,经典的逆向设计方法通常依赖于拓扑优化、进化算法或粒子群优化等搜索策略,并使用重复的正向模拟来评估候选图案。这些方法导致每个目标的高计算成本,并且需要为每个目标专用的优化循环,这使得生成可行设计的计算成本高昂\(xue2017kirigami;perez2007particle;ying2025inverse\)。这些方法还必须处理非凸设计空间和约束\(perez2007particle;ying2025inverse\)。
数据驱动的生成模型可能提供更有效的替代方案。更广泛地说,最近的工作展示了数据驱动逆向设计在可编程和架构化超材料中的前景\(cerniauskas2024machine;zheng2023deep\)。在模拟或实验数据集上训练后,这些模型可以在推理时针对规定的目标采样切割图案,而无需迭代搜索\(ha2023rapid;chen2025generative\)。这可能比运行多次调用正向模拟器的优化器更快,并且这些模型可以代表多个解决方案家族。最近的工作展示了使用扩散和相关生成模型进行机械超材料的逆向映射,包括匹配应力-应变曲线和变形历史的设计\(bastek2023inverse\)。基于 GAN 的模型也已用于预测架构化超材料中的全场机械响应\(xiang2024gan\)。以前关于剪纸和相关架构材料的工作也支持这一方向\(alderete2022machine;brzin2025generative\)。然而,学习剪纸约束仍然具有挑战性。切割规则是离散的和关系的(切割不能相交,并且只有在兼容性约束下某些连接在几何上才是可能的)。展开在整个运动过程中也必须保持无碰撞\(choi2019programming;dudte2023additive;ying2025inverse\)。纯前馈生成器可能会违反硬性规则或忽略对可行性和匹配指标至关重要的细微几何细节\(felsch2024generative\)。在相关的机械超材料工作中,引导扩散可以将生成引导至期望的机械响应\(yang2026guided\)。然而,对于剪纸,这种引导仍然不能保证满足离散的切割规则;因此,显式约束检查仍然有用。
基于这一方向,RL-Kirigami 将最优输运条件流匹配(OT-CFM)生成器与来自正向模拟器和评估器的奖励下的强化学习微调相结合。流匹配和相关的连续时间生成模型(例如,修正流和随机插值器)学习一个速度场,该场将简单的基分布映射到数据分布,并且也已被用于其他条件生成设置中\(lipman2023flow;liu2023flow;albergo2023building;yazdani2025flow\)。这实现了快速条件采样,这对于每个候选者都需要解码和可行性检查非常重要。OT-CFM 生成器被视为针对目标轮廓的条件剪纸切割图案上的随机策略。然后使用强化学习在闭环中细化该策略。奖励结合剪纸有效性规则、重叠惩罚以及正向模拟后计算的形状误差和比率场正则性等评估项。这种不可微的黑盒奖励使用群体相对策略优化(GRPO)\(shao2024deepseekmath\)进行优化,使生成器与不可微的任务奖励和设计偏好对齐。此外,在结构和超材料问题中,当设计空间是组合性的时,RL 可以产生反直觉的设计,并可以与经典拓扑优化竞争\(brown2022deep;brown2023deep;rosafalco2023reinforcement;shah2021reinforcement\)。据我们所知,RL 在剪纸中的应用仍然显得有限且分散。我们的目标在这里是开辟一条实用的逆向剪纸设计路线,其中快速条件采样处理一对多逆向映射,而 RL 支持在离散可行性规则和其他不可微或面向制造的偏好下的偏好对齐,而无需可微代理。行进解码器在此管道内强制实施兼容性。每种方法的速度、准确性和可靠性与基于求解器的基线进行了比较,并评估了 RL 对匹配性能和比率场正则性的影响。最后,我们通过演示端到端的激光切割快速原型制作工作流程来展示我们模型的实用性。图 1 (https://arxiv.org/html/2605.08098#S1.F1)总结了 RL-Kirigami 流程。
参见标题图 1:闭环 RL-Kirigami 使用来自正向模拟器和评估器的奖励微调 OT-CFM 生成器。对于目标展开轮廓y\mathbf{y},生成器提出剪纸切割图案,环境模拟y^\widehat{\mathbf{y}}以与y\mathbf{y}进行比较。群体相对策略优化(GRPO)更新生成器,以增加满足约束并匹配目标的样本的可能性。
## 2 方法
图 1 (https://arxiv.org/html/2605.08098#S1.F1)显示了闭环逆向设计流程。给定目标展开轮廓y\mathbf{y}和条件(全局展开参数φ\varphi和边界锚点B\mathcal{B}),目标是找到剪纸设计x\mathbf{x},使其解码后的展开在通过正向模拟器时匹配y\mathbf{y}。在本文中,x\mathbf{x}表示比率场,x_{ij}局部比率,y\mathbf{y}目标轮廓,y^\widehat{\mathbf{y}}模拟展开轮廓,φ\varphi全局展开参数,φ_{ij}局部单元格角度,G\mathcal{G}行进解码器,F\mathcal{F}正向模拟器。四元剪纸使用负空间(空洞)视图和受 Dudte 等人启发的局部边/角表示法表示\(dudte2023additive\)。图 2 (https://arxiv.org/html/2605.08098#S2.F2)定义了空洞(i,j)(i,j)的局部变量,并显示空洞如何铺满m×nm\times n片材。全局一致性使用行进解码器强制实施,该解码器从局部比率和展开角度场重建完整几何形状,并结合离散可行性检查。使用这种表示,RL-Kirigami 通过使用最优输运条件流匹配(OT-CFM)\(lipman2023flow;liu2023flow;albergo2023building\)建模 P(x∣y,φ,B)P(\mathbf{x}\mid\mathbf{y},\varphi,\mathcal{B})来学习逆向映射的条件生成先验。然后使用群体相对策略优化(GRPO)\(shao2024deepseekmath\)将该先验与任务奖励对齐。
### 2.1 剪纸参数化与行进解码器
剪纸图案被建模为 m×nm\times n 的空洞数组,如图 2 (https://arxiv.org/html/2605.08098#S2.F2)(左)所示。对于每个单元格(i,j)(i,j),空洞是一个四边形,其角顶点为p_{ij}^{0...3}\in\mathbb{R}^2p_{ij}^{0...3}\in\mathbb{R}^2,逆时针索引,匹配图 2 (https://arxiv.org/html/2605.08098#S2.F2)(右)。该公式限制为平行四边形空洞,并通过内部展开角φ_{ij}=\angle(p_{ij}^{1}-p_{ij}^{0},p_{ij}^{3}-p_{ij}^{0})\phi_{ij}=\angle(p_{ij}^{1}-p_{ij}^{0},\,p_{ij}^{3}-p_{ij}^{0})和边长比x_{ij}=a_{ij}/b_{ij}>0x_{ij}=a_{ij}/b_{ij}>0 对每个空洞进行参数化,其中a_{ij}=\|p_{ij}^{1}-p_{ij}^{0}\|_2a_{ij}=\|p_{ij}^{1}-p_{ij}^{0}\|_2 且b_{ij}=\|p_{ij}^{3}-p_{ij}^{0}\|_2b_{ij}=\|p_{ij}^{3}-p_{ij}^{0}\|_2。
参见标题图 2:负空间视图中的剪纸片材和局部表示法。左:带有 m×nm\times n 空洞数组的片材。右:带有角顶点p_{ij}^{0...3}p_{ij}^{0...3}(蓝色)、边长a_{ij}a_{ij}和b_{ij}b_{ij}的空洞(i,j)(i,j),以及顶点 0 处的展开角φ_{ij}\phi_{ij},由行进解码器使用(公式 (2 (https://arxiv.相似文章
RL²:通过缓慢强化学习实现快速强化学习
RL²将快速强化学习算法编码为循环神经网络的权重,通过缓慢的通用强化学习来学习,使智能体能够像生物学习一样通过少量试验快速适应新任务。该方法在小规模老虎机问题和大规模基于视觉的导航任务上都展现了强大性能。
通过双层优化实现交互场景的交互式逆向强化学习
本文介绍了交互式逆向强化学习(IIRL),这是一个学习者通过与专家主动互动来推断奖励函数的框架,其形式化为随机双层优化问题。作者提出了 BISIRL 算法,为该交互式学习范式提供了收敛性保证和实验验证。
叛逆的学生:通过自蒸馏 RLVR 反转教师信号以进行推理探索
本文介绍了 RLRT,这是一种在自蒸馏过程中反转教师信号的方法,旨在强化学生模型成功的偏离行为,从而增强大语言模型的推理探索能力。
将3D生成模型用于自回归布局生成
LaviGen是一个框架,它重用3D生成模型进行自回归3D布局生成,使用改进的3D扩散模型和dual-guidance self-rollout蒸馏机制,在LayoutVLM基准上实现了比最先进方法高19%的物理合理性和快65%的计算速度。
借助大语言模型发现强化学习接口
本文介绍了 LIMEN,这是一个由大语言模型引导的演化框架,能够通过联合优化原始模拟器状态的观测映射与奖励函数,自动发现强化学习接口。该方法有效降低了人工设计成本,并证明了观测与奖励的协同设计优于单独优化其中任意单一组件。