通过轻量级结构引导的自回归模型实现新型图生成的可扩展性
摘要
研究人员提出了一种用于图生成的轻量级自回归框架,该框架使用结构引导的拓扑排序实现了接近对数线性的复杂度,解决了现有扩散和自回归方法在可扩展性和新颖性方面的局限性。该方法同时支持LSTM和Mamba风格的主干网络,在分子和非分子基准测试中展示了改进的新颖性,同时保持了有效性和独特性。
arXiv:2606.04287v1 公告类型:新
摘要:生成逼真且多样化的图是机器学习中的一个关键问题,应用于分子发现、电路设计、网络安全等领域。然而,当前的图生成模型在可扩展性和新颖性方面仍存在局限性。基于扩散的方法通常需要昂贵的全邻接操作和较长的去噪链,而许多自回归和混合模型至少具有二次复杂度。此外,这些模型往往模仿训练图,而非泛化到超出训练集的范围。
我们提出了一种轻量级自回归框架来解决这些问题。该框架使用结构引导的拓扑排序将图序列化为规则的边序列,从而实现接近对数线性的生成速度;并采用两阶段训练策略,结合探索性数据增强和迭代精炼,以减少过拟合并促进可控的新颖性。
在分子和非分子基准测试上的实验表明,我们的方法在提高新颖性的同时,保持了高有效性和独特性。该框架还支持LSTM和Mamba风格的因果序列主干网络,并通过大内存加速器支持超出常规GPU限制的更长的图序列实验。
相似文章
将3D生成模型用于自回归布局生成
LaviGen是一个框架,它重用3D生成模型进行自回归3D布局生成,使用改进的3D扩散模型和dual-guidance self-rollout蒸馏机制,在LayoutVLM基准上实现了比最先进方法高19%的物理合理性和快65%的计算速度。
基于拓扑感知排序的图Mamba生存分析
本文提出TopoMamSurv,一种用于全切片图像生存分析的图Mamba框架,采用拓扑感知排序解决Mamba对输入顺序的敏感性问题,并融合双向Mamba和图卷积网络(GCN)实现空间上下文建模。
通过扩散模型生成知识图谱推理的图状规则
本文介绍了GRiD,一个利用扩散模型和强化学习生成图状规则(如循环、分支)以进行知识图谱推理的框架,解决了现有链式规则挖掘方法的局限性。在六个基准数据集上的实验表明,该方法在知识图谱补全任务中取得了有竞争力的性能。
先素描后绘制:面向扩散多模态大语言模型的层次化强化学习
本文提出HT-GRPO,一种面向扩散多模态大语言模型的层次化强化学习方法,它采用先素描后绘制的训练方案和层次化信用分配机制,以提升图像生成质量和奖励对齐效果。
RT-Lynx:以正确方式将GEMM稀疏性应用于扩散模型
RT-Lynx提出利用激活稀疏性而非权重稀疏性来加速扩散模型,在线性层上实现了高达1.55倍的加速,同时保持生成质量,并被ICML 2026接收。