PyCC.id:一个具有结构可辨识性的假设驱动方程发现包
摘要
PyCC.id 是一个 Python 库,用于从时间序列数据中进行假设驱动的方程发现,利用结构可辨识性来帮助筛选候选模型。
arXiv:2606.05191v1 公告类型:新
摘要:数据驱动的方程发现本质上是一个逆问题,旨在直接从时间序列测量中推断系统的控制微分方程。一个已知问题是逆问题的病态性,常常会产生多个对数据拟合程度相似的数学模型。解决此问题的一个途径是事先将已知假设和约束纳入训练阶段。虽然这种方法有效缩小了搜索空间,但仍会产生多个候选模型,迫使从业者根据自身领域专业知识进行事后手动筛选。最近的一种方法引入了受特征曲线(CCs)启发的结构“骨架”,定义了一种假设驱动的方法论。在该方法论中,从业者定义一个与一族常微分方程(ODEs)相关联的骨架,然后基于其领域知识添加假设和先验,迭代地改进所获得的模型。这种方法的一个重要优势是,某些骨架具有可证明的结构可辨识性属性,这有助于检查骨架是否正确或应被舍弃。此外,由于其模块化特性,这一形式体系支持使用多种方程发现范式(如神经网络、符号回归和稀疏回归)。在这项工作中,我们介绍了 Python 库 PyCC,它将上述努力浓缩成一个灵活的工具,使研究人员和工程师能够无缝地定义他们的骨架和假设,从而从时间相关数据中发现 ODEs。
查看缓存全文
缓存时间: 2026/06/05 08:08
# PyCC.id:一个基于假设驱动且具备结构可辨识性的方程发现工具包 来源:https://arxiv.org/abs/2606.05191 查看PDF (https://arxiv.org/pdf/2606.05191) > Abstract:数据驱动的方程发现本质上是一个逆问题,旨在从时间序列测量数据中直接推断系统的控制微分方程。一个已知问题是逆问题的病态性质,常常会产生多个数学模型,这些模型对数据的拟合程度相似。解决此问题的一种方法是事先将已知假设和约束纳入训练阶段。虽然这种方法有效缩小了搜索空间,但仍然会产生多个候选模型,迫使实践者依赖基于自身领域知识的后验手动筛选。最近的一种方法引入了受特征曲线(CCs)启发的结构化“骨架”,定义了一种假设驱动的方法。在这种方法中,实践者定义一个与常微分方程(ODEs)族相关联的骨架,然后基于其领域知识添加假设和先验,迭代地完善得到的模型。该方法的一个重要优势是某些骨架具有可证明的结构可辨识性属性,有助于检查骨架是否正确或应被舍弃。此外,由于其模块化特性(如神经网络、符号回归和稀疏回归),该形式化方法支持使用多种方程发现范式。在本工作中,我们介绍了Python库PyCC,它将上述努力浓缩为一个灵活的工具,允许研究人员和工程师无缝定义其骨架和假设,从而从时变数据中发现ODE。 ## 提交历史 来自:Federico Javier Gonzalez \[view email (https://arxiv.org/show-email/759689bb/2606.05191)\] **\[v1\]**Thu, 7 May 2026 00:17:01 UTC (136 KB)
相似文章
MOSAIC:通过稀疏可加可识别因果学习在科学时间序列中进行模块发现
本文介绍了 MOSAIC,这是一种用于科学时间序列中模块发现的方法,它将因果表征学习与稀疏可加可识别因果学习相结合。其目标是在无需事后对齐的情况下,恢复可解释的潜在变量及其关联观测值,并在分子动力学和气候数据等领域进行了验证。
PACER: 从大规模干预数据中进行无环因果发现
PACER 是一个新的可扩展框架,用于从大规模干预数据中进行因果发现,其设计保证了无环性,在包含数千个变量的基准测试中,比基于惩罚的方法实现了高达两个数量级的加速。
APCyc:通过自动化环化进行性质导向的环肽设计
APCyc是一个靶点感知的生成框架,通过显式建模环化模式并利用贝叶斯后验引导,设计具有可控理化性质的环肽。
基于自演化多智能体数字孪生的自主多相催化剂发现
本文介绍了CatDT,一个自演化多智能体数字孪生系统,能够从块体晶体和反应描述中自主预测多相催化剂性质,在七个基准测试中达到实验精度,并发现了用于丙烷脱氢的非贵金属催化剂候选物。
Psy-Chronicle: 一种合成长时序校园心理咨询对话的结构化流程
本文介绍了Psy-Chronicle,一个用于合成长时序校园心理咨询对话的结构化框架,并发布了CPCD,一个包含90,000个跨多次会话对话的中文数据集,以及一个用于评估模型长时序咨询能力的基准测试。