PyCC.id:一个具有结构可辨识性的假设驱动方程发现包

arXiv cs.LG 工具

摘要

PyCC.id 是一个 Python 库,用于从时间序列数据中进行假设驱动的方程发现,利用结构可辨识性来帮助筛选候选模型。

arXiv:2606.05191v1 公告类型:新 摘要:数据驱动的方程发现本质上是一个逆问题,旨在直接从时间序列测量中推断系统的控制微分方程。一个已知问题是逆问题的病态性,常常会产生多个对数据拟合程度相似的数学模型。解决此问题的一个途径是事先将已知假设和约束纳入训练阶段。虽然这种方法有效缩小了搜索空间,但仍会产生多个候选模型,迫使从业者根据自身领域专业知识进行事后手动筛选。最近的一种方法引入了受特征曲线(CCs)启发的结构“骨架”,定义了一种假设驱动的方法论。在该方法论中,从业者定义一个与一族常微分方程(ODEs)相关联的骨架,然后基于其领域知识添加假设和先验,迭代地改进所获得的模型。这种方法的一个重要优势是,某些骨架具有可证明的结构可辨识性属性,这有助于检查骨架是否正确或应被舍弃。此外,由于其模块化特性,这一形式体系支持使用多种方程发现范式(如神经网络、符号回归和稀疏回归)。在这项工作中,我们介绍了 Python 库 PyCC,它将上述努力浓缩成一个灵活的工具,使研究人员和工程师能够无缝地定义他们的骨架和假设,从而从时间相关数据中发现 ODEs。
查看原文
查看缓存全文

缓存时间: 2026/06/05 08:08

# PyCC.id:一个基于假设驱动且具备结构可辨识性的方程发现工具包
来源:https://arxiv.org/abs/2606.05191
查看PDF (https://arxiv.org/pdf/2606.05191)

> Abstract:数据驱动的方程发现本质上是一个逆问题,旨在从时间序列测量数据中直接推断系统的控制微分方程。一个已知问题是逆问题的病态性质,常常会产生多个数学模型,这些模型对数据的拟合程度相似。解决此问题的一种方法是事先将已知假设和约束纳入训练阶段。虽然这种方法有效缩小了搜索空间,但仍然会产生多个候选模型,迫使实践者依赖基于自身领域知识的后验手动筛选。最近的一种方法引入了受特征曲线(CCs)启发的结构化“骨架”,定义了一种假设驱动的方法。在这种方法中,实践者定义一个与常微分方程(ODEs)族相关联的骨架,然后基于其领域知识添加假设和先验,迭代地完善得到的模型。该方法的一个重要优势是某些骨架具有可证明的结构可辨识性属性,有助于检查骨架是否正确或应被舍弃。此外,由于其模块化特性(如神经网络、符号回归和稀疏回归),该形式化方法支持使用多种方程发现范式。在本工作中,我们介绍了Python库PyCC,它将上述努力浓缩为一个灵活的工具,允许研究人员和工程师无缝定义其骨架和假设,从而从时变数据中发现ODE。

## 提交历史

来自:Federico Javier Gonzalez \[view email (https://arxiv.org/show-email/759689bb/2606.05191)\] **\[v1\]**Thu, 7 May 2026 00:17:01 UTC (136 KB)

相似文章

PACER: 从大规模干预数据中进行无环因果发现

arXiv cs.LG

PACER 是一个新的可扩展框架,用于从大规模干预数据中进行因果发现,其设计保证了无环性,在包含数千个变量的基准测试中,比基于惩罚的方法实现了高达两个数量级的加速。