对柯达图集的逐图 PCA 分解首次揭示精心策划

Hacker News Top 2026/04/20 16:12 论文

摘要

对 24 张图像的柯达 PCD0992 图集进行首次逐图 PCA 分解，发现其在通道间冗余度上跨越两个数量级的精心策划。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/04/22 23:23

PearsonZero/kodak-pcd0992-statistical-characterization

来源：https://github.com/PearsonZero/kodak-pcd0992-statistical-characterization

Kodak PCD0992 统计画像系列

Kodak 无损真彩色图像套件（PCD0992）的逐图 PCA 与通道间冗余度分析

Baetzel, J.（2026）

概述

本仓库首次公开了 Kodak 无损真彩色图像套件（PCD0992）全部 24 张图像的逐图统计特征。每张图像以两页数据表形式呈现，完整记录通道间冗余结构：协方差矩阵、特征分解、Pearson 相关系数、空间自相关及由此衍生的分类指标。

所有统计量均基于标准 768×512 基础分辨率 PNG 发行版的 8-bit RGB 像素阵列直接计算，无任何主观描述。冗余分类由固定阈值算法依据已记录的度量值自动生成。

数据集规格

属性	值
套件	Kodak Lossless True Color Image Suite（PCD0992）
图像数量	24
分辨率	768×512 或 512×768
位深	24-bit（每通道 8 bit）
色域	sRGB
色彩模式	RGB
格式	PNG（无损）
来源	Kodak PCD Film Scanner 2000，35 mm 胶片，PhotoYCC 解码至 8-bit RGB

每张图像计算指标

每份两页画像包含：

第 1 页

RGB 通道分布（像素数据平滑密度曲线）
单通道统计：均值、标准差、方差、峰度、偏度、最小值、最大值
通道间相关热力图（3×3）
成对 Pearson 相关系数（R-G、R-B、G-B）及套件均值
完整 3×3 协方差矩阵

第 2 页

特征分解：特征值、方差解释率（%）、特征向量载荷
衍生指标：条件数、特征值比率、蓝通道独立性、PC1 主导通道
维度层级分类
空间自相关（滞后 1，水平与垂直）
平均局部方差（3×3 邻域）
冗余画像（由计算指标逻辑生成）

套件总览

24 张图像几乎覆盖了胶片摄影可实现的全部通道间冗余配置。条件数从 7.55 到 1,739.16，跨越两个数量级，色分布从近球形到极度拉长。

维度层级

层级	PC1 范围	数量	图像
三维（PC1 < 75%）	69.27–73.37%	3	kodim02, kodim03, kodim23
二维（PC1 75–85%）	81.60%	1	kodim14
弱一维（PC1 85–93%）	86.87–91.91%	8	kodim04, kodim05, kodim07, kodim09, kodim11, kodim18, kodim21, kodim22
强一维（PC1 93–97%）	93.36–96.96%	7	kodim01, kodim08, kodim10, kodim12, kodim15, kodim16, kodim19
近退化（PC1 > 97%）	97.36–98.42%	5	kodim06, kodim13, kodim17, kodim20, kodim24

特征向量载荷模式

模式	数量	图像
绿通道主导	7	kodim03, kodim05, kodim08, kodim09, kodim10, kodim16, kodim17
绿-蓝耦合	6	kodim01, kodim04, kodim11, kodim12, kodim15, kodim21
红通道主导	6	kodim02, kodim06, kodim14, kodim18, kodim19, kodim23
均衡	4	kodim07, kodim13, kodim20, kodim24
蓝通道主导	1	kodim22

套件极值

指标	低值	高值
平均 \|r\|	kodim23: 0.5595	kodim20: 0.9903
条件数	kodim23: 7.55	kodim20: 1,739.16
PC1 方差解释率	kodim03: 69.27%	kodim20: 98.42%
蓝通道独立性	kodim15: 2.3%	kodim03: 52.0%
最高单对 r		kodim20 R-G: 0.9955
最低单对 r		kodim03 R-B: 0.2890

如何阅读画像表

条件数（lambda1/lambda3）：最大与最小特征值之比。高值表示色分布呈针状集中于单一轴；低值表示更接近球形，各通道信息独立。

蓝通道独立性：蓝通道方差中未被第一主成分解释的比例。计算式为 (1 - (blue_loading_PC1² × lambda1 / Var(B))) × 100。低值表示蓝通道几乎可由主方差轴预测；高值表示蓝通道携带大量独特信息。

维度层级：依据 PC1 方差解释率划分，阈值 75%、85%、93%、97%，共五级，从“三维”到“近退化”，对应不同冗余区间。

特征向量模式：第一主成分的载荷结构。识别主导方差轴由哪个通道或通道对驱动：均衡（三通道近等）、耦合（双通道共载）、主导（单通道领先）。

空间自相关（滞后 1）：像素与其直接邻域的 Pearson 相关，分水平与垂直计算。值接近 1.0 表示图像数据空间平滑、连贯。

文件结构

/
    README.md
    baetzel_2026_kodak_pca_characterization.pdf
/baseline/
    KODIM01_STATISTICAL_PROFILE.pdf
    kodim01_stats.json
    KODIM02_STATISTICAL_PROFILE.pdf
    kodim02_stats.json
    ...
    KODIM24_STATISTICAL_PROFILE.pdf
    kodim24_stats.json
    kodak_suite_master_stats.json
/docs/
    methodology.md

根目录：母论文与仓库自述。
/baseline/：24 份两页 PDF 参考表 + 25 份 JSON（24 张单图 + 1 份总表）。
/docs/：计算流程文档，确保结果可复现。

参考文献

[1] Eastman Kodak Company. Kodak Publication No. PCD-042, 1992.

[2] Baetzel, J. (2026). “Statistical Characterization of Inter-Channel Redundancy Structure in the Kodak Lossless True Color Image Suite.”

[3] Watanabe, S. “Karhunen-Loeve Expansion and Factor Analysis,” pp. 635-660, 1965.

[4] Giorgianni, E.J. and Madden, T.E. Digital Color Management. Addison-Wesley, 1998.

引用格式

Baetzel, J. (2026). Kodak PCD0992 Statistical Profile Series:
Per-Image PCA and Inter-Channel Redundancy Analysis of the
Kodak Lossless True Color Image Suite.

对柯达图集的逐图 PCA 分解首次揭示精心策划

PearsonZero/kodak-pcd0992-statistical-characterization

Kodak PCD0992 统计画像系列

概述

相关研究

数据集规格

每张图像计算指标

套件总览

维度层级

特征向量载荷模式

套件极值

如何阅读画像表

文件结构

参考文献

引用格式

许可

相似文章

单次调色板优化与有序抖动

CPCANet：用于域泛化的深度展开通用主成分分析

SmartPhotoCrafter：统一推理、生成与优化的自动摄影图像编辑

二元少样本分类的光谱相图：内在维度、几何饱和与表征诊断

PhotoCraft: 基于层次化自演化记忆的深度图像搜索智能体推理

提交意见反馈