
2026/04/21 1:12
コダック・スイートに対する最初の画像別主成分分析(PCA)分解は、意図的な選定が行われていることを示唆している。
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
概要
このリポジトリは、Kodak Lossless True Color Image Suite (PCD0992) に対する包括的な統計解析を提供し、主観的な記述を行わずに標準 PNG ファイルから直接抽出されたすべての 24 個のベンチマーク画像について、初回となる客観的で機械可読なプロファイルを提示します。Baetzel(2026)によって確立された理論的枠組みに基づき、本プロジェクトは完全な PCA 分解と詳細な報告書を PDF リファレンスシートおよび JSON エクスポートの形式で提供します。解析の結果、データセット全体にわたって幾何学的複雑性において顕著な変異が明らかとなりました:条件数は kodim23 で 7.55 から kodim20 で 1,739 以上まで変化し、次元性ティアは画像を「三次元(3 枚)」「弱/強一次的(15 枚)」、「準特異値(5 枚)」に分類します。さらに、主成分による支配的な固有ベクトル負荷パターン(緑色系から青色系の優勢まで範囲あり)や極端なチャンネル間相関(例:kodim20 における最大 R-G 相関 0.9955)などの洞察が得られます。RGB 分布、共分散行列、主成分ごとの説明変数比を含む粒度の高い指標を提供することで、本研究資源は研究者および企業が、全体セットにわたる内在的な冗長性とカラー空間の状況を即座に評価することを可能にします。
本文
コダック PCD0992 統計プロファイルシリーズ
「コダック・ロスレス・トゥルーカラー・イメージ・スーツ」の画像別主成分解析およびインタースレッド冗長性分析
著者: J. Baetzel(2026)
概要 (Overview)
本リポジトリは、コダック・ロスレス・トゥルーカラー・イメージ・スーツ(PCD0992)に収められている 24 画像すべてに対する初の実用化された画像別統計的記述を提供します。各画像は、完全なインタースレッド冗長性構造(共分散行列、固有値分解、ピアソンの相関係数、空間的自己相関、および派生的な分類メトリクス)を報告する二ページ構成のリファレンスデータシートとして文書化されています。
すべての統計量は、標準的な解像度(768x512 ピクセル)の PNG 分布に含まれる 8 ビット RGB ピクセル配列から直接計算されました。プロファイル内のいずれにも主観的な記述は含まれておりません。すべての冗長性分類は、メソロジーで文書化された固定閾値を用いた計算結果に基づき、プログラム的に生成されています。
関連研究 (Related Research)
-
親論文 (Parent Paper):
- Baetzel, J. (2026). "Statistical Characterization of Inter-Channel Redundancy Structure in the Kodak Lossless True Color Image Suite: Per-Image Principal Component Decomposition of PCD0992."
- 焦点: コダック・スーツに対する初の完全な画像別主成分分解(PCA)を確立する理論的枠組み。次元スペクトル、ブルーチャンネルの独立性の範囲、固有ベクターの負荷パターン、および 24 画像コレクション全体にわたる意図的なキュレーションに関する証拠を文書化しています。
- 入手可能性: このリポジトリに含まれています(
)。baetzel_2026_kodak_pca_characterization.pdf
-
本シリーズ (This Series):
- Baetzel, J. (2026). "Kodak PCD0992 Statistical Profile Series: Per-Image PCA and Inter-Channel Redundancy Analysis."
- 焦点: 24 画像それぞれに対する個別のリファレンスデータシートおよび機械可読なメトリクスエクスポート。親論文に記述されているスーツ全体分析の根拠となる、共分散行列、固有値分解、相関ヒートマップ、空間的自己相関、ならびにロジック生成型冗長性分類の詳細を提供します。
- 入手可能性:
ディレクトリ(24 つの PDF および 25 つの JSON ファイル)。/baseline/
親論文はなぜコダック・スーツがインタースレッド冗長性の全スペクトルをカバーするのかを説明し、本プロファイルシリーズは各画像がそのスペクトルに寄与する具体内容を記録しています。
データセット仕様 (Dataset Specifications)
| プロパティ | 値 |
|---|---|
| スーツ名 | コダック・ロスレス・トゥルーカラー・イメージ・スーツ (PCD0992) |
| 画像数 | 24 |
| 解像度 | 768x512 または 512x768 |
| ビット深度 | 24 ビット(各チャネル 8 ビット) |
| カラースペース | sRGB |
| カラーモード | RGB |
| フォーマット | PNG(ロスレス) |
| プロヴェナンス | コダック PCD フィルムスキャナー 2000 / 35mm フィルム / PhotoYCC デコード後の 8 ビット RGB |
画像別計算メトリクス (Computed Metrics Per Image)
各二ページのプロファイルは、以下の情報を報告します:
-
1 ページ目
- RGB チャネルの分布(ピクセルデータから生成された平滑化密度曲線)
- チャネル別の統計量:平均、標準偏差、分散、尖度、歪度、最小値、最大値
- インタースレッド相関ヒートマップ(3x3)
- 対 twin ピアソン相関係数(R-G, R-B, G-B)およびスーツ全体平均
- 完全な 3x3 共分散行列
-
2 ページ目
- 固有値分解:固有値、説明される分散の割合 (%)、固有ベクター負荷
- 派生的メトリクス:条件数、固有値比率、ブルーチャンネル独立性、PC1 優位チャネル
- 次元ティア分類
- 空間的自己相関(ラグ-1、横方向および縦方向)
- 平均局所分散(3x3 近傍)
- 冗長性プロファイル(計算されたメトリクスからロジックで生成)
スーツ概要 (Suite Overview)
24 画像は、フィルムによる写真撮影によって達成可能なインタースレッド冗長性の構成のほぼ全域にわたります。条件数は 7.55 から 1,739.16 に達し、より than two orders of magnitude(約 200 倍)に及ぶ範囲をカバーしており、色彩分布はほぼ球状から極めて楕円状まで広がっています。
次元ティア (Dimensionality Tiers)
| テア | PC1 の範囲 | 数 | 画像 ID |
|---|---|---|---|
| 三次元(PC1 < 75%) | 69.27-73.37% | 3 | kodim02, kodim03, kodim23 |
| 二次元(PC1 75-85%) | 81.60% | 1 | kodim14 |
| 弱一維性(PC1 85-93%) | 86.87-91.91% | 8 | kodim04, kodim05, kodim07, kodim09, kodim11, kodim18, kodim21, kodim22 |
| 強く一維性(PC1 93-97%) | 93.36-96.96% | 7 | kodim01, kodim08, kodim10, kodim12, kodim15, kodim16, kodim19 |
| ほぼ特異(PC1 > 97%) | 97.36-98.42% | 5 | kodim06, kodim13, kodim17, kodim20, kodim24 |
固有ベクター負荷パターン (Eigenvector Loading Patterns)
| パターン | 数 | 画像 ID |
|---|---|---|
| グリーン優位 | 7 | kodim03, kodim05, kodim08, kodim09, kodim10, kodim16, kodim17 |
| グリーングリーン・ブルー結合 | 6 | kodim01, kodim04, kodim11, kodim12, kodim15, kodim21 |
| レッド優位 | 6 | kodim02, kodim06, kodim14, kodim18, kodim19, kodim23 |
| 均衡型 | 4 | kodim07, kodim13, kodim20, kodim24 |
| ブルー優位 | 1 | kodim22 |
スーツ極値 (Suite Extremes)
| メトリック | 低値 | 高値 |
|---|---|---|
| 平均 |r| | kodim23: 0.5595 | kodim20: 0.9903 |
| 条件数 | kodim23: 7.55 | kodim20: 1,739.16 |
| PC1 分散 | kodim03: 69.27% | kodim20: 98.42% |
| ブルー独立性 | kodim15: 2.3% | kodim03: 52.0% |
| 最高単一对の r | kodim20 R-G: 0.9955 | - |
| 最低単一对の r | kodim03 R-B: 0.2890 | - |
プロファイルシートの読み方 (How to Read a Profile Sheet)
- 条件数(λ1/λ3): 最大固有値と最小固有値の比率。高い値は、一つの軸に沿って集中している針型の色彩分布を示します。低い値は、各チャネルが独立した情報を担うより球状の分布を示します。
- ブルーチャンネル独立性: 第一主成分によって捕捉されていないブルーチャンネル分散の割合です。(1 - (blue_loading_PC1^2 × λ1 / Var(B))) × 100 で計算されます。低い値は、ブルーチャンネルが一次変異軸からほぼ完全に予測可能であることを示し、高い値はブルーチャンネルが実質的な独自情報を担っていることを示します。
- 次元ティア: PC1 が説明する分散の割合に基づく分類です。75%、85%、93%、97% の閾値により、三次元からほぼ特異までの 5 つのティアが生じ、これらはインタースレッド冗長性の異なるレジームに対応します。
- 固有ベクターパターン: 第一主成分の負荷構造です。どのチャネルまたはチャネルペアが支配的な分散軸を駆動するかを特定します:均衡型(全チャネルほぼ等しい)、結合型(2 つのチャネルが共同で負荷)、優位型(1 つのチャネルが主導)。
- 空間的自己相関(ラグ-1): 各ピクセルとその直近の隣接ピクセル間のピアソン相関係数です。横方向と縦方向で別々に計算されます。値が 1.0 に近い場合は、滑らかで空間的に整合性のある画像データであることを示します。
ファイル構成 (File Structure)
/ README.md baetzel_2026_kodak_pca_characterization.pdf /baseline/ KODIM01_STATISTICAL_PROFILE.pdf kodim01_stats.json KODIM02_STATISTICAL_PROFILE.pdf kodim02_stats.json ... KODIM24_STATISTICAL_PROFILE.pdf kodim24_stats.json kodak_suite_master_stats.json /docs/ methodology.md
- ルートディレクトリ: 親 PCA 特徴論文とリポジトリの README。
- /baseline/: 24 つの二ページ構成の PDF リファレンスデータシートと 25 つの JSON ファイル(個別計 24 ファイル+合計計 1 ファイル)。
- /docs/: 完全な再現性を保証するための計算パイプラインドキュメント。
参考文献 (References)
[1] Eastman Kodak Company. "Kodak Publication No. PCD-042", 1992. [2] Baetzel, J. (2026). "Statistical Characterization of Inter-Channel Redundancy Structure in the Kodak Lossless True Color Image Suite." [3] Watanabe, S. "Karhunen-Loeve Expansion and Factor Analysis," pp. 635-660, 1965. [4] Giorgianni, E.J. and Madden, T.E. Digital Color Management. Addison-Wesley, 1998.
引用情報 (Citation)
Baetzel, J. (2026). Kodak PCD0992 Statistical Profile Series: Per-Image PCA and Inter-Channel Redundancy Analysis of the Kodak Lossless True Color Image Suite.
ライセンス (License)
統計解析およびプロファイルシートは Jasmine Baetzel(2026)により作成されました。ベンチマーク画像は、Eastman Kodak Company により制限なしの使用を許諾された「コダック・ロスレス・トゥルーカラー・イメージ・スーツ」(PCD0992)からのものであります。