私のランダムフォレストは、主に有効期限までの時間(Time‑to‑Expiry)ノイズを学習していました。

2026/03/17 3:16

私のランダムフォレストは、主に有効期限までの時間(Time‑to‑Expiry)ノイズを学習していました。

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

(欠落していたポイントを組み込む)

要約

著者は、短期ビットコイン価格変動を予測するランダムフォレストモデルを改良し、特徴量最適化の指針として「Out‑of‑Sample Permutation Feature Importance(OOS)」の使用に重点を置いています。OOS はトレーニングセットで学習し、検証データ内の一つの特徴量を入れ替えて外部サンプル AUC の低下を測定します。scikit‑learn のデフォルト Gini 重要度は高カードリナリティ(多値)特徴に偏り、トレーニングデータに大きく依存し、相関変数に等しい重みを与えるため、OOS が選択されました。現在のモデルは5 分間ビットコイン移動に対して AUC 0.7566 を達成しています―つまり、勝ちウィンドウと負けウィンドウを約 76 % の確率で正しくランク付けできることを意味します。しかし予測力は単一の時間関連特徴量(「seconds_to_settle」)に支配されており、過学習や先読みバイアスの可能性が示唆されます。これは、他の変数よりも時刻/満期時間への依存が強いことを意味します。継続的な作業では特徴量のクリーンアップと OOS 手法のさらなる最適化に取り組み、この支配的変数への依存度を減らすことを目指しています。成功した場合、よりバランスの取れたモデルはトレーダーや金融機関に信頼できる短期ビットコイン予測を提供できます。失敗した場合は誤ったシグナルを生成し、金銭的損失につながる可能性があります。

本文

ランダムフォレストのパラメータを調整した後、訓練に使用する特徴量の最適化へ注力しました。
既に小規模なクリーニングは実施済みでしたが、各特徴量の予測重要度はまだ評価されていませんでした。

特徴量の関連性を検証するために Out‑of‑Sample Permutation Feature Importance(OOS) を採用しました。
OOS の手順は主に3つあります:

  1. 訓練データでランダムフォレストを一度学習させる。
  2. 検証データ(テストセット)を取り出し、ある特徴量の値だけをその列内でシャッフルしたデータを手順 1 で学習したモデルに渡す。
  3. シャッフルによって予測性能が 有意に低下 する場合、その特徴量は重要とみなされる。

「アウト・オブ・サンプル」なのは、訓練データと評価データを分離し、ノイズの影響を抑えるためです。
scikit‑learn のデフォルトでは Gini Importance で特徴量を順位付けしますが、私のデータセットには不適切です:

  • 高い 高次元バイアス があり、連続変数に有利。
  • Gini は訓練データのみで計算される。
  • 2つの特徴量が相関していると、フォレストは各ノードで片方を選び、Gini は重要度を分割します。

結果として得られた 0.7566 のアウト・オブ・サンプル AUC は、5 分間のビットコイン価格変動予測に対して現実的には高すぎます。
もしこれが真に正しいなら、ランダムに選んだ勝ちと負けの 5 分間区間で、モデルが約 76 % の確率で勝者を上位に評価できることになります。
つまりこれは金融機関を凌駕する驚異的な成果か、あるいは lookahead バイアス / 過学習 によって指標が膨らんでいる可能性があります。

結論: 「seconds_to_settle」特徴量がモデルに支配的であり、実質的にフォレストは時間帯/満期までの時間からほぼ全てを学習しています。
現在、この特徴量のクリーニングと追加検証作業を進めています。

同じ日のほかのニュース

一覧に戻る →

2026/03/20 5:33

コックピットは、サーバー用のウェブベースのグラフィカルインターフェイスです。

## Japanese Translation: **Cockpit** は、Linux 管理者がオペレーティングシステムから直接サーバーを管理できる軽量でブラウザベースのインターフェイスです。OS 内で動作し、Debian、Fedora、および RHEL など主要なディストリビューションに対応しており、コンテナの起動、ストレージやネットワークの設定、ログの確認、ブラウザを離れずにターミナルとグラフィカルコントロール間で切替えなどが可能です。 ユーザーは Cockpit からでも従来のシェルからでもサービスをシームレスに開始・停止でき、端末で発生したエラーは自動的に Cockpit のジャーナルインターフェイスに表示されます。 プロジェクトはリモート管理もサポートしており、ユーザーは SSH 経由で Cockpit がインストールされた他のマシンを追加・管理できるため、ホスト切替が簡単です。コミュニティサポートは Matrix チャネル(#cockpit:fedoraproject.org)とメールリストで提供されます。ドキュメントにはツールの使い方だけでなくコードベースへの貢献方法も網羅しており、ガイディングプリンシプル、リリースノート、およびプライバシーポリシーが含まれています。 複数の Linux ディストリビューションにわたる統一で使いやすい GUI を提供することで、Cockpit はサーバー管理を効率化し、ドキュメントと活発なコミュニケーションチャネルを通じて継続的な開発者貢献を促進することを目指しています。

2026/03/19 22:05

**Astral が OpenAI に参入**

## Japanese Translation: **(欠落していた詳細を補完)** ### 要約 Astral は、オープンソースの Python ツールを存続させつつ OpenAI の Codex チームに参加することに合意し、そのツールチェーンをモダンな Python 開発の中心に位置付けました。この取引は Astral の創業者が発表し、Python エコシステムの生産性を少なくとも 1 % 向上させる高レバレッジ戦略を強調しています。Ruff(高速リンター)、uv(依存関係解決ツール)、ty といった人気ツールへの継続的なサポートが含まれ、これらを Codex の AI コーディングアシスタントに統合する計画です。Astral のツールチェーンはゼロから数億件の月間ダウンロードへと成長し、Accel が主導した Casey Aylward 氏によるシード資金調達と Andreessen Horowitz が牽引した Jennifer Li 氏によるシリーズ B 資金調達で支えられています。創業者は Astral チームのユーザー重視の製品品質に感謝し、今後も高い基準を維持するとともに、ユーザーの信頼への感謝を表明しました。買収後、Astral はオープンソース提供物の開発を継続し、それらを Codex と統合し、ソフトウェアエンジニアリングにおける影響力を拡大します。これにより、開発者・企業・広範なエコシステムは、生産性を加速させる AI 強化型の堅牢な Python ユーティリティ―基盤となるツールセット―を享受できます。

2026/03/20 2:16

Google、未認証Androidアプリをサイドロードするための新しい24時間プロセスを発表

## Japanese Translation: Googleは2025年後半にAndroid向けの開発者認証プログラムを開始し、開発者が認証されていない場合はサイドロードされたアプリをブロックすることでマルウェアリスクを低減することを目指します。開発者は本人確認書類を提出し、アプリ署名キーをアップロードし、25ドルの手数料を支払う必要があります。 ユーザーは「未認証パッケージを許可」オプションを有効にして認証を回避できます。設定方法は、ビルド番号を7回タップして開発者向けオプションを解除し、スイッチを切り替えてPIN/パスワードで確認し、デバイスを再起動します。その後24時間待ち、次に「一時的に許可」または「無期限に許可」を選択します。24時間の遅延は、高度なソーシャルエンジニアリング攻撃を抑止するためです。 Googleは非Playソースからマルウェアに遭遇する確率が約50倍高いと引用し、このプログラムでそのリスクを低減すると主張しています。検証機能はすでにAndroid 16.1(2025年後半にリリース)に組み込まれており、全てのサポート対象デバイスで利用可能です。実施開始はブラジル、シンガポール、インドネシア、タイで2025年9月から行われ、2026年には世界中へ展開されます。 このプログラムは手数料などのハードルを追加するため、制裁対象国の開発者にとって不利になる可能性がありますが、Googleはその方針がそのような開発者を排除することを意図していないとし、検証済み開発者リストを非永続化に保ち法的課題を回避すると述べています。プライバシー擁護派は検証済み開発者のデータベースについて懸念を示し続けています。

私のランダムフォレストは、主に有効期限までの時間(Time‑to‑Expiry)ノイズを学習していました。 | そっか~ニュース