Show HN: Local Privacy Firewall-blocks PII and secrets before ChatGPT sees them

2025/12/10 1:10

Show HN: Local Privacy Firewall-blocks PII and secrets before ChatGPT sees them

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

PrivacyFirewallは、AIチャットツール(ChatGPT、Claude、Gemini)用のローカルファースト型ファイアウォールであり、PIIやシークレットがプロンプトに漏れないようにブロックします。完全にユーザーのデバイス上で動作し、ブラウザ内または任意のローカルFastAPIサーバー経由で実行されるため、ネットワークトラフィックチェックとオープンソースコードレビューによって確認されたように、データがマシンから外へ出ることはありません。

この拡張機能は2つのモードを提供します。「Lite Mode」では正規表現を使用してメールアドレス、電話番号、APIキー、SSNなどのパターンを即座に検知し、「AI Mode」では軽量な

dslim/bert-base-NER
モデル(約400 MB)をオプションでロードしてより深いエンティティ認識を実行します。ローカルエンジンがオフラインの場合、拡張機能は正規表現チェックにフォールバックします。

プロジェクトには警告用UI要素、ペーストブロックモーダル、および上書きオプションを備えたChrome MV3拡張が含まれています。インストールはPython 3.10+、Chrome/Chromium/Edge、およびGitが必要です。オプショナルエンジンを実行すると、Hugging Faceモデルが

~/.cache/huggingface
にダウンロードされ、
127.0.0.1:8765
でFastAPIサーバーが起動します。

今後の計画としては、拡張設定UI、サイトごとの許可/拒否リスト、自動シークレット削除、エンジンをバイナリまたはデスクトップアプリとしてパッケージ化、ブラウザ内推論用transformer.js、および自動CI/ブラウザテストがあります。

PrivacyFirewallは、メールアドレス、電話番号、APIキー、認証情報、顧客データ、IP/MACアドレス、内部ログ、PII/PHIなどの漏洩を防ぎます。従来のDLPツールではAIチャットプロンプトで見逃されがちな規制対象個人情報に対して有効です。本プロジェクトはMITライセンスで提供されており、ライセンスファイルが含まれています。PRやIssueを通じて詳細な再現手順とモデルバージョン情報を添えて貢献を歓迎します。

本文

PrivacyFirewall
(ローカルAIプライバシーシールド / ローカルLLM DLP)


⭐ 24時間で100+スター | 🍴 7フォーク | 🔥 トレンド

“主要なセキュリティ課題を解決” — セキュリティ専門家
“非常に洗練された印象的なソリューション” — LinkedInユーザー

👋 PrivacyFirewall を試している方はぜひリポジトリにスターを付けてください!
他の人がプロジェクトを発見しやすくなるとともに、開発へのモチベーションにも繋がります。
2秒で完了 → ⭐(右上)


PrivacyFirewall とは?

ChatGPT・Claude・Gemini 等の AI ツール向けのローカル優先型 PII/シークレットファイアウォールです。

  • リスクの高い貼り付けイベントをブロック
  • タイピング中に警告表示
  • 必要に応じて軽量なオンデバイス Transformer モデルでより深い PII 検出を実施

🔒 データは一切外部へ送信されません – ブラウザ内、またはオプションのローカル API 上で全処理が完結します。
ネットワークパネルを確認し、オープンソースコードをレビューしてご自身で検証してください。


このプロジェクトが存在する理由

現代の AI ツールは機密情報漏洩を極めて容易にしています:

機密データ
メールアドレス・電話番号
john.doe@example.com
+1-555-1234
API キー・認証情報AWS キー、JWT トークン
顧客・従業員データ名前、住所
IP & MAC アドレス
192.168.1.1
00:0a:95:9d:68:16
内部ログ・スタックトレースデバッグ出力
規制対象の個人情報(PII/PHI)SSN、医療記録

従来型のエンタープライズ DLP は AI チャットプロンプトをカバーしていません。
PrivacyFirewall はテキストが第三者 AI システムに届く前に ゼロ・トラスト のプライバシーシールドを追加します。


PrivacyFirewall が提供する機能

  • ✋ 人間の判断で誤送信を防止(ヒューマンインザループ)
  • 🔒 100 % ローカル処理(ブラウザ+ローカルホストのみ)
  • ⚡ 実用的な保護:正規表現 + オプションの Transformer NER
  • 🧩 使いやすい UX:警告、貼り付けブロックモーダル、上書きオプション
  • 🛠 OSS & 可監査性(MV3 + FastAPI + Hugging Face スタック)

動作原理 – 二重防御

Lite モード(正規表現のみ)

拡張機能内で即時実行。セットアップ不要。

AI モード(オプション、ローカル LLM)

Python FastAPI エージェント+Transformer モデルを用いて深層検出(人物・組織・場所・文脈エンティティ)。

高水準アーキテクチャ

graph TD
    A[ユーザーが貼り付け/入力]:::blueNode -->|インターセプト| B(Chrome Extension):::blueNode
    B -->|正規表現チェック| C{シークレット/PII あり?}
    C -->|はい & 貼り付け| D[ブロック&警告]:::redNode
    C -->|はい & タイピング| E[警告バナー表示]:::redNode
    C -->|いいえ| F{ローカルエンジン稼働?}
    F -->|無い| G[許可]:::blueNode
    F -->|有る| H[Python ローカルエンジン]:::blueNode
    H -->|BERT モデル| I{AI が PII を検出?}
    I -->|はい & 貼り付け| D
    I -->|はい & タイピング| E
    I -->|いいえ| G

    classDef blueNode fill:#2563eb,stroke:#1e40af,color:#fff
    classDef redNode fill:#dc2626,stroke:#b91c1c,color:#fff
  • 正規表現モードで速やかにシークレットを検知
  • AI モードはローカルエンジンが稼働中に検出精度を向上
  • エージェントがオフラインの場合、拡張機能は自動的にフォールバック

🚀 クイックスタート(ローカル開発)

前提条件

アイテムバージョン
Python3.10+
Chrome/Chromium/Edge最新
Git任意

1) クローン

git clone https://github.com/privacyshield-ai/privacy-firewall.git
cd privacy-firewall

2) ローカルエンジンを起動(AI モード用、オプション)

cd src/engine
python -m venv .venv
source .venv/bin/activate          # Windows: .venv\Scripts\activate
pip install --upgrade pip
pip install -r requirements.txt
uvicorn main:app --host 127.0.0.1 --port 8765

初回実行時に

dslim/bert-base-NER
(約400 MB)が
~/.cache/huggingface
にダウンロードされます。
ステータス確認:
http://127.0.0.1:8765/health → {"status":"ok"}

3) Chrome 拡張機能をインストール

  1. chrome://extensions
    を開く
  2. Developer mode を有効にする
  3. Load unpacked をクリックし、
    src/extension/
    を選択

Lite モード(正規表現ベース)が稼働します。

4) テスト

以下のいずれかを開く:

貼り付け:

My email is john.doe@example.com

→ 貼り付けがインターセプトされ、モーダル表示。
AWS キーを貼り付けるとブロック。

AI モードを有効に(ポップアップ UI が準備できたら)入力:

Meeting notes from Sarah Thompson at HR...

→ ローカル Transformer が

PERSON
を検知し警告表示。


🔍 検出カバレッジ

モード検出パターン
Regex Mode(高速・オフライン・デフォルト)メールアドレス、電話番号、クレジットカード候補、MAC アドレス、IPv4 アドレス、AWS アクセスキー、JWT トークン、プライベートキー区切り文字列、汎用 API キー/ハッシュパターン、米国 SSN(基本パターン)
AI Mode(ローカル Transformer, dslim/bert-base-NER)PERSON、ORGANIZATION、LOCATION、その他名詞エンティティ

曖昧または文脈依存の漏洩に有効です。


📁 プロジェクト構成

  • src/extension/
    – Chrome MV3 拡張(コンテンツスクリプト・バックグラウンドワーカー・UI 資産)
  • src/engine/
    – FastAPI サービス + Transformer モデルラッパー
  • src/engine/models/
    – モデルユーティリティ(Hugging Face パイプライン)
  • src/engine/tests/
    – 検出テストハーネス

モデル & キャッシュの注意点

  • HuggingFace モデルは
    ~/.cache/huggingface/
    に保存
  • フルダウンロードを強制したい場合はこのディレクトリを削除

🛠️ 今後の改善予定

  • 拡張機能設定 UI(正規表現/AI モードの有効化・無効化)
  • サイト別許可/拒否リスト
  • 完全ブロックではなくシークレットタイプごとのレダクション
  • エンジンをバイナリまたはデスクトップアプリとしてパッケージ化
  • transformer.js
    を用いたブラウザ内推論の検討
  • CI + ブラウザテスト自動化

❗ トラブルシューティング

症状対処
“Engine Offline” バナー表示Python エンジンが稼働しているか確認し、ポート 8765 が他で使用されていないかチェック。Lite モードは正規表現ベースで機能します。
「入力した名前が検出されない」AI モードを有効にし、エンジンがオンライン状態か確認。NER モデルは確率的なので長い名前ほど精度が上がります。信頼閾値は
transformer_detector.py
で調整可能です。

🤝 コントリビューション

PR と issue は歓迎です!
以下を含めてください:

  • OS & ブラウザバージョン
  • 再現手順
  • モデルバージョン(AI の誤検知・見逃し報告時)

🔐 セキュリティ & プライバシーに関する注意

  • プロンプトやテキストは一切外部へ送信されません。
  • 拡張機能が通信するのは:
    • ブラウザローカルコンテキスト
    • オプションで
      127.0.0.1:8765
      のローカルホスト API
  • アナリティクス、テレメトリー、外部ログは一切行いません。
  • src/extension/content-script.js
    と DevTools → Network タブを確認して挙動を検証してください。

📄 ライセンス

MIT License – 詳細は

LICENSE
をご覧ください。

同じ日のほかのニュース

一覧に戻る →

2025/12/12 3:04

GPT-5.2

## Japanese Translation: **OpenAIのGPT‑5.2リリース** OpenAIは、プロフェッショナルな知識作業を対象とした3つのバリアント(Instant、Thinking、Pro)を含む新しいモデルシリーズGPT‑5.2を公開しています。 **パフォーマンスハイライト** *スピード & コスト*: GPT‑5.2 Thinkingは、歴史的指標に基づくと、人間専門家のコストの1%未満で、出力速度が11倍以上速いです。 *精度*: GDPval(44職種)では、Thinkingが新しい最先端70.9 %を達成し、業界プロフェッショナルを70.9 %のタスクで上回ります。また、SWE‑Bench Proで55.6 %、SWE‑Bench Verifiedで80 %を達成し、幻覚(hallucinations)を約30 %削減します。 *長文コンテキスト & ビジョン*: モデルはOpenAI MRCRv2(≈100 %精度、256kトークン)で新たな最先端を設定し、チャート推論とソフトウェアインターフェース理解のエラー率を半減します。 *ツール使用*: GPT‑5.2 ThinkingはTau2‑bench Telecomで98.7 %を達成し、遅延感受性ワークフローにおいてGPT‑5.1を上回ります。 *科学ベンチマーク*: ProはGPQA Diamondで93.2 %、FrontierMath(Tier 1–3)で40.3 %成功率、ARC‑AGI‑1で>90 %を達成し、ThinkingはARC‑AGI‑2で54.2 %を記録します。 **ユーザーへの影響** 平均的なChatGPT Enterpriseユーザーは毎日40–60分の節約を報告しており、重度利用者は週に10時間以上削減しています。この効率向上により、特定タスクの人件費が99 %超で削減される可能性があります。 **インプリケーション** GPT‑5.2の広範な機能(スプレッドシート、プレゼンテーション、コード、画像認識、長文コンテキスト推論、ツール使用、複雑な多段階プロジェクト)は、金融・ソフトウェア工学・科学研究などのプロフェッショナルドメインでAI採用を加速させる位置づけです。

2025/12/12 5:46

Denial of service and source code exposure in React Server Components

## Japanese Translation: React は Server Components 機能における 2 つの重大なセキュリティ脆弱性(CVE‑2025‑55184(Denial of Service、CVSS 7.5)と CVE‑2025‑55183(Source Code Exposure、CVSS 5.3))に対するパッチをリリースしました。いずれの脆弱性も Remote Code Execution を可能にしないため、既存の React2Shell パッチは有効なままです。 バグは `react-server-dom-webpack`、`react-server-dom-parcel`、および `react-server-dom-turbopack` のそれぞれ 19.0.0/1、19.1.0‑1.2、および 19.2.0‑1 バージョンに影響します。修正リリースは 19.0.2、19.1.3、そして 19.2.2 です;これらのいずれかを直ちにインストールしてください。 対象となる React フレームワーク/バンドラーには Next.js、react‑router、waku、@parcel/rsc、@vite/rsc-plugin、および rwsdk が含まれます。アプリケーションが Server Components またはそれをサポートするバンドラー/プラグインを使用していない場合、影響はありません。 DoS 脆弱性は、特定の HTTP リクエストを逆直列化すると無限ループに陥り、ソースコード脆弱性は任意の Server Function の文字列表現(stringified body)を返し、ハードコーディングされた秘密情報が漏洩する恐れがあります。 React Native を monorepo で使用している場合、影響を受ける `react-server-dom-*` パッケージだけを更新すれば十分です;core の `react/react-dom` バージョンは変更不要です。 ホスティングプロバイダーは一時的な緩和策を適用していますが、サーバー停止や秘密情報の偶発的漏洩を防ぐために開発者は依存関係を直ちに更新する必要があります。 --- *上記の要約をそのまま保持したい場合は、元のまとめを繰り返してください。

2025/12/12 3:17

Rivian Unveils Custom Silicon, R2 Lidar Roadmap, and Universal Hands Free

## Japanese Translation: RivianはエンドツーエンドのAIスタックを拡張することで自動運転車市場でリーダーになるという野心を固めています。 - **ハードウェア&ソフトウェア**:同社は、5 nmマルチチッププロセッサ「RAP1」を発表しました。このプロセッサは1600 sparse INT8 TOPSを提供し、新しいGen 3 Autonomy Computerで秒間50億ピクセルの処理が可能です。また、自社開発のAIコンパイラとプラットフォームソフトウェアも構築しています。 - **認知モジュール**:ACM 3は2026年後半にR2で初登場し、最初はLiDARを装備せず、後にカメラとレーダーとともに追加されます。 - **ソフトウェア展開**:Universal Hands‑FreeはGen 2 R1T/R1S車両向けにリリースされ、米国・カナダの3.5 百万マイル以上の道路で明確に描画されたレーンラインをカバーし、現在のオーナーの支援走行領域を拡大します。 - **Autonomy+**:階層化された機能セットが2026年初頭に登場予定で、1回限り2,500ドルまたは月額49.99ドルで提供されます。 - **データ基盤**:RivianはUnified Intelligenceを中心とした組織再編を行っており、このデータフレームワークはテレメトリ、クラウドモデル、サービスシステム、および顧客機能を結びつけ、予知保全・診断・AIツールの実現を可能にします。 - **音声アシスタント**:次世代Rivian Assistantは2026年初頭にGen 1/2車両で登場し、R2ではより強力なインフォテインメントコンピュータを使用して完全オフラインで動作させることでレイテンシを低減します。 - **サービスワークフロー**:テレメトリと車両履歴を分析するAI駆動の専門家システムはすでにサービスワークフローに組み込まれており、技術者が問題箇所を迅速に特定できるようになっています。類似ツールはモバイルアプリにも計画されており、自助診断をサポートします。 これらの動きは、最先端のコンピューティングハードウェア、データ中心のプラットフォーム、拡張された支援走行機能、およびAI強化保守を車両ラインナップ全体に統合することで、Rivianの競争力を深めます。