
2026/04/07 4:50
**Show HN: Ghost Pepper – Mac 用ローカル「ホールド・トゥー・トーク」音声認識アプリ** - **概要** シングルキー(デフォルトは⌘)を押し続けるだけで、Mac 上で話す内容をテキスト化できる軽量かつプライバシー重視のアプリです。クラウド処理は一切行わず、全てローカルで完結します。 - **主な機能** • 即時文字起こし(遅延がほぼゼロ) • 複数言語・方言に対応 • ショートカットやホットキーのカスタマイズ可能 • 内蔵文法校正と句読点自動挿入 • オープンソース(GitHub) - **重要性** • 第三者 API に依存しないため、コスト削減とデータ共有に関する懸念が軽減されます • 開発者・作家・サブスクリプション不要で高速な文字起こしを求める人に最適です - **入手方法** 1. GitHub のリリースページから最新版をダウンロード 2. `GhostPepper.app` を `/Applications` フォルダーへドラッグ&ドロップ 3. アプリを起動し、好みのキー割り当てを設定して話し始める - **フィードバック & サポート** GitHub 上で不具合報告や機能リクエストが受け付けられています。小規模な貢献者コミュニティによって積極的にメンテナンスされています。 *macOS でクラウドを使わず低遅延の音声認識ツールを探しているなら、Ghost Pepper が最適かもしれません。*
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
概要
Ghost PepperはmacOS専用の完全ローカル音声認識アプリで、macOS 14+ Apple Silicon上で動作します。
- プライバシー優先設計: クラウドAPIを使用せず、データはマシンから外部へ出ることがなく、転写結果はメモリ内にのみ保持されます(デバッグログは終了時に消失)。
- 動作方法: Controlキーを押し続けて録音し、離すと自動的に任意のテキストフィールドへ転写結果が貼り付けられます。
- モデルオプション:
- 音声認識モデル: Whisper tiny.en (~75 MB)、Whisper small.en(デフォルト、~466 MB)、Whisper small multilingual (~466 MB)、Parakeet v3 (~1.4 GB)。
- クリーンアップモデル: Qwen 3.5 0.8B (~535 MB, ~1–2 s)、Qwen 3.5 2B (~1.3 GB, ~4–5 s)、Qwen 3.5 4B (~2.8 GB, ~5–7 s)。
- ユーザーインターフェース: メニューバーに表示され、Dockアイコンはありません。ログイン時に自動起動しますが、設定で無効化可能です。
- 権限: マイクロフォンとアクセシビリティの許可が必要です(音声取得およびキーストロークの擬似入力)。
- インストール & ライセンス: DMGからインストールするか、Xcodeでソースをビルドします。アプリはMITライセンスで配布され、WhisperKit、LLM.swift、Hugging Face、Sparkle を使用しています。
- エンタープライズサポート: 管理デバイス上ではMDM PPPCペイロード(Bundle ID
、Team IDcom.github.matthartman.ghostpepper
)を通じてアクセシビリティ許可を事前承認できます。BBVMGXR9AY
Ghost Pepperはクラウドサービスに依存せず、資金調達も大きくなく、完全ローカルで利用できる無料の音声転写代替手段です。
本文
macOS向け 100 % ローカル「話す→テキスト」
- Control キーを押し続けて録音、離した瞬間に文字起こしして貼り付けます。
- クラウド API は一切使用せず、データは全てローカルに留まります。
ダウンロード
- 最新版:macOS 14.0+、Apple Silicon(M1以降)
主な特徴
| 機能 | 説明 |
|---|---|
| Control キーで話す | 離した瞬間に文字起こし&貼り付け |
| 完全ローカル | Apple Silicon 上でモデルを実行、外部へ送信は一切なし |
| スマートクリーニング | ローカル LLM がフィラー語句や自己訂正を除去 |
| メニューバーアプリ | ドックアイコン無し、ログイン時に自動起動 |
| カスタマイズ性 | クリーニングプロンプト編集、マイク選択、機能オン/オフ切替 |
動作原理
Ghost Pepper は全てのモデルをローカルで実行します。モデルは自動ダウンロードされ、ローカルにキャッシュされます。
音声認識モデル
| モデル | サイズ | 目的 |
|---|---|---|
| Whisper tiny.en | ~75 MB | 最速・英語のみ |
| Whisper small.en (デフォルト) | ~466 MB | 英語で最高精度 |
| Whisper small(多言語) | ~466 MB | 多言語対応 |
| Parakeet v3 (25 言語) | ~1.4 GB | FluidAudio 経由の多言語 |
クリーニングモデル
| モデル | サイズ | 実行速度 |
|---|---|---|
| Qwen 3.5 0.8B (デフォルト) | ~535 MB | 非常に高速(1–2 秒) |
| Qwen 3.5 2B | ~1.3 GB | 高速(4–5 秒) |
| Qwen 3.5 4B | ~2.8 GB | 完全品質(5–7 秒) |
音声モデルは WhisperKit、クリーニングモデルは LLM.swift により実装されます。すべてのモデルは Hugging Face から提供されています。
はじめに
- アプリをダウンロード
を取得GhostPepper.dmg- DMG を開き、Ghost Pepper を Applications フォルダーへドラッグ
- Microphone と Accessibility 権限を許可(プロンプトが表示されたら)
- Control キーを押しながら話す
ソースからビルドする場合:
- リポジトリをクローン
を Xcode で開くGhostPepper.xcodeproj- ビルド&実行(Cmd+R)
権限
| 権限 | 用途 |
|---|---|
| Microphone | 音声録音 |
| Accessibility | グローバルホットキーと貼り付けをシミュレート |
便利情報
- 初回起動時に「ログイン時に自動起動」が有効。設定でオフに可能。
- ディスクへのログは一切行わず、文字起こしはファイルへ保存されません。デバッグログはメモリ上のみでアプリ終了と同時に消失します。
参考
WhisperKit, LLM.swift, Hugging Face, Sparkle を使用して開発しました。
ライセンス
MIT
「Ghost Pepper」の由来
全モデルがローカルで動作し、個人情報は外部へ漏れません。無料で提供できるものを、他社が 8,000 万ドルをかけて構築するようなアプリに対抗して作りました。
エンタープライズ / 管理デバイス向け
Ghost Pepper は Accessibility 権限を必要とし、通常は管理者権限で付与します。管理対象デバイスでは IT 管理者が MDM プロファイル(Jamf, Kandji, Mosaic 等)経由で PPPC(Privacy Preferences Policy Control)ペイロードにより事前承認できます。
| フィールド | 値 |
|---|---|
| Bundle ID | |
| Team ID | |
| Permission | Accessibility () |