**Show HN: ChunkHound、ローカル優先型ツールで大規模コードベースを理解する**

2026/01/18 6:03

**Show HN: ChunkHound、ローカル優先型ツールで大規模コードベースを理解する**

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

ChunkHoundはローカルファーストのAIアシスタントで、コードベース全体をインデックス化し、開発者が意味的に検索できるようにします。正規表現サポート付きで複数言語間でも検索可能であり、外部APIは必要ありません。cASTアルゴリズムを使用してファイルを意味のあるチャンクに分割し、マルチホップセマンティックサーチを適用することでコード間の関係性を発見します。Tree-sitterパーサーが30種類のプログラミング言語(Python, JavaScript/TypeScript/JSX/TSX, Java, Kotlin, Groovy, C/C++/C#, Go, Rust, Haskell, Swift, Bash, MATLAB, Makefile, Objective‑C, PHP, Vue, Svelte, Zig)と構成フォーマット(JSON, YAML, TOML, HCL, Markdown)のネイティブサポートを提供し、テキストファイルやPDF用のカスタムパーサーも備えています。

ChunkHoundはMCPフレームワークに統合されており、リアルタイムインクリメンタルインデックス化、スマートディフ、およびシームレスなブランチ切替を実現します。VS Code, Cursor, Windsurf, Zedなどの人気エディタと連携でき、Claude Code CLIやその他LLMバックエンド(Claude, Codex, Anthropic, OpenAI)経由で動作させることも可能です。埋め込みはVoyageAI(推奨)、OpenAI、またはローカルOllamaから取得できます;正規表現検索はオプションのAPIキーを使用して有効にすることができます。

インストールにはPython 3.10+とuvパッケージマネージャーが必要です。クイックスタート設定ファイル(.chunkhound.json)で埋め込みプロバイダーとLLMプロバイダーを指定します。完全なドキュメント、チュートリアル、およびアーキテクチャの詳細はchunkhound.github.ioにて入手できます。

ChunkHoundの価値提案は、意味的検索・正規表現検索・コードリサーチ機能を自動インクリメンタルリアルタイムインデックス化と組み合わせる点にあります。従来のキーワードツールでは欠けている機能であり、RAGソリューションが再インデックスオーバーヘッドのために持たない機能、知識グラフが継続的な同期コストを伴う点とも対照的です。大規模なモノレポでクロスチーム依存関係がある場合や、セキュリティ重視・空気隔離されたローカルプロジェクト、多言語コードベースで一貫したオフライン検索を必要とするケースに特に適しています。

本プロジェクトはMITライセンスの下で公開されています。

本文

ローカルファースト・コードベースインテリジェンス

AI アシスタントはコードを検索できますが、理解に失敗することが多いです。
ChunkHound は、アーキテクチャやパターン、組織知識を任意の規模で抽出し、MCP を通じてスムーズに統合できる、コードベース全体を調査します。


主な機能

  • cAST アルゴリズム – 研究に基づく意味的コードチャンク化

  • マルチホップセマンティック検索 – 直接の一致だけでなく相互に関連するコード関係を発見

  • セマンティック検索 – 「認証コードを探す」など自然言語クエリに対応

  • 正規表現検索 – API キー不要でパターンマッチング

  • ローカルファースト – コードは常に自前のマシン上に保持

  • 30 以上の言語を構造化解析でサポート

    • プログラミング(Tree‑sitter):Python、JavaScript、TypeScript、JSX、TSX、Java、Kotlin、Groovy、C、C++、C#、Go、Rust、Haskell、Swift、Bash、MATLAB、Makefile、Objective‑C、PHP、Vue、Svelte、Zig
    • 設定ファイル:JSON、YAML、TOML、HCL、Markdown
    • テキストベース(カスタムパーサ):テキストファイル、PDF
  • MCP 統合 – Claude、VS Code、Cursor、Windsurf、Zed 等と連携

  • リアルタイムインデックス作成 – ファイル監視・差分検知・ブランチ切替を自動で行いシームレスに


ドキュメント

chunkhound.github.io で完全なガイドをご覧ください。

  • チュートリアル
  • 設定ガイド
  • アーキテクチャ詳細

要件

項目詳細
Python3.10+
パッケージマネージャ
uv
API キー(任意)正規表現検索はキー不要
埋め込みモデルVoyageAI(推奨)、OpenAI、ローカル (Ollama)
コード調査用 LLMClaude Code CLI または Codex CLI(API キー不要)、Anthropic、OpenAI

インストール

# uv が無い場合はインストール
curl -LsSf https://astral.sh/uv/install.sh | sh

# ChunkHound をインストール
uv tool install chunkhound

すぐに始める

プロジェクトルートに

.chunkhound.json
を作成します。

{
  "embedding": {
    "provider": "voyageai",
    "api_key": "your-voyageai-key"
  },
  "llm": {
    "provider": "claude-code-cli"
  }
}

ヒント:Codex を使いたい場合は

"codex-cli"
を指定してください。どちらも同様に機能し、API キーは不要です。

コードベースをインデックス化したら、ドキュメントで高度な設定と IDE のセットアップ方法をご確認ください。


なぜ ChunkHound なのか?

アプローチ能力スケールメンテナンス
キーワード検索正確一致高速なし
従来の RAGセマンティック検索拡張性ありファイル再インデックス化
知識グラフ関係クエリコスト高継続的同期必要
ChunkHoundセマンティック + 正規表現 + コード調査自動インクリメンタル+リアルタイム

以下のようなケースに最適です。

  • クロスチーム依存が多い大規模モノレポ
  • セキュリティ重視でクラウドを使わないコードベース
  • 一貫した検索を必要とするマルチ言語プロジェクト
  • オフライン/エアギャップ開発環境

コードの再作成をやめ、深い理解から始めましょう。


ライセンス

MIT です。

同じ日のほかのニュース

一覧に戻る →

2026/01/18 5:44

トルコ語の格変化をベースとするプログラミング言語

## Japanese Translation: **(全ての重要ポイントを組み込んだもの)** --- ## Kip – ケースベース型研究言語 Kip は、トルコ語の格変化を型システムと構文に埋め込む実験的プログラミング言語です。名詞格接尾辞と母音調和を用いて引数関係を表現し、関数引数の順序を柔軟に変更できる一方で意味は明確に保たれます。 ### コア機能 | 機能 | 説明 | |------|------| | **引数順序** | 格接尾辞が役割を決定します。例:`(5'le 3'ün farkını) yaz.` と `(3'ün 5'le farkını) yaz.` は同じ意味です。 | | **帰納型** | トルコ語構文で宣言します。例:`Bir doğal-sayı ya sıfır ya da bir doğal-sayının ardılı olabilir.` | | **多相型** | 同様に宣言します。例:`Bir (öğe listesi) ya boş ya da bir öğenin bir öğe listesine eki olabilir.` | | **パターンマッチング** | 条件付き接尾辞 `-sa/-se` を使用し、入れ子パターンとワイルドカード `_` をサポートします。 | | **定数** | キーワード `diyelim` で宣言します。例:`sıfırın ardılına bir diyelim.` | | **組み込み型** | 整数 (`tam-sayı`) – 算術、比較、階乗;文字列 (`dizge`) – 長さ、連結、整数へのパース。 | | **I/Oプリミティブ** | 出力:`yazmak/yaz`;入力:`okumak/oku`;シーケンス接尾辞 `-ip/-ıp/-up/-üp`。 | ### 形態論と実装 * Kip はトルコ語の形態解析に TRmorph の有限状態変換器を利用します。曖昧な単語はすべてのパースで表現され、アポストロフィで解消できます。 * コンパイラは Foma(パッケージマネージャ経由)と Haskell Stack を使用し、REPL (`stack exec kip`) で実行するかファイルを `--exec` で実行します。WASM プレイグラウンドは `playground/` 以下にあります。 ### プロジェクト状況 Kip は研究専用プロジェクトです。構文と挙動は進化する可能性があります。キャッシュされたバイトコードファイル (`.iz`) は、コンパイラが変更されると無効になります。 --- この要約はすべての主要ポイントを反映し、元のテキストに忠実でありながらメインメッセージを明確かつ簡潔に保っています。

2026/01/17 20:15

ASCII文字はピクセルではない:ASCIIレンダリングの深掘り解析

## Japanese Translation: **概要** この記事では、各文字を多次元「形状ベクトル」でモデル化することで鮮明で高コントラストのASCII画像を生成できるインタラクティブな画像→ASCIIレンダラーを紹介しています。従来の最近傍サンプリングはセルごとに1ピクセルとして扱い、ジャギーやぼやけた出力が生じます。スーパーサンプリングはジャギーを減らしますが、単一の輝度値へ平均化するためエッジがまだぼやけてしまいます。 新しい手法では、セルの上/下と左/右の半分を小さな円でサンプリングし、各グリフがどのように空間を占有しているかを捉えます。これにより6次元(方向性コントラスト用の外部サンプリングをオプションで追加)形状ベクトルが生成されます。このベクトル空間で最近傍検索を行い、グリッドセルごとに最適な文字を選択します。ベクトル要素を指数関数的に上げることでコントラストを増幅し(全体の対比を高めつつ均一な勾配を保持)、さらに隣接セルをサンプリングする方向性コントラストでシャープ化します。 フレームごとのユークリッド距離計算とサンプリング収集によるパフォーマンスボトルネックは、**k‑d木インデックス**、**量子化キーを用いたキャッシュ**、およびサンプリングとコントラスト段階の **GPUアクセラレーション** を組み合わせて解消し、モバイルデバイスでもスムーズなFPSを実現しています。著者はさらに、各文字に異なる色/明度を割り当てる方法や高次元サンプリングベクトルの探索などの拡張可能性についても概説しています。 最後に、読者は将来の投稿でこれらの開発内容を取り上げる予定のメールリストへの登録を勧められています。

2026/01/18 7:19

ライトモード・インフレーション (Note: “ライトモード”は「軽い(低エネルギー)モード」を指し、物理学や宇宙論の文脈で使われることが多いです。)

## Japanese Translation: **改善された概要** この記事は、macOS のライトモードウィンドウが過去 16 年で徐々に明るくなってきたことを示しており、Snow Leopard(2012)では平均明度が約 71 %だったのが、Mac OS Tahoe ではほぼ 100 %に上昇しています。著者はスクリーンショットをクロップし、Pillow を使ってグレースケールへ変換した後、ピクセル平均強度を算出することで測定しました。この分析は画面全体やアプリケーションの明るさではなく、**ウィンドウクロム**に特化しています。2020 年末に M1 MacBook Air にアップグレード(Big Sur でウィンドウ明度が 85 %から 97 %に増加)した後、著者はダークモードへ切り替えました。ダークモードは Mojave(2018)で導入されました。本研究では、典型的なライトモードウィンドウの最も暗い色が Tahoe では 97 %明度に達する一方、Snow Leopard では 90 %であることを指摘しています。また、iOS 26 の HDR 実装は一部要素を 100 %以上の白に押し上げる可能性があり、知覚される明るさを過大評価する恐れがあると述べています。 著者は、このより明るい UI デザインへの移行がコントラストバイアスによってダーク背景をより魅力的にしていると主張し、ユーザーの目の疲労を軽減しつつアプリ間の視覚的区別を保つために中程度のグレー(約 50 %)インターフェースを推奨しています。将来のデザインへのインスピレーションとして、著者はより高い明るさレベルにもかかわらず、Yosemite などの古い macOS スタイルを好んでいます。 このバージョンは主要なポイントすべてを保持し、ダークモード導入に関する余計な因果推論を削除し、ウィンドウクロムへの焦点を明確にしています。