Show HN: Ktx – データエージェント用のオープンソース実行可能コンテキストレイヤー

2026/05/29 0:05

Show HN: Ktx – データエージェント用のオープンソース実行可能コンテキストレイヤー

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

KTX は、AI エージェントが承認済みのメトリック定義、結合可能なカラム、および組み込みのビジネス知識を活用してデータウェアハウスを正確にクエリできるよう教導する自己向上型のコンテキストレイヤーです。Notion や dbt などのソースから企業の知識を自動的に学習し、データスタックをマッピングしてセマンティック層を構築、実行時にエージェントへ提供することで、手動のメンテナンスや標準 LLM サブスクリプションを超える追加の使用量課金を不要にします。汎用的なエージェントがデータタスクで苦戦するのと対照的に、KTX はウィキコンテンツを取り込んでコンテキストを整備し、重複を除去し、矛盾箇所をレビューのためにフラッグします。メタデータと使用パターンをキャプチャし、結合可能なカラムを検出するとともに、シャスムトラップやファントラップなどの複雑なスキーマ問題を自動的に解決し、宣言的なメトリック取得を実現します。CLI ツールおよび MCP ツールの両方を暴露するため、ウィキコンテンツとセマンティック層エンティティを対象とした全文検索とセマンティック検索を組み合わせた機能を備えています。KTX は、エージェント(例:Claude Code、Cursor)が承認済みの定義でデータウェアハウスをクエリしたり、正則な SQL を再利用してゼロから新しいクエリを発明する必要がないことを望むユーザーに強く推奨されます。インストールは

npm install -g @kaelio/ktx
で行われ、その後に
ktx setup
で構成し、
ktx status
でステータスを確認します。プロジェクト構成には
ktx.yaml
(コンフィグ)、
semantic-layer/
(YAML ソース)、
wiki/
(コンテキスト)、
.ktx/
(ローカル状態、git 無視)が含まれます。ホストサービスは必要なく、ローカルの MCP デモンは
ktx mcp start
でオンデマンドで起動します。PostgreSQL、Snowflake、BigQuery、ClickHouse、MySQL、SQL Server、SQLite の主要なデータベースおよび dbt、MetricFlow、LookML、Looker、Metabase、Notion などのスタックと互換性があります。ローカルで読み取り専用データベース接続を介して動作するため、データウェアハウスへの書き込みは行わず、Anthropic API、Google Vertex AI、AI Gateway、そしてローカルの Claude Code セッションなどの AI プロバイダーをサポートします。

Text to translate:

KTX is a self-improving context layer that teaches AI agents to query data warehouses accurately using approved metric definitions, joinable columns, and built-in business knowledge. It automatically learns company knowledge from sources like Notion and dbt, maps your data stack, builds a semantic layer, and serves agents at execution—eliminating the need for manual upkeep or extra usage billing beyond standard LLM subscriptions (works with your own LLM API keys or Claude Pro/Max). Unlike general-purpose agents that struggle with data tasks, KTX ingests wiki content to organize context, removes duplicates, and flags contradictions for review. It captures metadata and usage patterns, detects joinable columns, and resolves complex schema issues such as chasm traps and fan traps automatically, enabling declarative metric fetching. Exposing both CLI and MCP tools, it offers combined full-text and semantic search across wiki content and semantic-layer entities. KTX is highly recommended for users wanting agents (e.g., Claude Code, Cursor) to query warehouses with approved definitions or reuse canonical SQL instead of inventing new queries from scratch. Installation is done via

npm install -g @kaelio/ktx
, followed by configuration with
ktx setup
and status checks using
ktx status
. The project layout includes
ktx.yaml
for config,
semantic-layer/
for YAML sources,
wiki/
for context, and
.ktx/
for local state (git-ignored). No hosted service is required; the local MCP daemon runs on demand via
ktx mcp start
. It works with major databases including PostgreSQL, Snowflake, BigQuery, ClickHouse, MySQL, SQL Server, and SQLite, and integrates with stacks like dbt, MetricFlow, LookML, Looker, Metabase, and Notion. Running locally with read-only database connections, KTX never writes to the warehouse and supports AI providers such as Anthropic API, Google Vertex AI, AI Gateway, and local Claude Code sessions.

本文

ktx: 自発的に改善されるコンテキスト層

ktx
は、承認済みの指標定義結合可能な列、そして組織のビジネス知識に基づいて、エージェントにデータを正確に照会させる方法を教えるために設計されています。これにより、従来の意味層(Semantic Layer)や汎用型エージェントの問題点を自動で解決します。

注意:

ktx
を使用する際は、ご自身の LLM API キーまたは Claude Pro/Max サブスクリプションをご利用ください。追加の利用料はかかりません。


なぜ ktx か

汎用型エージェントはデータ関連のタスクにおいて、倉庫を再探索したり、独自ロジックで数値を返すなどの課題を抱えています。

ktx
は以下を自動的に実行します:

  • 組織の知識から学習: Wiki の内容を整理し、矛盾箇所をフラグ立てて人間レビューに回します。
  • データスタックのマッピング: テーブルメタデータを捕捉し、結合可能な列を検出、注釈を追加します。
  • 意味層の自動構築: 生データと上位指標を組み合わせたジョイングラフにより、シャズムトラップやファントラップを解決し、標準 SQL を宣言的に取得できます。
  • 実行時のサービス提供: Wiki と意味論的検索を組み合わせた CLI および MCP ツールを公開します。

ktx の比較機能

機能汎用型エージェント従来の意味層ktx
倉庫コンテキストの自動構築××
結合可能な列検出+トラップ解決×手動
承認済み・再利用可能な指標定義×
Wiki/Notion/チーム知識の取り込み××
ソース間の矛盾フラグ立て××
エージェント実行用 CLI+MCP一部×
デザイン上読み取り専用なしなし

ktx は誰のためのものか

ご利用の対象者

  • クラウドエージェント(Claude Code, Codex, Cursor, OpenCode など)が、承認済みの指標定義を使って倉庫を照会したい方。
  • ビジネス知識が dbt、Looker、Metabase、Notion、およびチームの Wiki に散在している方。
  • エージェントに各プロンプトごとではなく、標準 SQL の再利用を望む方。

ご導入をご検討の皆様

  • SQL ウェアハウスを持っていない方
    ktx
    はその上層に動作します)。
  • アドホックなクエリのみが必要な場合(psql またはノートブックで対応可能です)。

互換性のあるデータベース: PostgreSQL, Snowflake, BigQuery, ClickHouse, MySQL, SQL Server, SQLite。

連携可能なツールの指標層: dbt, MetricFlow, LookML, Looker, Metabase, Notion。


クイックスタート

環境構築と設定を行うための初歩的なコマンドです。

npm install -g @kaelio/ktx
ktx setup
ktx status

セットアップ概要

ktx setup
コマンドは以下の処理を行います:

  • ローカルな
    ktx
    プロジェクトの作成または再開
  • プロバイダーへの接続構成
  • コンテキストの構築
  • エージェントとの統合インストール

ktx status
の出力例

ktx project: /home/user/analytics
Project ready: yes
LLM ready: yes (claude-sonnet-4-6)
Embeddings ready: yes (text-embedding-3-small)
Databases configured: yes (warehouse)
Context sources configured: yes (dbt_main)
ktx context built: yes
Agent integration ready: yes (codex:project)

ヒント: すでにエージェントをご利用の方、プロジェクトディレクトリから Claude Code、Codex、Cursor、または OpenCode に

npx skills add Kaelio/ktx --skill ktx
を実行してください。これにより
ktx
スキルをインストールおよび構成できます。

重要:

ktx status
の出力に
ktx mcp start --project-dir ...
が表示された場合は、エージェントクライアントを開く前に必ずそのコマンドを実行してください。

主要コマンド一覧

コマンド用途
ktx setup
プロジェクトの作成、再開、または更新
ktx status
プロジェクトの準備状態の確認
ktx ingest
設定された接続ごとのコンテキスト構築
ktx sl "revenue"
意味論的ソース(指標)の検索
ktx wiki "refund policy"
ローカル Wiki ページの検索
ktx mcp start
エージェント用 MCP サーバーの起動

詳細なオプションについては CLI リファレンス をご参照ください。


プロジェクトの構造

基本的なディレクトリ構成は以下の通りです。

my-project/
├── ktx.yaml                         # プロジェクト設定(コミット対象外)
├── semantic-layer/<connection-id>/  # YAML 形式の意味論的ソース
├── wiki/global/                     # シェアされたビジネスコンテキスト
├── wiki/user/<user-id>/             # ユーザー固有のノート
├── raw-sources/<connection-id>/     # インゲストされたデータおよびレポート
└── .ktx/                            # ローカル状態および機密情報(.gitignore に設定)
  • コミット対象外:
    ktx.yaml
    ,
    semantic-layer/
    ,
    wiki/
  • ローカールーム:
    .ktx/
    は必ずローカルに残してください。

プロジェクトの解決順序

スクリプトで使用する場合、以下の優先順位で解決されます:

  1. KTX_PROJECT_DIR
    環境変数
  2. 最も近い
    ktx.yaml
    ファイル
  3. 現在のディレクトリ

スクリプトでの使用時は、必ず

--project-dir <パス>
を引数に渡してください。


FAQ(よくある質問)

Q: ktx はスキーマまたはクエリ結果をホストされたサービスに送信しますか? A: いいえ。

ktx
はローカルで動作します。データが外部へ移動するのは、設定した LLM プロバイダーへ送信する分だけです。

Q: どの LLM バックエンドに対応していますか? A: Anthropic API, Google Vertex AI, AI Gateway、および Claude Agent SDK を介した ローカルの Claude Code セッションに対応します。(詳細:LLM 構成

Q: ktx と dbt や MetricFlow の意味層の違いは何ですか? A:

ktx
はそれらの意味層を読み込み、生データのテーブルへの内省と Wiki コンテンツを組み合わせます。エージェントは複数の断片的な情報源ではなく、1 つの統合された検索可能表面を得られ、またソース間の矛盾もフラグ立ててくれます。

Q: ktx は実行中のサーバーが必要ですか? A: ホストされたサービスはありません。エージェントクライアントが必要とする時だけ、

ktx mcp start
を通じてオンデマンドで ローカルの MCP デーモンが起動します。

Q: ウェアハウスは安全ですか? A: はい。接続は読み取り専用であり、

ktx
はデータベースに書き込むことはありません。


ドキュメント一覧


コミュニティとサポート

  • Slack: 質問をしたり、構築された成果を共有したり、維持者と一緒にチャットしたりできます。
  • GitHub Issues: バグ報告や機能リクエストを受け付けています。
  • コントリビューション: リポジトリのセットアップ、テスト実行、および PR の公開が可能です。

開発環境での構築

以下のコマンドを実行することで、開発環境を構築できます。

git clone https://github.com/kaelio/ktx.git
cd ktx
pnpm install
uv sync --all-groups
pnpm run build
pnpm run check

ktx
pnpmuv を使用したワークスペースです。主要なモジュール構成は以下の通りです:

パス目的
packages/cli
TypeScript CLI および公開される npm パッケージのソース
packages/cli/src/context
コアコンテキストエンジン
packages/cli/src/llm
LLM と埋め込みプロバイダー
packages/cli/src/connectors
データベーススキャンコネクタ
python/ktx-sl
意味論的層クエリ計画
python/ktx-daemon
ポータブルコンピューティングサービス

ローカル開発用 CLI

pnpm run setup:dev
pnpm run link:dev
ktx-dev --help

便利なチェックコマンド

  • 型チェック:
    pnpm run type-check
  • テスト実行:
    pnpm run test
  • デッドコード検出:
    pnpm run dead-code
  • Pytest 実行:
    uv run pytest -q

テレメトリ(利用状況)

ktx
は、インタラクティブな CLI の実行から、以下の目的で匿名の利用テレメトリを収集します:

  • セットアップの改善
  • コマンドの信頼性向上
  • データエージェントワークフローの強化

記録されない情報: ファイルパス、ホスト名、SQL、スキーマ名、エラーメッセージ、または

argv
は記録されません。イベントカタログとオプトアウトオプションについては詳細をご覧ください。


ライセンス

ktx
Apache License Version 2.0 のライセンス条項に従っています。LICENSE ファイルをご参照ください。

同じ日のほかのニュース

一覧に戻る →

2026/05/29 1:49

Claude Opus 4.8

## Japanese Translation: Claude Opus バージョン 4.8 が正式にリリースされ、前世代と比較してコストが同等あるいは優位でありながら、パフォーマンスと信頼性の大幅な向上を示しています。このアップグレードは、Super-Agent ベンチマークにおけるすべての課題を制覇した最初のモデルとなった点で重要なマイルストーンとなります。同時に、高速モードや Genie といった特定のオーケストレーターを通じて比較的低価格帯のプランでも、ハイエンドクラスの GPT-5.5 に匹敵する性能を提供します。重要なのは、以前の問題だったコード生成の不備やツール呼び出しのエラーが解決されており、モデルの誠実性の向上により、コードの不備を見逃す確率が約 4 分の一に抑制されたことです。新しいアーキテクチャは「動的ワークフロー」を導入し、フルコードベース移行など大規模なタスクのために数百もの並列サブエージェントを可能にします。また、「Effort Control」といった機能によりユーザーが応答の深さをカスタマイズでき、Messages API のシステムエントリーを通じて計算リソースを浪費せずにリアルタイムで指示を更新することも可能です。複雑な財務文書や法律文書の処理において、Genie や Hebbia などのオーケストレーターを利用する企業は、大幅に向上した効率性と引用の精度を享受できます。全体として、Opus 4.8 は優れた推論能力、ユーザーの自律性を支える親社会的なアライメント、そして以前の コストパフォーマンス記録を更新し得るエンドツーエンドの完了機能を備えています。

2026/05/29 3:41

持続的なワークフローには PostgreSQL をそのまま使用してください

## Japanese Translation: 記事は、複雑な外部オーケストレーションサーバーを置き換え、永続的なワークフロー管理の中央エンジンとして PostgreSQL を採用することでインフラストラクチャを単純化することを提唱しています。Temporal や AWS Step Functions、Airflow といった専用のオーケストレーターに依存し、隔離されたワーカープール間でタスクを調整する従来のシステムとは異なり、このアプローチではオーケストレーションロジックを直接データベースに埋め込むことで、すべてロジックをリレーショナルデータベースエコシステム内に維持します。アプリケーションサーバーは標準的な workflows テーブルポーリングによってタスクをデキューし、ワーカーは Postgres テーブルに直接チェックポイントを行います。データベースの整合性制約が外部ロック機構なしで重複作業を防ぎます。高い可用性は、ワーカーが相互置換可能であることから達成されます(任意のワーカーがストリーミングレプリケーションと複数 AZ デプロイメントを使用して Postgres から状態を回復できます)。スケーラビリティは基盤となるデータベースの容量とともに拡大し、数千ものワークフローを処理できるよう垂直にスケールするか(CockroachDB などのように)分散化することができます。可観測性はチェックポイントに対する組み込み SQL クエリによって向上し、セキュリティオーバーヘッドは減少します(ワークフローデータが信頼された Postgres エンビロメント外に出ることはありませんので、別のオーケストレーターを強化する必要がありません)。DBOS は実用的な Postgres 裏付けの永続実行ソリューションを提供しており、Quickstart ドキュメント、GitHub リポジトリ、Discord コミュニティにてリソースを利用できます。

2026/05/29 4:02

多種多様な LLM のにおい

## Japanese Translation: 2026 年 5 月 28 日、著者は昨年終わりごろに数学ブログを立ち上げ、大規模言語モデル(LLM)を使用して文章を推敲した経験について考察する。当初は単なる改修のみを意図していたが、やがてインターネット全体にわたって同様の文構造が無数に出現することに気づき、これを「AI 臭」と呼んでいる。このような言語的な人工物の例としては、過度なツッコミポイント、あるいは「ただし、傾きは偶然ではない。それは最適解の形状である」といった連続した短い文や、「X は Y の Z であり」(例:「不愉快さは、選択した勾配を進むことの可視的签名である」)といった硬直的なメタセンテンスがある。また、「人類は対称性を信頼するのは、それが知性の可視化のように感じられるから」といった例も含まれる。また、AI 関与を識別するための視覚的な指標もある:ウェブサイトでは通常、JetBrains Mono フォントを特定の UI パターン(例:正確な段階ごとの箇条書きリスト、同一のボタン、標準化されたカード、点滅するドットのバッジ)と組み合わせて使用することが多い。脚注も別の指標として機能し得る。ガイドは AI ツールに対する非難ではなく、読者がこれらの新たな様式基準を認識することを助け、デジタルコンテンツをより適切に評価できるようにすることを目的としている。著者は LLM を創造的なタスクに使用することに反対しているのではなく、人間の表現と機械生成の出力を区別する検出可能な痕跡を特定することに焦点を当てていることを明記する。 ## Text to translate: Summary: On May 28, 2026, the author reflects on their experience starting a math blog late last year and using Large Language Models (LLMs) to polish their writing. Initially intending only enhancements, they soon noticed that identical sentence structures began appearing ubiquitously across the internet—signals they term "AI smells." These linguistic artifacts include excessive punchlines, consecutive short sentences such as "Yet the tilt is not an accident. It is the shape of the optimum," and rigid meta-sentences like "X is the Y of Z" (e.g., "Cringe is the visible signature of moving along a gradient you chose.") as well as examples like "Humans trust symmetry because it feels like intelligence made visible." Visual markers also help identify AI involvement: websites often use the JetBrains Mono font paired with specific UI patterns such as exact step-by-step bullet lists, identical buttons, standardized cards, and blinking-dot badges. Footnotes may serve as another indicator. Rather than condemning AI tools, the guide aims to help readers recognize these emerging stylistic standards so they can better evaluate digital content. The author clarifies that they are not against using LLMs for creative tasks; instead, the focus is on identifying detectable traces that distinguish human expression from machine-generated output.

Show HN: Ktx – データエージェント用のオープンソース実行可能コンテキストレイヤー | そっか~ニュース