ビーグル(Beagle)―ASTツリーを格納するソースコード管理システムです。

2026/03/08 22:28

ビーグル(Beagle)―ASTツリーを格納するソースコード管理システムです。

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

Beagle は、コードをプレーンファイルやバイナリではなく抽象構文木(AST)として保存する実験的な自己ホスト型ソースコード管理システムです。すべてのコード関連データ―チケット、CI結果など―を単一のデータベースハブとして機能し、現在は RocksDB をキー・バリュー ストアとして使用しています。AST の変更にわたって一貫性を保つために CRDT に似た形式である BASON が採用されています。

ユーザーは簡易 CLI コマンドを通じて Beagle と対話します:

  • be post //replicated.live/@gritzko/librdx
    はプロジェクト(リポジトリとパス)を投稿し、デフォルトでローカルディレクトリ
    $HOME/.be
    に保存します。
  • 投稿後、Beagle は各ファイルの状態を行単位で報告します(例:「OK h ast/tree-sitter/point.h」)。
  • RocksDB ディレクトリ (
    $HOME/.be/replicated.live/
    ) を調べると内部データ構成が確認できます。
  • be get //replicated.live/@gritzko/librdx
    はプロジェクトのコード(約 100 万行)を取得し、リポジトリ名、プロジェクト名、ブランチ、ベースファイル数(約 574)、ウェイポイント数などのメタデータを表示します。

まだ初期段階ですが、Beagle は AST ベースのツールでチームがより効果的に協力できるようコード情報を集中化することを目指しています。今後の更新ではコマンドインターフェイスを通じてさらに豊富なデータを公開し、追加リポジトリやブランチへのサポート拡大が期待されますが、ユーザーは実験的ソフトウェアに伴う典型的なリスクを認識しておく必要があります。

本文

Beagle SCM

Beagle は、バイナリブロブの代わりに AST(抽象構文木)を保存するソースコード管理システムです。
コードのデータベースとして機能し、コード関連のすべての活動のハブとなり、チケットや CI の結果など関連情報も格納します。バックエンドストアは任意のキー・バリュー型データベースを使用できますが、現在は RocksDB が採用されています。

データ形式である AST BASON は CRDT(Conflict‑Free Replicated Data Type)に近い構造です。
Beagle はまだ実験段階にあり、自前でホストしていますが、その他の機能は保証されていません――ご利用は自己責任でお願いいたします。


さらに読む

  • デザイン原理
  • ブランチングとストレージモデル
  • BASON – 安価にマージ可能なバイナリ JSON

使用例

# プロジェクトの初期 POST。リポジトリとプロジェクトパスを指定します。
# http: や ssh: がない場合は $HOME/.be 内でローカルに保存されます。
$ be post //replicated.live/@gritzko/librdx
...
OK   h    ast/tree-sitter/point.h
OK   h    ast/tree-sitter/parser.h
OK   c    ast/tree-sitter/query.c
OK   text ast/verilog/LICENSE
...さらに数百万行...

# RocksDB の内部構造を好奇心で確認する場合。
$ ls $HOME/.be/replicated.live/

# ワークツリー/リポジトリの状態を確認
$ cat .be
//replicated.live/@gritzko/librdx

$ be
repo: replicated.live
project: /@gritzko/librdx
branches: *main
base files: 574, waypoints: 0

$ cd /some/other/dir
$ be get //replicated.live/@gritzko/librdx
...数百万行...
OK   h    rdx/test/YX.h
OK   h    rdx/test/ZE.h
OK   sh   rdx/test/http-test.sh
OK   sh   rdx/test/query-test.sh
OK   sh   scripts/ci-fast.sh

$ cd librdx
$ be
repo: replicated.live
project: /@gritzko/librdx
branches: *main
base files: 574, waypoints: 0

同じ日のほかのニュース

一覧に戻る →

2026/03/09 5:30

エージェント・セーフハウス – macOS ネイティブサンドボックスによるローカルエージェントの保護 --- **ポイント解説** - **Agent Safehouse** は、macOS 上で動作するローカルエージェント(バックグラウンドプロセスやサービス)を安全に隔離し、外部からの不正アクセスや権限昇格を防ぐための仕組みです。 - 「macOS‑native sandboxing」は、Apple が提供するサンドボックス機能(`sandbox-exec`, `com.apple.security.*` など)を利用しており、追加のソフトウェアやカーネル拡張は不要です。 **主な特徴** 1. **最小権限で実行** – 必要最低限のファイル・ネットワークアクセスのみ許可し、それ以外は自動的にブロック。 2. **監査ログ** – アクセス試行や失敗がすべて記録され、後からトラブルシューティングやセキュリティ調査に利用可能。 3. **設定の柔軟性** – プロファイルベースでポリシーを定義でき、企業規模に合わせた細かな制御が可能。 **実装例(サンドボックスプロファイル)** ```xml <key>com.apple.security.app-sandbox</key> <true/> <key>com.apple.security.files.user-selected.read-write</key> <true/> ``` このように、エージェント・セーフハウスは macOS の標準機能だけで安全性を大幅に向上させるソリューションです。

## Japanese Translation: > Safehouse は、ローカル AI エージェントがアクセスできるファイルを厳密に制御する軽量な macOS ネイティブサンドボックスです。デフォルトでは「deny‑first」ポリシーに従い、指定されたワークスペース外への読み書き試行はカーネルエラー(“Operation not permitted”)を引き起こし、SSH キーや `.aws` などの機密項目やその他個人リポジトリを保護します。ツールは `curl` を使って `~/.local/bin` にインストールされる単一の Bash スクリプト(`safehouse.sh`)でセットアップされます。 > > エージェントは `safehouse claude --dangerously-skip-permissions` のようなコマンドで呼び出され、現在の作業ディレクトリ(通常は git リポジトリルート)への読み書きアクセスを自動的に許可し、インストール済みツールチェーンへの読み取りアクセスのみを許可して残りのホームディレクトリは拒否します。 > > 上級ユーザーは `safe() { safehouse --add-dirs-ro=~/mywork "$@"; }` のようなシェル関数を `.zshrc` や `.bashrc` に追加し、すべてのエージェント呼び出しがデフォルトで Safehouse 内で実行されるようにできます。セッションごとにサンドボックスをバイパスするには、コマンドに文字列 `command` を接頭辞として付けます(例:`command claude`)。 > > このゼロコンフィグ方式により、開発者やチームはローカルファイルとの AI 連携を安全に行い、個人プロジェクト、クラウド認証情報、企業リポジトリでの偶発的なデータ漏洩を減らすことができます。

2026/03/09 6:40

**ブラックスカイ・AppView**

## Japanese Translation: Blacksky の AppView は Bluesky Social PBC の AT Protocol 参考実装をフォークしたもので、**外部からの貢献やプルリクエストは受け付けません**。すべての変更は `packages/bsky`、`services/bsky` の3つのディレクトリと1つのマイグレーションファイルに限定され、参考コードの大部分を保持しています。 リポジトリは組み込みの TypeScript フィーホーズコンシューマーを Rust ベースのインデクサ **rsky‑wintermute** に置き換えており、並列キューを通じて約10 k+ レコード/秒を取り込むことができます。Wintermute はブートストラップツール(`queue_backfill`、`direct_index`、`label_sync` など)を提供し、ライブインデクシングとバックフィルを分離します。 主なパフォーマンス最適化は次の通りです: - PostgreSQL の LATERAL JOIN 再書き込み(`getTimeline` / `getListFeed` 用) - Redis キャッシュレイヤー(アクタープロファイル TTL 60 s、レコード TTL 5 m、相互作用カウント TTL 30 s、投稿メタデータ TTL 5 m) - 通知設定のサーバー側強制 実装された修正: - JWT 検証における古い署名鍵の処理 - JSON のサニタイゼーションで null バイト/制御文字を除去 - アクターメモリキャッシュ内の protobuf タイムスタンプバグへの対策 Blacksky は **コミュニティ投稿サポート** をカスタムレキシコン namespace(`community.blacksky.feed.*`)と専用 `community_post` テーブル、データプレーン/API 層でのメンバーシップゲーティングを通じて追加しています。これは混在した投稿スレッド(`getPostThreadV2`)とも統合されます。 全体アーキテクチャフロー: Bluesky Relay → rsky‑wintermute(フィーホーズコンシューマ/バックファラー/ラベルインデクサ) → PostgreSQL 17 → bsky‑dataplane(gRPC) → オプションの Redis キャッシュ → bsky‑appview(HTTP) → リバースプロキシ、Palomar が OpenSearch 検索機能を提供 バックフィル性能: ライブインデクシングは約1 k イベント/秒。42 M ユーザーと 18.5 B レコードのフルバックフィルは10 k レコード/秒で 2–4 週間、部分的なバックフィルは数時間〜数日で完了 ブートストラップ課題への対策: - PostgreSQL COPY による JSON 腐敗 - null バイト処理 - タイムスタンプ精度の強制 - 通知テーブルの肥大化緩和 - 投稿埋め込みテーブルの人口化 - ラベル否定順序 - Fjall キュー毒性解決 - TLS プロバイダ初期化 - アカウント移行後の署名鍵回転 **フルネットワーク AppView のリソース要件:** ≥ 16 CPU コア(推奨 48+)、≥ 64 GB RAM(256 GB 推奨)、10 TB NVMe ストレージ(28 TB RAID 推奨)、同一マシンまたは低遅延での PostgreSQL、継続的ネットワーク 100 Mbps(1 Gbps+)以上の取り込み帯域 リポジトリは MIT/Apache 2.0 のデュアルライセンスです。アップストリーム同期手順は `git remote add upstream https://github.com/bluesky-social/atproto.git` で提供されています。

2026/03/09 4:58

「エージェント時代にリテラトープログラミングを見直すべきです。」

## Japanese Translation: > 本稿は、コードと説明文を組み合わせたリテラトープログラミングが、AI エージェント(例:Claude や Kimi)が Org‑Mode ファイルを単一の真実源として扱う場合に実用化できることを主張しています。 > > Org の構文を解析することで、これらのエージェントはランブックを生成し、埋め込みコードブロックを実行し、Jupyter ノートブックのように結果を保存し、プローズとコードを同期して自動的に更新できるため、ナラティブと実行可能なスクリプトを分離する手作業「タンギング」ステップが排除されます。 > > 著者は、Org Mode を設定管理に個人的に使用した例でこれを示しています:エディタ内で直接コマンドを書き込み、それらを実行し、メモを自動的に取得します。 > > コードとプローズの2つの並列文書を維持することは採用への一般的な障壁ですが、AI 主導のワークフローは `AGENTS.md` ファイルに記載された指示(実行前のタンギング、常にステップを説明するプローズ、両側を同期させる)に従うことでそのオーバーヘッドを排除します。 > > このアプローチはワークフローを合理化し、コードベースを複数の読みやすいフォーマットへエクスポートしやすくし、「コードを書く」から「コードを読む」へのシフトを促進します。また、大規模プロジェクトにおける Org‑Mode の Emacs 統合の限界を浮き彫りにし、リテラトープログラミングの普及を広げるために Markdown などの類似フォーマットを推奨することも示唆しています。