
2026/03/07 19:48
ファイルシステムが注目されつつある。
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
要約
AIエージェントはツール中心のワークフローから、コンテキストとメモリにファイルシステムを利用する方向へ移行しており、ファイルベースのAPIが商業的な実現可能性と長期的データ永続化の重要な推進力となっています。
-
証拠・例
- LlamaIndex の「Files Are All You Need」 はファイルシステム中心のエージェントへの傾向を示しています。
- Anthropic が開発した CLI ツール Claude Code はローカルファイルの読み書きを行い、同社が収益性に近づく手助けとなり、ファイルベースのエージェントの商業的価値を強調しています。
- ETH Zürich の研究では、リポジトリレベルのコンテキストファイル(例:CLAUDE.md)を提供するとタスク成功率が低下し、推論コストが20%以上増加することが判明し、不十分または過剰なコンテキストがパフォーマンスに悪影響を与えることを示しています。
-
コンテキスト対永続化
LLM の短期的「ホワイトボード」コンテキストウィンドウは、ファイルが提供するエージェントメモリの持続的長期保存とは別物です。 -
ファイルフォーマットを API として利用
現在のフォーマットには CLAUDE.md、AGENTS.md、copilot‑instructions.md、.cursorrules、そしてオープン標準 SKILL.md があり、多くのベンダーが採用しています。これらの Markdown ファイルはエージェントに対して直接 API として機能します。 -
補完概念
- Dan Abramov の social filesystem はユーザーデータを個人リポジトリ内の名前付きファイルとして扱い、アプリが「post」の定義に合意せずとも読み書きできるようにしています。
- NanoClaw は「機能よりスキル」モデルを示し、各スキルは編集可能な SKILL.md ファイルで表され、ポータブルかつ監査可能なエージェント能力を実現します。
-
ボトルネックのシフトとアーキテクチャ
AI エージェントのボトルネックは計算からコンテキストへ移行し、ファイルシステムは開発者環境に合った効果的なローカル永続化レイヤーを提供します。ディレクトリ→ファイルの自然なグラフ構造はエージェントに有用ですが、データベースは同時アクセス、スケールでの意味検索、および重複排除には依然として必要です。 -
潜在的影響
ファイルシステムは個人コンピューティングを再定義し得る可能性があり、データ・好み・スキル・メモリをユーザー所有のフォーマットで保持し、任意のエージェントにアクセス可能にすることで壁付き SaaS モデルに対抗します。また、長期的な人間知識を個々のソフトウェアプラットフォームを超えて保存できる相互運用層も提供します。
この改訂要約は主要ポイントをすべて網羅し、根拠のない推測を避け、読者にとって明瞭さを保っています。
本文
🌱 芽生える思考の集まり
以前、ベクトルデータベース企業で働いていました。私の仕事は、人々に AI 専用データベース(埋め込み、セマンティック検索など)が必要な理由を説明することでした。そんな中でこの記事を書いている自分を見ると、ちょっと面白い気がします。しかしここにいます――AI エコシステムの皆さんが突然ファイルシステムという謙虚な存在に再び目覚めており、実はそれよりも大きな何かを掴んでいるように思えるからです。
データベースより大きいわけではない。データベースとは違う。
ここで言っておくと、誰かが「ファイルが良い、データベースは悪い」と読んでしまうかもしれません。そんなことはありません。どうぞ最後までご覧ください。
みんながファイルについて語る
過去数ヶ月間 AI エージェント領域を注視していると、不思議な点に気づくでしょう:
- LlamaIndex が 「Files Are All You Need」 を発表。
- LangChain はエージェントがファイルシステムを文脈設計に利用できることを書いた。
- Oracle(そう、Oracle です――誰かが何か作っているとき) が エージェントメモリとしてのファイルシステムとデータベースを比較した記事を公開。
- Dan Abramov は AT プロトコル上に構築されたソーシャルファイルシステムについて語った。
- Archil はエージェントが POSIX ファイルシステムを欲しがるため、クラウドボリュームを特別に構築中。
LlamaIndex の Jerry Liu は率直にこう述べています:百ものツールを持つ単一のエージェントではなく、ファイルシステムへアクセスでき、5〜10個程度のツール(ファイルシステム、コードインタープリター、ウェブアクセス)しか持たない世界へ移行している。これが、100以上の MCP ツールを持つエージェントと同じか、それ以上に汎用的なのです。
Karpathy が添えた隣接した観察も私の心に残りました:Claude Code はあなたのコンピュータ上で動き、あなたの環境、データ、文脈を利用しているために機能します。ウェブサイトにアクセスするものではなく、マシン上に存在する小さな精神です。OpenAI はクラウドコンテナで ChatGPT を統括しようとした結果、本来の localhost 上で単純に動かすことを見失ってしまったと言えるでしょう。
そして商業的に重要なのは、コーディングエージェントが現在の AI 利用ケースの大半を占めている点です。Anthropic は利益率に近づいており、その主な推進力は Claude Code ― CLI ツールでありチャットボットではなく、あなたのファイルシステム上でファイルを読み書きするもの ― にあります。
文脈ウィンドウは記憶ではない
多くの議論が見落としている深いポイントがあります。心理学的に言えば、記憶は我々が機能するための基盤です。意思決定を行うたびに人生全体を再読するわけではありません。長期ストレージ、選択的回想、重要でないものを忘れ、必要なものだけを取り出すという仕組みがあります。LLM の文脈ウィンドウはそのような機能を持っていません――むしろ誰かが何度も消しているホワイトボードのようです。
Claude Code を実際に使ったことがあるなら、「context left until auto‑compact」 という通知がどんどん近づく恐怖を体験したでしょう。エージェントが構築したコードベースや好み、意思決定に関する全文脈は圧縮または失われるリスクにさらされています。
ファイルシステムは最も退屈で明白な方法でこれを解決します:書き留め、ファイルに保存し、必要になったときに読み戻すだけです。
- Claude の
がプロジェクトに関する永続的な文脈を提供。CLAUDE.md - Cursor は過去のチャット履歴を検索可能なファイルとして保持。
- 人々は
を作成し、どんなエージェントでも読み取れるポータブルなアイデンティティ記述子(好み・スキル・作業スタイル)としています――API を調整する必要がありません。aboutme.md
ただし!必ずしもそれほど単純ではないかもしれません
ETH Zürich の最近の論文は、リポジトリレベルのコンテキストファイルが実際にコーディングエージェントのタスク完了を助けるかどうかを評価しました。驚くべき結論は、複数のエージェントとモデルで、コンテキストファイルはタスク成功率を低下させつつ推論コストを 20 % 超増加させるというものでした。ファイルを与えられたエージェントはより広く探索し、テストを多く実行し、修正が必要なコードに到達するまで遅延しました。ファイルはチェックリストのように機能し、エージェントがそれを真剣に受け止めすぎた結果です。
このことは前提全体を否定するものではありません。論文の結論は「コンテキストファイルを使わないでください」というものではなく、「不要な要件はタスクを難しくし、コンテキストファイルは最小限の制約のみを記述すべきだ」という点にあります。問題はファイルシステム自体の永続化層ではなく、人々が
CLAUDE.md を 2,000 語のオンボーディングドキュメントとして扱い、むしろ簡潔な制約セットとするべきだという点です。
ファイルフォーマットこそ API(ただしどのファイルか?)
現在私たちが持っているものは:
CLAUDE.mdAGENTS.mdcopilot-instructions.md.cursorrules- そして読むまでにさらに五つくらい増えるでしょう
エージェントには永続的なファイルベースの文脈が必要であることは誰もが認めますが、ファイル名や内容について合意がありません。統一を目指す動きは良い方向です。
Dan Abramov のソーシャルファイルシステムに関する記事は重要な点を固めました:AT プロトコルではユーザーデータを個人リポジトリ内のファイルとして扱います。構造化され、所有者が管理し、フォーマットを理解できるあらゆるアプリが読み取れるものです。重要な設計選択は「投稿」が何であるかを異なるアプリが合意する必要はなく、名前空間(ドメイン名、Java パッケージのように)を使って衝突しないようにすれば良いという点です。各アプリはファイルに反応します。データベースは派生データ―誰もが持つフォルダのキャッシュ化されたマテリアライズドビューになります。
同じ緊張感はエージェントコンテキストファイル領域にも存在します。
CLAUDE.md と AGENTS.md と copilot-instructions.md を一つにまとめる必要はなく、衝突せず共存できれば十分です。一部統合が進んでいます:Anthropic は Agent Skills をオープンスタンダードとして公開し、Microsoft、OpenAI、Atlassian、GitHub、Cursor が採用した SKILL.md フォーマットを提供しています。Claude Code 用に書いたスキルは Codex でも Copilot でも動作します。ファイルフォーマットが API です。
NanoClaw は軽量な個人 AI アシスタントフレームワークで、機能拡張よりも skills over features モデルを採用しています。Telegram サポートが欲しい? Telegram モジュールは無い。
/add-telegram スキル――本質的には Claude Code に統合方法を書いたマークダウンファイルです。スキルは単なるファイル ― ポータブル、監査可能、組み合わせ可能です。MCP サーバー不要、プラグインマーケットプレイスも不要。SKILL.md が入ったフォルダだけで完結します。
これは調整なしの相互運用性です。私が言いたいことを明確にするのは重要です――それは強い主張です。技術的には、競合製品同士が連携するためには通常:
- 標準化プロセスに数年かけて承認される正式な標準
- ある支配プラットフォームが互換性を強制
ファイルは両方を回避します。二つのアプリがマークダウンを読めれば文脈を共有できますし、
SKILL.md フォーマットを理解すれば機能を共有できます。パートナーシップ契約や標準化委員会に参加する必要はありません。ファイルフォーマット自体が調整役です。
ボトルネックは移動した
インフラストラクチャから有用なアナロジーがあります。従来のデータアーキテクチャは「ストレージがボトルネックだ」という前提で設計されました。CPU はメモリやディスクからデータを待ち、演算は提供されたストレージに反応していました。しかし処理能力がストレージ I/O を上回るとパラダイムは変わりました。業界はストレージとコンピュートを分離し、それぞれ独立してスケールさせる方向へ移行しました―S3 とエフェメラルな計算クラスターの組み合わせです。ボトルネックが移動し、すべてが新しい制約に沿って再編成されました。
AI エージェントでも同様の事象が起きています。ボトルネックはモデル能力やコンピュートではなく「文脈」です。モデルは十分に賢いものの、忘却性があります。ファイルシステムはその単純さにもかかわらず、エージェントが実行される正確な場所―開発者のマシン上、既に存在するデータと環境―で永続的文脈を管理する非常に効果的な手段です。
あなたはグラフを使っている、しかしそれに気づいていない
Twitter で誰かが冗談めかして「ファイルシステムを使用しながらもグラフを必要としないと主張するあなたは、実際にはグラフを否定的に受け止めているだけだ」と言った人もいます。そうです、彼らは正しい。ファイルシステムは木構造です:ディレクトリ、サブディレクトリ、ファイル――有向非循環グラフ(DAG)です。エージェントが
ls、grep を実行し、ファイルを読み取り、別のファイルへの参照を辿るとき、それはグラフを走査しているのです。
Oracle の記事で Richmond が最も鋭い区別を示しました:「ファイルシステムはインターフェースとして勝っており、データベースはサブストレートとして勝っています。」同時アクセスが必要になったり、大規模なセマンティック検索や重複排除、最新性の重み付けを行いたい場合、自前でインデックスを構築する必要があります。正直言ってそれは結局データベースです。
Weaviate で働いてきた経験から、これは「どちらか一方」という状況ではありません。ファイルインターフェースは普遍性と LLM が既に理解しているため強力です。データベースサブストレートは保証を提供し、実務が真剣になった時に必要なものです。興味深い未来は「ファイル vs データベース」ではなく、「人間とエージェントが相互作用するインターフェースとしてのファイル、そしてユースケースに応じて最適なサブストレートで裏付けられる」という点です。
これは本当にパーソナルコンピューティングについて
ここで私が実際に考えていること――人々が回避しているが直接は言わないポイントを述べます。
ファイルシステムは AI 時代におけるパーソナルコンピューティングの意味を再定義できます:
- 「すべてローカルで動く」 という意味ではありません(ただし…?)。
- あなた自身が所有するフォーマットにデータ、文脈、好み、スキル、記憶が存在し、どんなエージェントでも読み取れる。特定のアプリ内に閉じ込められない。
aboutme.md は今日あなたの OpenClaw/NanoClaw 風味とともに動き、明日来るものとも互換性があります。スキルファイルはポータブルです。プロジェクト文脈はツール間で継続します。
これはすべてがウォールド・ガーデン SaaS アプリや専有データベースへ移行した以前に想定されていたパーソナルコンピューティングの姿でした。ファイルは元々オープンプラットフォームです。そして AI エージェントが計算への主要インターフェースになるにつれ、ファイルはツール切替、ワークフロー構成、アプリ間で継続性を保つ相互運用層へと進化しています――誰かの許可なしに。
理想主義的な部分もあることを認めます。オープンフォーマットの歴史は紙面上では勝利したが実務では失敗した標準でいっぱいです。企業はコンテキストファイルを少し変えて、切替コストを高く保とうと強いインセンティブがあります。既に
CLAUDE.md、AGENTS.md、.cursorrules が共存している事実は分断がデフォルトであることの証拠です。そして ETH Zürich の論文は、フォーマットが存在する場合でも良いコンテキストファイルを書くことが難しいと示しています。多くの人が悪いものを書き、悪いコンテキストファイルは実際には無いよりも悪いという事実です。
しかし私は Dan Abramov が書いた言葉に戻ります:「私たちの記憶、思考、設計はそれを作るために使ったソフトウェアを超えて生き続けるべきだ。」 これは技術的な議論ではなく価値観の議論です。そしてファイルシステムは、その年齢と単純さにもかかわらず、唯一その役割を果たす立場にあります。最良のテクノロジーである必要はありません――ただあなたのものだからです。