
2026/06/08 3:17
自動化された疑問開発プロセス
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
はい、欠落している具体的なエージェント、指標、リソース制約、およびソースリンクを統合しつつ読みやすさを維持するために、改良されたバージョンが必要です。
改善されたサマリー
本テキストは、ソフトウェア開発への信頼回復を目的とした厳密な AI を支援するワークフローを示し、「疑念」を自動化してコードが出荷される前に繰り返しの批判を実行します。自律型エージェントによる有害なエラーが発生した過去の信頼性の問題を解決するため、システムは初期段階でサブエージェントがコードを書き込ませることを制限し、開発にはターミナルベースの実行に焦点を当て、深層的な監査には専門のサブエージェントを使用します。この戦略は、「パララックス・カバレッジ」と呼ばれる「複数の角度から問題を見つめる」アプローチを採用し、 scrutiny(精査)に重きを置いた 15〜60 分の先行段階を持つ分相段的方式で実行されます:
- フェーズ 1(設計):仕様書または PRD から開始し、仮定発掘機(普遍的に適用可能と特定されている)、事前実装アーキテクト、ドキュメントバリデーターなどのエージェントを用いてスコープを確認し、隠れた欠陥を捉えます。中規模から大規模なスコープでは、ギャップアナライザーおよび曖昧性マッパーを追加で採用します。
- フェーズ 2(開発):主要なターミナルエージェントがコードの記述を担当します。同時に、ポスト実装ワークフローにおいてセキュリティアナリスト、型安全性バリデーターなどの 6 つの専門サブエージェントがコードベースを監査し、通常は実行ごとに 15〜35 の発見事項を生成します。重要な問題については、次のイテレーションで即座に解決することがフラグ立てられます。
- フェーズ 3(まとめと出荷):包括的な 7 エージェントのワークフロー(アニュエティリーダーを含む)が API コントラクト、ランタイムの一貫性、リリース姿勢を検証し、複雑なプロジェクトでは複数回のイテレーションを必要とする可能性があります。
このプロセスはトークン消費量大ですが、検証済であり保守可能なコードを生み出すことを目指しています。スコープ(小/中/大の構成)に応じて拡張でき、進捗を追跡するための別々の伴行チェックリストも出力されます。すべてのエージェントとパイプラインは GitHub で利用可能です。
本文
不信感から生まれた AI 開発ワークフロー:多重視点による自動監査と品質収束
このアプローチの源は「不信感」にあります。AI 支援開発の初期段階で、標準的なプラクティスを軽視し、LLM に過大な権限を急激に委ねたことで信頼関係を損なう事態に陥りました。その不信感を挽回するため、あらゆる「疑念」を自動化して取り仕切る必要がありました。
本記事では、アーティファクト(コード、仕様書、ドキュメントなど)の作成において、AI を活用している方向けの実践法を紹介します。
核心:多重視点による自動的な監査
このプロセスの核となる概念は以下の通りです。
- 複数の視点からの自動的な疑念:
- サブエージェントを頻繁に活用し、開発プロセス全体の要(フルクラム)として機能させます。
- 標準的な単一インスタンシエーションではカバーしきれない、多角的な視点による監査を実現します。
- Scrutiny の早期投入:
- AI 開発におけるパラリークス(多点からの視野)が広いほど理想です。
- 異なる観測点により欠陥を捕捉し、双眼で立体視する効果を生みます。
フェーズ 1:設計 (Design)
まず、アイデアやフィーチャーの仕様書を持ち込みます。通常 PRD や計画書から始め、Claude に仕様書作成を依頼します。ファイル内容を素早く確認しながら、実装要素が適切に捕捉されているか検証します。
事前実装ワークフロー(Pre-Implementation Workflow)
「事前実装アーキテクト」「ドキュメントバリデーター」「仮説発掘者」の 3 つのエージェントが第 1 の疑念ラウンドを実施します。これらは以下の点を検証します。
- 設計品質の検証
- スコープの評価と完全性の確認
- ドキュメント上のギャップ
- 仕様書内の隠れた仮説
【発見例】事前実装による課題発見
- Assumption Excavator(仮説発掘者):
- 「登録 SDK の
はexecutionStatsSchema
を返しますが、仕様が{totalCount, recentCount, windowMinutes}
を仮定しています。新しい API エンドポイントを追加しない限り、履歴セクションを構築できません。」{avgScore, medianDurationMs, passRate, lastRunDate, lastRunScore}
- 「登録 SDK の
- Pre-Implementation Architect(事前実装アーキテクト):
- '
はHarnessProfile
を埋め込んでいますが、mcp.read/merge/remove/write
を抽出して関心の分離を図るべきです。そうしないと、各ハーネスファイルが 80〜120 ラインに膨れ上がります。」McpConfigStrategy
- '
スコープに応じた反復プロセス
スコープに応じて、以下のエージェントセットを用いた追加の反復を行います。これらは省略された側面や曖昧さを発見することに優れています。
| スコープ規模 | 実施内容 |
|---|---|
| 小規模 | 事前実装のみ |
| 中規模 | 事前実装 + ギャップ、推論された完全性、曖昧さの検証 |
| 大規模 | 各ラウンドでの複数回にわたる総括的スキャン 必要に応じて専門エージェントへ拡大 |
【発見例】追加的反復による深掘り
- Gap Analyzer(ギャップアナライザー):
- '
は read/merge/write を定義していますが、権限エラーやファイルロックなどへの挙動規定がありません。これにより破壊的操作を引き起こす可能性があります。」McpConfigStrategy
- '
- Implied Completeness Detector(推論された完全性検出器):
- 「バージョン管理がルートとハーネスで不一致です。ユーザーが
で動作中にv0.3.0
を実行した場合の挙動が未定義であり、バージョニングやアップグレード処理が欠如しています。」v0.4.0
- 「バージョン管理がルートとハーネスで不一致です。ユーザーが
仕様書確定後のアクション
- 一時停止し、仕様書を読み通す(約 15〜60 分)。
- クエリ良好であれば、Claude に開発用チェックリストの作成を依頼。
- チェックリストは別ファイルとして作成し、セッション中断時にも有効活用します。
フェーズ 2:開発 (Development)
Claude が仕様書とチェックリストを読み込み、開発を開始します。新規セッションで再開する場合は、「Explore」「Chain Tracer」「Deep Explore」などのサブエージェントを送信して全体像を把握してから進めます。
書き込み処理への注意点
本プロセスにおける重要な画線は、**「書式化(writes)にサブエージェントを使用しない」**ことです。
- 信頼の角度に戻すため、書き込み処理には直感に基づくターミナルエージェントを使用します。
- 失敗した経験から学び、現在はスウォームオーケストレーションやワークツリー駆動型の開発手法よりも、単一の Claude Code ターミナルインスタンス一択としています。
事後実装ワークフロー(Post-Implementation Workflow)
ビルド動作確認後、以下に焦点を当てたサブエージェントを実行します。ここが「自動的な疑念」の光を発する場所です。
| エージェント役割 | 主な機能 |
|---|---|
| Code Validator | コード品質と構造的整合性の検証 |
| Type Safety Validator | 型安全の確認 |
| Test Architect | テストケースの設計 |
| Code Optimizer | パフォーマンス向上の提案 |
| Public Interface Validator | 公開 API の妥当性チェック |
| Security Analyst | セキュリティ脆弱性の特定 |
これらのエージェントは、コードベースを監査し、品質・セキュリティ・重複度・パフォーマンスなどの見解を提供します。
- 初回実行での発見数: 通常 15〜35 件。
- 重大度: そのうち最初の 15〜20 件 がクリティカルまたは高重大度としてフラグ付けされます。
対応策を適用した後、ワークフローを再実行して品質イメージに達するまで続けます。
【発見例】開発中の監査
- Code Validator:
- 「他のメソッドは完了後に
を呼び出しますが、trackIfEnabled()
はトラックを行わず、非同期パイプラインの利用者がデータを取得できません。」startPipeline()
- 「他のメソッドは完了後に
- Security Analyst:
- '
に含まれるシェルクォート展開パスが文字列として保存されています。これによりファイルシステムパスが含まれるエラーメッセージがダッシュボードに伝播するリスクがあります。」PreflightError
- '
フェーズ 3:締めくくりと公開 (Wrap-up and Ship)
実用的かつ質的な両面でリリース準備が整ったと感じた時点で、「Ship」ワークフローを実行します。これにより最終的な品質収束を図ります。
最終検証エージェント
このフェーズでは、前段の反復プロセスを最終化し、さらに以下のエージェントを追加してシステム公開の姿勢を確認します。
- Code Validator, Type Safety Validator, Test Architect
- Code Auditor (コード全体のアウディット)
- Public Interface Validator, Security Analyst
- API Contract Validator (API がある場合のみ)
- Release Readiness Validator (公開準備確認)
このフェーズの重要な追加要素:Anxiety Reader
- 不安読み手 (Anxiety Reader): リソース枯渇や API レート制限など、システムに過負荷がかかる可能性を直感的・概念的に検知します。
複雑な場合によっては、本プロセス「Ship」を 2 回以上の反復で実行する必要がある場合があります。以前の実事後実装ワークフロー(5/9 エージェント)とは異なり、残りエージェントは微調整よりもシステム全体の整合性を優先します。
【発見例】最終確認による発見
- Anxiety Reader:
- '
はすべてのエージェントを同時発火させており、競合制限がありません。これによりリソース枯渇や API レート制限のリスクがあります。」Promise.allSettled
- '
- Code Auditor:
- 「ファイル I/O エラーによる例外は
でキャッチされていますが、SDK 特有のヒントではなく、ファイルシステム固有のメッセージ化されておりユーザー体験に悪影響を与える可能性があります。」handleCoreError
- 「ファイル I/O エラーによる例外は
結論:品質の収束と信頼
哲学的な観点而言えると、このアプローチはアーティファクト、エージェント、オペレーターの間の交渉であり、「品質」という概念が収束する場所です。
品質の定義
- 主観と客観の架橋: エージェント自身も「何を定量化し、何が qualifies か」という基準を持ちます。人間と AI の間で合意形成(同意)を繰り返すことで、「準備就绪」の要件が確定します。
- 一貫性への収束: 使いやすさ、可読性、保守性を目指すことで、直感よりも客観的な目標が機能します。
- エンジニアリングの哲学: 「芸術家には終わりがない、エンジニアには終わりはある」。その判断基準は、開発者の忍耐、実践、判断力、そして正しい質問です。
トークン消費について
- このプロセスはトークン消費量に関しても安価ではありません。
- 無数の時間をかけて監査を行うため、利用制限に直面する可能性があります。
- プロジェクトの規模や性質に応じて、エージェントセットを調整する必要があります(小規模なものもあれば、40 個以上のエージェントから多角的視点を用いる必要があるものもあります)。
- 少なくとも一つは試すべき: すべてのプロジェクトにおいて汎用的に適用可能な **「Assumption Excavator(仮説発掘者)」**です。
まとめ
この方法論は当初「不信感」から生まれ、「信頼のシグナル」として発展してきました。アーティファクトのいずれについても、何らかの形式での監査を試みる価値があります。
参考:エージェントとパイプライン
本記事で言及されたエージェント、コマンド、パイプラインは以下の GitHub リポジトリにて利用可能です。