Japanese Translation:

セキュリティクリティカルなシステムを扱う専門家開発者にとって、AI を活用する最も効果的な戦略は、大規模並列エージェントや最先端モデルに依存することではなく、「短いリード方法」を採用することです。このアプローチでは、自動化の規模よりも厳格な人間の制御とコード品質を優先します。著者は、現状の方法は上位クラスのツールを使用しても不可解で失敗しやすいコードを生み出すことが多く、トレーニングデータが不足しているニッチな分野では非効率的なコードを生成し得ると主張しています。その代わり、「短いリード方法」は専用の計画フェーズ、差分による提案変更の能動的分析、および誤りを防ぐため望ましくないアクションの即時拒否を義務付けます。各サブタスク後に形式的レビューフェーズが続き、コードのマージ前に人間の監督と専門的な AI リンター両方によってコードを検証する必要があります。透明性を確保するためには、すべての AI 支援型プルリクエストには、使用された特定のモデルの詳細を含む必須の「AI 開示」ヘッダーを含める必要があります。この手法は okTurtles の公式ポリシー下で実証されており、高いパフォーマンスを保ちつつ安全性を維持させ、規律ある監督と責任あるツール利用を通じて専門家開発者が優れた結果を達成することを可能にします。

セキュリティ要件が極めて高いシステム向け：AI エージェントの活用戦略

本文概要

本稿は、セキュリティ要件が厳しい環境において高品質なソフトウェアを作成する際の AI エージェント活用手法について、1 年以上の研究に基づきまとめたものです。著者は、ソフトウェア開発者・プロトコル開発者・セキュリティクリティカルなシステムメンテナの視点から記述し、AI の限界と可能性を探求しました。

主な成果物として、マルチバイリオン・ドル規模の AI レビューシステムと同等のパフォーマンスを発揮する独自アプローチである**「AI リビュートル」およびカスタムフォークされたコーディングエージェント「Crush」**の開発経験が記載されています。本稿では、「最先端 AI モデル」を凌ぐスキルを持つプロフェッショナル向けに、品質を損なうことなく AI をパフォーマンス向上の手段とする最適アプローチを提示します。

現状のアプローチにおける課題

既存の「雰囲気優先（Vibe）」アプローチや複雑なエージェント・オーケストレーションには、以下の根本的な問題があります。

アイデアの質的低下: 最初に抱いたアイデアが非合理的であることに気づいていない状況で進行してしまう。
軌道からの逸脱: エージェントがユーザーの意図と異なる行動を開始してしまうリスク。
自己学習の阻害: YouTube 等で推奨される「並行動作・大規模タスク」「人間の作業不干渉」な手法は、人間によるコード理解を構築することを不可能にする。
「スlop（安っぽく粗悪なコード）」の生成: ビーチで日焼けしながら Coffee を飲みながら書かれるような、低品質なコードが生成されることが多い。
品質保証不能: AI が複数回軌道から外れても、実際にソフトウェアが利用されるまでその問題に気づかない。

特に**「臭い」である**のは、トレーニングデータの範囲を超えた思考能力を持っていないため、ニッチな分野や参照データ不足の場合にコードが非効率で醜形になりやすい点です。

AI コード生成：「短い綱（Short Leash）」方式

最先端モデルを使用しなくても Fable よりも優れた結果を得るための、プロフェッショナル向けの実践手法です。人間をループ内に保ちつつ、AI を厳しく制御するアプローチです。

具体的なアクション

計画と調査: タスクのプランニング、進捗追跡、大規模タスクの分解（例：
```
tasks
```
スキルの活用）を行う。
無制限モードの禁止: 「YOLO モード」（危険を顧みず権限省略）は一切使用しない。
常時監視: ユーザーが作業中でも AI が放置されることはなく、常に人間がループ内に在る。
差分確認: 許可プロンプトを通じて差し迫る変更内容の差分（diff）を必ず表示させる。
精査と拒否: AI が提案する変更を精査し、望まない行動には直ちに**「DENY（拒否）」**する。
頻繁な介入: AI が軌道から外れそうな瞬間に即座に手を加え、方向修正を行う。

技術的な防護策

継続的理解の維持: コードベースに対する自らの理解を最新に保つため、AI を常に「短い綱」で束縛する振る舞いをする。
コミットの頻繁化: サブタスク終了時に必ずコミットを行い、Opus で確認されたような「以前の作業が破壊・削除されるリスク」から自衛する。

レビューの最終工程

完了後、人間のみまたは AI 単独によるレビューではなく、人間と AI の双方が関与したハイブリッドレビューを実行します。これによりミスを最小化し、高次な課題や方向性の転換点を見落とさないようにします。

AI レビューの実践方法

AI をリンターのように扱いつつ、人間が高次課題を判断する体制を構築します。すべての PR（プルリクエスト）に AI によるレビューは必須です。

リビューの必要条件

コンテキストの確保: AI が十分な情報（課題内容、PR 説明、コードベース、変更差分など）にアクセス可能であることを確認する。
モデル選定: 最新かつ最高性能のモデルを使用してレビューを行う。
作成者による精査: AI が作成・支援した PR は、「人間の補助を得た AI から届いたもの」と見なし、PR を提出した人間自身が行間ごと（ラインごと）に精査する必要がある。

AI ディスクロージャーの重要性

すべての PR 説明には「AI ディスクロージャー」項目を設け、以下のことを明記します。

使用モデルの特定: 開発に用いた AI モデルの種類を具体的に記載する。
メンテナへの通知: AI が使用された旨を伝え、弱力なモデルの場合、より優れたモデルへの更新提案を可能にする。
誠実さの証明: 「AI を仕込んだまますれ違い」を行っていないことを示す。「人間がコードを理解して承認した」というプロセスを示す必要がある。

このプロセスを経ることで、コードベースに対する自らの理解が構築されかつ実証されます。

結論と方針

本稿は okTurtles の公式な AI 活用方針に基づいています。セキュリティ要件が高く、品質にこだわりを持つ環境において、AI を「敵対的存在」として排除するのではなく、厳格な制御下で「パートナー」として活用することこそが、高品質なソフトウェア開発の正解です。

重要: 上記の「短い綱方式」および精査プロセスを守らない場合は、システムのセキュリティと品質が著しく低下するリスクがあります。

※ AI ディスクロージャー:
本記事は完全に人間の指と人間の脳によって記述されました。公開前にスペルチェックのみが AI を介して行われました。

※ 寄付＝愛！
当社の活動を支えていただける皆様に感謝申し上げます。今こそ私たちの取り組みを支援してください。

Fable 攻略のための「ショートリース」AI コーディング法