
2026/07/01 6:28
スーパーパワー 6
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
Superpowers 6 は、トークンコストを最大 60% 削減し、ビルド速度を 50% 向上させることで大きな飛躍を示します。このモデル非依存な更新は、Pi、Antigravity、Codex、Cursor など対応プラットフォームのコーディングエージェントおよび視覚的なブレインストーミングの信頼性全般において広く適用されます。効率性の画期的進展は、Anthropic の Fable ツールを用いて過夜で 25 の実験を検証した最適化ループによって生じました;具体的には、レビューパケットを事前にバーク(pre-bake)し、簡潔なリビュアー契約を採用することが利点の主要な要因でした。初期テストでは OS による隔離問題が発生し、早期の結果が歪められていましたが、これらの問題は解決され、「E27」構成のような正確なメトリクスが検証されました。今後、公式プラグインマーケットプレイスは GitHub の展開に続いてすぐに発足する予定で、新しいコミュニティエンジニアリング雇用の支援の下で進みます。開発者とエンタープライズにとって、この更新はコーディングタスクにおいて厳密かつ公的に利用可能な評価スイートを基礎とした、大幅に低い運用コストと高速なイテレーションサイクルを意味します。
本文
Superpowers 6 リリース:最大 50% の高速化と 60% のコスト削減を実現
当社の企業ブログ Prima Radiant のブログ でも本投稿をご覧いただけます。
TL;DR: まとめ
- Superpowers 6 は大幅に高速化され、同等の高品質な成果を得るためのトークン消費量を劇的に削減しました。
- 「トークン節約」を最優先にする場合は、今回のリリースをお控えください(旧バージョンの方が経済的)。
- ビルド時間を最大で 50% 短縮し、コストを最大で 60% 抑えたい場合は、Superpowers 6 を必ずお試しください。
開発の背景とこれまでの改善
一週間前に Superpowers 5.2 のリリース準備を進め、「あと一つだけ改良を加えたい」として延期しておりました。これまでに以下の工事が行われました。
- サポート追加: Pi、Antigravity、Kimi Code を対応しました。
- IDE 動作改善: Superpowers を Codex、OpenCode、Cursor 上でより動作良くするための工事を完了しました。
- 環境依存の解消: 各種スキルをモデルやハネス(実行環境)に依存しないように書き換え、あらゆる環境での信頼性を高めました。また、新しいコードエージェントハネスへの対応方法についてもコントリビューターガイドを作成しました。
- Visual Brainstorming の強化: 使いやすさとセキュリティ、信頼性の向上に向けた改修を行いました。
- 重大なバグの修正: コードレビューサブエージェントが単一タスクではなく全体ブランチをレビューしてしまうなどの既知の問題を解消しました。
なぜ Superpowers は「遅く」「高価」だったのか?
Superpowers ユーザーから最も多い苦情は、「トークン代が高く、消費量が多い」という点です。ソフトウェア開発自体が非現実的な時間がかかるため、「遅い」と感じられる方も多いでしょう。
「遅さ」と「高額さ」の主な原因:
- 同時に多くのユーザーに優れた結果をもたらすため、Superpowers は実装を最小限の手間で行えるよう念入りな事前計画を行います。
- 実装中は厳格な グリーン・レッド TDD(テスト駆動開発) を強制します。
- オーケストレータはあらゆる変更に対して、以下の 2 つの軸でレビューを行います:
- エージェントが正確に求められた実装を行ったか?(余分でも不足でもないか?)
- 作業の品質は要件を満たしているか?
そのため、未検証の実装を即座に行う方法よりも時間がかかります。しかし、私たちはこれらの課題を解決することに尽力してきました。
Fable を活用した最適化実験
Anthropic の Fable を利用し、Subagent Driven Development(サブエージェント駆動型開発)の最適化を追求しました。当初はトークン消費量を 15% 削減できればよければでしたが、その目標を超えた成果を得ることができました。
最初の改善:レビュープロセスの効率化
- 課題: レビューサブエージェントがコードおよび仕様に準拠する際、多くの
コマンドを実行していた。git - 対策: レビュー対象のコミットを探す方法を、事前生成されたシェルスクリプトに変更した。
- 成果: レビューパッケージ(フォーマット済みの差分情報やメタデータを含む)を準備することで、トークン消費量および実用時間を約 10% も削減。
自動化によるさらなる進化
睡眠中に Fable に「追加の 15% の削減」と指示を出し、「コードレビュー役と仕様準拠レビュー役を統合する」ことを提案しました。Fable が独立して同様の結論に至り、以下の成果を実証しました。
自動研究ループの実施結果
- ステータス: 25 の実験を完了(追加で 4 件は順延)。
- 調整役: Opus が担当。
- ドキュメンテーション: 仮説と予測を事前登録し、永続化(コミット a76ddc9)。
- ループコスト: 約
。$165
発見された最適化案と改善点
自動研究から導き出された最も優れた組み合わせは以下です。
🏆 本命候補(E27):Fractals $6.24/$6.60
構成: Opus 調整役 + 誘導された計画 + 条件付きハイクー実装者 + 簡潔なレビュー契約 + 叙述レシピ + 最終審査階層固定
具体的な改善成果(数値での勝利):
- 簡潔なレビュー契約: レビューヤー出力を −41% に抑制し、結論は維持。
- 叙述レシピ: −54% の削減を実現し、変動なし。
- 条件付き実装者階層化: 各実行あたり約
の節約、ハイクーの拒否も正しく機能。$0.5–1 - スコープ一致: Svelte 上で再現されたフィクスチャリアルイズムにより −24%。
⚠️ 逆効果となった試行:
- 調整役の思考制限: ターン数が 92→138 に増加し、出力が 2 倍になった(思考はターンの効率性を購買する)。
- プラン単語予算削減: テストコンテンツが −62% も減少し、コード自体も除外された。
- Sonnet のプラン生成: 忠実度は保たれるが、タスク構造が崩壊した。
💡 重要なリスク発見:
- レビューヤーに差分パッケージのみを与えると、「仕様」を静的な制約として再定義し、簡易仕様に気づかず結論を出してしまう傾向がある(5 件中 0 件の欠陥検出)。
評価スイートでの検証結果
Superpowers ビルドのウォールクロック実行時間: 50% 削減
トークン消費量: 60% 削減
※Anthropic の評価ベンチマークによる結果です。 もともと −74% と誤って測定していた判定は、ループ中の手動検査により訂正され、誠実な −41% に再確認されました。
Codex への対応でも同様の改善が見られたことについて懸念しておりましたが、調査の結果、評価がホスト OS と十分に隔離されていないために旧ベンチマーク値が表示されていたことが判明し、実際にはすべての改善が維持されていることを確認しました。
最大の改善要因:
- 統合: 仕様準拠レビューエージェントとコード品質レビューエージェントを統合。
- 事前準備: レビュー「パケット」を事前に作成して渡すことで、
コマンドの実行を最小化。git - ガイダンス変更: オーケストレータへ提示するエージェントの選び方を最適化。
インストールと今後の展開
Superpowers 用の評価スイートを用いて、これらの変更を測定・検証しました。詳細は GitHub 上で確認いただけます。
スーパーパワーズ 6 をインストールするには:
# リポジトリ URL https://github.com/obra/superpowers
- GitHub: 今すぐインストール可能です。
- プラグインマーケットプレイス: 今後数日以内に展開予定です。
採用情報
Superpowers のフルタイム開発に携わってほしい方を募集しております。興味のある方は以下のリンクをご覧ください。