スーパーパワー 6

2026/07/01 6:28

スーパーパワー 6

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

Superpowers 6 は、トークンコストを最大 60% 削減し、ビルド速度を 50% 向上させることで大きな飛躍を示します。このモデル非依存な更新は、Pi、Antigravity、Codex、Cursor など対応プラットフォームのコーディングエージェントおよび視覚的なブレインストーミングの信頼性全般において広く適用されます。効率性の画期的進展は、Anthropic の Fable ツールを用いて過夜で 25 の実験を検証した最適化ループによって生じました;具体的には、レビューパケットを事前にバーク(pre-bake)し、簡潔なリビュアー契約を採用することが利点の主要な要因でした。初期テストでは OS による隔離問題が発生し、早期の結果が歪められていましたが、これらの問題は解決され、「E27」構成のような正確なメトリクスが検証されました。今後、公式プラグインマーケットプレイスは GitHub の展開に続いてすぐに発足する予定で、新しいコミュニティエンジニアリング雇用の支援の下で進みます。開発者とエンタープライズにとって、この更新はコーディングタスクにおいて厳密かつ公的に利用可能な評価スイートを基礎とした、大幅に低い運用コストと高速なイテレーションサイクルを意味します。

本文

Superpowers 6 リリース:最大 50% の高速化と 60% のコスト削減を実現

当社の企業ブログ Prima Radiant のブログ でも本投稿をご覧いただけます。

TL;DR: まとめ

  • Superpowers 6 は大幅に高速化され、同等の高品質な成果を得るためのトークン消費量を劇的に削減しました。
  • 「トークン節約」を最優先にする場合は、今回のリリースをお控えください(旧バージョンの方が経済的)。
  • ビルド時間を最大で 50% 短縮し、コストを最大で 60% 抑えたい場合は、Superpowers 6 を必ずお試しください。

開発の背景とこれまでの改善

一週間前に Superpowers 5.2 のリリース準備を進め、「あと一つだけ改良を加えたい」として延期しておりました。これまでに以下の工事が行われました。

  • サポート追加: Pi、Antigravity、Kimi Code を対応しました。
  • IDE 動作改善: Superpowers を Codex、OpenCode、Cursor 上でより動作良くするための工事を完了しました。
  • 環境依存の解消: 各種スキルをモデルやハネス(実行環境)に依存しないように書き換え、あらゆる環境での信頼性を高めました。また、新しいコードエージェントハネスへの対応方法についてもコントリビューターガイドを作成しました。
  • Visual Brainstorming の強化: 使いやすさとセキュリティ、信頼性の向上に向けた改修を行いました。
  • 重大なバグの修正: コードレビューサブエージェントが単一タスクではなく全体ブランチをレビューしてしまうなどの既知の問題を解消しました。

なぜ Superpowers は「遅く」「高価」だったのか?

Superpowers ユーザーから最も多い苦情は、「トークン代が高く、消費量が多い」という点です。ソフトウェア開発自体が非現実的な時間がかかるため、「遅い」と感じられる方も多いでしょう。

「遅さ」と「高額さ」の主な原因:

  • 同時に多くのユーザーに優れた結果をもたらすため、Superpowers は実装を最小限の手間で行えるよう念入りな事前計画を行います。
  • 実装中は厳格な グリーン・レッド TDD(テスト駆動開発) を強制します。
  • オーケストレータはあらゆる変更に対して、以下の 2 つの軸でレビューを行います:
    1. エージェントが正確に求められた実装を行ったか?(余分でも不足でもないか?)
    2. 作業の品質は要件を満たしているか?

そのため、未検証の実装を即座に行う方法よりも時間がかかります。しかし、私たちはこれらの課題を解決することに尽力してきました。

Fable を活用した最適化実験

Anthropic の Fable を利用し、Subagent Driven Development(サブエージェント駆動型開発)の最適化を追求しました。当初はトークン消費量を 15% 削減できればよければでしたが、その目標を超えた成果を得ることができました。

最初の改善:レビュープロセスの効率化

  • 課題: レビューサブエージェントがコードおよび仕様に準拠する際、多くの
    git
    コマンドを実行していた。
  • 対策: レビュー対象のコミットを探す方法を、事前生成されたシェルスクリプトに変更した。
  • 成果: レビューパッケージ(フォーマット済みの差分情報やメタデータを含む)を準備することで、トークン消費量および実用時間を約 10% も削減

自動化によるさらなる進化

睡眠中に Fable に「追加の 15% の削減」と指示を出し、「コードレビュー役と仕様準拠レビュー役を統合する」ことを提案しました。Fable が独立して同様の結論に至り、以下の成果を実証しました。

自動研究ループの実施結果

  • ステータス: 25 の実験を完了(追加で 4 件は順延)。
  • 調整役: Opus が担当。
  • ドキュメンテーション: 仮説と予測を事前登録し、永続化(コミット a76ddc9)。
  • ループコスト: 約
    $165

発見された最適化案と改善点

自動研究から導き出された最も優れた組み合わせは以下です。

🏆 本命候補(E27):Fractals $6.24/$6.60

構成: Opus 調整役 + 誘導された計画 + 条件付きハイクー実装者 + 簡潔なレビュー契約 + 叙述レシピ + 最終審査階層固定

具体的な改善成果(数値での勝利):

  • 簡潔なレビュー契約: レビューヤー出力を −41% に抑制し、結論は維持。
  • 叙述レシピ: −54% の削減を実現し、変動なし。
  • 条件付き実装者階層化: 各実行あたり約
    $0.5–1
    の節約、ハイクーの拒否も正しく機能。
  • スコープ一致: Svelte 上で再現されたフィクスチャリアルイズムにより −24%

⚠️ 逆効果となった試行:

  • 調整役の思考制限: ターン数が 92→138 に増加し、出力が 2 倍になった(思考はターンの効率性を購買する)。
  • プラン単語予算削減: テストコンテンツが −62% も減少し、コード自体も除外された。
  • Sonnet のプラン生成: 忠実度は保たれるが、タスク構造が崩壊した。

💡 重要なリスク発見:

  • レビューヤーに差分パッケージのみを与えると、「仕様」を静的な制約として再定義し、簡易仕様に気づかず結論を出してしまう傾向がある(5 件中 0 件の欠陥検出)。

評価スイートでの検証結果

Superpowers ビルドのウォールクロック実行時間: 50% 削減
トークン消費量: 60% 削減

※Anthropic の評価ベンチマークによる結果です。 もともと −74% と誤って測定していた判定は、ループ中の手動検査により訂正され、誠実な −41% に再確認されました。

Codex への対応でも同様の改善が見られたことについて懸念しておりましたが、調査の結果、評価がホスト OS と十分に隔離されていないために旧ベンチマーク値が表示されていたことが判明し、実際にはすべての改善が維持されていることを確認しました。

最大の改善要因:

  • 統合: 仕様準拠レビューエージェントとコード品質レビューエージェントを統合。
  • 事前準備: レビュー「パケット」を事前に作成して渡すことで、
    git
    コマンドの実行を最小化。
  • ガイダンス変更: オーケストレータへ提示するエージェントの選び方を最適化。

インストールと今後の展開

Superpowers 用の評価スイートを用いて、これらの変更を測定・検証しました。詳細は GitHub 上で確認いただけます。

スーパーパワーズ 6 をインストールするには:

# リポジトリ URL
https://github.com/obra/superpowers
  • GitHub: 今すぐインストール可能です。
  • プラグインマーケットプレイス: 今後数日以内に展開予定です。

採用情報

Superpowers のフルタイム開発に携わってほしい方を募集しております。興味のある方は以下のリンクをご覧ください。

Superpowers Community Engineer(採用ページ)

同じ日のほかのニュース

一覧に戻る →

2026/07/03 6:03

バージニア州、地理的位置データ販売を禁止

## Japanese Translation: 提供されたテキストは、一貫した記事ではなく二進データ、符号化文字、および読み取れない内容のみから構成されているため、要約することができません。事実や日付、製品名を含む標準的な記事とは異なり、この源資料には有意義な分析に必要な理解可能性を欠いています。その解読不可能な性質から、特定の文脈、出来事、または背景情報は導き出すことができません。テキストを処理できないというこの状況のため、有益な洞察や関連する事実を引き出すことは不可能です。源入力を人間が読み取れる言語に変換されるまで、有効な要約を作成することは不可能です。その間もなお、中央テーマ、主要な論点、または具体的な物語を特定しようとするのは無駄であり、データには識別可能なストーリーが存在しないためです。最も重要な点は、この入力が混乱した非構造化形式のため、標準的な読解タスクに根本的に使用できないということです。

2026/07/03 3:41

エキスパンクス(2018)

## Japanese Translation: EXAPUNKS プロジェクトは、プレイヤーが現実的なハッキング活動に取り組み、「EXas」と呼ばれる自律エージェントを管理し、複雑なデジタルタスクを実行できるサンドボックス環境を提供します。従来のシミュレーションとは異なり、このエコシステムではユーザーが現実世界の物体を操作したり、実際のネットワークを侵害したりし、その侵害された状態の中でゲーム世界内で安全に行動することができます。体験の中核には、秘密のヒント、コメント、チュートリアル、EXas をプログラミングしてファイルを破棄させたり、自己複製したり、他のエージェントを停止させたり、痕跡を残さずに姿を消させたりするための詳細を提供する公式 *TRASH WORLD NEWS* ズィンがあります。プレイヤーは銀行、大学、工場、テレビ局、高速道路の標識、ゲームコンソール、政府システム、さらには自身の肉体など幅広い対象を対象とし、その後「ПАСЬЯНС」(パシアンズ)、地域ロックをハッキングした後の「HACK*MATCH」、あるいは TEC Redshift 用のホームブロー開発などの代替ミニゲームにアクセスできます。物理的なデラックス版のズィンセットは、2020 年 4 月に Lulu でのオンデマンド印刷を通じて復活し、7 ドルプラス送料で提供されましたが、両方の号への注文が必要でした。開発者向けには、2018 年 7 月 16 日に詳細とともにリリースされた「Axiom VirtualNetwork+」があり、ホスト、ファイル、レジスタ、ゴール、そしてその API を通じた完全なパズル仕様機能を利用して、ホストスクリプトを記述した JavaScript ベースの「バーチャルネットワーク」を作成することでカスタムパズルの作成が可能になります。2018 年と 2020 年のこれらのリリース以降、専用のコミュニティが栄え、標準的な商業制約を超えたサイバーセキュリティの探求やイノベーションを促進し続けます。

2026/06/28 8:36

現実には驚くほど多くの詳細が存在する (2017)

## Japanese Translation: 私たちが単純なものとして扱っている多くのタスク—地下室の階段を築くことや水を沸かすことなど—is、実行前に深い調査が必要となる重要な細部を隠しています。著者の父は 18 歳でコロンビアから北米へ移住し、実地作業を通じて建築を教えてくれました(フェンスの取り替え、塹壕の掘削、床および小屋の築造など)。著者はフェンスの手すりを取り替える際、床を敷設し、地下室の階段を築く際にこの教訓を実際の経験として学びました。 二つの 2×12 に角度ブラケットを用いて作られた階段は一見単純に見えますが、複数の副次的タスクを含んでいます:切り取り角度を計算またはトラACING し、U ブラケットを取り付けること、および板材を固定することです。木材は乾燥するにつれて歪むため、2x12 を正しい角度に切り取ることは容易ではありません。視覚的な対齐も失敗するため、三角関数を使用するか、円鋸用ガイドを雇用するか、または計算だけよりも木目追跡の方法を好む必要があります。ブラケットを引かれた線上に合わせてからネジを取り付けた場合でも、最初にもうけホールを掘らないとネジが斜めに取り付けられてしまいます;ブラケットを数インチ移動して再 drilling することでより良い結果が得られます。2 インチより長いネジを使用すると、階段の踏み面から突き抜け足に刺さるリスクがあるため、短いネジが不可欠です。 同様に、沸騰は単に「100°C の水」ではありません。真の沸騰の前に小さな気泡が発生します。ガラス鍋はより高い温度を耐え、硫酸で清掃されたガラス容器では水を過加熱することができ、攪拌によって爆発的に飛び散ります。二つの液体の間にわずか一滴の水を挟むだけでも、沸騰せずに約 300°C に加熱でき、一般的な主張と矛盾します。これらのリスクは、充填ベッドとロケット軌道計画を必要とする工業プロセスにも広がっており、見えない力は正確なスロットル制御と使い回し可能なロケットのための慎重な重量管理を要求します。 歴史もこれらの教訓に反響しています:アルコール熱計は 18 世紀にジャン=アンドレ・デュリュがその非線形性を明らかにするまで標準的なものでした。重要な細部が見えないままにされる時、知的な行き詰まりが生じます—例えば、「すべてのデータは「偽造されている」と主張し気候変動を否定する代わりに、見落とした過ちを注意すること—。一度見えなかった細部が出会うと透明化し、進捗はそれを見無視する場合のみ停滞します(例:三角関数 versus トラACING を巡る家族の議論)。究極的に言えば、住宅修理、大規模なエンジニアリング、科学的探究における成功は、予期しない変数を積極的に探し求め、詳細な観察を受け入れ、表面的な仮説への依存を拒むことにかかっています。

スーパーパワー 6 | そっか~ニュース