エージェントにはプロンプトの増加ではなく、制御フローが必要なのです。

2026/05/08 1:43

エージェントにはプロンプトの増加ではなく、制御フローが必要なのです。

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

本稿の核心的な論点は、複雑なタスクに対応する信頼性のある AI エージェントは、精巧なプロンプト連鎖ではなく、決定論的なソフトウェア制御フローに依存しなければならないという点である。現在では、強制指示の下でプロンプティングを用いると技術的な限界に達するが、非決定論的な提案には堅牢な推論を不可能とする欠陥がある。ソフトウェアは再帰的統合性を通じてスケールし、局所推論と検証可能な状態遷移を提供するが、プロンプト連鎖にはこれらの保証が欠け、弱く仕様化されたままである。信頼性を確保するためには、曖昧な散文から論理を抽出し、検証チェックポイントと決定論的な状態遷移を備えた明示的な実行時スケルプトに組み込む必要がある。

その結果、大規模言語モデル(LLM)は厳密にシステムの一部として捉えるべきであり、システムそのものではない。提案に基づく記述への依存は、幻覚を起こしながらも「成功」として事実を返すプログラミング言語を使うことに類する。このような環境において激しいエラー検出を持たないエージェントは、単に誤った結論への高速な道筋となるのみである。プログラマティックな検証がない限り、残される選択肢は三つだけである:人間の「ベビーシッター」として振る舞う、高コストの網羅的監査を行う、あるいは完全に「祈り」(ビブ・アセットプター)に依存することしかない。業界は直ちに曖昧な「バイブ」から明確な状態遷移へ転換しなければならず、監督を制限し監査費用を支払う、あるいは検証されていない出力を受け入れるという決定的な選択を回避する必要がある。

Text to translate:

The original summary is strong, but a slight structural adjustment can better align it with the list's logical flow by explicitly grouping the "three options" and reinforcing the contrast between prose and runtime logic. Here is the refined version:

The core argument is that reliable AI agents for complex tasks must rely on deterministic software control flow rather than elaborate prompt chains. Currently, prompting reaches a hard limit when forced with mandatory instructions, while non-deterministic suggestions render robust reasoning impossible. Unlike software, which scales through recursive composability to offer local reasoning and verifiable state transitions, prompt chains lack these guarantees and remain weakly specified. To ensure reliability, logic must be moved from vague prose into explicit runtime scaffolds featuring validation checkpoints and deterministic state transitions.

Consequently, the Large Language Model should be viewed strictly as a component within a larger system, not the system itself. Relying on suggestion-based statements is akin to using a programming language where functions return "Success" despite hallucinating facts; an agent without aggressive error detection in such an environment acts merely as a fast path to incorrect conclusions. Without programmatic verification, only three paths remain: acting as a human "babysitter," performing costly exhaustive audits, or relying entirely on "prayer" (vibe acceptance). The industry must immediately shift away from vague vibes and toward explicit state transitions to avoid the critical choice of limiting supervision, paying for audits, or accepting unverified outputs.

本文

Bryan の思索

ホーム・ブログ

2026 年 5 月 7 日

命題:複雑なタスクを担う信頼性の高いエージェントには、ソフトウェアにエンコードされた決定論的な制御フローが必要であり、ますます高度化するプロンプトチェーンだけでは不十分である。

かつて「MANDATORY(必須)」や「DO NOT SKIP(スキップしないでください)」といった表現に出向されたことがあるか。もしあるなら、あなたはプロンプティングの限界に達していると考えよ。ステートメントが単なる提案であり、関数がハルシネーション(幻覚)を生じながら「成功」とを返すようなプログラミング言語を想像してみよう。推論は不可能となり、複雑性が高まるにつれて信頼性は崩壊する。

ソフトウェアは再帰的な構成可能性を通じてスケーリングする:ライブラリ、モジュール、関数から構築されるシステムのことだ。すべてがコードそのもの、まさに「最下層までコード」と言える。コードは予測可能な振る舞いを露呈させるため、局所的な推論を可能にします。一方、プロンプトチェーンはこの性質を欠いている。広範なタスクには有用ではあっても、プロンプトは非決定論的であり、明確に仕様が指定されておらず、かつ検証も困難である。

信頼性の確保には、論理を散文から runtime(ランタイム)へと移転させることが不可欠である。我々は、LLM を「システムそのもの」ではなく「コンポーネント」として扱い、明示的な状態遷移と検証チェックポイントを備えた決定論的なスケルトン(骨組み)が必要となる。

しかし、決定論的なオーケストレーションだけで戦いは半端に終わるではない。静かなる故障(silent failure)が発生しやすいシステムにおいて、攻撃的なエラー検出を持たないエージェントは、単に誤った結論へと素早く到達するだけの手段に過ぎない。プログラムによる検証がなければ、我々には以下の三つの選択肢しか残されていない:

  • ベビーシッター的対応:エラーの伝播を未然に防ぐため、人間をループ内(in the loop)に保持し続けること。
  • 監査員的事業:実行後に行き渡り的なエンドツーエンド検証を実行すること。
  • 祈る:出力を受け入れ、そのありのままを「流れるまま(vibe)」として許容する道。

同じ日のほかのニュース

一覧に戻る →

2026/05/08 7:22

キャンバス(Instructure)LMS は、現在も継続中のランサムウェア攻撃の影響で利用できない状態にあります。

## Japanese Translation: 2026 年 5 月 7 日、ShinyHunters 集団と見做されるランサムウェア攻撃により、Instructure の Canvas プラットフォーム(Canvas Beta および Canvas Test を含む)が停止し、調査が行われる間、すべての環境にアクセスできなくなる事態となった。この侵害は Instructure の確認によると、学生名、ID 番号、メール地址、および私信を含む情報を暴露させ、約 9,000 の学校で活動する約 2.75 億人の学生、教職員、スタッフに影響を与えた。ShinyHunters は、影響を受けた学校がサイバーアドバイザリーファームと連絡をとり、「TOX」へ私下に連絡して漏洩期限である 2026 年 5 月 12 日までのデータ漏洩防止に向けた解決策の交渉を行うよう要求し、加えて被害者リストへのリンクも提供した。ShinyHunters は以前にも AT&T、Ticketmaster、Rockstar Games、ADT、Vercel など大手組織を標的にしており、高度な手口を示している。Instructure は以前にも過去のアシインを受け、セキュリティを強化するためのパッチを展開していた。この事実は、大規模な学習管理システムが協調的なランサムウェア作戦に対して極めて脆弱であることを示すと同時に、漏洩期限前に大量のプライバシー侵害を防ぐため、教育機関に脅威アクターとの緊急交渉を迫っている。 ## Text to translate: ## Summary: On May 7, 2026, a ransomware attack attributed to the ShinyHunters group disabled Instructure's Canvas platform (including Canvas Beta and Canvas Test), leaving all environments inaccessible while an investigation proceeds. The breach affected roughly 275 million students, teachers, and staff across 9,000 schools, exposing student names, ID numbers, emails, and private messages per Instructure's confirmation. ShinyHunters demanded that affected schools contact a cyber advisory firm and reach out to "TOX" privately to negotiate a settlement before a data leak on May 12, 2026; the attackers also provided a link to a list of claimed victims. ShinyHunters has previously targeted major organizations such as AT&T, Ticketmaster, Rockstar Games, ADT, and Vercel, indicating sophisticated tactics. Instructure had previously deployed patches to strengthen security following a prior breach. The incident underscores the acute vulnerability of large-scale learning management systems to coordinated ransomware operations and forces educational institutions to urgently negotiate with threat actors to prevent mass privacy violations before the leak deadline.

2026/05/08 4:21

ディリー frag: ユニバーサル Linux LPE(ローカル・プリミティブ型エクスプロイト)

## 日本語翻訳: 「Dirty Frag」は、2026 年 5 月時点ですでにパッチが存在せず、攻撃者が瞬時に完全なルート権限によるシステム制御を可能にする重要な Linux セキュリティ欠陥である。この脆弱性は 2 つの異なる攻撃手法を連結することで、認証バイパスと必須ファイル(例:`/etc/passwd`)の書き換えを実現し、バックドアアクセスを作成することを許可する。技術的には、暗号化通信によく用いられる `esp4`、`esp6`、または `rxrpc` などの特定のカーネルモジュールを標的にしており、サンボクس化された環境内での「ESP 認証バイパス」トリックを用いたり、システムページのキャッシュに悪意のあるルートシェルを記述したりすることで攻撃を行う。通常のソフトウェアアップデートとは異なり、深刻さの理由から情報公開が制限されており、まだ正式な CVE(Common Vulnerabilities and Exposures)は存在しない。影響を受けるユーザーは、手動で脆弱なモジュールをカーネル設定から無効化しない限り、即時に完全なる侵害のリスクに直面している。管理者は、システムパスワード内の特定のバイトシグネチャを確認することで、自らの環境が曝されているかを検証できる。この状況は、「Copy Fail」といった以前にもある脆弱性と類似しており、これもまた別個のバグを連結させていた。「Dirty Frag」に対するパッチが開発されるまで、組織は不正な権限昇進と主要な Linux ディストリビューション全体にわたるデータ漏洩を防ぐため、これらの危険なコンポーネントを能動的に取り除く必要がある。

2026/05/08 8:02

一時的に新しいソフトウェアをインストールしない方がいいかもしれません。

## Japanese Translation: この文書は、Anubis ソフトウェアリリース版 v1.25.0-46-gd3a00da のための情報クレジットとして機能し、マスコットデザインを CELPHASE に帰属させ、サイトは🇨🇦(カナダ)で❤️(愛)を持って構築されたことを示しています。また、ウェブサイトは Techaro セキュリティインフラストラクチャによって保護されていることも記載されています。これら全ての要素は、視覚的な制作の帰属、開発の場所、セキュリティパートナーシップを確認するためのアトリビューションタグとして機能し、より広い歴史的背景や分析的な文脈を提供していません。 ## Text to translate: This passage serves as an informational credit for the Anubis software release, v1.25.0-46-gd3a00da. It attributes the mascot design to CELPHASE and indicates that the site was built with ❤️ in 🇨🇦 (Canada). The text also notes that the website is protected by Techaro security infrastructure. Collectively, these elements function as attribution tags that confirm visual authorship, location of development, and security partnerships, while offering no broader historical or analytical context.

エージェントにはプロンプトの増加ではなく、制御フローが必要なのです。 | そっか~ニュース