マルチストリーム大規模言語モデル:プロンプト、思考プロセス、および入出力を並列化・分離化する新刊論文について

2026/05/22 4:37

マルチストリーム大規模言語モデル:プロンプト、思考プロセス、および入出力を並列化・分離化する新刊論文について

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

この文章は、従来の単一ストリームの AI 処理から、複数の並列計算ストリームへの根本的な転換を提案しており、これにより現在の使いやすさの限界を克服する。ChatGPT などの早期モデルでは、システムが読むことを完了してから行動したり、書く前に思考したりするような堅牢な順次形式に依存していたが、この新アーキテクチャではエージェントが読みながら行動し、書きながら同時に思考することを可能にする。役割の分離を改善することで効率性とセキュリティに関するボトルネックに対処できるようになるため、従来の順序性行为を強制する古いインストラクションチューニング手法を置き換える代わりに、すべてのフォワードパスで複数の入力ストリームから読み取りを行い、因果的に依存した複数の出力ストリームでトークンを生成するという構造へと移行する。このアプローチは、使いやす性の向上、並列化によるモデル効率の向上、関心の分離によるセキュリティ強化、ならびにモニタリビリティの増大を目的としている。ジョナス・ゲイピンによって提出されたこの作業(バージョン [v1]、2026 年 5 月 12 日水曜日)は、複雑なタスクを実行することを妨げてきたデッドロックなどの問題を直接解決するように設計されている。最終的には、この並列構造の採用により、順次処理によって制限されていたモデルの機能を解放することができ、ユーザーには大幅に向上した使いやすさを提供し、企業にはより効率的で安全かつモニタリング可能な自律システムを構築できる。

本文

【要約】
言語モデルの性能が引き続き向上することで、コーディングやコンピューター使用など、自律的なエージェントを駆動する手段として広く利用されるようになりました。しかしながら、これらのシステムの核心部分は、ChatGPT などの早期に指示調整(instruction-tuning)されたモデルが登場して以来、大きな変化を受けずにおり、高度な AI エージェントであっても、メッセージの交換形式に基づいており、単一の計算ストリームの中でユーザー、システム、自身(思考連鎖を伴うものも含む)、そしてツールとの間で逐次的にメッセージ交換を行うという点に変わりはありません。チャットモデルにおけるこの単一ストリームのボトルネックは、次のような複数の制限を引き起こしています:エージェントが読み込み中にもかかわらず出力(行動)を生成することができず、逆に書式化中に新しい情報に対して反応することができないという双方向の制約です。同様に、思考しながら行動することはできず、あるいは読み込み中や情報への対応行動中において思考を行うこともできません。

本研究では、指示調整を行う際のメッセージ形式が逐次的な流れから、並列な複数の計算ストリームへと変更し、それぞれの役割を別々のストリームに分割する手法によって、モデルの封じ込めを解くことができることを示します。このアプローチにより、言語モデルの前向きパッセージ(forward pass)のたびに、複数の入力ストリームから同時に読み込みを行い、複数の出力ストリームでトークンを生成することが可能となり、これらすべてのストリームは過去の時間ステップに因果的に依存しています。我々は、このデータ駆動型の変更が上記に挙げたいくつかの使用面での制限を是正し、並列化を通じてモデルの効率性を向上させるとともに、関心の分離(separation of concerns)の改善によりモデルのセキュリティを強化すると同時に、さらにモデルの監視可能性も向上させることができると考えます。

投稿履歴:Jonas Geiping [メールアドレス表示]
[v1] 2026 年 5 月 12 日 17:47:41 UTC(871 KB)

同じ日のほかのニュース

一覧に戻る →

2026/05/22 3:54

Ubuntu 16.04 で 10 ユーアー運用したブログを、FreeBSD に移行しました。

2026/05/22 4:32

視覚障害者の方々が Kagi シーチを使用してする方法

## Japanese Translation: Kagi は、ユーザーのサブスクリプションによって完全に資金提供され、SEO やエンゲージメント指標よりも結果の品質を優先する有料かつ広告非表示の検索エンジンです。主流の検索エンジンで見られる乱立した結果、自動再生動画、詐欺的なサイト、AI 生成ノイズなどによる「視覚疲労」に備えて採用されました。結果は有料配置やキーワードではなく品質に基づいてランク付けされ、プラットフォームは「small web」の高品質なソース(開発者ドキュメントやインデペンデントブログなど)を統合するとともに、よりクリーンで信頼性の高いリサーチ環境を構築するために豊富なカスタマイズ機能を備えています。 Kagi のサブスクリプションモデルには、無料トライアル(100 回検索)から Starter(月額 $5 で 300 回検索)、Professional(月額 $10 で無限検索)、Ultimate(月額 $25)までのティアが含まれます。「Fair Pricing」ポリシーにより、ユーザーは未使用の検索クレジットを将来の利用プランに転換したり、適切なクレジット調整とともにプランをダウングレードしたりすることができます。ユーザーは内蔵された CSS エディタを通じて不要な要素を非表示にし、テーマをカスタマイズし、フォントや高コントラスト設定を調整し、AI 生成画像を削除できます。追加の機能として、「Lenses」によるトピックフィルター(例:Academic、Programming)の保存、ドメイン制御による結果のブロック・低減・増加・ピン留め、Bangs コマンド(!w で Wikipedia など)、キーボードショートカット(`?` キーでアクセス可能)があります。「Share this Search」機能により、個々のリンクをコピーせずに特定の Kagi 検索結果を共有することが可能です。Chrome、Edge、Firefox のデフォルト統合を有効にすることで、Kagi は広告、自動再生コンテンツ、詐欺的なサイトへの露出を減らし、より高い検索品質を促すシームレスでプライバシー重視のエコシステムを提供しています。

2026/05/21 23:34

[Show HN] Freenet:分散型アプリケーション向けのピア・ツー・ピア・プラットフォーム

## Japanese Translation: Freenet プラットフォームは、大規模テック企業のインフラに依存せず動作する通信、コラボレーション、商用向けの分散型アプリケーションを可能にする転換的なアプローチをデジタル領域にもたらします。位置情報に基づいたリング構造で組織化されたグローバルピアツーピアネットワークとして機能し、ユーザーのコンピュータがノードとして作用することを許可するとともに、中央集権サーバーへの依存を排除します。ユーザーはこれらのアプリケーションをブラウザ経由で直接アクセスでき、通常のウェブサイトのように表示されますが、撤去されることができず、追跡不可能であり、従来のクラウドモデルで見られるデータ監視から自由です。開発者は Rust や TypeScript などの熟悉的なプログラミング言語を活用して、これら頑健なツールの構築が可能になり、高額なホスティングコストや依存関係に縛られずに済みます。汎用アクセシビリティのための開放標準を用いて構造化されており、ベンチャー資金によるモデルとは異なり、少数チームによる助成金と寄付に完全に頼っています。今後の成長は、持続可能で無料のデジタルインフラを求める開発者とユーザー双方における採用拡大に大きく依存しており、個人に必須ツールのアクセスを止められないようにするという/serverレス代替手段へと業界をシフトさせる可能性があります。