デルタ・メモリ:大規模言語モデルのための効率的なオンラインメモリ

2026/05/16 18:30

デルタ・メモリ:大規模言語モデルのための効率的なオンラインメモリ

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

本論の核心は、コアアーキテクチャを変更せず、長期動作エージェントシステムを大幅に強化する軽量なメモリ機構である「δ-mem」の導入にあります。過去の情報圧縮を $8\times8$ の固定サイズ状態行列化し、生成時にロウアウト(readout)によって低ランク補正を適用することで、フルファインチューニングやバックボーン置換に伴う高計算コストを回避します。この手法は、既存の非δ-mem ベースラインに対して正確に $15%$ の性能向上を実現し、フrozen バックボーンとの比較ではスコアが $1.10$ 倍、最も強力なベースラインとの比較では $1.15$ 倍という超過 $10%$ の向上を達成します。MemoryAgentBench や LoCoMo など専門ベンチマークで検証され(それぞれ $1.31\times$ と $1.20\times$ のスコアを得る)、メモリ負荷の高いタスクにおいて極めて有効であることが示されました。従来の文脈拡張や明示的なモデル修正を必要とする手法とは異なり、δ-mem は最小限の関連記憶状態を用いてフrozen フルアテンションバックボーンを増幅します。この革新により、開発者は一般能力とベンチマーク結果を効率的に向上させられ、システム全体再訓練のオーバーヘッドなしで長期記憶改善を目指す既存モデルに対する基礎的なアップグレードを提供します。

本文

PDF ビューア

サマリー: 大規模言語モデル(LLM)は、長期にわたるアシスタントやエージェントシステムの構築において、過去の情報とその再利用をますます必要としています。単にコンテキストウィンドウのサイズを拡大するだけではコストが高くなるばかりか、効果的な文脈の利用を保証しきれない場合があります。本稿では、凍結されたフル・アテンションバックボーンにコンパクトなオンライン状態(連想記憶)を組み合わせた軽量なメモリ機構「δ-mem(デルタ・メム)」を提案します。「δ-mem」は、過去の情報を圧縮して固定サイズの状態行列へと統合し、学習にはデルタ則を用います。生成段階においては、この出力を利用した低ランク補正により、バッキングのアテンション計算を改善します。オンラインメモリ状態がわずか $8\times 8$ の場合でも、「δ-mem」は凍結されたバックボーンを基準として平均スコアを $1.10$ 倍、最も性能の高い「δ-mem」以外のメモリベースラインを基準としても $1.15$ 倍の向上をもたらします。特にメモリ負荷が高いベンチマークでも顕著な効果が見られ、MemoryAgentBench では $1.31$ 倍、LoCoMo では $1.20$ 倍のスコアを達成しています。なお、汎用能力は大きく低下していません。これらの結果は、フル・ファインチューニングやバックボーンの置換、コンテキストの明示的拡張といった工程を導入せずに、注意力計算と直接結びついたコンパクトなオンライン状態を通じて、効果的なメモリを実現可能であることを示しています。

投稿履歴
送信元:Jingdi Lei [メールを読む]
[v1] 2026 年 5 月 12 日(火)16:31:44 UTC(ファイルサイズ:609 KB)

同じ日のほかのニュース

一覧に戻る →

2026/05/17 7:25

MCP はようページ

## Japanese Translation: HybridLogic は、ユーザーが直面している摩擦(直接ブラウザ経由で Model Context Protocol (MCP) サーバーにアクセスすると、生の JSON を伴う 401 Unauthorized エラーが表示されるという混乱を引き起こす問題)を解消しました。根本的な原因は、ユーザーが MCP エンドポイントをブラウザで開こうとするのではなく、LLM クライアントに統合しようとしていた点にあります。エンジニアらは、軽量かつ「ハック的」なリダイレクトを実装し、Accept ヘッダーが text/html を示すが application/json または text/event-stream を示さない場合に GET /mcp リクエストに対して HTML ページを返すようにしました。このページは、ユーザーがブラウザで表示する代わりにサーバーを LLM クライアントに追加することを案内します。デプロイ以降、サポートチケットは大幅に減少し、顧客サクセスの満足度が向上し、統合も早まりました。この解決策には運用負荷は一切必要なく、すべてのクライアントに対してコネクタを構築することなく、MCP 仕様の制限を補完するための手動アプローチの有効性を検証しました。AI も追跡もなく Luke Lanchester が作成した HybridLogic のホームページでは、顧客がより素早く環境整備を開始できるようになり、進化している仕様と現実世界のオンボーディングの間の不満に対処しています。

2026/05/17 2:12

キオクシアとデルが、薄型の 2 ラックユニット(2 RU)サーバーに 10 ピタバイトのストレージを収容することに成功。

## Japanese Translation: Dell は、AMD EPYC 9005 プロセッサを搭載し、最大 5 個の 400 Gbps NIC をサポートする新型 PowerEdge R7725xd サーバーに、Kioxia の高容量 QLC SSD「LC9」を統合しました。1 台あたりに E3.L フォーマットの 245.76 TB NVMe ドライブを 40 個使用することで、コンパクトな 2 RU フットプリント内で驚異的な 9.8 ペタバイトの総容量を実現しています。Dell の「コンピューティングおよびネットワーク担当執行副社長」Arun Narayanan氏によれば、この設計は AI インフラのスケーリングに不可欠なストレージ密度と電源効率を最適化しています。また、Kioxia アメリカの SSD 事業部の「執行副社長兼統括経営責任者」Neville Ichhaporia氏は、「顧客は物理空間のごく一部で巨大なインジェストストリームを展開することで、総保有コスト(TCO)を大幅に改善できます」と指摘しており、このサーバーを 20 台搭載したラックでは最大 196 PB のストレージを収容可能です。Micron(6600 ION)、SanDisk(UltraQLC SN670)、SK Hynix の Solidigm(AIN D)が独自の 256 TB クラスのドライブを開発し、Samsung は 1 PB のロードマップへ進んでいる中で、Dell がこのコンパクトな QLC 技術を採用することは、現代の AI デプロイメントに不可欠な高密度ストレージソリューションへの中道的な歩みとなります。 ## 欠落している要素(ある場合): * 競合他社の特定の製品名(Micron 6600 ION、SK Hynix AIN D、SanDisk UltraQLC SN670)および Samsung のロードマップ詳細は省略されています。 ## 推測・飛躍(ある場合): 重要なのは無し;要約は提供された点を正確に反映しており、根拠のない主張を行っていません。

2026/05/13 19:37

Windows Subsystem for Linux(WSL)

## Japanese Translation: WSL9x は、再ブートなしで Windows 9x カーネル内に最新の Linux カーネル バージョン 6.19 を協調的に実行する革新的なプロジェクトです。標準的な仮想化とは異なり、本システムはユーザースペースではなくスーパーバイザーモード(リング 0)で動作し、Windows 9x API を直接呼び出すことで古いオペレーティングシステムの深刻なハードウェア制限を回避します。このシームレスな統合は、以下の 3 つの主要コンポーネントにより実現されています:修正済み Linux カーネル(win9x-um-6.19 ブランチから)、専用 VxD ドライバ、DOS ベースのクライアントプログラム (`wsl.com`) です。特に重要なのは、元々の中断ベクトルテーブルでは適切なシステムコールに不十分なため、`int 0x80` の相互作用を効率的に管理するためにはジェネラルプロテクションフォルトハンドラへの依存である点です。Linux カーネルはユーザモード Linux から派生しており、リング 0 で実行するように変更されています。複雑な Windows 9x カーネル統合とコンテキストスイッチング論理の大部分はこのカスタムレイヤーに存在します。環境を設定するには、クライアントを起動する前にANSI ドライバ(例:`nnansi.com`)をロードし、色などのターミナル出力機能をサポートする必要があります。また、利用可能なシステムを作成するには、事前にインストール済み Windows 9x ベースイメージ (`hdd.base.img`) からハードディスクイメージ (`hdd.img`) を構築して生成する必要があります。本書全体は GPL-3 ライセンスの下で配布されており、ユーザーにはソフトウェアを修正し共有する明確な法的権利が保証され、そのオープンソース性が維持されています。

デルタ・メモリ:大規模言語モデルのための効率的なオンラインメモリ | そっか~ニュース