**ムーズ・スパーク:個人向けスーパーインテリジェンスへの拡大**

2026/04/09 1:01

**ムーズ・スパーク:個人向けスーパーインテリジェンスへの拡大**

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

## 改良された概要

MetaのSuperintelligence LabsはMuse Sparkを発表しました。これはMuseファミリー初のマルチモーダル推論モデルで、ツール使用、視覚的思考連鎖、および「Contemplating mode」を備えています。このモードは複数エージェントを統括して並列推論を実現します。Muse Sparkは現在meta.aiとMeta AIアプリで利用可能で、選択されたユーザーに対してプライベートAPIのプレビューも公開されています。

Muse Sparkは競争力ある性能を発揮します:Humanity’s Last Examで58%、FrontierScience Researchで38%を達成し、Gemini Deep ThinkやGPT Proなどのフロンティアモデルに匹敵します。マルチモーダル知覚・推論、健康関連インタラクティブディスプレイ(例:栄養内容、筋肉活動)、および数独、コーヒーマシンチュートリアル、パーソナライズド栄養アドバイス、ヨガ指導などのタスクに対するユーザーカスタマイズ可能なプロンプトで優れた性能を示します。

9か月にわたる事前学習はLlama 4 Maverickと比較して計算量を10倍削減しつつ効率性を向上させました。強化学習スケーリングでは、訓練データでのpass@1/16が対数線形に増加し、保留評価でも一貫した精度を示すことで予測可能な汎化能力を示しています。テスト時推論は思考時間ペナルティとマルチエージェント統括を活用し、RLは初期の長い思考フェーズ後に推論トークンを圧縮するようモデルを訓練し、遅延を追加せずに性能を向上させます。

安全性テストはMetaのAdvanced AI Scaling Frameworkに従って実施されました。生物学的/化学兵器など高リスク領域で強力な拒否行動が確認され、サイバーセキュリティや制御喪失シナリオでは自律能力を持たず、すべてのフロンティアリスクカテゴリで安全マージンが保たれています。Apollo Researchのノーランチチェックポイントは評価認識率が高く、有害な影響がないことを確認しました。

戦略的投資は研究・訓練・インフラストラクチャにわたり、Hyperionデータセンターなどを含み、個人スーパーインテリジェンスへのさらなるスケーリングを支援します。Metaは予測可能で効率的な軌道に沿って、ますます高度なモデルを公開する計画です。

本文

本日の発表 – Muse Spark

Muse Spark は Meta Superintelligence Labs が新たに構築した「Muse」シリーズの最初のモデルです。
ネイティブマルチモーダル推論 モデルであり、以下をサポートします。

  • ツール使用
  • ビジュアルチェーン・オブ・ソート(思考過程)
  • マルチエージェント調整

これは私たちの AI スタックを一から見直す開始点となり、本日より meta.ai と Meta AI アプリで利用可能です。選ばれたユーザー向けにプライベート API プレビューも開放予定です。


個人スーパーインテリジェンスへの機能

Muse Spark は次の分野で競争力のある性能を発揮します。

  • マルチモーダル知覚
  • 推論
  • 健康関連タスク
  • エージェンシー操作

現在の投資は、長期的なエージェントシステムやコーディングワークフローといったギャップ解消に集中しています。より大きなモデルを開発中であり、その結果が私たちのスタックがスケールしやすいことを確認しています。

新機能 – 省察モード

省察モード は複数エージェントが並列に推論するよう調整し、Muse Spark が Gemini Deep Think や GPT Pro といった最先端の極限推論モードと競合できるようにします。大きな向上を実現しています。

タスクスコア
Humanity’s Last Exam58 %
FrontierScience Research38 %

アプリケーション

  1. マルチモーダルインタラクション
    ドメイン横断で視覚情報を統合するよう設計。

    • ビジュアル STEM クイズ、エンティティ認識、ローカリゼーションで高い性能。
    • ミニゲームや動的な家電トラブルシューティングなどの対話型体験を可能にします。
  2. ヘルスサポート
    1,000 名以上の医師と協力し、事実に基づく包括的健康応答用データを収集。

    • 栄養や運動中の筋肉活性化などを説明するインタラクティブディスプレイを生成。
  3. プロンプト例(ウェブ対話型)

    • Sudoku ゲームが Web 上で遊べる。
    • ラテ作りのチュートリアル:ステップにカーソルを合わせるとコンポーネントの境界ボックスがハイライト。
    • 高コレステロールのペスカタリアン向けパーソナライズド食品推奨:緑点=推奨食品、赤点=非推奨で、ホバーすると健康スコア・カロリー・マクロを表示。
    • ヨガ指導:筋肉伸展と難易度評価を並べて比較。

スケーリング軸

モデルの機能は次の三つの軸に沿って予測可能に拡張されます。

重点主な発見
プレトレーニングコアマルチモーダル理解と推論アーキテクチャ・最適化・データを再構築し、Llama 4 Maverick の10倍以上のコンピュートで同等性能を達成。
強化学習 (RL)コンピュートを使って能力を増幅Pass@1 / Pass@16 がログ線形に伸び、評価セットでは精度が向上。
テスト時推論推論トークンとマルチエージェント調整の効率的利用フェーズ転換:長い思考 → トークン圧縮 → 強化された性能。マルチエージェント思考は遅延増加なしに優れた結果をもたらす。

安全性

Advanced AI Scaling Framework に従い、広範な安全評価を実施しました。

  • 生物学的/化学兵器など高リスク領域での強力な拒否行動
  • サイバーセキュリティや制御喪失シナリオにおいて自律性・危険性がない
  • 「評価認識」を示し、整合性トラップを検知。現在はブロッキング懸念はありませんが、さらなる研究が必要です。

完全な安全結果は近日公開予定の Safety & Preparedness Report に掲載されます。


結論

Muse Spark は個人スーパーインテリジェンスへ向けた予測可能で効率的なスケーリング軌道を示しています。今後もこの経路上でさらに高度なモデルを共有できることを楽しみにしています。

同じ日のほかのニュース

一覧に戻る →

2026/04/09 0:40

私、macOS XをNintendo Wiiにポート(移植)いたしました。

## Japanese Translation: --- ## 改良された要約 Mac OS X 10.0(Cheetah)は、Nintendo Wii 上でネイティブに動作するようにポートされ、コンソールをキーボード/マウス入力と GUI サポート付きの完全機能型デスクトップへ変貌させました。プロジェクトのコアは、*ppcskel* をベースに最初から書き直されたカスタムブートローダーです。このブートローダーは、Wii の PowerPC 750CL CPU を起動し、メモリレイアウトを設定し、最小限のデバイスツリー(root → cpus → PowerPC,750; memory)を作成します。SD カードから XNU カーネルをロードし、実行中にカーネルバイナリをパッチ(MEM1/MEM2 用の BAT 設定と USB Gecko へのコンソール出力)し、制御を XNU に渡します。 ブートローダーが提供する主要ドライバーは次の通りです: - **SD‑カードドライバー**:Starlet MINI IPC コマンド(IPC_SDMMC_SIZE, READ, WRITE)を介して IOBlockStorageDevice を実装し、XNU が SD カードからルートファイルシステムをマウントできるようにします。 - **フレームバッファドライバー**:0x01700000 に RGB フレームバッファ(640×480 @ 16 bpp)を提供し、Wii のアナログテレビ出力用に YUV へ変換して Mac OS X GUI を実現します。 - **USB サポート**:PCI デバイスのニブ(NintendoWiiHollywoodPCIDevice)を作成し、AppleUSBOHCI をパッチして受け入れさせ、OHCI ドライバーからバイトスワップ処理を除去することでリバースレトルエンディアンハードウェアに対応し、USB キーボード/マウス機能をフル実装します。 ブートローダーは Apple Partition Map を解析し、起動可能なパーティションを一覧表示し、/chosen/memory‑map ノード経由でカーネル拡張を直接メモリにロードできるようにするため、改変されていない Mac OS X インストーラーパーティションからのインストールも可能です。必要なカーネル変更は最小限(BAT 設定、“hollywood” I/O ベース取得、フレームバッファキャッシュ整合性修正)で済み、その他すべてのドライバーはブートローダーが提供します。 この成果は、歴史的にサポートされていなかったプラットフォーム――Nintendo Wii――でも Mac OS X Cheetah をエンドツーエンドで動作させることを示し、ホビイストに低コストのレトロコンソールとして機能するデスクトップコンピュータを提供します。

2026/04/09 4:23

**ソフトウェア開発者のためのUSB:ユーザースペース USB ドライバー作成入門**

## Japanese Translation: ``` USB デバイスの操作は、libusb を使用してユーザー空間だけで完全に処理できるため、カーネルレベルのドライバ開発は不要です。 例として、Fastboot モード(VID 18d1 / PID 4ee0)にある Android フォンを挙げます。接続すると `lsusb` は「Google Inc. Nexus/Pixel Device (fastboot)」と表示し、カーネルドライバは付いていません。また、ベンダー固有クラスインターフェースが 2 つのバルクエンドポイントを公開します:コマンド送信用 OUT 0x02 とレスポンス受信用 IN 0x81。 libusb のホットプラグコールバックはこのデバイスの到着を検出し、Fastboot コマンドを自動的に発行できます。典型的な手順は次のとおりです: 1. `libusb_control_transfer` を使用して GET_STATUS リクエストを送信します。2 バイトの応答はデバイスがセルフパワーであり、リモートウェイクアップをサポートしないことを示します。 2. GET_DESCRIPTOR リクエストを送信して完全なデバイスディスクリプタ(ベンダー/プロダクト ID、USB バージョン等)を取得します。 3. バルク OUT 0x02 を介して Fastboot コマンドを発行します(例:「getvar:version」を 64 バイトにパディング)。 デバイスは IN 0x81 で 4 文字のステータス(「OKAY」または「FAIL」)と任意のペイロードを返します。 同じユーザー空間アプローチは、バルク転送に依存する他の USB プロトコルにも適用できます。主な作業はカーネルコードを書く代わりにプロトコルロジックを実装することです。これにより OEM 向けドライバ開発が簡素化され、ブートローダーのテストが迅速化し、カーネルモジュールなしでカスタム USB デバイスの高速プロトタイピングやデバッグが可能になり、組込み開発者と広範な USB エコシステムに恩恵をもたらします。 ```

2026/04/08 17:53

**コードを読む前に実行しておくべき一般的な Git コマンド** - `git fetch --all` *リモートの全ブランチとタグを取得します。* - `git status` *現在のブランチと未コミットの変更点を確認します。* - `git checkout <branch>` *対象となる機能やバグ修正用ブランチに切り替えます。* - `git pull --rebase` *ローカルブランチを最新の upstream コミットで更新します。* - `git log --oneline --graph --decorate -5` *簡潔なコミット履歴を表示し、文脈を把握します。* - `git diff origin/<branch>..HEAD` *まだプッシュしていない変更点を確認します。* - `git rev-parse HEAD` *現在のコミットハッシュを取得(参照に便利)。* - `git tag --list` *利用可能なタグ一覧を表示し、バージョン管理に役立てます。* - `git show <commit>` *特定のコミットの詳細と差分を調べます。* これらのコマンドで、コードを掘り下げる前にリポジトリの状態を素早く把握できます。

## 日本語訳: 以下の文章を日本語に翻訳してください。 ### 修正版要約 この記事は、ソースファイルを検査する前にコードベースの簡易監査が隠れた健康リスクを明らかにできる方法を示しています。これは5つの簡潔な Git コマンドを実行することで達成されます。 1. `git log --format=format: --name-only --since="1 year ago" | sort | uniq -c | sort -nr | head -20` 過去 1 年間で最も変更頻度が高い上位 20 ファイルを一覧表示し、潜在的な「ドラッグ」スポット(高い変更率)をフラグ付けします。 2. `git shortlog -sn --no-merges` コミット数で貢献者をランク付けします。単一人物が 70 % 超を占める場合はバスファクターが低く、過去 6 ヶ月にその貢献者がいない場合は危機的状況を示唆します。 3. `git log -i -E --grep="fix|bug|broken" --name-only --format='' | sort | uniq -c | sort -nr | head -20` バグ関連コミットが最も多いファイルを特定し、変更率データと照合して最高リスクコードをピンポイントします。 4. `git log --format='%ad' --date=format:'%Y-%m' | sort | uniq -c` 月ごとのコミット数を表示し、活動の加速または減退(例:半月間のドロップ)が重要人物の離脱を示す可能性があります。 5. `git log --oneline --since="1 year ago" | grep -iE 'revert|hotfix|emergency|rollback'` リバートとホットフィックスの数をカウントします。頻繁なリバートはデプロイ/テストが不安定であることを示し、ゼロの場合は安定性またはコミットメッセージ不足を意味する可能性があります。 これらの指標(変更ホットスポット、バスファクター問題、バグクラスタ、プロジェクトモーメンタム、火災対策頻度)は、コード複雑度測定だけよりも欠陥予測精度が高いと示されています(Microsoft Research 2005)。記事はスクワッシュマージワークフローが著者データを歪めることを警告しています。最初の監査に1時間を費やした後、筆者は特定されたリスクスポットに対して週単位で詳細調査を計画しています。関連研究としてはエンジニアリングチーム速度、Vim 使用、レガシー Rails 監査、Rails `default_scope` が引用されています。この手法は開発者に迅速なコミット履歴ベースの診断を提供し、高リスクファイルへの詳細コードレビューを集中させることでバグ削減、チームレジリエンス、およびリリース信頼性の向上を実現します。