ミストラル・ミディアム 3.5

2026/04/30 0:17

ミストラル・ミディアム 3.5

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

Mistral は、指示追従、推論、コーディングの能力を統合したフラッグシップモデルである 128B パラメータを持つ Mistral Medium 3.5 を改訂版 MIT ライセンス下で一般プレビューとして公開しました。このモデルは 256k のコンテキストウィンドウ、設定可能な推論努力度、そして変数の画像サイズとアスペクト比に対応するようにゼロからトレーニングされたビジョンエンコーダーを搭載しています。SWE-Bench Verified では 77.6%のスコアを記録し(Devstral 2 を上回)、τ³-Telecomでは91.4 のスコアを獲得し、わずか 4 台の GPU でのセルフホスティングも可能です。モデルと並行して、Mistral はクラウドベースコーディングエージェントプラットフォーム「Vibe」を導入しました。Vibe はリモートエージェントをクラウドへ移動させ、CLI または Le Chat から開始される非同期・並列実行を実現します。ユーザーは Le Chat 内でコーディングタスクを直接開始でき、セッションはリモートランタイム上に保持されます。また、ローカルの CLI セッションはクラウドへの「テレポート」により継続可能で、履歴、タスク状態、承認情報が保存されます。Vibe は GitHub(コード/Pull Requests)、Linear/Jira(Issue)、Sentry(インシデント)および Slack/Teams などのアプリと連携し、広範な編集やインストールに対応した隔離されたサンドボックス環境で動作します。モジュールリファクタリング、テスト生成、依存関係のアップグレード、CI 調査、バグ修正といった高容量タスク向けに設計されており、継続的な人的監視の必要性を低減します。ワークフローは Mistral Studio でオーケストレーションされ、Pro、Team、Enterprise プランにおいて Vibe を Le Chat に統合します。また、新しい「Work モード」(プレビュー)では Medium 3.5 を実行バックエンドとして採用し、ツールがデフォルトで有効な複雑な多ステッププロジェクトに対応します。Work モードはメール、カレンダー、ドキュメント、リサーチ合成、インボックスの三振り、Jira Issue の作成、Slack 上のチームサマリーなどを含むクロスツールのワークフローをサポートします。すべてのエージェントアクションについてツール呼び出しと根拠が可視化され、メッセージ送信やデータ変更などの機密タスクには明確な承認が必要です。この高度な推論力、スケーラブルなクラウド実行、および安全なサンドボックス化されたワークフローの組み合わせは、孤立したコーディングタスクから開発ライフサイクル全体を自律的に管理するへの大きな転換を示しています。

本文

コーディングエージェントは従来、ほぼすべてがユーザーのラップトップ上で稼働していましたが、今日はそれらをクラウドに移動させました。これらはクラウド上で自律的に実行され、並列処理が可能で、完了時にはユーザーへ通知を行います。Mistral Vibe CLI または Le Chat の内でも直接起動でき、会話を終えることなくコーディングタスクを外注できます。

この機能を後押ししているのは、公開プレビュー版として登場した Mistral Medium 3.5 です。これは Mistral Vibe および Le Chat の新しいデフォルトモデルであり、長期間わたるコーディングおよび生産性関連の作業を想定して構築されました。また、Le Chat の新機能「Work モード(プレビュー)」では、研究、分析、クロスツール操作といった複雑なマルチステップタスクに対応するための強力なエージェントが新たに導入され、さらなる拡張を実現しています。

主な特徴

  • Mistral Medium 3.5:指示従順性、推論能力、コーディング能力を単一の 128B パラメータの密集型モデルに統合した最新フラグシップモデルです。オープンウェイトとしてリリースされ、修正版 MIT ライセンスの下提供されています。
  • 実用上の強力なパフォーマンスを発揮し、かつ少数(4 グプ以上)の GPU でセルフホスト可能なサイズを実現しています。
  • Mistral Vibe リモートエージェントによる非同期コーディング:セッションはクラウド上で実行され、CLI または Le Chat から起動可能です。また、ローカルの CLI セッションをクラウドへテレポーティングすることもできます。
  • Le Chat での Mistral Vibe コーディングタスクの開始:セッションは同一のリモートランタイムで稼働し、ユーザーが離れても進捗を継続します。
  • Le Chat の Work モードでは、Mistral Medium 3.5 で動作する新エージェントにより、マルチステップタスクを処理します。タスク完了まで複数のツールを並列呼び出しながら実行を行います。

Mistral Medium 3.5

Mistral Medium 3.5 は、当社初のフラグシップ統合モデルであり、今般公開プレビュー版として提供開始されました。指示従順性、推論能力、コーディング能力を単一の重みセットで統合した、256k コンテキストウィンドウを持つ密集型 128B モデルです。実用シーンにおいて高い性能を発揮し、4 グプ程度でのセルフホストも可能です。また、各リクエストに応じて推論努力の程度を調整可能にし、同じモデルで即答的なチャット返信から複雑なエージェント駆動の実行まで柔軟に対応できます。さらに、可変的な画像サイズやアスペクト比にも対応できるよう、ビジョンエンコーダーを一から見直す形で再訓練を行いました。

SWE-Bench Verified ベンチマークでは 77.6% のスコアを記録し、Devstral 2 や Qwen3.5 397B A17B など既存モデルを凌駕する結果を示しました。また、強力なエージェント能力も備え、τ³-Telecom で 91.4 のスコアを取得しています。

本モデルは長期的視点を持つタスク向けに設計されており、複数のツールを確実に呼び出し、下流のコードが消費可能な構造化出力を生成できます。これにより、Vibe における非同期クラウドエージェントの実用化が可能になりました。

Mistral Medium 3.5 は Le Chat のデフォルトモデルとして採用され、またコーディングエージェントである Vibe CLI においては Devstral 2 を代替します。

Mistral Vibe リモートエージェント

今日より、ユーザーが離れている間もコード編集セッションは長期タスクを処理可能です。多くのセッションは並列実行でき、エージェントの各ステップでユーザーがボトルネックになることを防ぎます。

クラウド上で動作するエージェントは、Mistral Vibe CLI および Le Chat から起動できます。稼働中は、ファイル差分、ツール呼び出し、進捗状況、または随時表示される質問などを通じて、エージェントがどのような動作を行っているかを点検可能です。また、継続中のローカル CLI セッションをクラウドへテレポーティングし、セッション履歴、タスク状態、承認フローなども跨いで維持できます。

Vibe はシステムエンジニアリングチームが既に利用している環境との間に位置し、必要な場所で人間がループに組み込まれるよう設計されています。GitHub(コードとプルリクエスト)、Linear および Jira(課題)、Sentry(インシデント)、Slack または Teams(レポート)などのアプリケーションとの連携も可能です。

各コーディングセッションは、大規模な編集やインストールを含めた広範な変更を行うことも可能な独立したサンドボックス内で実行されます。作業完了時には、エージェントが GitHub にプルリクエストを作成し、ユーザーへ通知を送るため、個々のキーストロークではなく最終的な成果物をレビューすればよいようになります。これは、開発者の時間を必要とするが判断力を要求しない大量発生する明確な業務——モジュールのリファクタリング、テスト生成、依存関係のアップグレード、CI 調査、バグ修正など——に適しています。

私たちは Mistral Studio でオーケストレーションされたワークフローを活用し、Mistral Vibe を Le Chat に統合しました。当初は社内コーディング環境向けに開発し、その後企業顧客向けにも展開してまいりました。現在ではこの機能が一般ユーザーにも開放され、ウェブからコーディングタスクを発行できるようになりました。また、ローカルターミナルに依存しないため、複数のセッションを並列で実行することも可能です。

Le Chat の内でも直接コーディングセッションを開始でき、チャットで記述されたタスクも CLI やウェブサイトと同じリモートランタイム上で実行され、後に完了したブランチやドラフト PR として引き継がれます。

Le Chat にて新たに登場する Work モード(プレビュー)

Work モードは、Le Chat における複雑なタスク向けに設計された強力な新エージェントモードです。新型ハルネスと Mistral Medium 3.5 を組み合わせ、アシスタント自体の実行バックエンドとして機能します。これにより Le Chat は読み書きを行うほか、複数のツールを同時に使い、マルチステッププロジェクトを進めて最終的な目標達成を目指せます。

Work モードで今日から実現できること:

  • クロスツールワークフロー:1 つの走査内でメール、メッセージ、カレンダーを追跡し、会議準備に際して参加者情報、最新ニュース、話題提起ポイントなどの源資料からの情報を整えます。
  • 研究と総合:ウェブ、内部ドキュメント、連携ツールの複数ソースからトピックを掘り下げ、導出した構造化された簡易報告書やレポートを作成し、出力または送信前に編集可能です。
  • メール受信トレイの整理と返信下書き作成:チームおよび顧客との議論から Jira に課題を作成し、Slack でチームへサマリーを送信できます。

セッションは通常のチャット返信よりも長期間存続するため、エージェントは試行錯誤を繰り返し、複数のターンにわたって継続してタスクを完了させることができます。Work モードでは、コネクタがデフォルトで有効化されており、マニュアル選択の代わりにドキュメント、メールボックス、カレンダー、その他のシステムへアクセスし、適切なアクションを実行するために必要な豊富なコンテキストを取得できます。

エージェントが行うすべての動作は可視化されます:各ツール呼び出しとその思考プロセス・根拠を確認できます。また、メッセージ送信、文書作成、データ改ざんなど機密性の高いタスクに進む際、ユーザーの権限に基づいて明示的な承認を求めてから実行します。

開始方法

Mistral Medium 3.5 は今日より Mistral Vibe および Le Chat で利用可能です。Pro、Team、Enterprise プランではリモートコーディングエージェントや Le Chat の Work モードを動作させるために採用されています。API では入力トークンあたり 1.5 ドル、出力トークンあたり 7.5 ドルで提供されます。オープンウェイトは Hugging Face で修正版 MIT ライセンスのもと公開されています。

また、プロトタイピング用途でもご利用可能です。NVIDIA GPU アクセラレーションエンドポイント(build.nvidia.com)またはスケーラブルなコンテナ化推論マイクロサービス「NVIDIA NIM」としてホストされた形で提供されます。

エージェントシステムの未来を共に構築しましょう。研究、エンジニアリング、プロダクト各分野で採用を行っております。オープンロールはこちらからご確認ください。

同じ日のほかのニュース

一覧に戻る →

2026/04/29 23:34

ゼッド 1.0

## Japanese Translation: Zed は公式にバージョン 1.0 をリリースし、多くの開発者が Mac、Windows、Linux 上でこの高性能なコードエディタを安心して利用できる重要な転換点を迎えました。Rust で完全構築され、GPU による加速レンダリングを採用する Zed は、従来のデスクトップアプリモデル(Electron など)を手放し、ゲーム環境のような優れた速度を実現するために設計された環境へと移行しました。独自に GPUI ライブラリ、CRDT を基盤とする DeltaDB データベース、シェーダーなどスタック全体を深く制御することで、競合には真似できないパフォーマンスを発揮しており、5 年で数百万行のコードを処理し、千以上のバージョンをリリースしてきました。バージョン 1.0 では数十の言語に対応し、Git 統合、SSH リモート、デバッガー、レインボー括弧などをサポートしており、すでに数十万人のデイリーユーザーに信頼されています。AI ネイティブなエディタとしての Zed は、Claude Agent、Codex、OpenCode、Cursor などのエージェントに対して Agents Client Protocol を用いてキーストローク粒度の予測とともに複数のエージェントを並行して統合しており、DeltaDB はチームメンバーが他者とエージェントとの会話を招待し、生成コンテキスト内で直接エイジェントコードをレビュー・発展させることを可能にします。このリリースの後、Zed は每周アップデートを継続し、人間と AI エージェントが文字レベルでリアルタイムに協業する未来へと向けられていきます。さらに、エンタープライズのニーズをサポートするために中央集権的な請求、ロールベースのアクセス制御、チーム管理、セキュリティ制御を提供する新たな「Zed for Business」のオファーも間もなく登場し、効率的なソフトウェア shipping において不可欠なツールとしての地位を確固たるものにします。現在、数十万人の開発者が Zed に依存して日々ソフトウェアを shipping し続けており、その職人技とパフォーマンスへの姿勢にチームは自信を抱いています。

2026/04/30 3:13

コピー失敗 – CVE-2026-31431

## Japanese Translation: CVE-2026-31431「Copy Fail」は、Xint Code による自動スキャンで発見された重大なコンテナエスケープ脆弱性であり、Linux システム上の何らかの未特権ユーザーが root に権限を昇級することを可能にします。この欠陥は 2017 年に追加された `algif_aead` モジュールにおける論理エラーに起因しており、タイミングの問題やレース条件が存在しない直線の攻撃経路によってデータ漏洩を引き起こします。2026-04-29 に公開され、2017 年以来のほぼすべての主流の Linux ディストリビューションに影響を与えており、Ubuntu、RHEL、Amazon Linux、SUSE、Debian、Arch、Fedora などを含むスタンドアロンの 732 バイトのProof-of-Conceptスクリプトによって確認されています。 **重大性と範囲:** * **高リスク:** マルチテナントホスト、Kubernetes クラスター、CI リナラー、クラウド SaaS 環境。 * **中リスク:** シングルトナントサーバー。 * **比較的低リスク:** シングルユーザーのノートパソコン(権限昇級のみ)。 **緩和措置と影響:** 管理者は直ちにメインラインの修正(コミット `a664bf3d603d` で特定)を適用する必要があります。緊急的な臨時対策として、脆弱なモジュールを無効化するために `/etc/modprobe.d/disable-algif.conf` を使用し、`rmmod algif_aead` を実行してください。AF_ALG の無効化は、それを明示的に使用するアプリケーション(例:afalg エンジンを使用する OpenSSL)に影響を与えるものの、dm-crypt、LUKS、IPsec、SSH などのコアサービスには影響しません。非信頼のワークロードについては、パッチの有無に関わらず追加の防御層として seccomp を使用して AF_ALG ソケットの作成をブロックすることをお勧めします。 ## Text to translate The original summary is well-written, clear, and comprehensive. No improvement is strictly necessary, but a slightly more structured version below offers better readability while retaining all key points. ## Improved Summary: CVE-2026-31431 "Copy Fail" A critical container escape vulnerability, CVE-2026-31431 ("Copy Fail"), discovered by Xint Code via automated scanning, allows any unprivileged user on Linux systems to escalate privileges to root. The flaw stems from a logic error in the `algif_aead` module—an optimization added in 2017—which enables data leakage through a straight-line attack path without timing issues or race conditions. Disclosed publicly on 2026-04-29, the vulnerability affects nearly all mainstream Linux distributions since 2017, confirmed across Ubuntu, RHEL, Amazon Linux, SUSE, Debian, Arch, Fedora, and more via a standalone 732-byte proof-of-concept script. **Severity & Scope:** * **High Risk:** Multi-tenant hosts, Kubernetes clusters, CI runners, and cloud SaaS environments. * **Medium Risk:** Single-tenant servers. * **Lower Risk:** Single-user laptops (privilege escalation only). **Mitigation & Impact:** Administrators must urgently apply the mainline fix identified by commit `a664bf3d603d`. As an immediate temporary measure, disable the vulnerable module using `/etc/modprobe.d/disable-algif.conf` and `rmmod algif_aead`. While disabling AF_ALG impacts applications explicitly using it (e.g., OpenSSL with the afalg engine), core services like dm-crypt, LUKS, IPsec, and SSH remain unaffected. For untrusted workloads, blocking AF_ALG socket creation via seccomp is recommended as an additional defense layer regardless of patch status.

2026/04/30 6:58

ドイツは現在、世界最大の弾薬製造国となっています。

## Japanese Translation: ラインメタルはドイツの軍事生産能力を劇的に拡大し、同国を世界トップクラスの常规兵器製造国として確立しました。この転換は、主に供給量の劇的な増加——例えば榴弾の生産速度が以前から10倍に向上し、軍用トラックの年間生産量は600台から4,500台へと増大した——によって国内防衛の緊急な需要を満たすことを目的として推進されています。これらの拡大努力はロシアの侵攻に伴うドイツの工業基盤の変革を導き、連邦国防軍(Bundeswehr)を欧州最強の勢力と位置づけることを目指していますが、新しい生産能力は特定の分野で現在の米国の生産水準を上回ることを可能にしますが、必ずしも米国よりも大量の在庫を保有しているわけではないことを意味しません。 この増大を支援するため、ラインメタルは35万件以上の雇用申請(うちドイツからの申請が25万件)を受け、急速に労働力を拡大しています。同社は2030年までに直接雇用を7万人に増やし、既存の1万1,500社のサプライヤーネットワーク全体でさらに21万人の追加ポストを設けることを期待しています。そのサプライヤーの多くは既に自動車業界における専門知識を持っています。この移行は構造転換であり、縮小傾向にある自動車業界から吸収されていた雇用を防衛生産が担うものです。ラインメタルのCEO は、これらの削減により防衛兵器生産が最終的にドイツの自動車セクターの約1/3 の雇用を代替する可能性があるとの見通しを示しています。結局のところ、この再編成は深層的な産業統合と、常规弾薬および装備品における大幅に強化された生産能力を確保します。

ミストラル・ミディアム 3.5 | そっか~ニュース