
2026/04/30 0:17
ミストラル・ミディアム 3.5
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
Mistral は、指示追従、推論、コーディングの能力を統合したフラッグシップモデルである 128B パラメータを持つ Mistral Medium 3.5 を改訂版 MIT ライセンス下で一般プレビューとして公開しました。このモデルは 256k のコンテキストウィンドウ、設定可能な推論努力度、そして変数の画像サイズとアスペクト比に対応するようにゼロからトレーニングされたビジョンエンコーダーを搭載しています。SWE-Bench Verified では 77.6%のスコアを記録し(Devstral 2 を上回)、τ³-Telecomでは91.4 のスコアを獲得し、わずか 4 台の GPU でのセルフホスティングも可能です。モデルと並行して、Mistral はクラウドベースコーディングエージェントプラットフォーム「Vibe」を導入しました。Vibe はリモートエージェントをクラウドへ移動させ、CLI または Le Chat から開始される非同期・並列実行を実現します。ユーザーは Le Chat 内でコーディングタスクを直接開始でき、セッションはリモートランタイム上に保持されます。また、ローカルの CLI セッションはクラウドへの「テレポート」により継続可能で、履歴、タスク状態、承認情報が保存されます。Vibe は GitHub(コード/Pull Requests)、Linear/Jira(Issue)、Sentry(インシデント)および Slack/Teams などのアプリと連携し、広範な編集やインストールに対応した隔離されたサンドボックス環境で動作します。モジュールリファクタリング、テスト生成、依存関係のアップグレード、CI 調査、バグ修正といった高容量タスク向けに設計されており、継続的な人的監視の必要性を低減します。ワークフローは Mistral Studio でオーケストレーションされ、Pro、Team、Enterprise プランにおいて Vibe を Le Chat に統合します。また、新しい「Work モード」(プレビュー)では Medium 3.5 を実行バックエンドとして採用し、ツールがデフォルトで有効な複雑な多ステッププロジェクトに対応します。Work モードはメール、カレンダー、ドキュメント、リサーチ合成、インボックスの三振り、Jira Issue の作成、Slack 上のチームサマリーなどを含むクロスツールのワークフローをサポートします。すべてのエージェントアクションについてツール呼び出しと根拠が可視化され、メッセージ送信やデータ変更などの機密タスクには明確な承認が必要です。この高度な推論力、スケーラブルなクラウド実行、および安全なサンドボックス化されたワークフローの組み合わせは、孤立したコーディングタスクから開発ライフサイクル全体を自律的に管理するへの大きな転換を示しています。
本文
コーディングエージェントは従来、ほぼすべてがユーザーのラップトップ上で稼働していましたが、今日はそれらをクラウドに移動させました。これらはクラウド上で自律的に実行され、並列処理が可能で、完了時にはユーザーへ通知を行います。Mistral Vibe CLI または Le Chat の内でも直接起動でき、会話を終えることなくコーディングタスクを外注できます。
この機能を後押ししているのは、公開プレビュー版として登場した Mistral Medium 3.5 です。これは Mistral Vibe および Le Chat の新しいデフォルトモデルであり、長期間わたるコーディングおよび生産性関連の作業を想定して構築されました。また、Le Chat の新機能「Work モード(プレビュー)」では、研究、分析、クロスツール操作といった複雑なマルチステップタスクに対応するための強力なエージェントが新たに導入され、さらなる拡張を実現しています。
主な特徴
- Mistral Medium 3.5:指示従順性、推論能力、コーディング能力を単一の 128B パラメータの密集型モデルに統合した最新フラグシップモデルです。オープンウェイトとしてリリースされ、修正版 MIT ライセンスの下提供されています。
- 実用上の強力なパフォーマンスを発揮し、かつ少数(4 グプ以上)の GPU でセルフホスト可能なサイズを実現しています。
- Mistral Vibe リモートエージェントによる非同期コーディング:セッションはクラウド上で実行され、CLI または Le Chat から起動可能です。また、ローカルの CLI セッションをクラウドへテレポーティングすることもできます。
- Le Chat での Mistral Vibe コーディングタスクの開始:セッションは同一のリモートランタイムで稼働し、ユーザーが離れても進捗を継続します。
- Le Chat の Work モードでは、Mistral Medium 3.5 で動作する新エージェントにより、マルチステップタスクを処理します。タスク完了まで複数のツールを並列呼び出しながら実行を行います。
Mistral Medium 3.5
Mistral Medium 3.5 は、当社初のフラグシップ統合モデルであり、今般公開プレビュー版として提供開始されました。指示従順性、推論能力、コーディング能力を単一の重みセットで統合した、256k コンテキストウィンドウを持つ密集型 128B モデルです。実用シーンにおいて高い性能を発揮し、4 グプ程度でのセルフホストも可能です。また、各リクエストに応じて推論努力の程度を調整可能にし、同じモデルで即答的なチャット返信から複雑なエージェント駆動の実行まで柔軟に対応できます。さらに、可変的な画像サイズやアスペクト比にも対応できるよう、ビジョンエンコーダーを一から見直す形で再訓練を行いました。
SWE-Bench Verified ベンチマークでは 77.6% のスコアを記録し、Devstral 2 や Qwen3.5 397B A17B など既存モデルを凌駕する結果を示しました。また、強力なエージェント能力も備え、τ³-Telecom で 91.4 のスコアを取得しています。
本モデルは長期的視点を持つタスク向けに設計されており、複数のツールを確実に呼び出し、下流のコードが消費可能な構造化出力を生成できます。これにより、Vibe における非同期クラウドエージェントの実用化が可能になりました。
Mistral Medium 3.5 は Le Chat のデフォルトモデルとして採用され、またコーディングエージェントである Vibe CLI においては Devstral 2 を代替します。
Mistral Vibe リモートエージェント
今日より、ユーザーが離れている間もコード編集セッションは長期タスクを処理可能です。多くのセッションは並列実行でき、エージェントの各ステップでユーザーがボトルネックになることを防ぎます。
クラウド上で動作するエージェントは、Mistral Vibe CLI および Le Chat から起動できます。稼働中は、ファイル差分、ツール呼び出し、進捗状況、または随時表示される質問などを通じて、エージェントがどのような動作を行っているかを点検可能です。また、継続中のローカル CLI セッションをクラウドへテレポーティングし、セッション履歴、タスク状態、承認フローなども跨いで維持できます。
Vibe はシステムエンジニアリングチームが既に利用している環境との間に位置し、必要な場所で人間がループに組み込まれるよう設計されています。GitHub(コードとプルリクエスト)、Linear および Jira(課題)、Sentry(インシデント)、Slack または Teams(レポート)などのアプリケーションとの連携も可能です。
各コーディングセッションは、大規模な編集やインストールを含めた広範な変更を行うことも可能な独立したサンドボックス内で実行されます。作業完了時には、エージェントが GitHub にプルリクエストを作成し、ユーザーへ通知を送るため、個々のキーストロークではなく最終的な成果物をレビューすればよいようになります。これは、開発者の時間を必要とするが判断力を要求しない大量発生する明確な業務——モジュールのリファクタリング、テスト生成、依存関係のアップグレード、CI 調査、バグ修正など——に適しています。
私たちは Mistral Studio でオーケストレーションされたワークフローを活用し、Mistral Vibe を Le Chat に統合しました。当初は社内コーディング環境向けに開発し、その後企業顧客向けにも展開してまいりました。現在ではこの機能が一般ユーザーにも開放され、ウェブからコーディングタスクを発行できるようになりました。また、ローカルターミナルに依存しないため、複数のセッションを並列で実行することも可能です。
Le Chat の内でも直接コーディングセッションを開始でき、チャットで記述されたタスクも CLI やウェブサイトと同じリモートランタイム上で実行され、後に完了したブランチやドラフト PR として引き継がれます。
Le Chat にて新たに登場する Work モード(プレビュー)
Work モードは、Le Chat における複雑なタスク向けに設計された強力な新エージェントモードです。新型ハルネスと Mistral Medium 3.5 を組み合わせ、アシスタント自体の実行バックエンドとして機能します。これにより Le Chat は読み書きを行うほか、複数のツールを同時に使い、マルチステッププロジェクトを進めて最終的な目標達成を目指せます。
Work モードで今日から実現できること:
- クロスツールワークフロー:1 つの走査内でメール、メッセージ、カレンダーを追跡し、会議準備に際して参加者情報、最新ニュース、話題提起ポイントなどの源資料からの情報を整えます。
- 研究と総合:ウェブ、内部ドキュメント、連携ツールの複数ソースからトピックを掘り下げ、導出した構造化された簡易報告書やレポートを作成し、出力または送信前に編集可能です。
- メール受信トレイの整理と返信下書き作成:チームおよび顧客との議論から Jira に課題を作成し、Slack でチームへサマリーを送信できます。
セッションは通常のチャット返信よりも長期間存続するため、エージェントは試行錯誤を繰り返し、複数のターンにわたって継続してタスクを完了させることができます。Work モードでは、コネクタがデフォルトで有効化されており、マニュアル選択の代わりにドキュメント、メールボックス、カレンダー、その他のシステムへアクセスし、適切なアクションを実行するために必要な豊富なコンテキストを取得できます。
エージェントが行うすべての動作は可視化されます:各ツール呼び出しとその思考プロセス・根拠を確認できます。また、メッセージ送信、文書作成、データ改ざんなど機密性の高いタスクに進む際、ユーザーの権限に基づいて明示的な承認を求めてから実行します。
開始方法
Mistral Medium 3.5 は今日より Mistral Vibe および Le Chat で利用可能です。Pro、Team、Enterprise プランではリモートコーディングエージェントや Le Chat の Work モードを動作させるために採用されています。API では入力トークンあたり 1.5 ドル、出力トークンあたり 7.5 ドルで提供されます。オープンウェイトは Hugging Face で修正版 MIT ライセンスのもと公開されています。
また、プロトタイピング用途でもご利用可能です。NVIDIA GPU アクセラレーションエンドポイント(build.nvidia.com)またはスケーラブルなコンテナ化推論マイクロサービス「NVIDIA NIM」としてホストされた形で提供されます。
エージェントシステムの未来を共に構築しましょう。研究、エンジニアリング、プロダクト各分野で採用を行っております。オープンロールはこちらからご確認ください。