Mistral Releases Devstral 2 (72.2% SWE-Bench Verified) and Vibe CLI

2025/12/09 23:45

Mistral Releases Devstral 2 (72.2% SWE-Bench Verified) and Vibe CLI

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

Devstral は、2 つの大規模オープンソース言語モデルをリリースしました。

  • Devstral 2(123 B パラメータ、256K コンテキストウィンドウ、MIT バリアントライセンス)
  • Devstral Small 2(24 B パラメータ、同じコンテキストサイズ、Apache 2.0 ライセンス)

両モデルは最初の 90 日間は API 経由で無料です。以降は Devstral 2 が入力/出力それぞれで 1 百万トークンあたり $0.40 / $2.00、Small 2 は $0.10 / $0.30 の料金になります。

SWE‑bench Verified ベンチマークでは、Devstral 2 が 72.2 % を記録し、Claude Sonnet より 7 倍のコスト効率を実現しています。さらに DeepSeek V3.2 に対しては、人間評価で 42.8 % 対 28.6 % の損失差で優位に立っています。
同じベンチマークで Small 2 は 68.0 % を達成し、より大きな競合モデルと比較しても優れた性能を示すか、あるいは同等です。ただし、サイズは 5 倍から 28 倍まで小さく抑えられています。

Devstral 2 はデータセンターでの導入に最低 4 台の H100 クラス GPU を必要とします。
Small 2 は単一 GPU の消費者向けハードウェア(DGX Spark、GeForce RTX)に最適化されており、CPU だけでも動作可能です。両モデルとも特定言語や企業コードベース用のファインチューニングをサポートし、オンプレミスまたはローカル環境でカスタム構成と共にデプロイできます。

Mistral Vibe CLI は、これらのモデルを搭載したネイティブコマンドラインコードアシスタントです。

  • マルチファイルオーケストレーション
  • プロジェクト認識コンテキスト
  • 永続的ヒストリ
  • ファイル操作
  • コード検索
  • バージョン管理
  • コマンド実行

Apache 2.0 ライセンスで公開され、Zed IDE 拡張機能として利用可能です。Agent Communication Protocol を介して他の IDE へも統合できます。

Devstral Small 2 はさらに画像入力をサポートし、ハビリティや小規模事業者向けに高速推論が可能なマルチモーダルエージェントを実現します。Kilo Code が「これまでで最も成功したステルスローンチの一つ」と評価したこのリリースは、開始 24 時間以内に 170 億トークン を処理しました。

Devstral は X/Twitter、Discord、および GitHub を通じてコミュニティ参加を促進しており、オープンソースエコシステムの拡大に向けて研究者とインターフェースエンジニアを募集しています。

本文

本日、Devstral 2をリリースします—次世代のコード生成モデルファミリーが2つのサイズでご利用いただけます。

  • Devstral 2 (123 B) – 256K‑コンテキストの密結合トランスフォーマーで、SWE‑bench Verifiedで**72.2 %**を達成。競合モデルに比べてパラメータ数が少ないにも関わらず、最先端の性能を実現します。
  • Devstral Small 2 (24 B) – コンパクトでローカルデプロイ可能なモデルで、SWE‑bench Verifiedでも**68.0 %**に到達し、マルチモーダルエージェント向けに画像入力をサポートします。

両モデルともオープンソースです。

モデルライセンスAPI 利用
Devstral 2Modified MIT発表期間中は無料。以降は入力/出力トークンあたり $0.40 / $2.00(百万単位)
Devstral Small 2Apache 2.0発表期間中は無料。以降は入力/出力トークンあたり $0.10 / $0.30(百万単位)

主要ポイント

  • Devstral 2 – SWE‑bench Verifiedで72.2 %、実際のタスクではClaude Sonnetより最大7倍安価。
  • Mistral Vibe CLI – ネイティブなオープンソース端末エージェントが、ソフトウェア工学タスクを自律的に解決します。
  • Devstral Small 2 – 24 Bでコンシューマ向けハードウェア上にローカルデプロイ可能;オンプレミスでのファインチューニングもサポート。

本番レベルのワークフロー

  • Devstral 2 はコードベース全体を探索し、マルチファイル変更を調整し、フレームワーク依存関係を追跡し、失敗を検知して修正と再試行を行うことができるため、バグ修正やレガシー近代化に最適です。
  • モデルをファインチューニングして特定の言語や大規模エンタープライズコードベースを優先させることも可能です。

性能比較

モデルSWE‑bench VerifiedDeepSeek V3.2 相対サイズKimi K2 相対サイズ
Devstral 2 (123 B)72.2 %5× 小さい8× 小さい
Devstral Small 2 (24 B)68.0 %28× 小さい41× 小さい

Mistral Vibe CLI – 主な機能

  • プロジェクト認識コンテキスト:ファイル構造と Git の状態を自動スキャン。
  • スマート参照
    @
    自動補完、
    !
    シェル実行、設定用のスラッシュコマンド。
  • マルチファイル調整:コードベース全体にわたるアーキテクチャレベルの推論。
  • 永続的ヒストリ、自動補完、カスタムテーマ

CLI は Apache 2.0 の下で公開されており、Agent Communication Protocol を通じて IDE(例:Zed)に統合できます。


デプロイメントの推奨設定

モデルGPU 要件対応ハードウェア
Devstral 2最小 4 台の H100 クラス GPUデータセンター GPU(build.nvidia.com 推奨)
Devstral Small 2単一 GPU または CPU のみで動作NVIDIA DGX Spark、GeForce RTX、コンシューマグレード GPU

推奨温度:0.2。最適なパフォーマンスを得るために Mistral Vibe CLI のベストプラクティスに従ってください。


使い始め

  1. API アクセス – Devstral 2 は発表期間中無料。以降は料金が適用されます。
  2. CLI – Zed 拡張機能またはコマンドラインでインストールし、
    config.toml
    で設定。
  3. コミュニティ – X/Twitter、Discord、GitHub でプロジェクトを共有。

一緒に参加しませんか?

オープンソース研究の形を変え、最先端 AI のための世界クラスインターフェイスを構築する情熱的な開発者を募集しています。今すぐ応募して、真にオープンで高性能なコーディングモデルを全世界のユーザーへ届ける手助けをしてください。

同じ日のほかのニュース

一覧に戻る →

2025/12/10 0:00

Show HN: Gemini Pro 3 hallucinates the HN front page 10 years from now

## Japanese Translation: ## 改訂版まとめ この記事では、最近のさまざまな技術的マイルストーンとリリースをレビューしています。 1. **SpaceX**:Starship HLS‑9 が Sea of Tranquility からテレメトリーを正常に送信しました。 2. **Linux Kernel**:バージョン 7.4 に完全な上流化された 100 % Rust カーネルが含まれています。 3. **開発者プラクティス**:生のコードを書くこととコンパイラプロンプトを使用することを対比した議論があります。 4. **人工知能**:LLaMA‑12 7B モデルは WebAssembly を介してコンタクトレンズ上で動作し、YC シード付きスタートアップ Nia は自律型コーディングエージェントを導入しています。 5. **教育ツール**:AlgoDrill は LeetCode パターンの強化に向けたインタラクティブなプラットフォームを提供します。 6. **エネルギー研究**:ITER の炉は 20 分間連続で正のエネルギー収支を達成しました。 7. **ハードウェア修理**:2024 年製 Framework Laptop を復元する方法を詳細に説明したレトロスペクティブガイドがあります。 8. **クラウドサービス**:Google は Gemini Cloud Services の提供を終了します。 9. **グラフィックスプログラミング**:WebGPU 2.0 により第 5 次元の可視化が可能になりました。 10. **Linux ディストリビューション**:Debian がバージョン 18 “Trixie” をリリースしました。 11. **プログラミング言語提案**:`sudo` ユーティリティを Zig で書き直す提案が提示されています。 この記事はこれらの出来事を文脈に置き、各々が過去の成功にどのように基づいているかを指摘し、その進歩が今後の開発実践、AI 統合、およびクラウドサービス戦略に影響を与えることを示唆しています。

2025/12/10 2:08

PeerTube is recognized as a digital public good by Digital Public Goods Alliance

## Japanese Translation: ### Summary PeerTubeはプラットフォームに依存しない多言語対応のビデオホスティングおよびライブストリーミングソリューションで、正式にデジタル公共財(DPG ID0092472)として承認されています。2025年10月7日にRicardo Torresによるレビューが行われ、Platform Independence評価を含むすべてのDPG標準要件を満たしていることが確認されました。これにより、ベンダーロックインなしで任意のインフラ上で実行できることが保証されています。ソースコードはGitHub(`github.com/Chocobozzz/PeerTube`)とFramagit(`framagit.org/framasoft/peertube`)で公開されており、透明性とコミュニティの貢献を確保しています。PeerTubeは44以上の言語(エスペラント、アラビア語、中国語簡体字・繁体字、日本語、韓国語、スペイン語、フランス語、ドイツ語、イタリア語、ポルトガル語、ロシア語など)をサポートし、フランスの教育省からイタリアの国家研究評議会、複数のドイツ大学、Blender、Debianプロジェクト、および活動家グループまで、多様な組織で既に利用されています。承認は2026年10月7日まで有効であり、毎年自己申告による使用状況更新が求められます。この推奨は、機関やオープンソースコミュニティが分散型ビデオプラットフォームを採用することを促進し、メディアホスティングの風景をよりオープンで多言語化、ベンダー非依存な解決策へとシフトさせる可能性があります。

2025/12/10 5:33

Django: what’s new in 6.0

## Japanese Translation: --- ## Django 6.0 – 主なリリースハイライト *リリース日 2025‑12‑03* | エリア | 変更点 | 意義 | |------|--------------|----------------| | **テンプレート** | 新しい `{% partialdef %}` / `{% endpartialdef %}` タグで、テンプレートを再利用可能なフラグメントに分割し、インラインまたは別途レンダリングでき、htmx とも相性が良い。 | テンプレートの DRY 化、ボイラープレート削減、コンポーネント再利用の容易化。 | | **バックグラウンドタスク** | 組み込み「Tasks」フレームワーク: `@task` デコレーター + `Task.enqueue()` API。組み込みバックエンド(`ImmediateBackend`、`DummyBackend`)があり、実稼働ではサードパーティパッケージ(例: `django-tasks` の `DatabaseBackend`)が必要。 | 単純なジョブに対して外部タスクライブラリの必要性を排除しつつ、実稼働時の柔軟性は維持。 | | **セキュリティ** | `ContentSecurityPolicyMiddleware` を追加。 `SECURE_CSP` と `SECURE_CSP_REPORT_ONLY` で設定可能。ノンスは自動生成され、テンプレート内では `{% csp_nonce %}`(`nonce="{{ csp_nonce }}"`)で使用できる。 | 自動ノンス処理付きの CSP サポートを組み込み、XSS リスクをデフォルトで低減。 | | **メール** | Django のメール API が Python の `email.message.EmailMessage` を利用するように変更。 `EmailMessage.send()` は内部でこの API に変換し、インライン添付は `MIMEPart` オブジェクトで追加可能。 | 標準ライブラリ互換のモダンなメール処理と簡易的な添付サポート。 | | **Mail API の非推奨** | `django.core.mail` API ではキーワード専用引数が必須となり、位置オプションパラメータは警告を出し将来的にエラーになる。 | より明確な API 使用を促進し、コードの未来保証を実現。 | | **シェル** | 自動インポートが拡張され、 `settings`、`connection`、`models`、`reset_queries`、`functions`、`timezone` が追加。 | もっと高速で便利な対話型開発環境。 | | **ORM** | • 動的フィールド(`db_default`、`GeneratedField`)は `save()` 後に SQL RETURNING を通じてリフレッシュされる;未対応バックエンドでは次回アクセス時まで遅延。<br>• `StringAgg` 集約がすべてのサポートデータベースで動作;文字列リテラル区切りは `Value()` で包む必要。<br>• デフォルト主キー型が `BigAutoField` に変更され、新規プロジェクトでは `DEFAULT_AUTO_FIELD` を設定しなくなる。 | モデル定義の簡素化、パフォーマンス向上、大規模アプリでの PK 終了防止。 | | **テンプレート変数 & タグ** | `forloop.length` が追加され、ループ長にアクセス可能;更新された `querystring` タグは `?` で接頭辞し、複数位置引数を受け取り、重複時には優先順位でマージ。 | より表現力豊かなテンプレートロジックとクリーンなクエリ文字列処理。 | | **コミュニティ** | Django 6.0 に 174 人の貢献者が参加。リリースノートではアップグレード準備を強調し、開発者に新機能を試すよう呼びかける;今後のリリースでタスクバックエンドや CSP 機能が拡張される可能性。 | 健全なコミュニティサポートとさらなる改善へのロードマップを示唆。 | **まとめ:** Django 6.0 は、再利用可能なテンプレートフラグメント、オプションの組み込みタスクシステム、ノンス付き CSP ミドルウェア、モダン化されたメール API など、実務で即使える改善を提供します。さらに ORM の強化、シェルの利便性向上、旧パターンの非推奨により、ボイラープレート削減・セキュリティ向上・大規模プロジェクトの将来準備が実現されます。 ---