GPT-5.2

2025/12/12 3:04

GPT-5.2

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

OpenAIのGPT‑5.2リリース
OpenAIは、プロフェッショナルな知識作業を対象とした3つのバリアント(Instant、Thinking、Pro)を含む新しいモデルシリーズGPT‑5.2を公開しています。

パフォーマンスハイライト
スピード & コスト: GPT‑5.2 Thinkingは、歴史的指標に基づくと、人間専門家のコストの1%未満で、出力速度が11倍以上速いです。
精度: GDPval(44職種)では、Thinkingが新しい最先端70.9 %を達成し、業界プロフェッショナルを70.9 %のタスクで上回ります。また、SWE‑Bench Proで55.6 %、SWE‑Bench Verifiedで80 %を達成し、幻覚(hallucinations)を約30 %削減します。
長文コンテキスト & ビジョン: モデルはOpenAI MRCRv2(≈100 %精度、256kトークン)で新たな最先端を設定し、チャート推論とソフトウェアインターフェース理解のエラー率を半減します。
ツール使用: GPT‑5.2 ThinkingはTau2‑bench Telecomで98.7 %を達成し、遅延感受性ワークフローにおいてGPT‑5.1を上回ります。
科学ベンチマーク: ProはGPQA Diamondで93.2 %、FrontierMath(Tier 1–3)で40.3 %成功率、ARC‑AGI‑1で>90 %を達成し、ThinkingはARC‑AGI‑2で54.2 %を記録します。

ユーザーへの影響
平均的なChatGPT Enterpriseユーザーは毎日40–60分の節約を報告しており、重度利用者は週に10時間以上削減しています。この効率向上により、特定タスクの人件費が99 %超で削減される可能性があります。

インプリケーション
GPT‑5.2の広範な機能(スプレッドシート、プレゼンテーション、コード、画像認識、長文コンテキスト推論、ツール使用、複雑な多段階プロジェクト)は、金融・ソフトウェア工学・科学研究などのプロフェッショナルドメインでAI採用を加速させる位置づけです。

本文

GPT‑5.2のご紹介 – プロフェッショナル向け知識作業において最も高性能なモデルシリーズ


主なハイライト

  • 平均節約時間:
    • ChatGPT Enterpriseユーザー: 1日40〜60 分
    • ハードユーザー: 週10 時間以上
  • 機能性:
    • スプレッドシート、プレゼンテーション、コード、画像認識、長文コンテキスト理解、ツール利用、複雑な多段階プロジェクト
  • ベンチマーク:
    • GDPval – 44職種で業界専門家を上回る性能
    • SWE‑Bench Pro – 55.6 %(4言語)
    • MRCRv2 – 256kトークンバリアントでほぼ100 %の正確性
    • Vision – チャート推論・インターフェース理解においてエラー率を半減

モデルバリエーションと提供状況

バリアント説明利用可能
GPT‑5.2 Instant日常業務(情報検索、How‑to、翻訳)に適した高速ワークホースChatGPT: Plus/Pro/Business/Enterprise; API:
gpt-5.2-chat-latest
GPT‑5.2 Thinkingコーディング、長文要約、段階的推論・計画などのディープワークChatGPT: 同上; API:
gpt-5.2
(レスポンス&チャット完了)
GPT‑5.2 Pro難問への高品質応答。プログラミングや複雑領域での重大エラーが少ないChatGPT: 同上; API:
gpt-5.2-pro

すべてのバリアントは新しい「xhigh」推論努力に対応しています。


パフォーマンスハイライト

  • GDPval(知識作業):
    • GPT‑5.2 Thinking はタスク70.9 %でトップ専門家と同等または上回る
    • 11倍の速度、1 %未満のコストでエキスパートに匹敵

  • スプレッドシート・プレゼンテーションタスク:
    • GPT‑5.1(59.1 %)から68.4 %へ平均点が9.3 %向上(ジュニア投資銀行アナリストベンチマーク)
  • SWE‑Bench Pro: 55.6 %(4言語) – このレベルを達成した最初のモデル
  • 長文コンテキスト推論:
    • MRCRバリアント256kトークンでほぼ100 %正確性
    • 拡張ワークフロー向けにレスポンス/コンパクトエンドポイントをサポート
  • Vision:
    • 空間理解が強化され、低品質画像でも境界ボックス予測精度が向上
  • ツール利用・マルチターンタスク:
    • Tau2‑bench Telecom(ツール信頼性)で98.7 %
    • レイテンシーセンシティブケースでの推論速度も改善

安全性と信頼性

  • GPT‑5安全完結研究を継承
  • 自殺・自傷・精神健康危機に対する感受性対応が向上
  • すべてのバリアントで望ましくない応答を減らすターゲット介入
  • 18歳未満ユーザー保護用コンテンツ制御として、年齢予測モデルを初期展開

価格(API)

トークンタイプGPT‑5.2 Thinking / ProGPT‑5.1
入力$1.75 / Mトークン(キャッシュ済み入力に90 %割引)低い
出力$14 / Mトークン低い

高単価でもトークン効率が高く、同等の品質を得るコストは実際には安価です。


デプロイとサポート

  • ChatGPT: 段階的展開。Plus・Pro・Go・Business・Enterpriseプランで今日から利用可能。GPT‑5.1 は3か月間レガシーモデルとして残ります。
  • API: Thinking と Instant が即時利用可能。Pro はレスポンスAPIにて提供。推論パラメータが調整可能です。
  • 将来計画: 現在のところ古いモデルは非推奨にならず、Codex最適化版 GPT‑5.2 も近日登場予定。

パートナーシップとインフラ

NVIDIA(H100, H200, GB200-NVL72 GPU)および Microsoft Azure データセンターで構築し、スケーラブルなトレーニングとデプロイを実現しています。


付録 – ベンチマークスコア

ドメインモデルスコア
専門的コーディングGPT‑5.2 Thinking55.6 %(SWE‑Bench Pro)
事実性GPT‑5.2 Thinking
長文コンテキストGPT‑5.2 ThinkingMRCRv2 256kトークンでほぼ100 %
VisionGPT‑5.2 Thinkingチャート推論のエラー率を半減
ツール利用GPT‑5.2 ThinkingTau2‑bench Telecomで98.7 %
学術要旨推論GPT‑5.2 Pro92.4 %(GPQA Diamond)

ベンチマークは最大推論努力(APIではxhigh、ChatGPT Proではheavy)で実施。


同じ日のほかのニュース

一覧に戻る →

2025/12/12 5:46

Denial of service and source code exposure in React Server Components

## Japanese Translation: React は Server Components 機能における 2 つの重大なセキュリティ脆弱性(CVE‑2025‑55184(Denial of Service、CVSS 7.5)と CVE‑2025‑55183(Source Code Exposure、CVSS 5.3))に対するパッチをリリースしました。いずれの脆弱性も Remote Code Execution を可能にしないため、既存の React2Shell パッチは有効なままです。 バグは `react-server-dom-webpack`、`react-server-dom-parcel`、および `react-server-dom-turbopack` のそれぞれ 19.0.0/1、19.1.0‑1.2、および 19.2.0‑1 バージョンに影響します。修正リリースは 19.0.2、19.1.3、そして 19.2.2 です;これらのいずれかを直ちにインストールしてください。 対象となる React フレームワーク/バンドラーには Next.js、react‑router、waku、@parcel/rsc、@vite/rsc-plugin、および rwsdk が含まれます。アプリケーションが Server Components またはそれをサポートするバンドラー/プラグインを使用していない場合、影響はありません。 DoS 脆弱性は、特定の HTTP リクエストを逆直列化すると無限ループに陥り、ソースコード脆弱性は任意の Server Function の文字列表現(stringified body)を返し、ハードコーディングされた秘密情報が漏洩する恐れがあります。 React Native を monorepo で使用している場合、影響を受ける `react-server-dom-*` パッケージだけを更新すれば十分です;core の `react/react-dom` バージョンは変更不要です。 ホスティングプロバイダーは一時的な緩和策を適用していますが、サーバー停止や秘密情報の偶発的漏洩を防ぐために開発者は依存関係を直ちに更新する必要があります。 --- *上記の要約をそのまま保持したい場合は、元のまとめを繰り返してください。

2025/12/12 3:17

Rivian Unveils Custom Silicon, R2 Lidar Roadmap, and Universal Hands Free

## Japanese Translation: RivianはエンドツーエンドのAIスタックを拡張することで自動運転車市場でリーダーになるという野心を固めています。 - **ハードウェア&ソフトウェア**:同社は、5 nmマルチチッププロセッサ「RAP1」を発表しました。このプロセッサは1600 sparse INT8 TOPSを提供し、新しいGen 3 Autonomy Computerで秒間50億ピクセルの処理が可能です。また、自社開発のAIコンパイラとプラットフォームソフトウェアも構築しています。 - **認知モジュール**:ACM 3は2026年後半にR2で初登場し、最初はLiDARを装備せず、後にカメラとレーダーとともに追加されます。 - **ソフトウェア展開**:Universal Hands‑FreeはGen 2 R1T/R1S車両向けにリリースされ、米国・カナダの3.5 百万マイル以上の道路で明確に描画されたレーンラインをカバーし、現在のオーナーの支援走行領域を拡大します。 - **Autonomy+**:階層化された機能セットが2026年初頭に登場予定で、1回限り2,500ドルまたは月額49.99ドルで提供されます。 - **データ基盤**:RivianはUnified Intelligenceを中心とした組織再編を行っており、このデータフレームワークはテレメトリ、クラウドモデル、サービスシステム、および顧客機能を結びつけ、予知保全・診断・AIツールの実現を可能にします。 - **音声アシスタント**:次世代Rivian Assistantは2026年初頭にGen 1/2車両で登場し、R2ではより強力なインフォテインメントコンピュータを使用して完全オフラインで動作させることでレイテンシを低減します。 - **サービスワークフロー**:テレメトリと車両履歴を分析するAI駆動の専門家システムはすでにサービスワークフローに組み込まれており、技術者が問題箇所を迅速に特定できるようになっています。類似ツールはモバイルアプリにも計画されており、自助診断をサポートします。 これらの動きは、最先端のコンピューティングハードウェア、データ中心のプラットフォーム、拡張された支援走行機能、およびAI強化保守を車両ラインナップ全体に統合することで、Rivianの競争力を深めます。

2025/12/12 6:37

Two new RSC protocol vulnerabilities uncovered

## Japanese Translation: (欠落していた詳細を補い、表現を明確化したもの) --- ## Summary React の Server Components (RSC) は現在、CVE‑2025‑55183 と CVE‑2025‑55184 という新たに特定された脆弱性の対象となっていますが、攻撃者がサーバー上で任意コードを実行することは **できません**。 - **CVE‑2025‑55184** は高い深刻度の Denial‑of‑Service (DoS) 欠陥です。App Router のエンドポイントをデシリアライズすると無限ループが発生し、サーバー処理が停止します。 - **CVE‑2025‑55183** は中程度の深刻度の Source Code Exposure 問題で、他の Server Functions のコンパイル済みソースコードを返す可能性があります。これによりビジネスロジックやインライン化されたシークレットが漏れる恐れがあります。 両脆弱性は React2Shell パッチ・スイートの調査中に発見され、App Router と RSC を使用した Next.js アプリケーションに限定されます。旧式の Pages Router で構築されたプロジェクトには影響ありませんが、全開発者はセキュリティ衛生を保つためにパッチ版へ更新すべきです。 修正は以下のリリースで利用可能です: - **DoS 修正 (CVE‑2025‑55184)**:Next.js 14.2.34 以降、15.x および 16.x の全バージョンに含まれます。 - **Source‑code exposure 修正 (CVE‑2025‑55183)**:Next.js 14.2.3415.0.x 以降、および 15.x と 16.x の全バージョンをカバーします。 ワークアラウンドは存在せず、アップグレードが必須です。すべてのユーザーは自分のリリースラインで最新パッチ版をインストールする必要があります—特に Next.js ≥ 13.3(または 14.0.x/14.1.x)では、最新の 14.2.x リリースへアップグレードしてサービス停止や機密ロジック漏洩の可能性を防止してください。 **発見クレジット**:GMO Flatt Security Inc. の RyotaK と Andrew MacPherson。

GPT-5.2 | そっか~ニュース