OpenAI、ブロードコムによる初自有チップを発表

2026/06/25 2:47

OpenAI、ブロードコムによる初自有チップを発表

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

要約:
OpenAI は、Nvidia ハードウェアへの依存を減らすという戦略的な動きとして、Broadcom と共同で開発した最初の独自の AI 推論チップ「Jalapeño」を発表しました。このチップの主な優位点は、既存の選択肢を上回る卓越したワットあたりの性能であり、これは OpenAI の大規模言語モデルが直接、チップおよび全体の基盤スタック(アーキテクチャ、カーネル、メモリスистем、ネットワーク、デプロイメントシステムなど)の最適化に参加するという独自のプロセスを通じて実現されています。事前学習タスクは既存のシステムで引き続き行われますが、10 月の公式パートナーシップ発表以降およびさらなるテストを経て、推論ワークロードが Jalapeño へ迅速に移転する見込みです。このチップは推論用に特別に設計されており、より高速で信頼性が高くコスト効率の良い AI エクスペリエンスを実現するとともに運用コストを削減することを可能にします。これは OpenAI の財務の底線を改善する方法として強調されており、エージェント型製品(例:Codex)やリアルタイムモデルを取り扱う専用データセンターなどの目的builtアプリケーションを動かすために適しています。

本文

OpenAI、ブロードコムとの協業で専用推論プロセッサ「ジャラペニョ」を発売

水曜日、OpenAI はブロードコム(Broadcom)との共同開発による自社専用推論プロセッサの初製品、「ジャラペニョ(Jalapeño)」 を正式に発表しました。

新しいプロセッサの特徴

  • 特別設計: OpenAI の推論システム特有の要件を満たすよう、非標準的なアーキテクチャで設計されています。
  • 開発協力: AI モデルの開発にも OpenAI が貢献し、チップの最適化を支援しています。
  • 高い効率性: 試験段階ではありますが、既存の最先端技術と比較して電力あたりの性能が著しく高いことが早期結果から示されました。

パートナーシップの背景と戦略

  • 発表の遅れ: 両社の提携は公式に 10 月に発表されましたが、OpenAI が NVIDIA GPU への依存を減らすための計画については長らく噂されてきた経緯があります。
  • 業界の流れ: Google や Amazon も同様の理由で独自のチップ(「AI アクセラレーター」)を開発しており、機械学習ワークロードの高速化を目指しています。
  • CEO のコメント: OpenAI のグレッグ・ブロックマン社長は社内ポッドキャストにて、以下の点を強調しました。

    「特定の種類のワークロードに対する深い理解を持ち、『何が実現可能か』を加速できる仕組みの構築に取り組んでいます」

「推論」という焦点

  • 定義: 推論とは、ユーザーのコマンドに対して事前に学習済みの AI モデルを実行し、回答を生成するプロセスです。
  • コスト削減: このチップはリアルタイムコーディングモデルなどの運用コストを大幅に低減することを目的としています。
  • 収益性の改善: 事前トレーニングなどは NVIDIA に依存する可能性がありますが、推論段階でのわずかなコスト削減でも企業の収益性を大きく向上させられます。

オープンAIのエコシステム戦略

  • 全層への展開: 専用チップへの移行は、データセンター開発やエージェント型製品(Codex など)を含むスタック全体の変革を可能にします。
  • 最適化の利点: OpenAI はモデル開発だけでなく、基盤そのものを設計しています。これにより、以下のすべてのレイヤーを同一の目標で最適化できます。
    • チップアーキテクチャ
    • カーネル(低レベル OS)
    • メモリシステム
    • ネットワーク構成
    • スケジューリング
    • デプロイメントシステム
    • ユーザー体験
  • 共通目標: **「モデルをより高速で、信頼性が高く、かつユーザーにとって利用しやすくすること」**が全層の最適化目的です。

※本記事内のリンクから購入された場合に発行側が手数料を得る場合がありますが、これは編集上の独立性に影響しません。

同じ日のほかのニュース

一覧に戻る →

2026/06/25 7:39

PostgreSQL で十分です

## Japanese Translation: 主要な要点は、GitHub Desktop で特定のクローニングタスクが必要なユーザーは、コントリビューター「cpursley」から提供される専用のスクリプトを使用すべきであるということです。Gist の URL—`https://gist.github.com/cpursley/c8fb81fe8a7e5df038158bdfe0f06dbb.js`—はスクリプトを提供しており、ユーザーは GitHub Desktop 内での使用のために「cpursley/c8fb81fe8a7e5df038158bdfe0f06dbb」をローカルに保存するよう指示されています。内容は、背景や今後のアップデートなしに直ちに実装することに焦点を当てています。

2026/06/24 23:41

RubyLLM:すべての主要 AI プロバイダーに対応する Ruby フレームワーク

## 日本語翻訳: RubyLLM は、OpenAI、xAI、Anthropic、Gemini、Ollama を含むローカルモデルに至るまで主要なすべての AI プロバイダーをサポートする統一された Ruby フレームワークです。多様な API とレスポンス形式を単一のインターフェースに統合することで開発を簡素化するのがその主たる価値であり、このことでチームはチャットボット、AI エージェント、RAG システム、コンテンツ生成器、および様々な AI ワークフローを構築できます。インストールは簡単です:Gemfile に RubyLLM を追加し、`config/initializers/ruby_llm.rb` で API キーを設定し、必要であれば generator コマンドで Rails と統合し、`localhost:3000/chats` でローカルチャット UI を起動できます。開発者は RAG システムやコンテンツ生成器などの複雑なアプリケーションをわずか 2 分で構築でき、Ruby エコシステム内でこの機能を拡張しています。JPG(画像)、MP4(ビデオ)、WAV(音声)、PDF(文書)、RB(コード)を含む広範なファイル解析をサポートしており、`RubyLLM.paint` を介した画像生成、`RubyLLM.embed` を介した埋め込み生成、`RubyLLM.transcribe` を介した音声書き起こしが可能となります。また、`RubyLLM.moderate` を用いたコンテンツモデレーション機能も含まれており、テキストの安全性を確認できます。ユーザーは `.with_tool` を使用して AI エージェントが特定の指示に基づいて実行するカスタム Ruby クラスツールを定義でき、`RubyLLM::Agent` を用いて特定の指示、モデル、ツールの関連付けを持つエージェントを作成できます。さらに、このフレームワークは `RubyLLM::Schema` で定義されたスキーマによる構造化 JSON 出力をサポートし、`.ask` メソッドに渡されるブロックを通じてストリーミングレスポンスを提供します。このアプローチにより、高度なモデルを使用して複雑なタスクを実行する洗練されたエージェントの迅速なデプロイが可能となり、ネイティブ Ruby 環境内で堅牢な人工知能ソリューションの作成が著しく加速されます。

2026/06/24 17:50

Bunny DNS を無料にします

## Japanese Translation: Bunny.net は、コアプロダクトである Bunny DNS を単純なクエリツールから、30 万件以上のドメインを管理し、1 ヶ月に約 2000 億回のクエリを処理可能な高度なスマートルーティングエンジンへと進化させました。この重要なアップデートは 119 のグローバル拠点にわたり、リアルタイムのヘルスチェック、レイテンシデータ、JavaScript を利用してトラフィックを動的に誘導し、低遅延のパフォーマンスを実現しています。同プラットフォームは、1 件ごとのクエリ料金や制限のある請求枠を廃止し、使用量課金なしで最大 500 ドメインまでホストできる無料プランを維持しつつ、標準的な月次最少支出額 $1 でアクセス democratizing(民主化)を実現しています。 今や、高価なクエリベースの構造ではなく、シンプルな月次支出を通じてエンタープライズグレードのカラビリティを利用できるようになりました。主な機能には、Pull Zones を通じて CDN への即時デプロイを行う「1-Click Acceleration」、Bunny Shield(エッジでの DDoS 保護)を介して自動的な DDoS 対策を行う「1-Click Security」が含まれます。IPv6 の全面的な採用はデュアルスタック環境でデフォルトでサポートされ、構成不要です。また、ドメイン構造の完全な開示を行わずに検証を提供するために DNSSEC と NSEC Black Lies を提供しています。さらに、プラットフォームは HTTPS、SVCB、TLSA、CDS/CDNSKEY といった高度なレコードタイプをサポートし、レコードを再構築するか、直接 BIND ファイルをアップロードすることで管理を円滑化する自動ゾーンスキャン機能を備えています。