2026/04/17 4:24

生命科学研究向け GPT-Rosalind

RSS: https://news.ycombinator.com/rss

要約▶

日本語訳:

OpenAI は、生物学、創薬およびトランスレーショナル・メディスンにおける複雑なワークフローの最適化に特化した Frontier モデル「GPT-Rosalind」を導入しました。汎用モデルとは異なり、このツールの強みは生命科学研究向けの多段階タスク（例：文献レビュー、実験計画、データ分析）での処理能力にあります。その主な特徴は分子推論であり、ベンチマークでは 11 の研究課題のうち 6 で GPT-5.4 よりも優れた性能を示しています。特に、DNA 配列や酵素試薬の設計において顕著な向上が見られ、RNA 予測タスクに関しては公開データセットと人間の専門家ベースラインの双方と比較して評価されました。

モデル名は DNA の構造解明における基盤的な役割を果たしたローザリンド・フランクリンにちなんで命名されています。主要なパートナーシップを背景とし、Amgen、Moderna、McKinsey 他との提携が支えています。50 を超える科学ツールおよびデータベースにつながる無料のプラグインを搭載しています。今後の開発では、長期的なワークフロー向けの生化学的推論を拡大し、AI 支援によるタンパク質および触媒設計の進歩に注力します。適格な企業ユーザーは現在、既存のクレジットを使用せず厳格なガバナンスコントロールの下でこの研究プレビューへのアクセスが可能です。これにより、有資格な顧客が最先端の AI を活用し、医療的画期的成果の加速を実現することが可能となっています。

原文:

Summary:

OpenAI has introduced GPT-Rosalind, a specialized frontier model engineered to optimize complex workflows in biology, drug discovery, and translational medicine. Unlike general-purpose models, this tool excels at multi-step tasks such as literature reviews, experimental planning, and data analysis specifically for life sciences research. Its primary strength lies in molecular reasoning; benchmarks show it outperforms GPT-5.4 on six out of eleven research challenges. Notably, it achieved significant gains in designing DNA sequences and enzyme reagents, with performance evaluated against both public datasets and human expert baselines for RNA prediction tasks.

Named after Rosalind Franklin to honor her foundational role in revealing DNA's structure, the model is backed by major partnerships including Amgen, Moderna, McKinsey, and others. It features a free plugin connecting over 50 scientific tools and databases. Future developments will focus on expanding biochemical reasoning for long-horizon workflows and advancing AI-guided protein and catalyst design. Eligible enterprise users can currently access this research preview under strict governance controls without using existing credits, enabling qualified customers to leverage cutting-edge AI for accelerating medical breakthroughs.

本文

本日は、生物学、創薬研究、および転換医療分野における全領域の研究を支援することを目的として開発された先端的な推論モデル『GPT-Rosalind』のご紹介となります。ライフサイエンス向けモデルシリーズは、科学工作流に最適化されており、化学、タンパク質工学、ゲノミクスといった分野における理解力を深めるだけでなく、ツール使用機能の強化も合わせて実現しています。米国において、新薬の開発からターゲット発見に至り規制当局への承認を得るまでには平均して 10 年から 15 年という期間を要すると言われています。早期段階での成果は、ターゲット選択の精度向上、より説得力のある生物学仮説の構築、高品質な実験の実施といった下流段階でも相乗効果を生み出します。ライフサイエンス分野における進展は、基礎科学の難しさに加え、研究そのものの複雑なワークフローにも制約されてきました。研究者は大規模な文献書、専門データベース、実験データ、そして変化する仮説を横断して活動する必要があり、新たなアイデアの生成と評価を実現しています。こうしたワークフローは往々にして時間のかかるものとなりがちであり、かつ断片的でスケール化が困難です。私たちは、高度な AI システムがこれらの課題に対し、単に既存業務の効率化だけでなく、より多くの可能性を探求することを支援し、見過ごされがちな関連性を明らかにするとともに、より優れた仮説を早期に導き出すことに寄与できると思っています。このモデルは、証拠に基づく総括、仮説生成、実験計画立案、そしてその他の多段階の研究タスクを支援することで、発見の初期段階における研究スピードの向上を目指して設計されています。これらのシステムが長期的には、これまで実現困難だった画期的な成果を生み出し、ライフサイエンス組織において大幅に高い成功確率を実現するお手伝いになるものと期待されます。

GPT-Rosalind は現在、信頼に基づくアクセスプログラムを通じて有資格のお客様に対して、ChatGPT、Codex、および API として研究用プレビュー形式で提供されています。また、Codex 向けの無料公開の「ライフサイエンスリサーチプラグイン」も新設しており、これにより研究者は模型を 50 件を超える科学ツールやデータソースと接続できるようになりました。Amgen、モダーナ、アレン研究所、サーモフィッシャーサイエンティフィックおよび他のお客様との連携のもと、GPT-Rosalind を研究と発見を加速させるワークフローの全領域に適用する取り組みを進めております。

モデルの名前来源于ロザリンド・フランクリン氏です。彼女が厳格な研究によって DNA の構造解明に貢献し、現代分子生物学の基盤を築いた功績に由来します。生のデータから根拠に基づいた発見判断に至るまで、この専用設計された模型がいかに研究ワークフローを加速するかをご覧ください。GPT-Rosalind ライフサイエンス向けモデルシリーズは、公開された証拠書、データ、ツール、および実験を踏まえた現代科学の仕事を支えるために構築されています。我々の評価結果では、分子、タンパク質、遺伝子、経路、ならびに疾患関連生物学に関する推論を要するタスクにおいて最高水準のパフォーマンスを発揮し、文献レビュー、配列から機能への変換解釈、実験計画立案、データ解析といった多段階のワークフローにおける科学ツールやデータベースの使用においても高い有効性を示しています。これは GPT-Rosalind ライフサイエンス向けモデルシリーズとしての第一弾リリースであり、今後引き続き、長期視野および多道具を必要とする科学的工作流において、模型の生化学的推論能力の境界線を拡張してまいります。OpenAI の計算インフラストラクチャにより、実在する科学的タスクに対してさらに能力のある領域特化型モデルを継続的に訓練・評価・改良することが可能となり、これらシステムの有用性を、ワークフローそのものがより複雑化するにつれて向上させられるのです。証拠に基づく発見の知見から高インパクトの実験に至るまで、当社のソリューション群が研究ワークフローにおいて測定可能な改善をもたらす様をご覧ください。GPT-Rosalind を発見推進を牽引するワークフローの全領域に応用するためには、主要な製薬企業、バイオテクノロジー企業、研究機関、ならびにライフサイエンス技術組織との連携を進めております。

GPT-Rosalind の評価は、科学的発見および産業研究にとって不可欠な多様な能力を対象に行われました。これらの評価では、化学反応機構、タンパク質構造・変異の影響・相互作用、DNA 配列の系統発生解釈といった科学分野における核心的推論力を測定します。また、実験出力の解釈、専門家に関連するパターンの特定、外部情報の総括による次の実験の設計といった機能を通じて、モデルが実際の研究ワークフローを支援できるかについても検証されています。さらに、推論を補完するために適切な計算ツール、データベース、およびドメイン固有の能力を選択・活用できるかもテストされます。これらを一覧にすれば、科学研究の始点から終点までの全工程における進展を示すとともに、研究者が困難な発見タスクに取り組むことをより強く支援する能力が存在することが示唆されています。GPT-Rosalind は一連の公開ベンチマークを用いて評価されました。BixBench（実世界のバイオインフォマティクスおよびデータ分析を軸としたベンチマーク）では、発表済みのスコアを持つモデルの中で最高水準のパフォーマンスを達成しました。LABBench2（文献検索、データベースアクセス、配列操作、プロトコル設計といった多様な研究タスクにおけるパフォーマンスを測定するベンチマーク）においては、11 のタスクのうち 6 つにおいて GPT-5.4 を上回る性能を発揮しました。特に顕著な向上が見られたのは、分子クローニングプロトコルのための DNA および酵素試薬の起点から終点までの設計を必要とする CloningQA です。また、AI バイオ分野で先駆的に AI 設計による遺伝療法の開発を行う Dyno Therapeutics と連携し、 unpublished な汚染のない配列を用いた RNA 配列からの機能予測および生成タスクにおいて模型の評価を行いました。そのパフォーマンスは、AI バイオ分野の人間専門家による 57 の歴史的スコアと比較されました。Codex アプリ内で直接評価された場合、「Best-of-Ten」モデル提出物は、予測タスクにおいては人間の専門家の上位 95 パーセンタイルに位置し、配列生成タスクにおいては同様に人間の専門家の約 84 パーセンタイルの水準を達成しました。これらの評価は、日常的に研究者が証拠を生み出し、複雑なデータを解析し、裏付けのある生物学結論に至るために依存するワークフローにおけるパフォーマンスにおいて意味あるシグナルを提供します。

現在、GitHub で利用可能な Codex 向けの新しい「ライフサイエンスリサーチプラグイン」を研究者の皆様に提供しています。このパッケージには、ヒト遺伝学、機能的ゲノミクス、タンパク質構造、生化学、臨床的証拠、ならびに公開研究の発見といった分野で最も一般的な研究ワークフローに対応する広範なモジュール化されたスキルが包含されており、これらがユーザーが広範囲・曖昧性・多段階の質問をより効果的に取り扱うことを支援します。さらに、50 件を超える公開マルチオミクスデータベース、文献ソース、ならびに生物学ツールのアクセスを提供するとともに、タンパク質構造検索、配列検索、文献レビュー、公開データセット発見といった一般的な反復可能なワークフローのための柔軟な出発点を与えます。資格があるエンタープライズユーザーは、GPT-Rosalind を用いた研究ワークフローにおいてこのプラグインを活用し、より深い生物学推論を行うことができます。一方、すべてのユーザーもメインラインモデルとあわせてこのプラグインパッケージを利用可能です。これらの能力を人類の健康進展に最も適した科学研究者および研究機関へ提供しつつ、生物学的悪用の防止に対する堅固な safeguards を維持することが目的です。ライフサイエンス向けモデルは、まず有資格エンタープライズ顧客（米国限定）に対して信頼に基づくアクセス展開方式でローンチし、 eligiblity 判定、アクセス管理、ならびに組織ガバナンスに関する統制を講じます。同時に、コネクタおよびライフサイエンスリサーチプラグインをより広範囲に公開することで、研究者がメインラインモデルを用いてライフサイエンス研究タスクをより効果的に遂行できるよう支援します。

ライフサイエンス向けモデルは、エンタープライズグレードのセキュリティ統制を強化した開発手法を採用しており、ガバナされた研究環境における専門科学的使用を可能にしています。当社はアクセス評価について 3 つの核心原則に基づいています：（1）有益な利用、（2）堅固なガバナンスと安全監督、（3）エンタープライズグレードセキュリティによる制御されたアクセスです。実践的に言えば、これは参加組織が明確な公共的利益を伴う正当な科学研究を実施し、適切なガバナンス・コンプライアンスおよび悪用防止統制を維持しつつ、承認済みのユーザーにのみ安全かつ適切に管理された環境内でアクセスを制限することを意味します。また、組織はライフサイエンスリサーチプレビューの利用規約に従い、OpenAI の利用ポリシーも遵守する必要があり、オンボーディングまたは継続的な参加の際には追加情報の提供が求められる場合があります。アクセス希望の場合は、当社の資格審査および安全性見直しプロセスを通じて申請してください。研究プレビュー期間中、このモデルの使用は現存するクレジットまたはトークンを消費せず、悪用ガードレールを条件とします。プログラム拡大に伴い、pricing および利用可能性に関する詳細を追加で共有してまいります。ライフサイエンス向けモデルは、技術的能力と運用制御の両方が求められる環境において、科学組織がより高品質な仕事をスピードアップするよう構築されています。我々の専用ライフサイエンスチームならびにマッキンゼーアンド・カンパニー、ボストンコンサルティンググループ（BCG）、ベインアンドカンパニーなどのアダイザリーパートナーは、高インパクトユースケースの特定、企業環境への模型統合、測定可能な成果の実現を支援します。OpenAI ライフサイエンスが皆様のご業務にどのように貢献できるかお探しいただく場合は、ライフサイエンスチームへお問い合わせください。

これは我々のライフサイエンス向けモデルシリーズにおける最初のリリースであり、社会にとって極めて重要な分野（人類健康から広範な生物学研究に至るまで）において科学発見を加速させる AI を構築する長期的コミットメントの出発点と考えています。今後も模型の生物学的推論力を改善し、ツール多用型かつ長期視野の研究ワークフローに対するサポートを拡張するとともに、主要な科学機関と緊密に協力して実世界でのインパクト評価を進めてまいります。これには、ロスアラモス国立研究所など各国の国立研究所との継続的パートナーシップも含まれます。ここでは、AI ガイドによるタンパク質および触媒設計を探求しており、AI システムが生物学的構造を変更しながら主要な機能的特性を維持または向上させる能力についても研究しています。長期的には、これらのシステムは発見におけるますます有能なパートナーとなり、研究者に「問い→証拠」「証拠→知見」「知見→患者治療新法」へと速やかに移行することを支援するものと期待されます。

同じ日のほかのニュース

一覧に戻る →

2026/04/16 23:23

Claude オプス 4.7

## Japanese Translation: Claude Opus 4.7 は、すべての Claude プラットフォーム、API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry において大幅な向上と一般利用を開始しました。先進的なソフトウェア工学における主要な飛躍として、長期的自律性と自己検証機能が強化された Opus 4.6 を引き継ぎます。モデルのビジョン能力も著しく向上し、最大約 375 万画素（従来の 3 倍以上）までの画像に対応します。料金は Opus 4.6 と同一の、入力トークン当たり 5 ドル、出力トークン当たり 25 ドルで維持され、より微細なトレードオフ制御を可能にする新たな"xhigh"レベルが導入されました。内部評価では、93 タスクからなるベンチマークにおけるコーディング精度が 13% 向上し、4 つの以前は解決不能だったタスクを完遂することを実現するなど大きな進歩が見られます。また、「General Finance」モジュールでは、Opus 4.6 の 0.767 に対し 0.813 という大幅な金融分析能力の進歩、CursorBench（明確回答率 70%）や Complex Multi-step Workflows（+14%）といったベンチマークでも著しい向上を記録。さらに Rakuten-SWE-Bench 上の本番タスク解決数は 3 倍に増加し、コード品質でも二位桁の改善が実現しました。これらの進展は、Devin などのような環境での長期的自律性を可能にし、Replit においては同等かそれ以下のコストで高性能な実行を達成します。新機能としては、「task budgets」ベータ版およびバグレビュー専用の `/ultrareview` スラッシュコマンドが含まれます。本リリースは「Project Glasswing」の一貫した慎重な安全アプローチと整合しており、自動的な防護機構により高リスクのサイバーセキュリティ用途をブロックすると同時に、正当な研究者に新しい Cyber Verification プログラムへの参加を呼びかけています。結論として、Opus 4.7 は金融分析や工学など重要分野における一貫性の新基準を設定し、次世代 AI ツールの採用準備が整った企業向けに、強化されたパフォーマンスと戦略的リソース管理を提供します。

2026/04/17 2:12

ほぼすべてのことに適用可能なコードックス。

## Japanese Translation: OpenAI は、Codex アプリに対する主要なアップデートを導入し、それを受動的アシスタントからユーザーのコンピュータを直接操作する能動的で自律的なエージェントへと変革します。macOS 上の高度なバックグラウンド機能（カーソル制御［見る、クリック、打つ］とマルチエージェント並列処理）を活用し、Codex はプルリクエストのレビュー、SSH を介したリモート環境の管理、PDF やスプレッドシートなどのリッチなファイルプレビューを開くことができます。アプリ内に統合されたブラウザを通じて、ユーザーは Web ページ上に直接コメントを付けることで正確な指示を提供できます。新しいシステムには、個人のコンテキストと好みを記憶するためのメモリレイヤーが追加され、90 以上のプラグインにより GitHub、GitLab、Atlassian、CircleCI、CodeRabbit などの外部ツールとの接続が可能になります。Codex は désormais、来週の日数や週間を跨いで作業をスケジューリングし、自律的に目覚めることで長期タスクをサポートします。また、Google Docs、Slack、Notion、コードベース内のオープンなコメントに基づき、能動的にアクションを提案します。さらに、このアップデートには gpt-image-1.5 が統合され、製品コンセプト、フロントエンドデザイン、マockアップ、ゲームなどの同じワークフロー内で画像の生成と反復を行うことができます。今日、ChatGPT にサインインしたデスクトップユーザー向けにロールアウトされており、これらの機能は間もなく Enterprise、Edu、EU、UK アカウントにも拡大されます。

2026/04/17 6:56

グイが、デュオテープ、古いカメラ、およびCNCマシンを組み合わせて、AIを駆使したハードウェアハッカー用の腕を作成しました。

## Japanese Translation: **改善されたサマリー:** 本テキストの主なメッセージは、電子機器に対する安全なピンプローブを可能化することを目的としたソースアベイラブルなハードウェアハッキング自動化スタックである「AutoProber」の導入です。標準的なツールが盲目的に進む可能性に対して、AutoProber は CNC モーション制御、光学顕微鏡、リアルタイムオシロスコープ監視を「安全第一」というアーキテクチャに統合します。本システムはプロジェクトを読み込み、ハードウェアと接続し、軸をキャリブレーションし、エージェントまたはダッシュボードを使用してターゲットを検出およびアノテーション済みマップをステッチします。特に重要なのは、安全が独立したチャンネル（オシロスコープチャンネル 4）によって執行されており、電圧を連続的に監視することであり、あらゆる曖昧さ、アラート、またはトリガーが発生した場合に自動回復なく即座に停止し、作業者の介入を必須としている点です。 GRBL 互換 CNC ミル（例：SainSmart Genmitsu）、USB 顕微鏡、および Siglent オシロスコープを基盤とし、本スタックは現在、特定の安全制約付きで制限リリースカンドイドとして存在しています：コントロールダッシュボードが信頼できないネットワークに露出させてはならないこと、および商用ライセンス発行にはメールでの申請が必要であることが含まれます。本プロジェクトは、複雑なプローブ作業中の機器破損や人身傷害を防ぐために、ダッシュボード上でのプローブターゲット承認などの作業者による専用の監督を強調しており、ハードウェアハッキングにおける標準的な自動化ワークフローの前提を根本的に変化させます。