2026/07/04 6:16

Claude Mythos Preview のリリースに伴い、重大な脆弱性が急増した

RSS: https://news.ycombinator.com/rss

要約▶

日本語訳:

要約:
主要なテック企業は、悪意のある攻撃者がそれを利用する前に重大なサイバーセキュリティの不具合を検出し修正するために、人工知能を前向きに活用しています。この戦略は既に歴史的大きな脆弱性情報公開の増加を引き起こし、自律的なセキュリティスキャンの有効性を証明しています。2026 年 6 月だけで、組織は約 1,500 の重大な CVE（Common Vulnerabilities and Exposures）をリリースし、これは過去の月間記録の 3.5 倍以上に達しました。この急増は、2026 年 4 月に Anthropic が Claude Mythos Preview を発表したことを皮切りにしており、Microsoft、Google、Apple、AWS など企業が同モデルを用いて公開リリース前に数千の不具合を発見・修正した、Project Glasswing といった共同プロジェクトとも一致しています。開始以来、Project Glasswing は 10,000 件以上の高または重大な脆弱性情報を特定しており、その多くはまだ個別に公開されていません。類似の取り組みには、強力な AI モデルから生じる脅威に対して重要なソフトウェアを強化することを目的として設計された OpenAI の Daybreak イニシアチブがあります。これらの開発者が自律的なツールを改良するにつれ、業界では企業向けソフトウェアにおけるさらなる拡大が期待されています。究極的には、この転換は不具合を早期に解決することでセキュリティ体制を大幅に強化するとともに、研究員に対しパッチ適用の迅速化やデジタルインフラのより効果的な保護を実施するための貴重な情報導入を提供することによってセキュリティを著しく向上させます。

本文

2026 年、自律型 AI がもたらす CVE 急増とセキュリティ業界の転換点

脆弱性情報開示件数の劇的増加

2026 年 6 月に主要組織が合わせて約1,500 件の「高」および「重要」Severity の CVEを公開。
これは Mythis Preview 発表前の月間記録の3.5 倍以上という歴史的な急増を示しています。
この現象は、AI モデルによる自律的な脆弱性発見能力の実証と密接に関連しています。

主要プレイヤー：Anthropic と OpenAI の取り組み

Anthropic: Project Glasswing

Claude Mythos Previewを活用し、一般公開前に既存の脆弱性の発見・修復を加速。
パートナー企業（Microsoft, Google, Apple, AWS など）が共同でモデルを構築・検証。
同プロジェクト開始以来、1 万件以上の「高」または「重要」Severity の脆弱性を特定済み。
- ※その多くは個別に公開されていない内部修復案件を含む。

OpenAI: Daybreak

Anthropic と並行して、自律的なセキュリティ強化取り組みを推進中。
**「Daybreak」**という製品名で同様の活動を実践。

背景と目的：悪用防止のための競争

目的: 悪意ある行為者が AI モデルを利用して脆弱性を発見する前に、先端的な AI を活用して防御側が率先して強化を行うこと。
戦略: 「オフensive セキュリティ（攻撃的セキュリティ）」へのアプローチ転換。
成果の可視化: これらの発表以降、公開された CVE の件数が著しく増加したことをグラフ等で示唆。

データとライセンス情報

データソース: 主要21 ユースケース組織が集計した月別「高」および「重要」Severity の CVE 一覧（CSV）。
- 更新日: 2026 年 7 月 2 日
利用条件: クレジット付与時のみ有効な、クリエイティブ・コモンズ BY ライセンスによる無料配布が可能。

同じ日のほかのニュース

一覧に戻る →

2026/07/04 7:40

巨大な木は問題なく水を上枝に送ることができます。

## Japanese Translation: エクセター大学とカーディフ大学が主導する新研究で、Science誌に発表された内容により、世界最高位の熱帯ティトロカルプ属（Dipterocarp）の樹木は、極めて高い位置での水分輸送課題を完全に補償できることが明らかになった。アジアの雨林を支配し、80 メートルを超える高さまで成長する巨大なティトロカルプ属の木々は、より低い木々に比べて旱魃に対する感受性を示さない。これは進化した水理学的適応によるものである。本研究は、2023 年～2024 年の激しいエルニーニョ現象を背景としてマレーシア・ボルネオで行われたものであり、7 メートルから 71 メートルの幅を持つ樹木が旱魃を通じて幹の成長速度を維持したことが見出された。これは、重力と導管の長さが高大型種における光合成および成長を制限するという長年の信念に挑戦するものである。より高いティトロカルプ属の木々は、地面付近で広く水分を運ぶ導管を持つことと、萎れる前により大きな水ストレスに耐えるように適応した葉を持つことによりこれを実現する。これらの適応は、80 メートル以上高く水を移動させるために必要な極めて低い圧力の下でも液体水の形態を維持することを可能にする。これらの結果は、特にアジアの地上バイオマス炭素の半分を貯蔵するティトロカルプ属森林において重要であり、水理学的システムが弱く高大型種では旱魃による急速な死に瀕するという以前の理論を矛盾させるものである。共同著者であるパウロ・ビッテンコート博士は、これらの希少樹木がマレーシア・ボルネオにおける生態学的中心性であることを強調しているが、研究者らは同様の特性を他の高大型樹種においても検討すべきであると指摘している。研究チームには、マレーシア、イギリス、チェコ共和国、ドイツ、スペイン、ブラジル、アメリカ合衆国の機関が含まれており、資金供与は自然環境研究評議会（NERC）からのものである。今後の研究では、ティトロカルプ属を超えた水理学的システムと旱魃耐性の調査を通じて、全球的な旱魃リスク評価および保全戦略を精査していく予定である。

2026/07/04 7:33

Leanstral 1.5：全データに対する証明の豊富さを実現

## Japanese Translation: Leanstral 1.5 は、60 億のアクティブパラメータと全パラメータとして 1190 億を持ち、競合製品のごく一部のコストで最先端のパフォーマンスを達成する無料の Apache-2.0 ライセンスモデルです。このモデルは miniF2F でサチュレーション（検証セットとテストセットで両方 100%）を達成し、PutnamBench の問題のうち 672 問中 587 問を解決します（25k トークンの予算では 44 問から、4M トークンの予算では 587 問へ向上）。FATE-H ベンチマークでは 87% の精度、FATE-X ベンチマークでは 34% の精度を達成しています。中学習（mid-training）、監督微調整、CISPO を用いた強化学習、特定の定理に対する安全性チェックを経て訓練された Leanstral 1.5 は、複数回のターンにわたる定理証明および生ファイルシステムでのコードエージェントにおけるエージェント型証明工学において卓越しています。ターゲットとなる定理のリストを用いて SafeVerify のフォーク版で検証され、このモデルは問題あたり約 $4 のコストがかかります（Seed-Prover の $300 以上や Aleph Prover の $54–68 に比べて著しく低く）、かつ大きなトークン予算と共によくスケーリングします。実際の運用では、オープンソースライブラリにおける微細なバグを検出し、57 リポジトリにわたって以前に知られていなかった 5 つのバグを発見しました。その例として、datrs/varinteger ライブラリにおいて `(value + 1)` が `Std.U64.MAX` 入力に対してオーバーフローした整数オーバーフローがありました。このモデルは Hugging Face で重みファイルおよび無料の API エンドポイント（leanstral-1-5）として利用可能です。ユーザーは Mistral Vibe（`uv tool install mistral-vibe`）で実行でき、Lean LSP MCP の設定をオプションで行うことで、その能力を活用し、高次の定理証明やバグ探索を行えるようにしながら、莫大なコストなしに動作させられます。

2026/07/04 6:49

AMD MI355X 上で GLM5.2 を実行し、コストは Blackwell よりも 2 倍以上低減してノードあたり 2626 トークン/秒を達成

## Japanese Translation: AMD の新しい Instinct MI355X アクセラレータは、NVIDIA の B シリーズ GPU に対して魅力的な代替手段を提供しており、B300 と比較して約 2.75 倍安い GPU 単価で同様のハードウェア仕様を備えています。また、B200 には 2 倍以上安いです。歴史的に CUDA エコシステムを通じて「day-0」の優位性を保持してきた NVIDIA ですが、AMD はこの格差を急速に縮めています。ROCm は当初、MI355X 上で GLM-5.2 のような frontier モデルに対してネイティブなサポートがなかったものの、ターゲットされた最適化によって B200 のノードあたり性能の約 80% を対価の少なさで実現しました。主要なブリークスルーとしては、AMD Quark を用いて損失のない MXFP4 量子化を実現し（公式の FP8 の制限を上回る）、出力劣化を伴わずに堅牢なネイティブ MXFP4 サポートのために sglang を選択し、モジュールプレフィックス不一致を修正したり、ROCm メタデータカーネルガードを追加したりする特定のパッチを適用することで推測デコーディングの利点を解放（約 3 倍）した点があります。戦略的な構成チューニング（例えば TP4×DP2 への移行）や fp4 シェイプ用の MoE カーネルの最適化を通じて、カスタムカーネルを書かずにシングルノードデプロイメントで 2626 tok/s/node という SOTA の総通量を実現しました。この戦略は推論ワークロードに対して有効であり、AMD が NVIDIA の市場的地利を成功裏に侵食し、低コストで高計算能力を実現していることを示しています。また、マルチノードスケーリングに関する課題がまだ残るものの、よりバランスの取れた競争環境が育まれていることを意味します。