プロジェクト・グラスウィングの規模拡大

2026/06/02 22:15

プロジェクト・グラスウィングの規模拡大

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

元のサマリーは重要なポイントをリストしたものと誤解がなく、漏れも裏付けのない推論もなく、改善する必要はありません。

Text to translate:

The original Summary accurately reflects the Key Points List without omissions or unsupported inferences, so no improvement is required.

本文

プロジェクト・グラスウィングの拡大と今後の展開

「プロジェクト・グラスウィング」は、世界の最重要ソフトウェアを安全に守るための共同取り組みです。現在、本プロジェクトは大幅な拡大を図っており、以下が主な動向です。

  • 参加機関の増加: 対象組織数を約 50 社から約 150 の新規機関に拡大しました。
    • 新加入団体は 15 カ国以上にまたがり、電力・水道・医療・通信・ハードウェアなど、重要なインフラを支える事業を担っています。
    • これまで十分に表現されてこなかった産業分野も含まれており、政府や国際組織によって信頼されているコードベースを維持するベンダーや非営利団体も多数参加しています。
  • 参加条件: 各機関はアクセス権限付与前に、当社が定めるセキュリティ要件を満たすことを前提としています。

発見された脆弱性の状況

  • スキャン成果: パートナー企業は『Claude Mythos Preview』を活用し、コードベース内の脆弱性を継続的にスキャンして運用を進めてきました。
    • 現在までに発見された高重大度または重大度のセキュリティ弱点が 1 万件を超えており、その詳細な報告が行われています。
  • 攻撃の深刻さ: コードベースに対する成功した攻撃の結果として引き起こされる影響は壊滅的です。
    • 当社推計では、多くのパートナーにおいて1 億人以上に影響を与える可能性のある重大な攻撃が発生するリスクがあります。
    • これは国際安全保障および国家安全保障にとって重要な意味を持ちます。

プロジェクト・グラスウィングの役割と方針

本プロジェクトは、AI がサイバーセキュリティをどう変革するかという対話を促進し、業界全体の適応を支援することを目的としています。

長期的な課題認識

  • 新モデルの登場: 低価格かつ高性能の AI モデルが間もなく登場します。
    • 6 か月〜12 ヶ月以内に、他の AI 企業も「Mythos クラス」のモデルを開発し、悪用の防止措置なしで公開する可能性があります。
    • その場合、サイバー攻撃は頻繁かつ予測不可能になり、防御側が追いつくことが極めて重要です。

二つの核心的役割

当社は以下の 2 つを重要なミッションとして設定しています。

  1. 適応支援: より高度なモデル、ツール、共通インフラストラクチャを安全かつ広範に提供し、ソフトウェア業界の適応を助けます。
  2. 重点移行: 活動内容を段階的に変化させ、「脆弱性の発見」から**「脆弱性の開示、修正、およびパッチ付きソフトウェアの展開」**へと重心を移します。

サイバー防御者への支援策

企業、非営利団体、マインテーナー、研究者は迅速に対応しており、以下のアクションが推奨されています。

  • 初期対応の成功: プロジェクト開始直後から大規模な『Mythos Preview』活用を行い、情報共有や最良のプラクティスの伝達、第三者との協働による優先順位付けを実施しました。
    • この適応方法は、数百万の組織および開発者において広く再現・推奨されるべきものです。
  • 新製品『Claude Security』の発表:
    • 最新の Frontier モデル(例:Claude Opus 4.8)を活用し、コードベースのスキャンとパッチ提案を行う機能を提供します。
    • 信頼できるセキュリティチーム向けに、脆弱性をより迅速に見つけるための開発ツールの提供も要請に応じて行います。

パッチ適用とセキュリティ全体の加速化

現在のサイバーセキュリティにおける最大ボトルネックは、大量の脆弱性の検証・開示・パッチ適用プロセスです。『Mythos Preview』はこのプロセスを大幅に効率化します。

  • 事前防止: 脆弱性がそもそも発生しないよう防ぐための事前リリースチェックにおいて活用されています(パッチ作成だけでなく)。
  • 多岐にわたる防御的業務への活用:
    • 浸透テスト(悪用シミュレーション)
    • 脅威検知および対応の自動化
    • メモリ安全性の高い言語へのレガシーコードベースのリコンパイル

さらに、オープンソースソフトウェアにおける脆弱性レビューとパッチ適用を拡大するため、第三者との協議やベストプラクティスの共有を進めています。

今後の道筋

数多くの組織に最も高度なサイバー能力とツールへのアクセス権限を提供することを急務としています。

直近の計画

  • プロジェクト・グラスウィングのさらなる拡大:
    • 追加の重要インフラプロバイダー、重要なオープンソースマインテーナー、セキュリティテスト担当者を優先的に招致します。
    • 米国および海外の両方の組織を含め、今回の取り組みと同様の範囲をカバーする予定です。
  • Cyber Verification Program の規模拡大:
    • 特定のサイバー防御タスクにおいて、多くの組織にMythos クラスの能力を提供する仕組みを整えます。

長期的な展望

  • Frontier モデルのリリースはより重大な意味を持ちます。攻撃者と防御者の両方を強化できる領域も多数存在します。
  • プロジェクト・グラスウィングを通じて、モデルが重要な能力のしきい値を越えた際の対応法について学び、防御側に永続的な優位性を提供することを期待しています。

重要: 強力かつ精度の高い防衛措置を構築することは大きな課題ですが、これなしにはモデルのサイバー能力が悪用されることを防ぐことができません。

同じ日のほかのニュース

一覧に戻る →

2026/06/03 3:47

MAI コード 1 のフラッシュ処理

## Japanese Translation: 以下の内容は、Key Points List に含まれていた欠落していた具体的な指標およびデータポイントを統合しつつ、明瞭さを維持した改良されたバージョンです。 **Improved Summary:** MAI-Code-1-Flash は、実稼働環境で使用される GitHub Copilot harness を直接トレーニングによって訓練され、現実世界の agentic タスクを処理するコーディング AI における画期的な進歩を表します。以前の手法では正確性と効率性は排他的なものとして扱われていましたが、本モデルはこれらがシームレスに共存できることを実証しました。適応的なソリューション長制御を活用し、推論の深さを動的に調整することで、単純なリクエストには簡潔に応答し、複雑な問題にはより多くの予算を割く仕組みです。その結果、開発者は競合製品である Claude Haiku 4.5 に比べて最大 60% も少ないトークンで有用な出力をより早期に受け取り、レイテンシと運用コストを大幅に削減できます。 同じプロダクション harness 内での多様なデータセット(SWE-Bench Verified、SWE-Bench Multilingual、SWE-Bench Pro、Terminal Bench 2)を含む評価が、優位性の高いパフォーマンスを確認しました。MAI-Code-1-Flash は、テストされたすべてのコアコーディングベンチマークにおいて Claude Haiku 4.5 を凌駕し、多様で現実世界のタスクである SWE-Bench Pro で注目される +16 ポイントのリード(51.2% vs. 35.2%)を達成しました。これらの結果は、MAI-Code-1-Flash を使用する場合、より高い正確性と更大なる効率がもはやトレードオフではないことを検証し、インタラクティブなコーディングワークフローを滑らかにしつつ、全体の生産性を最適化するためのトークン投資を実現します。

2026/06/03 5:30

BYD の車部品 CT 走査検査

## Japanese Translation: 主な洞察は、現代のペットボトルが数十年前進化する工学によって最適化されており、シュリンクラップ、積み重ね、粗悪な取扱いなどに対して耐え抜き、産業物流に適合するように設計されているにもかかわらず、開封した後は実用的な使用時間がわずか数秒しかないという点にあります。この耐久性のパラドックスは、長距離輸送での耐久性に大規模な投資を行いながら製品を瞬時に廃棄するという重大な非効率性を浮き彫りにしています。重量のあるガラス(コカ・コーラの 1899 年の製瓶;エビアンが数世紀の陶器製の壺の使用の後、1908年にガラスへ転換)からプラスチックへの進化は、コスト、安全性、重量削減によって推進されました。初期のプラスチック試作には、モンサント社の「Easy-Goer」アクリロニトリルコポリマー(1975 年)があり、それが漏出と動物毒性に関する懸念から 1977年にFDA にて禁止されました。これにより、デュポン社が Polyethylene Terephthalate(PET)を導入した 1967–1973 年へと道が開かれました。1970年代後半には、大型の 2リットルボトル用の PET 生産が始まり、初期デザインは最大 96 g の重量を持ち、接着剤を用いたベースと 0.3–0.4 mm の壁厚を特徴としていました。1990年代初頭の革新としては、接着剤を使用しない「Petaloid」ベースや、より薄い壁(例:アクアフィナで約 0.2 mm)を採用するものがあり、材料使用量を大幅に削減しました。それ以降のさらなる進歩—例えば、ニージャラ・ボトルリング社の Eco-Air デザインが厚さ 0.17 mm 以下を達成し、1998年から現在にかけてプラスチック使用量を 60%削減した事例や、半リットルボトルが 2000年代中期のバージョンと比較して 75%少ないプラスチックを使用した事例—は、継続的な効率向上を反映しています。これらの進歩は企業の戦略とも整合しており、ネスレ社がペリエ社を買収(1992年)や、ペプシ/コカ・コーラがアクアフィナとダサニを中〜後半の 1990年代に発売したことは、ソーダ販売の減少への対応として行われました。しかし環境上の課題は依然として残っています。リサイクルシステムが材料の分離や汚染管理—if 特に破砕されたガラスが多材料ストリームに混入し、新しい容器にとって使用不可能になる—を失敗した場合、これらの良質に設計されたボトルは多くが埋め立て地に行き着いたり、下位利用されたりします。将来の進歩には、スマートなデザイン、厳格な材料分離プロトコル、改善されたリサイクルインフラストラクチャを通じて、サプライチェーンの耐性と廃棄物削減を調和させる必要があります。 ## Text to translate: The primary insight is that modern water bottles represent decades of advanced engineering optimized for robust industrial logistics—surviving shrink-wrapping, stacking, and rough handling—even though they have only seconds of practical use once opened. This durability paradox highlights a major inefficiency: investing heavily in long-haul resilience while discarding the product instantly. The evolution from heavy glass (Coca-Cola's 1899 bottling; Evian's switch to glass in 1908 after decades of earthenware jugs) to plastics was driven by cost, safety, and weight reductions. Early plastic attempts included Monsanto's "Easy-Goer" acrylonitrile copolymer (1975), which faced FDA bans in 1977 due to leaching and animal toxicity concerns, paving the way for DuPont's Polyethylene Terephthalate (PET) introduced around 1967–1973. By the late 1970s, PET production for large two-liter bottles began, with early designs weighing up to 96 g, featuring glued bases and wall thicknesses of 0.3–0.4 mm. Innovations in the early 1990s, such as "Petaloid" bases that eliminated glue and thinner walls (e.g., Aquafina at ~0.2 mm), cut material use significantly. Further advances since then—such as Niagara Bottling's Eco-Air designs under 0.17 mm thickness, which achieved a 60% plastic reduction from 1998 to today, and half-liter bottles using 75% less plastic than mid-2000s versions—reflect ongoing efficiency gains. These advances also align with corporate strategy: Nestlé's acquisition of Perrier (1992), and Pepsi/Coke launching Aquafina and Dasani in the mid-to-late 1990s, all in response to declining soda sales. Yet environmental challenges remain. If recycling systems fail to separate materials or manage contamination—especially with crushed glass mixed into multimaterial streams that become unusable for new containers—these well-engineered bottles often end up landfilled or downcycled. Future progress must reconcile supply chain resilience with waste reduction through smarter design, stricter material separation protocols, and improved recycling infrastructure.

2026/06/03 4:27

「グメールが私をおろかに思っている」と感じたので、退社しました。

## Japanese Translation: 著者は、嫌悪感と軽慢さを感じてしまう強制的な AI 機能のため、16 年使用してきた Gmail アカウントを恒久離脱することにした。具体的な問題は、不要なメッセージの要約、自動補填された返信文、そして「メールを書いてください」、「Tab で改善する」など、ユーザー自身がメールを作成できないか、あるいは受信者への時間の価値が低いことを示唆するような常駐的なプロンプト(促し)が含まれる。一部の AI 機能はオフにすることもできるが、それを行うことで自動的なスレッド分類といった長く使い続けられ有用な機能を犠牲にせざるを得なくなる。著者は、これらの強制的な機能が真のユーザーニーズを満たすためではなく、言語モデルの利用指標を人為的に高めるための意図的な戦術であることを疑っている。Google の従来からある安定したサービスや、fediverse を通じて独自ドメインと接続して使用している Fastmail での良好な第一印象とは裏腹に、著者はこの移行を Google エコシステムからの故意の断絶——単なるクライアントの切り替えではない——と捉えている。著者は連絡先を移す予定だが、歴史のあるメールスレッドはインポートせず、「不快な経験」として記述する後に「きれいな決別」を図る打算である。この状況はより広範な懸念を示している:技術企業は、ユーザーの自律性や長期的な信頼よりもエンゲージメントデータを優先することで、忠実な顧客を失うリスクを抱えている。 ## Text to translate: Improved Summary: The author is permanently leaving their 16-year-old Gmail account due to mandatory AI features they find intrusive and disrespectful. Specific issues include unsolicited message summaries, pre-filled replies, and persistent prompts ("help me write," "Tab to improve") that imply the user cannot compose emails themselves or that recipients do not deserve their time. While some AI features can be disabled, doing so forces users to sacrifice long-standing, useful functions like automatic thread categorization. The author suspects these unsolicited features are intentional tactics to artificially inflate language model usage metrics rather than serve genuine user needs. Despite Google's historically stable service and positive first impressions with Fastmail (which they have connected their custom domain to and use via the fediverse), the author views this move as a deliberate break from Google's ecosystem—not merely a client switch. They plan to migrate their contacts but will not import historical email threads, seeking a "clean break" after what they describe as a "bad taste" experience. The situation highlights a broader concern: tech companies risk losing loyal customers by prioritizing engagement data over user autonomy and long-term trust.