人類の料理史を全て圧縮した 2 メガバイト

2026/05/27 17:14

人類の料理史を全て圧縮した 2 メガバイト

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

現在のサマリーはExcellentです。リストを整合性のある物語へと統合し、技術的な指標を滑らかにグループ化しながら正確性を維持しています。チェックポイントを満たすために厳密に改善が必要となるわけではなく、推論や混乱を生じさせることなく全ての主要なポイントを捉えています。

サマリー:

Epicure は、食品アプリケーションに特化して設計された革新的な新しい skip-gram エンベディメントファミリーであり、成分の使用量と化学的特性の両方を統合し、料理的文脈をより深く理解できるようにしています。言語パターンと構造的化学的知識を組み合わせることで、このモデルは 7 カ国の言語を用いた 400 万以上のレシピを超え、言語的なニュアンスと科学的データを橋渡しする統一されたフレームワークを提供します。システムには「Cooc」、「Chem」、「Core」という 3 つの明確なバリエーションがあり、これらは同じアーキテクチャを共有しますが、ランダムウォークスキーマが異なり、必要に応じて純粋な化学的洞察还是一般的なレシピ文脈を選択できるようにしています。このイノベーションの根底には、成分の共出現と化学化合物をマッピングする広範なグラフがあり、大規模な NPMI グラフ(20 万 3 千エッジ以上)および Typed FlavorDB データベース(8 万エッジ以上)を利用して、LLM 補助パイプラインを通じて数千種の成分を 1,790 の標準的なエントリーに正規化しています。Josef Liyanjun Chen により執筆され、2026 年 5 月にバージョン 1 として提出されたこのモデルは、食品科学における高度な意味理解への道を切り開き、業界が料理をその文化的利用と基本的な化学組成の両面から同時に分析することを可能にしています。

本文

多言語レシピコーパス用「Epicure」シリーズモデルとグラフ種付け手法

本研究では、LLM を補完したパイプラインを基に構築された多言語レシピコーパスを用い、「Epicure」シリーズという三つの兄弟モデルを導入します。これらは从头(scratch)で再学習されており、化学的特徴とレシピ文脈の両方におけるスペクトル上で独自的位置付けを獲得しています。

コーパスの特徴と構築

データセットは以下のプロセスにより構築されました。

  • パイプライン: LLM を用いて生データからの原材料文字列を正規化
  • 統合項目: 4.14 万のレシピを 1,790 の標準化項目に統合。
    • ソース:11 つの異なるソースより集約。
  • 言語: 計 7 ヶ国語対応。
    • 英語、中国語、ロシア語、ベトナム語、スペイン語、トルコ語、インドネシア語、ドイツ語、およびインディアン英語。

グラフデータと種付け手法

モデルは以下の二つのグラフ情報を用いたMetapath2Vec バリエーションで種付け(初期化)されています。

  • NPMI グラフ
    • 辺数:203,508
    • 対象:原材料間の関係性。
  • FlavorDB「原材料−化合物」グラフ
    • 辺数:80,019
    • カテゴリ分類:2,247 カテゴリへ属する 15 の分類を備えたタイプ化されたデータ。

モデルアーキテクチャの違い

三つのモデルは同一のアーキテクチャと超パラメータを共有しますが、ランダムウォークのスキームのみが異なっています。

モデルウォークスキームの特徴
Cooc共出現グラフのみを使用。
Chemタイプ化された化合物メタパスのみを使用。
Core制御された混合比で注入された原材料間のウォークを組み合わせ、両モデルの利点を融合。

提出詳細情報

  • 提出者: Josef Liyanjun Chen [メールアドレスの確認]
  • バージョン:
    v1
  • 日時: 2026 年 5 月 21 日(木)12:23:38 UTC
  • ファイルサイズ: 6,566 KB

同じ日のほかのニュース

一覧に戻る →

2026/05/28 5:00

YouTube が AI 生成動画を自動でラベル付け

## Japanese Translation: 2026 年 5 月現在、YouTube は視聴者に対する AI 生成コンテンツに関する即座の明確化を確保するため、AI デイスクロージャーシステムを大幅に見直しています。最も重要な更新は、フォトリアリスティックまたは意味のある変改が行われたメディアについては動画プレーヤーの直下にラベルを顕著に表示し、Shorts では説明にのみ埋め込むのではなく、オーバーレイでラベルを表示することです。非現実的、アニメーション、または軽微な変更が加えられたコンテンツについては、開示は引き続き拡張された説明に維持されます。この統合的なラベルリング基準は、2024 年以降増大するコミュニティの透明性への要請に応えるため、すべての此类の重大な AI 生成または変更されたメディアに適用されます。 特に重要なのは、AI ツールの使用がクリエイター収益化能力やプラットフォーム上の推奨受容に影響を与えることのないことです。具体的には、開示ラベルは動画の推奨か収益化資格への影響を及ぼしません。本ポリシーは、Veo や Dream Screen といった YouTube 自前のツールで作成されたコンテンツと、C2PA メタデータでマークされたサードパーティ製素材を区別しており、これら両方とも恒久的な開示ラベルが付与されます。以前クリエイターは自主的な開示に依存していましたが、現在は重大な AI 機能の検出がある場合でも明示的なフラグがなくても自動的に行き来されることがデフォルトとなっています。今後、YouTube は内部シグナルを利用して AI マテリアルを自動的に特定し、純粋な自主的モデルから移行します。クリエイターは、作業が誤ってフラグされた場合に YouTube Studio 内でエラーを修正する権利を維持します。最終的に、この転換は業界全体の透明性を推進すると同時に、生成技術を利用する革新者に対する罰則を伴いません。

2026/05/28 1:39

Anthropic と OpenAI が商品と市場の適合性を発見したと思います

## Japanese Translation: AI 市場における主要な戦略転換として、Anthropic や OpenAI のような先導的なプロバイダーが、重いサブスクリプション割引から標準 API プライシングモデルへ移行しており、補助されたアクセス時代が終わりを告げました。この変化は、コーディングエージェントに対する製品市場適合の実現、ならびにそれらを維持するために現在必要な大規模なインフラコストによって駆動され、2025 年後半に正式化され、2026 年頭で完全に実現されました。Anthropic はエンタープライズプランを席数 20 ドルに加えての使用量モデルへ移行し、OpenAI も GPT-5.5 のリリース後、すべてのプランをトークン使用量との直接連携に合わせました。この財務的実態が鋭い企業の反応を引き起こしました:Uber は Claude Code そのものだけで年間 AI 予算を「上限」に達させ、Microsoft は内部的ツールの優先のために Anthropic ライセンスの取消を allegedly(とされ)行っています。一方、需要は依然として堅くあり、SpaceX は 2029 年までコンピューティング容量に対して月間 12.5 億ドルコミットしています。アナリストらは現在、Anthropic が 2026 年第 2 四半期に初めて利益のある四半期を迎え、API 収益が 109 億ドルに達すると予測しており、2025 年後半の楽観視から、エンタープライズグレード AI インフラを維持する高コストの実態へと根本的な調整を示しています。

2026/05/28 4:24

Apple と Google がプッシュ通知に注力する取り組みとは

## Japanese Translation: 主要なテクノロジー企業(具体的には Google、Yahoo、Microsoft、Apple)は、プッシュ通知を単なる配信チャネルから、プラットフォームがメッセージを受信する前に解析し、順位付けし、変更を加え、ユーザーに到達させるまで積極的に管理する環境へと本質的に変革させてきた。この変化により、「通知パイプ」は厳密に制御された空間へと転換しており、現在では Apple(APNs)と Google(FCM/Firebase)によって支配されており、送信側は厳しいフィルタリング、不透明な編集、そしてスロットリングや優先度低下による拒否の可能性に直面している。2009 年から 2017 年までは静脈的であったが、Android 8 の通知チャンネルと iOS のフォーカスモード導入を機にこの介入の時代が始まり、許可率を 85% から 67% に大幅に引き下げる影響をもたらした。現在では、Apple の 30 億パラメータ規模のモデルや Google の Gemini Nano といった固有モデルに基づき内容を再書き換えしたり、未発表のランキングロジックで順位付けを行ったりする独自メカニズムによって、従来のダウンストリーム指標がメッセージの抑制や改変を隠蔽するため信頼できなくなっている。その結果、開発者はクロスセルや教育コンテンツのためにプッシュ通知に依存し続けることができず、代わりにそのようなインタラクションをメトリクスが完全に可視化される自社所有の_Surface_(例:アプリ内インボックス)へと移行させる必要がある。このトレンドは、準拠しない送信者に対する「ゼロ・トレランス」ポリシーの拡大と、通知から直接自動タスクを発火させる AI エージェントの登場へと向かっており、メッセージを受動的なアラートではなく制御シグナルへと本質的に変えていく。

人類の料理史を全て圧縮した 2 メガバイト | そっか~ニュース