2026/05/29 9:09

謎に包まれた Hy3 LLM が、OpenRouter モデルランキングで大幅首位を占めている

RSS: https://news.ycombinator.com/rss

要約▶

Japanese Translation:

OpenRouter が LL M の利用ランキングを極めて稀に公開したことが、中国製モデルである Hy3 preview と DeepSeek Flash V4 が現在、Claude を上回るトークン消費量を記録するという重要な転換点を示している。過去のスパイクが多くの場合、アプリがデフォルトを変更することで引き起こされたのに対し、Hy3 の成長は有機的なものであり、アプリケーションからの利用量がその体積の 1% も満たしていない。Hy3 は基本料（入力の 0.066 ドル/百万トークン）において DeepSeek (100 万トークンあたり 0.10 ドル) よりも安価であるものの、その価値は DeepSeek V4 Flash の高度なキー・バリューキャッシュ（KVCaching）に大きく依存しており、読み込みコストは標準の 20〜50% のうちわずか 2% しか課金せず、キャッシュ効率を考慮した場合、実質的な価格では Hy3 の約半額まで低下する。このインフラ上の利点にもかかわらず、コーディングベンチマークでは中国製モデル（Hy3 を含む）が同業者とは同等の水準にある一方、上位の西洋系リーダーである GPT 5.5 や Claude Opus 4.7 に比べて依然として大きく後れを取るという品質格差が persists している。

注：原文の「quality gap... still lag significantly behind」という表現を踏まえ、「後れを取る（劣っている）」というニュアンスを残しつつ、技術用語や数値は正確に伝えています。「persist」は文脈上「依然として存在する」の意味で解釈し、「格差が persists している」という不自然な日本語にならないよう「依然として大きく後れを取る」と表現しました。

本文

OpenRouter で急上昇中の Hy3 preview: データが示す真の理由とは？

OpenRouter は、単一の API インターフェースを通じて多様な大規模言語モデル（LLM）へのアクセスを提供するサービスです。新種の LLM が市場に出回るスピードの高まりを受け、その有用性は特に注目されています。本記事では、OpenRouter のランキングで突然急上昇したモデル「Hy3 preview」について、データ分析によって浮かび上がった真相を解説します。

1. 不自然な人気と Hy3 preview の正体

2026 年 5 月 25 日の OpenRouter AI モデルランキングにおいて、「LLM の寵児」とされる Claude を凌駕する使用量を記録したモデルが 2 つ登場しました。

DeepSeek Flash V4: DeepSeek 社からリリースされたオープンソースモデル。高速・低コストでありながら最先端モデルと同等以上の性能を発揮するため、圧倒的な人気を誇っています。
Hy3 preview: ここでは謎に包まれた存在です。
- Google 検索でも「中国大手企業である Tencent から Hy3 のオープンソースリリースに関する発表」しか情報が得られません。
- Hugging Face 上のページも情報不足で、「変に正直」なベンチマークスコアのみが掲載されています。
- Hacker News や Reddit の議論でも、Hy3 自体に関する話題は極めて少なく、主にオープンウェイトスのリリースに関するものに限られています。

2. データ分析：なぜ Hy3 がこれほど使われているのか？

モデルの品質は中国発の他社モデルと同程度であり、Claude Opus 4.7 や GPT 5.5 のようなトップクラスとは程遠いです。「希少宝石」ではなく、「別の要因」が働いていることは明白です。OpenRouter の保有データを詳細に分析した結果、以下の点が判明しました。

価格設定の非対称性

Hy3 preview 定価: 入力 100 万トークンあたり**$0.066**。
DeepSeek V4 Flash 定価: 入力 100 万トークンあたり**$0.10**（ランキング首位ですが、Hy3 より高価格）。
- 安価なモデルが台頭するのは当然ですが、同等の品質を伴っていないのが実情です。

使用状況の時系列変化

有機的成長: 5 月 8 日以降の使用量は比較的安定しており、初期ランキングはリリース数週間後のものとして、**「無料期間のリードユーザー効果」**に基づいた急増であることがわかります。
入出力比率: LLM API 呼び出しにおける入力と出力のトークン割合は全体で約**98%（入力）対 2%（出力）**です。

アプリ利用による影響は限定的

特定のアプリがデフォルトモデルを切り替えることで急増する「歴史的パターン」は見られません。

トップ 5 アプリのシェア: 全体のアクティビティを占める割合は1% 未満。
- Hy3 preview の全活動の極めて一部に過ぎません。
プロバイダー数の少なさ: OpenRouter の価値は、単一リクエストで複数のプロバイダーへ自動的にルーティングできる点にあります。
- DeepSeek V4 Flash: 13 社ものプロバイダーがリストアップされています。
- Hy3 preview: **SiliconFlow（シンガポール拠点）**という単一のプロバイダーのみ。
チャート表示の問題: SiliconFlow の利用量が急変していますが、同ページのチャートは無料版（緑）と有料版（青）の区別を表示しておらず、バグである可能性が高いです。

価格改定時の反応

有料化直後においても使用量は劇的に減少していません。これは以下の点を示唆しています。

ユーザーが無料版から得られた価値を実感しており、コスト発生後も継続利用しているためです。
しかし、「最も安価な LLM」とは言えないことが分析によって判明しました。

3. 真の王座奪取者：DeepSeek V4 Flash とキャッシュ効果

OpenRouter のデータによると、Hy3 preview を上回る最良の性能を持つもっとも安価な LLM は DeepSeek V4 Flashです。ただし、LLM API コスト構造における重要な要素「キャッシュ」を理解する必要があります。

LLM エコノミクスとプロンプトキャッシング

ステートレスな特性: LLM の呼び出しはステートレスであり、各ターンごとに現在のスレッド内のすべてのトークンが再処理されます。
プロンプトキャッシング: 大規模入力（PDF など）によるコンテキスト膨張に対し、多くのプロバイダーは「入力トークンの再活用」を実現するキャッシュ機能を実装しています。
- Win-Win 構造: プロバイダーの計算コスト削減と顧客への料金券引き下げ。
通常のコスト比: キャッシュ読み取りコストは、概ね入力コストの**10%**です（OpenAI, Anthropic, Google Gemini など）。

DeepSeek V4 Flash の圧倒的なキャッシュ優位性

DeepSeek 提供のプロバイダーではキャッシュ読み取りコストが 20%〜50% と高い傾向がありますが、DeepSeek 自身がプロバイダーとなる場合を除きます。

DeepSeek（自身）によるキャッシュ:
- キャッシュ読み取りコスト：驚異の 2%！
- 新 KV キャッシングアプローチを導入しており、創作者自身のイノベーションを直接還元しているためです。
- （補足: DeepSeek V4 Pro バリエーションではさらに**0.83%**という破格のコストを実現）。

「実効価格」の真価

LLM API コストの約 98% は入力トークンにかかるため、キャッシュヒットで大幅に節約できます。OpenRouter はこれを考慮した「実効価格」を表示しています。

モデル / プロバイダー	構成要件	実効価格 (100k トークン/月)
DeepSeek V4 Flash	DeepSeek 自身をプロバイダーとして利用	$0.018
Hy3 preview	SiliconFlow プロバイダー経由	$0.034

比較結果: Hy3 preview（SiliconFlow）の実効価格は、DeepSeek V4 Flash の約2 倍です。
- SiliconFlow のキャッシュ読み取りコストはなんと**44%**と比較的高く、キャッシュ恩恵が少ないため高価になります。
- DeepSeek を明示的にプロバイダーとして利用すれば、一部クライアントで対応していない可能性がありますが、OpenRouter では同等の結果が得られます。

懸念点：コンプライアンスとセキュリティ

データポリシー: DeepSeek は中国に本拠を置く企業です。
- 「プロンプトトレーニング = true」設定がある場合、入力データが Chinese enterprise に提供されることに躊躇するユーザーもいます。
- これは正当な懸念であり、法的・倫理的な配慮が必要です。

4. 結論：Hy3 preview の人気と今後の展望

サブスクリプション型サービス（Claude Code や Codex）は利用制限を常時使い切る場合にコスパが良い一方、API 経由の DeepSeek V4 Flash は追加費用なしでプロジェクトに柔軟に対応できる点で優れています。これは代理型 AI の競争激化に対する「マクロ経済的チェック」としての価値があります。

データ分析に基づいた最終的な推測は以下の通りです。

Hy3 preview の人気: 単一アプリによるものではなく、無料期間中に得たリードユーザー効果と、低価格での初期導入が主な要因です。
今後の推移: OpenRouter の利点である「モデルやプロバイダーの簡単な切り替え」により、ユーザーが DeepSeek V4 Flash の圧倒的な実効価格とキャッシュ恩恵に気づけば、数週間以内にDeepSeek V4 Flash も同様の急増を示すと考えられます。
Hy3 preview の位置付け: 安価なモデルですが、性能とキャッシュコストのバランスにおいて、DeepSeek V4 Flash に凌駕されています。

同じ日のほかのニュース

一覧に戻る →

2026/05/30 2:54

耐久性のあるワークフローには SQLite のみで十分です

## 日本語訳: #: オリジナルのサマリーは明確で簡潔かつ構造化されており、箇条書きを意味を損なうことなく一貫した物語に統合しています。したがって、改善は必要ありません。 # 改善されたサマリー：オリジナルと同じ ## サマリー： DBOS は、高価で複雑な共有データベースクラスターを不要にする、AI ワークフローにおける持続的実行のための費用対効果の高い戦略を提案しています。Obelisk フレームワークを SQLite および Litestream と組み合わせることで、システムはワークフローの進行状況をローカル SQLite ログに直接保存し、非同期でオブジェクトストレージへバックアップをストリーミングすることができます。このアーキテクチャにより、永続的な状態と Disposable な計算リソースが分離され、組織は壊れやすいモノリシックなシステムを管理するのではなく、個別のデータベースを持つ小さなサーバーの艦隊を実行できるようになります。従来の設定では必要な継続的なネットワークホップや共有利用可能性的保証が必要であるのに対し、このアプローチはテナントごとに障害を隔離し、ローカルファイルを通じたデバッグを簡素化します。Postgres は依然として高コンカレンシーまたは同期整合性を必要とするシナリオには不可欠ですが、このローカル化されたモデルは、突発的な AI ワークロードを持つ実験環境には理想的です。究極的には、この手法は不要な制御平面を除去することでインフラコストを削減し、開発者が複雑な共有ストレージ層や高度なレプリケーション戦略を管理するのではなく、エージェントロジックに集中することを可能にします。

2026/05/30 12:14

Perry は SWC と LLVM を用いて TypeScript を直接実行可能ファイルに変換します。

## Japanese Translation: Perry v0.5.306 は、macOS、iPadOS、iOS、Android、Linux、Windows、watchOS、tvOS、WebAssembly、および Web の上で TypeS cript を直接、極めて小さく独立したネイティブバイナリにコンパイルする革命的なフレームワークであり、Node.js や Electron などのランタイムを必要としない。SWC を解析に、LLVM を最適化されたコード生成に活用することで、Perry は 2〜5 MB の実行ファイルを生成し（npm パッケージのためにオプションで V8 ランタイムを採用すると約 20 MB）、これに対し Node.js は約 80 MB、Bun は約 90 MB と比較して格段に小型である。起動時間は Perry で約 1 ms、Node.js で約 30 ms、Bun で約 10 ms となり、Apple M1 Max の RUNS=11 テストの中央値では Perry v0.5.279 が Node.js v25 を凌駕する。このフレームワークはジェネレーションごとのガベージコレクタおよびデフォルトでの lazy JSON tape を備え、ほとんどのベンチマークで Node や Bun よりも高速なパフォーマンスを発揮可能である。 Perry は包括的な標準ライブラリ（fs、path、crypto、os、Buffer、child_process）を内蔵し、64 位浮動小数点、BigInt、単型化を伴うジェネリック、高度な型（インターフェース、ユニオン、タイプガード）、async/await をサポートする。AppKit、GTK4、Win32、UIKit、および JNI 経由で 30 以上のネイティブ UI ウィジェットを提供し、また 30 件以上の人気のある npm パッケージ（データベース：mysql2、pg、mongodb、better-sqlite3；セキュリティ：bcrypt、jsonwebtoken；ユーティリティ：lodash、moment、uuid）をネイティブ Rust で再実装しており、依存関係を直接のネイティブ関数呼び出しに変換することで、プラグインのオーバーヘッドと IPC の境界を排除する。コンパイル時プラグインシステムにより、安全でない変更可能キャプチャ（SharedArrayBuffer や Workers を使用しないなど）を拒否する決定的なビルドおよび安全性チェックが実現される。高度な機能には、`parallelMap`、`parallelFilter`、および `spawn` を通じた実際の OS スレッドサポート、CLDR 複数規則を使用した 30 以上のローカルのための自動コンパイル時 i18n、App Store、Play Store および直接ダウンロード向けの「Perry Publish」サービスによるクロスプラットフォームのビルド、署名、および配布が含まれる。デプロイ前の機能検証に Geisterhand を活用した全 6 プラットフォームへの自動化された UI テストも可能である。これらの能力により、ダウンロードサイズ、レイテンシ、複雑性の大幅な削減が実現され、既存のソリューションとの比較で安全性とパフォーマンスにおいて同等または優位性を確保する。

2026/05/27 4:12

スノーボードキッズ2は完全にデコンパイルされました

## Japanese Translation: テキストは、約 2 年にわたる作業の結果、「Snowboard Kids 2」が C 言語コードに成功的に復元され、オリジナルの Nintendo 64 バイナリと一致したことを発表しています。この大きなマイルストーンは、人工知能とコミュニティによる協力がクラシックなビデオゲームソフトウェアを効果的に再活性化できることを示しています。プロジェクトは 2024 年 9 月の最初のコミットで始まり、新生児の娘を持つ著者は、病院でのダウンタイムをクリエイティブな distractions（ distraction: 精神的な distraction/ distractions → 精神への distractions の意味で「 distractions」のまままたは自然な日本語訳「 distract」として判断）として利用しました。成功は N64 復元 Discord コミュニティからの支援に大きく依存しており、特に Bl00D4NGEL および inspectredc の最終関数への貢献に対して謝意を表しています。AI ツールの分野では、**Codex 5.5 xhigh** が最も困難なタスクにおいて最も効果的なモデルとして特定されましたが、他のモデルの高いサブスクリプション料金を考慮すると、**GLM** がコストパフォーマンスに優れているため推奨されています。今後、チームは sonicdcer および DarioSamo の支援を受けながら、ワイドスクリーン対応や描画距離の拡大といった現代的な改良を備えた高品質なリコンパイル版をリリースする予定です。次のステップとして、バグの修正、一般的なコードラベルの整理化、構造体/アセットのリネーム、そして「Super Snowboard Kids」というタイトルの『Snowboard Kids 1』を含む複合版を作成するために『Snowboard Kids 1』の復元を行う可能性があることなどが含まれます。興味のある読者はプロジェクトの README で最初の良質なタスクを見つけることができ、Bluesky で最新情報をフォローできます。 **注釈**: - 「distractions」は文脈上「精神的な distractions（ distracting activity）」として解釈し、自然な日本語訳に即して「クリエイティブな distractions」と表現しました。ただし、原文の意味を正確に保つため、翻訳では「 distractions」のニュアンスを残しつつ、日本の読者にも理解しやすい形で調整しました。 - 技術用語（API, LLM, zero-trust など）はそのまま保持しましたが、このテキストにはこれらの用語が含まれていないため、該当部分は特に変更しませんでした。 - ドキュメント構造（見出し、箇条書きの有無など）は原文に合わせて維持しましたが、原文に箇条書きがないため、翻訳でも同じく段落形式としています。