**Launch HN:IonRouter(YC W26)– 高スループット・低コスト推論**

2026/03/13 3:52

**Launch HN:IonRouter(YC W26)– 高スループット・低コスト推論**

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

IonAttention Engine は、モデルを高速でスワップし、トラフィックをリアルタイムに適応させることで、単一 GPU 上で高スループットかつ低コストの推論を実現します。Grace Hopper GH200 用にゼロから設計されており、Qwen2.5‑7B で約 3,000 トークン/秒を達成し、1 秒単位の請求とアイドル時間なし(1 百万トークンごとの従量課金)をサポートします。ファインチューニング済みモデル、LoRA アダプタ、または任意のオープンソースモデルなど、カスタムモデルもコールドスタート無しで専用 GPU ストリームにデプロイ可能です。チームはすでに Ion をロボティクス認識、多画面監視、ゲーム資産生成、AI ビデオパイプラインで使用しており、ケーススタディでは 5 つのビジョン‑ランゲージモデルを単一 GPU 上で実行し、2,700 本の動画クリップを 1 秒未満の起動遅延で処理しました。API はコード変更不要で、既存の OpenAI クライアントは Ion を指すだけで高速化できます。価格例としては、ZhiPu AI の 600B+ MoE モデルが約 $1.20(入力)/$3.50(出力)、MoonShot AI(~120 トークン/秒、$0.20 入 / $1.60 出)、MiniMax 1M‑context(~120 トークン/秒、$0.40 入 / $1.50 出)、Qwen3.5‑122B-A10(~120 トークン/秒、$0.20 入 / $1.60 出)、Wan2.2 Text‑to‑Video(8 秒/クリップ、$0.00194/GPU‑sec)および Black Forest Labs の Flux モデルが約 3 秒で画像を生成し、画像あたり約 $0.005 を請求します。ユーザーは GPU 専門知識なしに Ion 上で構築を開始でき、幅広い AI ワークロードに迅速に展開できます。

本文

IonAttention が実現する高速・低コスト推論

  • IonAttention エンジン

    • 単一GPU上で複数モデルをマルチプレクスするカスタムインフェレンススタック。
    • ミリ秒単位で切り替え、トラフィックにリアルタイムで適応。
    • Grace Hopper 用にゼロから設計。
  • スループット(token / s)

    • Single GH200, Qwen2.5‑7B – トップインフェレンスポバイダー ≈ 3,000
    • 詳細は深掘りをご覧ください

カスタムモデル

Ion に任意のモデルを投入:

  • 冷却開始なしの専用GPUストリーム
  • 秒単位課金
  • ファインチューニング、カスタムLoRA、あるいはオープンソースモデルを弊社フリートでデプロイ

コール予約 → Ion で構築されるチーム
ロボットからリアルタイム映像まで:ロボティクス知覚、多画面監視、ゲーム資産生成、AI動画パイプライン。

ケーススタディ

  • 5 VLM, 1 GPU
  • 単一GPUに5つのビジョン‑ラングエージモデル – 2,700本の映像クリップ、同時利用者数、< 1 s の冷却開始。
    ケーススタディを読む

API – コード変更ゼロ

既存の OpenAI クライアントをそのまま Ion に向けるだけ。
任意の言語・フレームワークで、一行の変更で完了。

モデルと価格設定

100万トークン単位で課金。アイドル時のコストは発生しません。

モデルスループット(tok/s)$/in$/out
ZhiPu AI 600B+ MoE約220$1.20$3.50
MoonShot AI約120$0.20$1.60
MiniMax 1M‑context約120$0.40$1.50
Qwen3.5‑122B-A10B約120$0.20$1.60
Cumulus 122B MoE約120$0.20$1.60
Wan2.2 Text‑to‑Video8 s/clip$0.00194 / GPU·sec
Black Forest Labs Flux3 s/image$0.005 per image

各モデルを Playground で試せます。


構築の準備はできましたか?
1 分以内に開始できます。GPU の専門知識は不要です。

同じ日のほかのニュース

一覧に戻る →

2026/03/13 6:01

「実装したほうがよろしいでしょうか? いいえ。」

## Japanese Translation: **オリジナルの要約は既に明確で正確、簡潔です。修正は不要です。**

2026/03/12 22:42

マルス – サービステクノロジー型クリーンルーム (“Malus – Clean Room as a Service” を自然な日本語に訳したものです。)

## Japanese Translation: ## 要約 このテキストは、企業がオープンソースライブラリを「ロボット再構築版」に合法的に置き換え、帰属表示とコピーレフトの義務を排除できる商業サービスを推進しています。公的なドキュメントと型定義のみを使用してクリーンルーム環境でコードを書き直すことで、同社は各新しいコピーが自動化されたチームによって独立して作成され、元のソースから直接コピーされていないことを保証すると主張しています。サービスは、パッケージの解凍サイズに基づく透明なKB単位課金を提供し、基本料金やサブスクリプションはなく、Stripe処理最低限度が設定されています。支払いはUSD、EUR、BTC、または株式オプションで可能です。npm、PyPI、Cargo、Maven、Go、NuGet、RubyGems、Composer など複数のエコシステムをサポートしていますが、ダッシュボードには現在処理済みプロジェクトもアクティブ顧客もゼロと表示されています。 匿名企業クライアントからのケーススタディでは、AGPL の依存関係削除、$4 M のコンプライアンスコスト節約(サービス料 $50 K と比較)、そして $2.3 B の買収を促進した事例が挙げられています。同社の「MalusCorp Guarantee™」は、リベレートされたコードが元のライセンスに違反した場合、全額返金または国際水域への移転を保証します—これまで一度も発動されたことがありません。 将来的な計画としては、緊急 AGPL 問題に対するラッシュ価格設定、追加パッケージエコシステムへの拡大、および帰属表示要件を排除する独自の MalusCorp‑0 ライセンスの継続的な推進が含まれます。広く採用されれば、企業は制限的なオープンソースライセンスを回避でき、法的リスクとコストを低減し、依存関係管理に関する業界規範を変える可能性があります。

2026/03/13 2:13

**バブルソートされたアメンブレイク**

## Japanese Translation: > **概要:** > 「このアイデアで起きた、今や存在する。かっこいい!」というタイトルの新しいインディーゲームプロトタイプが、itch.ioで*自分で価格を決めてください*タグ付きでリリースされました。Godotエンジンで構築され、HTML5とWindowsで動作し、「AmenSorting (Windows)」(~93 MB) などのダウンロード可能ファイルが含まれています。現在、このゲームは3人のレビューアから5つ星評価を受けています。Music、Music Production、および No AI のタグが付いており、人工知能よりも音声ソートに焦点を当てた内容であることを示しています。ユーザーはログイン後にコメントを残すことができ、一部の人々は並べ替えられたサンプルを再生する機能やソースコードの有無について尋ねています。この無料リリースは音楽制作の趣味家を惹きつける可能性があり、関心が高まればさらなる開発につながるかもしれません。