**Launch HN:RunAnywhere(YC W26)― Apple Silicon上で高速なAI推論を実現**

2026/03/11 2:14

**Launch HN:RunAnywhere(YC W26)― Apple Silicon上で高速なAI推論を実現**

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

## Summary
RCLIはmacOS向けの完全にオンデバイスで動作する音声AIアシスタントです。Apple Silicon上で、スピーチ→テキスト(Whisper)、大規模言語モデル推論(LFM2、Qwen3、Parakeetなど)、テキスト→音声(Piper、Kokoro)のパイプラインをローカルに実行します。データはクラウドへ送信されず、エンドツーエンドのレイテンシが200 ms未満です。

本システムはRunAnywhere独自のMetalRT GPU推論エンジンで動作し、M3/M4チップ向けに最適化されています。古いM1/M2 Macではllama.cppにフォールバックします。ベンチマークでは、Snowflake埋め込みを使用したユーザドキュメント(PDF、DOCX、プレーンテキスト)でのRAG時に約550トークン/秒と約4 msのハイブリッド検索レイテンシが確認されています。

インストールにはApple Silicon上のmacOS 13+が必要です。ワンライナーcurlスクリプトまたは`brew install rcli`で実行し、続いて`rcli setup`で約1 GBのモデルバンドル(LFM2 1.2B、Whisper、Piper、Silero VAD、Snowflake埋め込み)をダウンロードします。RCLIはターミナルUIを提供し、以下の操作が可能です。
- プッシュ・トゥ・トーク(`SPACE`)
- モデル閲覧(`M`)
- アクション管理(`A`)
- RAG取り込み(`R`)
- 会話クリア(`X`)

約38個のmacOSアクション(例:Spotify制御、音量調整、Safari起動)をローカルAppleScriptとシェルコマンドで公開しています。

ユーザーは`rcli models`および`rcli rag ingest`で新しいモデルやドキュメントタイプを追加できます。コマンドライン使用例:
- `rcli listen` – 継続的音声モード  
- `rcli ask "<text>"` – 一度限りのクエリ  
- `rcli rag ingest <dir>` / `rcli rag query <text>` – RAG操作  
- エンジン切替(`rcli metalrt`、`rcli llamacpp`)

トラブルシューティングではHomebrewインストール/アップグレードの問題(タップをリフレッシュまたはキャッシュをクリアしてSHA256不一致を解決)について記載しています。RCLIはMITライセンスでオープンソースです。MetalRTはプロプライエタリであり、ライセンシングに関するお問い合わせはfounder@runanywhere.aiまでお願いします。

本文

RCLI – macOS向けオンデバイス音声AI

RCLI は、Apple Silicon上でネイティブに動作する完結型の音声認識(STT)、大規模言語モデル(LLM)およびテキスト読み上げ(TTS)のパイプラインです。

  • 音声で実行できる macOS アクション 38 個
  • ローカル RAG によるドキュメント検索
  • エンドツーエンドの遅延が 200 ms 未満
  • クラウドや API キーは不要

Apple Silicon 向けに RunAnywhere, Inc. が開発した独自 GPU 推論エンジン MetalRT により実現しています。


デモ

Apple Silicon 上でのリアルタイムスクリーン録画 – クラウドも編集もトリックは一切無し。

  • Voice Conversation – 自然に話すと RCLI が聞き取り、理解し、デバイス上で応答します。
  • App Control – Spotify の再生や音量調整などを音声で操作。
  • Models – TUI から LLM を閲覧・ホットスワップ可能。
  • Document Intelligence (RAG) – ドキュメントを取り込み、音声で質問(約 4 ms のハイブリッド検索)。

インストール

前提条件:Apple Silicon 上の macOS 13+;MetalRT は M3 以降が必要。
M1/M2 Mac は自動的に llama.cpp にフォールバックします。

ワンライナー

curl -fsSL https://raw.githubusercontent.com/RunanywhereAI/RCLI/main/install.sh | bash

Homebrew

brew tap RunanywhereAI/rcli https://github.com/RunanywhereAI/RCLI.git
brew install rcli
rcli setup          # 初回のみ約 1 GB の AI モデルをダウンロード

最新バージョンへアップグレード:

brew update
brew upgrade rcli

トラブルシューティング

SHA256 不一致や古いバージョンエラーが出た場合:

cd $(brew --repo RunanywhereAI/rcli) && git fetch origin && git reset --hard origin/main
brew reinstall rcli

あるいはキャッシュをクリアして再タップ:

brew untap RunanywhereAI/rcli
rm -rf "$(brew --cache)/downloads/"*rcli*
brew tap RunanywhereAI/rcli https://github.com/RunanywhereAI/RCLI.git
brew install rcli
rcli setup

クイックスタート

コマンド説明
rcli
インタラクティブ TUI(Push‑to‑Talk + テキスト)
rcli listen
継続的音声モード
rcli ask "open Safari"
ワンショットコマンド
rcli metalrt
MetalRT GPU エンジン管理
rcli llamacpp
llama.cpp エンジン管理

ベンチマーク

  • MetalRT デコードスループット vs. llama.cpp と Apple MLX(M3 Max)
  • STT & TTS リアルタイム係数 – 低いほど良い;MetalRT STT はリアルタイムの 714 倍高速。

詳細は以下で確認ください。


主な機能

音声パイプライン

Metal GPU 上で 3 本のスレッドが同時に動作:

  1. VAD – Silero Voice Activity Detection
  2. STT – Zipformer ストリーミング + Whisper / Parakeet オフライン
  3. LLM – Qwen3 / LFM2 / Qwen3.5(KV キャッシュ+Flash Attention)
  4. TTS – 句レベルでダブルバッファリング(次の文をレンダリング中に現在が再生)

ツールコール、多輪対応メモリ(トークン予算に応じたスライディングウィンドウ)も備えています。

macOS アクション 38 個

音声またはテキストで Mac を操作。LLM が意図を解釈し、AppleScript とシェルコマンドでローカル実行します。

カテゴリ
Productivity
create_note
,
create_reminder
,
run_shortcut
Communication
send_message
,
facetime_call
Media
play_on_spotify
,
play_apple_music
,
set_music_volume
System
open_app
,
quit_app
,
toggle_dark_mode
,
screenshot
,
lock_screen
Web
search_web
,
search_youtube
,
open_url
,
open_maps

rcli actions
で全 38 を確認、または TUI の Actions パネルでトグル。
ツールコールが不安定に感じる場合は、TUI 内の X キーで会話をクリアしコンテキストをリセットしてください。

RAG(ローカルドキュメント Q&A)

ハイブリッドベクトル + BM25 検索(約 4 ms の遅延、5 k+ チャンク)。PDF・DOCX・プレーンテキストに対応。

rcli rag ingest ~/Documents/notes
rcli ask --rag ~/Library/RCLI/index "summarize the project plan"

インタラクティブ TUI

端末ダッシュボード:

  • Push‑to‑Talk
  • ハードウェアモニタリング(ライブ)
  • モデル管理
  • アクションブラウザ

キー割り当て

キー動作
SPACEPush‑to‑Talk
Mモデルの閲覧/ダウンロード
AmacOS アクションの有効化/無効化
RRAG 用ドキュメント取り込み
X会話クリア & コンテキストリセット
Tツールコールトレース切替
ESC停止 / 閉じる / 終了

MetalRT GPU エンジン

MetalRT は LLM、STT、TTS のオンデバイス推論で最速を誇り、最大 550 tok/s スループットとサブ 200 ms のエンドツーエンド遅延を実現します。

  • 必須:Apple M3 以降(M3, M3 Pro, M3 Max, M4 …)
  • 対応モデル:Qwen3 0.6B/4B、Llama 3.2 3B、LFM2.5 1.2B(LLM);Whisper Tiny/Small/Medium(STT);Kokoro 82M with 28 voices(TTS)

MetalRT は

rcli setup
実行時にインストールされます(“MetalRT”または “Both” を選択)。別途コマンドで管理可能。

rcli metalrt install
rcli metalrt status

ライセンス関連の問い合わせは founder@runanywhere.ai まで。


サポートしているモデル

タイプデフォルト / オプション
LLMLFM2 1.2B(デフォルト)、LFM2 350M、LFM2.5 1.2B、LFM2 2.6B、Qwen3 0.6B、Qwen3.5 0.8/2/4 B、Qwen3 4B
STTZipformer(ストリーミング)、Whisper base.en(オフライン - デフォルト)、Parakeet TDT 0.6B(約 1.9% WER)
TTSPiper Lessac/Amy、KittenTTS Nano、Matcha LJSpeech、Kokoro English/Multi‑lang
VADSilero VAD
EmbeddingsSnowflake

デフォルトインストール(

rcli setup
)は約 1 GB:LFM2 1.2B + Whisper + Piper + Silero VAD + Snowflake embeddings。

モデル管理

rcli models          # インタラクティブ管理
rcli upgrade-llm     # ガイド付き LLM アップグレード
rcli voices          # TTS 声の閲覧・切替
rcli cleanup         # 未使用モデル削除

ソースからビルド(CPU 版)

git clone https://github.com/RunanywhereAI/RCLI.git && cd RCLI
bash scripts/setup.sh
bash scripts/download_models.sh
mkdir -p build && cd build
cmake .. -DCMAKE_BUILD_TYPE=Release
cmake --build . -j$(sysctl -n hw.ncpu)
./rcli

すべての依存関係は vendored か CMake 経由で取得。CMake 3.15+ と Apple Clang(C++17)が必要です。


CLI リファレンス

コマンド説明
rcli
インタラクティブ TUI
rcli listen
継続的音声モード
rcli ask <text>
ワンショットテキストコマンド
rcli actions [name]
アクション一覧または詳細表示
rcli rag ingest <dir>
RAG 用ドキュメントをインデックス化
rcli rag query <text>
インデックスに対する問い合わせ
`rcli models [llmstt
rcli voices
TTS 声の管理
rcli metalrt
MetalRT GPU エンジン管理
rcli llamacpp
llama.cpp エンジン管理
rcli setup
デフォルトモデルをダウンロード
rcli info
エンジン・モデル情報表示

オプション

  • --models <dir>
    – モデルディレクトリ(デフォルト:
    ~/Library/RCLI/models
  • --rag <index>
    – RAG インデックスをロード
  • --gpu-layers <n>
    – LLM の GPU レイヤー数(デフォルト 99 = 全て)
  • --ctx-size <n>
    – LLM コンテキストサイズ(デフォルト 4096)
  • --no-speak
    – テキスト出力のみ(TTS を無効化)
  • --verbose, -v
    – デバッグログ

コントリビューション

貢献は大歓迎です。CONTRIBUTING.md にビルド手順と新アクション・モデル・声の追加方法が記載されています。


ライセンス

  • RCLI – MIT License(オープンソース)
  • MetalRT – RunAnywhere, Inc. の独自ライセンスで配布

RunAnywhere, Inc. が開発。

同じ日のほかのニュース

一覧に戻る →

2026/03/10 23:50

トニー・ホーア氏が亡くなられました。

## Japanese Translation: **改訂要約** トニー・ホアー(Turing Award受賞者で現代コンピューティングを形作った先駆者)は、2026年3月5日に英国ケンブリッジで92歳で亡くなりました。1934年1月11日生まれの彼は、古典文学と哲学を学び、国防サービス中に共同軍事語学学校(Joint Services School for Linguists)でロシア語を訓練し、その間にソビエト計算機と協力しました。ホアーの最も有名な業績はクイックソート、ALGOLプログラミング言語への貢献、およびホア論理(Hoare logic)の基礎化であり、これらが世界的に称賛されました。有名な逸話として、Elliott Brothers Ltdの上司と6ペンスを賭けてクイックソートが速いかどうかを挑戦したエピソードがあります。彼は勝ち、報酬を受け取りました。マイクロソフト・ケンブリッジ在籍中には、午後に地元のアーツピクチャハウスシネマ(Arts Picturehouse)を訪れることが多かったと述べています。また、彼はホラー映画や『グッド・ウィル・ハンタリング』などで描かれる天才像は非現実的だと指摘し、本物の専門知識には何年もの努力が必要だと主張しました。ホアーは将来のコンピューティング制限は公衆の認識を超える可能性があると警告し、暗号技術や量子テクノロジーへの影響を示唆しました。そのユーモア、忍耐力、鋭い記憶力、そして謙虚さはアルゴリズム、プログラミング言語、ソフトウェア工学の実践、および広範な研究コミュニティに永続的な影響を残しました。

2026/03/11 7:33

U+237C ⍼ は方位角です。

## Japanese Translation: 記事は、あまり知られていない文字「⍼」を調査し、中世20年代のドイツ語フォントカタログに数例登場するものの、それ以前の記録には存在しないことを指摘しています。最も顕著な証拠は1950年のH. Berthold AG シンボルカタログで、⍼が明示的に「Azimut/Richtungswinkel」(方位角・方向角)とラベル付けされている点です。1949–1952 年の Zeichenprobe および Schriftprobe 系列のコピーにはすべてこの文字が含まれていますが、1909 年の Hauptprobe や 1900 年の Schriftproben のようなそれ以前のカタログでは言及されていません。全ページスキャンにより、これら中世20年代の資料での存在とその他の場所での欠如が確認されています。Mastodon ユーザーは、この形状がセクスタントを通過する光線に似ていると指摘し、航海関連の起源を示唆しています。この記事は、⍼ が水上用記号として意図されたものかどうか、およびフォント版でどのように進化したかをさらに研究すべきだと結論付けています。この明確化は、タイポグラフィー史家、歴史的字体を参照するデザイナー、および遺産文書を扱う航海関連業界に有益となるでしょう。

2026/03/11 7:27

クラウドフレア クローラ エンドポイント

## Japanese Translation: **サマリー** Cloudflare の Browser Rendering サービスは、オープンベータ版の `/crawl` エンドポイントを公開しました。これにより、単一の API コールでウェブサイト全体をクロールできます。 - **仕組み:** POST リクエストで開始 URL と任意の設定(depth、page limits、ワイルドカードパターン、`render: false` 等)を送信します。サービスは sitemap やリンクから自動的にページを発見し、ヘッドレスブラウザでレンダリング(または `render: false` の場合は静的 HTML を取得)して結果を非同期で返します。 - **非同期ワークフロー:** ジョブ ID が返され、その後 GET エンドポイントをポーリングして処理済みページを raw HTML、Markdown、または構造化 JSON として取得できます。 - **主な機能:** - 複数の出力形式(HTML、Markdown、JSON) - depth とワイルドカードベースのスコープ制御 - `modifiedSince`/`maxAge` による増分クロール - `robots.txt` の crawl‑delay ディレクティブへの対応 - Workers Free および Paid プランの両方で利用可能 - **インパクト:** 開発者はプログラム的にサイトコンテンツを取得でき、分析チームは構造化ページデータを収集し、SEO ツールは効率的にサイトをインデックスできます。さらに、従来のクローラに代わる低コストなオルタナティブとして、ウェブクロールエコシステム全体にも貢献します。 このバージョンでは、Key Points List の主要ポイントすべてを保持しつつ、メインメッセージを明確かつ曖昧さのない表現にしています。

**Launch HN:RunAnywhere(YC W26)― Apple Silicon上で高速なAI推論を実現** | そっか~ニュース