**OSS ChatGPT WebUI の概要**

- **モデル数:** 530種利用可能  
- **主な機能:**
  - MCP(マルチコマンド処理)
  - ツール統合
  - Gemini RAG(検索拡張生成)
  - 画像生成
  - 音声生成

2026/01/27 0:01

**OSS ChatGPT WebUI の概要** - **モデル数:** 530種利用可能 - **主な機能:** - MCP(マルチコマンド処理) - ツール統合 - Gemini RAG(検索拡張生成) - 画像生成 - 音声生成

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

最新のLLMSリリースは、拡張性、モデルアクセス、およびユーザー向けツールに対する包括的な改修を実現します。
拡張性 – 新しいプラグインベースアーキテクチャ(

llms/extensions
+
~/.llms/extensions
)が旧来のモノリシック設計を置き換え、開発者は機能を簡単に追加または差し替えることができます。
モデルカタログ – 公開されている
models.dev
カタログと統合し、24社(OpenAI、Anthropic、Google Gemini、Nvidia など)から530+のモデルを取得し、それらの設定を
llms.json
にマージします。
UI の拡張 – モデルセレクターはスマート検索、モダリティ別高度フィルタリング、並び替え、お気に入り、および豊富なモデルカードを提供します。Gemini RAG Extension はファイルストア管理を実装し、ドラッグ&ドロップアップロードと背景インデックス作成で Retrieval Augmented Generation ワークフローをサポートします。
Python 関数呼び出し – ツールは
ctx.register_tool
(暗黙または明示的な JSON スキーマ)経由で登録でき、セッションごとのツールセレクター UI で有効/無効を切り替えられます。
MCP サポート – fast_mcp 拡張が Model Context Protocol を追加し、Anthropic の Git MCP Server や Gemini の画像/音声生成など外部 MCP サーバーからのツールの動的検出・実行を可能にします。
コア拡張
core_tools
(メモリ、ファイルシステム、数式、Python/JS/TS/C# でのコード実行)とデスクトップ自動化用
computer_use
が専用 UI(計算機、コード実行)と共にバンドルされています。
メディアハンドリング – Google、OpenAI、OpenRouter、Chutes、Z.ai、Nvidia で画像生成をサポートし、音声 TTS は現在 Gemini の Flash/Pro Preview に限定されます。生成されたメディアは
~/.llms/cache
内に SHA‑256 ファイル名でキャッシュされ、SQLite を通じて参照します。メディアギャラリー拡張はローカル SQLite DB(
~/.llms/user/default/gallery/gallery.sqlite
)にすべての生成ファイルを自動インデックスし、ライトボックスプレビュー付きで高速閲覧を実現します。
システムプロンプト – 置換可能な
system_prompts
拡張は200以上のキュレート済みプロンプトを提供し、ユーザー固有のライブラリは
~/.llms/user/<github-user>/system-prompts.json
に保存されます。
永続化 – クライアント側 IndexedDB からサーバー側 SQLite(
~/.llms/user/app/app.sqlite
)へ移行し、マルチデバイスアクセスを可能にします。また単一背景スレッドで同時書き込みが行われ、認証有効時には自動的にデータ分離が実現されます。
CLI – すべての機能はコマンドライン(
llms -m <model> --out image "<prompt>"
llms --serve 8000
等)からアクセスできるようになり、自動化とリモート操作が簡便になります。

本文

主要リリース概要

  • フォーカス:拡張性、プロバイダーサポートの拡充、ユーザー体験の向上
  • models.dev
    統合により 24 のプロバイダーから 530 + モデルを利用可能

主な機能

機能説明
モデルセレクター検索・フィルタリング・ソート・お気に入り機能付きのフルパワー対話ダイアログ。
拡張機能プラグインアーキテクチャで機能、プロバイダー、UI を自由に追加可能。
Gemini RAGファイル検索ストレージ、ドキュメントアップロード・同期、RAG ワークフローを実装。
ツールサポートPython 関数呼び出し、MCP サポート、デスクトップ自動化(コンピュータ使用)。
KaTeX 数式描画LaTeX で美しい数式をレンダリング。
計算機 UIPython の数式評価に優れたユーザーインターフェース。
コード実行 UICodeMirror エディタで Python、JS、TS、C# を実行。
画像生成Google、OpenAI、OpenRouter、Chutes、Nvidia などを組み込みサポート。
音声生成(TTS)Gemini 2.5 Flash/Pro Preview モデルで対応。
メディアギャラリー生成された画像・音声をライトボックスプレビューで閲覧。
サーバー側 SQLite ストレージ高速永続化、同時利用、バイナリ資産はローカルキャッシュ。
CLI 強化クエリ、モデル選択、ツール呼び出し、拡張機能・プロバイダー管理、メディア生成などの強力なコマンドを提供。

目次

  1. 新しいモデルセレクター UI
  2. 拡張性へのリライト
  3. 拡張機構
  4. Gemini RAG 拡張
  5. ツールサポート
  6. MCP サポート
  7. コアツール(コンピュータ使用、計算機、コード実行)
  8. KaTeX 数式描画
  9. 画像生成サポート
  10. 音声生成サポート
  11. メディアギャラリー
  12. システムプロンプトライブラリ
  13. サーバー側 SQLite ストレージ
  14. 画像キャッシュと最適化
  15. CLI – 今までで一番強力に
  16. アップグレード手順

はじめに

# インストールまたはアップグレード
pip install llms-py --upgrade

# ポート8000 でウェブ UI と API サーバーを起動
llms --serve 8000

ヒント

llms "What is the capital of France?"
を使えばワンショットクエリがすぐに実行できます。


モデルセレクター UI(再設計)

  • 検索・発見 – 名前、ID、プロバイダーを即時検索
  • フィルタリング – 名称、プロバイダー、入出力モダリティで絞り込み
  • ソート – 知識カットオフ、リリース日、最終更新日、コンテキストサイズ順
  • お気に入り – スター付きカードで高速アクセス
  • モデルカード – 各モデルの詳細概要を表示

拡張性

  • llms.py
    を再設計し、公開 Client & Server API を提供。
  • 拡張はフォルダー単位で UI やサーバー機能をフック(
    __parser__
    ,
    __install__
    ,
    __load__
    ,
    __run__
    )により追加可能。
  • 既定拡張は
    ~/.llms/extensions
    にあり、カスタム拡張が優先される。
  • インストール/アンインストール:
# GitHub から利用可能な拡張を一覧表示
llms --add

# 拡張をインストール
llms --add fast_mcp

# アンインストール
llms --remove fast_mcp

Gemini RAG 拡張

機能説明
ファイルストア管理プロジェクト/知識ベースごとに隔離されたストアを作成。
ドラッグ&ドロップアップロードPDF、テキスト、Markdown など。
スマート分類フォルダーで整理。
コンテクスチュアル RAG チャットストア全体、特定カテゴリ、単一文書を対象に質問可能。
双方向同期ローカル DB と Gemini File API を調整。

ツールサポート

Python 関数呼び出し(ツール)

def get_current_time(tz_name: Optional[str] = None) -> str:
    """ISO‑8601 形式で現在時刻を取得します。"""

登録:

ctx.register_tool(get_current_time)          # 暗黙的に登録
ctx.register_tool(get_current_time, group="my_tools")  # 明示的にグループ化

CLI 使用例:

llms "What time is it?" --tools calc,get_current_time

MCP サポート(fast_mcp)

  • 任意の MCP 準拠サーバーへ接続。
  • ツールを自動検出・登録。
  • mcp.json
    で設定。

コアツール

ツール説明
memory_read / memory_write永続的キー/バリュー保存。
ファイルシステム (
read_file
,
write_file
,
list_directory
,
glob_paths
)
カレントディレクトリで安全操作。
calcPython math ライブラリを使った数式評価。
run_python / run_javascript / run_typescript / run_csharpサンドボックス環境でコード実行。
computer_useデスクトップ自動化:マウス、キーボード、スクリーンショット、シェルコマンド。

UI 拡張

計算機 UI

  • クリーンでレスポンシブなデザイン(ダークモード対応)。
  • localStorage
    で履歴を永続化。
  • キーボードフリーアクセスと完全 Python 数学サポート。

コード実行 UI

  • CodeMirror エディタに構文ハイライト&オートコンプリート。
  • Python、JS、TS、C# をサポート。

KaTeX 数式描画

  • Markdown パーサと自動統合。
  • インライン (
    $...$
    ) とブロック (
    $$...$$
    ) の両方をレンダリング。

メディア生成

プロバイダー対応
Google
OpenAI
OpenRouter
Chutes
Z.ai
Nvidia

CLI 例

# 画像生成
llms --out image "A serene mountain landscape"

# 音声(TTS)
llms --out audio "Welcome to our podcast"

生成ファイルは

~/.llms/cache
に保存されます。


メディアギャラリー

  • すべての生成資産をインターセプト。
  • SQLite (
    gallery.sqlite
    ) にメタデータを保持。
  • 画像(縦・正方形・横長)と音声専用 UI を提供。

システムプロンプトライブラリ

  • system_prompts
    拡張で 200+ のキュレート済みプロンプトを置き換え可能。
  • カスタムプロンプトは以下に保存:
~/.llms/user/default/system-prompts.json
# またはサインインユーザー別:
~/.llms/user/<github-user>/system-prompts.json

サーバー側 SQLite ストレージ

  • クライアント側 IndexedDB からサーバー側 SQLite に移行。
  • バイナリ資産はローカルキャッシュ、相対 URL のみを DB 保存。
  • 書き込みは単一バックグラウンドスレッドで処理し、同時利用に対応。
  • マルチテナンシー:認証済みユーザーごとにデータが分離。

CLI – これまでで最も強力

# ワンショットクエリ
llms "What is the capital of France?"

# モデル選択
llms -m claude-opus-45 "Explain quantum computing"

# ツール使用
llms "Read file data.txt" --tools calc,get_current_time
llms "No tools" --tools none

# 拡張機能
llms --add fast_mcp
llms --remove fast_mcp

# プロバイダー管理
llms ls                 # 有効プロバイダー/モデル一覧
llms ls google          # Google のモデルを表示
llms --enable google    # プロバイダー有効化
llms --disable google   # 無効化
llms --update-providers # 定義の更新

# メディア生成
llms --out image "A cat in a hat"
llms -m gemini-2.5-flash-image --out image "Logo for a startup"

# 音声文字起こし
llms -m gpt-4o-audio-preview --audio interview.mp3 "Transcribe this interview"

# サーバーモード
llms --serve 8000

アップグレード

pip install llms-py --upgrade

llms.py からハッピー・ホリデーを! 🎄

同じ日のほかのニュース

一覧に戻る →

2026/01/27 7:03

**Windows の状況:** Windows 11 は現在どんな状態になっているのでしょうか?

## 日本語訳: **概要:** Microsoft の最新 Windows 更新は、安定したオペレーティングシステムよりも AI 主導の機能―特に Copilot ―を優先しているため、広範なバグ、パフォーマンス問題、およびセキュリティ欠陥が発生しています。2026 年 1 月の KB パッチは、新しい Intel プロセッサでシャットダウン失敗、クラウド PST を使用した Outlook のハング、メモ帳、RDP、およびデバイスドライバーのクラッシュを引き起こしました。同じ更新パッケージは、大規模 AI モデルのダウンロードによりサイズが 4 倍になり、バイナリが肥大化し、「Copilot‑ification」による UI が導入されました。暗号化されていないスクリーンショットへの懸念から削除を余儀なくされた事例もあります。 このシフトは、2023 年 12 月に Edge、メモ帳、設定、Office 等へ Copilot を投入したことから始まりました。以前のローカルアカウント用修正(OOBE.exe /bypassNRO)は後続の更新で閉じられ、Microsoft アカウントを持たないユーザーの使い勝手が低下しました。RDP のロールバック、DRM 失敗、およびエクスプローラーの遅延に関する月次報告は、24H2/25H2 リリースに起因しています。 Microsoft は、大規模な AI 重視更新を継続しつつ、重要なバグについては迅速な KB パッチで対処すると考えられます。この戦略はユーザーの信頼を損ない、企業のサポートコストを増大させ、一部の企業が代替 OS プラットフォームやデスクトップ AI 機能の採用をより慎重に検討するきっかけになる可能性があります。 **概要スケルトン** - **メインメッセージ(何を伝えたいか)** Microsoft の最近の Windows 更新は、安定した OS よりも Copilot などの AI 主導機能を積極的に推進する方向転換が原因で、広範なバグ・パフォーマンス低下・セキュリティ問題を引き起こしています。 - **証拠 / 推論(何故そう言えるか)** - 2026 年 1 月の KB 更新により、新しい Intel チップでシャットダウン失敗、クラウド PST を使った Outlook のハング、およびアプリ(メモ帳、RDP、デバイスドライバー)のクラッシュが発生。 - 同じ更新パッケージは AI モデルのダウンロードにより以前のリリースの 4 倍のサイズになり、バイナリが肥大化。 - Copilot の統合で UI が「Copilot‑ification」され、暗号化されていないスクリーンショットへの懸念から削除を強いられた。 - **関連ケース / 背景(文脈・過去の出来事)** - このシフトは、2023 年 12 月に Microsoft Copilot が Edge、メモ帳、設定、Office 等へ投入されることで始まりました。 - ローカルアカウント用ワークアラウンド(OOBE.exe /bypassNRO)は後続の更新で閉じられ、ローカル アカウント利用者の使い勝手が低下。 - RDP のロールバック、DRM 失敗、およびエクスプローラーの遅延に関する月次報告は、24H2/25H2 リリースに起因。 - **今後何が起こるか(将来の展開・予測)** Microsoft は大規模な AI 重視更新を継続しつつ、重要バグについては迅速な KB パッチで対処すると見込まれます。Copilot のアップセルを優先することで、毎月のスキャンダルが増え、安定性が回復されるまでユーザー信頼が徐々に低下する可能性があります。 - **影響(ユーザー / 企業 / 業界)** - ユーザーは頻繁なシステムクラッシュ、生産性の損失、および暗号化されていないデータ取得へのセキュリティ懸念に直面。 - 企業はサポートコストが増大し、新しい Windows リリース採用を再検討する可能性。 - 業界全体では、競合 OS プラットフォームへのシフトやデスクトップ環境での AI 機能採用に対するより慎重な姿勢が広まる可能性があります。

2026/01/26 23:41

テレビは本日で百周年を迎えました。

## Japanese Translation: テレビは本日100周年を迎え、ジョン・ログィー・ベアードの先駆的な業績に特に焦点が当てられました。1926年1月26日、ベアードはフリス通り22番地のソーホウワークショップで回転ディスクとレンズ、穴付きシートを用いたライブテレビの最初の公開デモンストレーションを行いました。その後、光感受性セルを追加して影の階調を送信できるようにしました。最初に送信された画像は、現在ヘイスティングス博物館で展示されている聖ジョンズ救急隊メダルの影でした。 ベアードの初期デモには、バラエティ・ドミー「ストゥッキー・ビル」と最初の人間被写体ウィリアム・テイントンが含まれます。1927年にフォノヴィジョンを導入し、画像をグラムフォンレコードに記録しました。1928年にはノクトヴィジョン(赤外線テレビ)、カラーテレビ、および立体テレビの実験を行いました。また、1930–31年にBBC放送用の30ライン機械式システムも開発しました。 1932年にEMIによって電子エミトロンカメラが導入され、ベアードの240ライン機械式システムとマルコニ-EMIの405ライン電子システムは一時的にロンドンテレビで採用されました。三か月後、最終的にはマルコニ・システムが優位になりました。 ベアードは1924年11月にフリス通り22番地へ移転し、ゴードン・セルフリッジのパーム・コートデモで60ポンドを稼ぎ、第二次世界大戦で会社が破産手続きになるまで発明の展示を続けました。爆撃被害により後期のカラー作業は中断され、1946年に57歳で脳卒中で亡くなりました。 初期の成功にもかかわらず、英国家庭へのテレビ機器の普及には数十年が必要でした。カラーTVは1960年代まで一般的になりませんでした。今日ではほぼすべての人がテレビまたは同等のデバイスを所有しており、これはベアードの回転ディスクと機械式画像伝送に関する先駆的な業績のおかげです

2026/01/21 1:52

滑走路に秘められた設計技術

## 日本語訳: ### 要約: 本文は、2025年9月に発生した最近の滑走路オーバーランが、EMAS(Energy‑Management and Arresting System)とFAAガイドラインに従った慎重な設計などの高度な安全システムによって防止されたことを説明しています。これらのガイドラインは、航空場で使用される最大機体を基準に滑走路長を決定しつつ、風向き・温度・標高も考慮して十分な停止距離を確保します。Embraer 145、Gulfstream、Bombardier機が関与した米国の3件の事故では、EMASが衝撃エネルギーを効果的に吸収し、航空機が滑走路外の危険箇所に着地することを防ぎました。FAAの詳細ガイダンスは、風向き(約95%)に合わせて滑走路を配置し、ディスプレースド・スレッショルド、ブラストパッド、ランウェイセーフティエリア(RSA)を追加して安全マージンを高めることを推奨しています。今後は、EMASの活用と機体種別に応じた舗装材の調整、単一方向が支配的でない場合の風向き戦略の精緻化が継続されます。これらの改善はパイロットの怪我リスクを減らし、空港が安全インフラへの投資を促進させ、航空業界に滑走路設計がオーバーランを防ぐことへの信頼感を与え、保険費用の低減につながる可能性があります。 ### 要約骨格 **本文が主に伝えようとしていること(メインメッセージ)** 2025年9月の滑走路オーバーランは、EMASなどの設計上の安全機能のおかげで回避され、滑走路設計はFAAガイドラインに従い、主要機体を基準に長さが決定され環境要因も調整されています。 **証拠/根拠(なぜそう言われているのか)** 米国で起きた3件の事故では航空機が滑走路を超えて衝突したものの、EMASがエネルギーを吸収し危険箇所に着地しませんでした。FAAの40ページの文書は、長さ・風・温度が設計を決定する方法を説明しており、舗装層と表面処理は摩擦と構造的健全性を維持するよう指定されています。 **関連事例/背景(コンテキスト、過去の出来事)** オーバーランはEmbraer 145、Gulfstream、Bombardier機で2025年9月24–3日に発生。FAAガイドラインは滑走路を主流風に合わせる(約95%)とし、ディスプレースド・スレッショルド、ブラストパッド、RSAを標準安全対策として含めています。 **今後何が起こりうるか(将来の展開/予測)** 将来的な滑走路計画ではEMAS使用の強調、機体種別に応じた舗装材の適用、単一風向きが支配的でない場合の風向き戦略の改善が継続されるでしょう。設計更新は温度・標高調整をより正確に取り入れる可能性があります。 **これらが与える影響(利用者/企業/業界)** パイロットは安全なオーバーランと怪我リスクの低減を享受し、空港はEMASや表面メンテナンスへの投資を検討。航空業界は滑走路長計算が事故防止に十分であるという自信を得て、保険・責任コストの削減につながる可能性があります。

**OSS ChatGPT WebUI の概要** - **モデル数:** 530種利用可能 - **主な機能:** - MCP(マルチコマンド処理) - ツール統合 - Gemini RAG(検索拡張生成) - 画像生成 - 音声生成 | そっか~ニュース