2026-01-29

日付別ニュース一覧

カードをクリックすると全文、Hacker Newsのリンクから元記事へ移動できます。

日付で読む

02/032026-02-03 02/022026-02-02 02/012026-02-01 01/312026-01-31 01/302026-01-30 01/292026-01-29 01/282026-01-28 01/272026-01-27 01/262026-01-26 01/252026-01-25 01/242026-01-24 01/232026-01-23 01/222026-01-22 01/212026-01-21 01/202026-01-20 01/192026-01-19 01/182026-01-18 01/172026-01-17 01/162026-01-16 01/152026-01-15 01/142026-01-14 01/132026-01-13 01/122026-01-12 01/112026-01-11 01/102026-01-10 01/092026-01-09 01/082026-01-08 01/072026-01-07 01/062026-01-06 01/052026-01-05 01/042026-01-04 01/032026-01-03 01/022026-01-02 01/012026-01-01 12/302025-12-30 12/292025-12-29 12/282025-12-28 12/272025-12-27 12/262025-12-26 12/252025-12-25 12/242025-12-24 12/232025-12-23 12/222025-12-22 12/212025-12-21 12/202025-12-20 12/192025-12-19 12/182025-12-18 12/172025-12-17 12/162025-12-16 12/152025-12-15 12/142025-12-14 12/132025-12-13 12/122025-12-12 12/112025-12-11 12/102025-12-10 12/092025-12-09 12/082025-12-08 12/072025-12-07 12/062025-12-06 12/052025-12-05 12/042025-12-04 12/032025-12-03 NaN/NaN2025-12-99

トリニティ・ラージオープンな400 B スパースMoEモデル

## Japanese Translation: ``` (combining all key points with clarity):** --- ### Trinity‑Large: A Fast, Open, State‑of‑the‑Art Sparse MoE Language Model Trinity‑Large は、1 つのトークンで約 13 B パラメータ（256 エキスパート、1.56 % ルーティング分率）しか活性化しない 400 B パラメータを持つ sparse mixture‑of‑experts モデルです。10 T、4 T、3 T の三段階で **17 T** のキュレーション済みトークンを使用して訓練されました。プログラミング・STEM・推論・多言語コンテンツをカバーする合成データが用いられ、Momentum‑based エキスパートロードバランシング、1 シーケンスあたりのバランスロス、z‑loss 正則化で LM‑head ロジットを抑制し、効率的な注意機構（HSDP）と 8‑expert 並列処理が採用されました。 **リリースされたバリアント** | バリアント | 説明 | |---------|-------------| | **Trinity‑Large‑Preview** | 軽くポストトレーニングし、チャット対応。創造的執筆・物語作成・ロールプレイ・リアルタイム音声支援・エージェントタスク（OpenCode, Cline, Kilo Code）で優れた性能を発揮します。まだ推論モデルではありません。 | | **Trinity‑Large‑Base** | 完全な 17 T 事前訓練チェックポイント。ベンチマークと研究資源として使用されます。 | | **TrueBase** | 初期の 10 T チェックポイントで、指示データや LR アニーリングが含まれていません。大規模な高品質事前訓練効果を研究するのに最適です。 | 全体の作業―6か月間にわたる4つのモデル―は約 **2,000 万ドル** の費用で、**2048 台の Nvidia B300 GPU** を使用し、**33 日間** にわたって訓練されました。 **性能** - 数学・コーディング・科学的推論・原知識ベンチマークにおいて同等またはそれ以上の性能を示します。 - 推論速度は、同じハードウェア上で比較可能な重みクラスモデルより約 2–3 倍速です。 - ベンチマーク比較（Preview vs. Llama 4 Maverick）： - MMLU: 87.2 vs. 85.5 - MMLU‑Pro: 75.2 vs. 80.5 - GPQA‑Diamond: 63.3 vs. 69.8 - AIME 2025: 24.0 vs. 19.3 **技術的詳細** - ネイティブコンテキスト長：**512k トークン**。Preview API はインフラ調整中に 128k と 8‑bit 量子化で動作します。 - モデルと API は Hugging Face、OpenRouter、および Arcee.ai を通じて公開されており、Kilo Code、Cline、OpenCode 用の統合がすぐに利用可能です。 **コミュニティへの関与** チームは Trinity‑Large が最先端レベルでありながら所有権と実際の使用を念頭に置いて設計されていることを強調し、ユーザーに失敗例を報告してもらうことでオープンモデルが継続的に改善できるよう奨励しています。 ```

2026/01/28 9:57

日付別ニュース一覧

**トリニティ・ラージ** オープンな400 B スパースMoEモデル

「有名な研究者が、赤ちゃんの中毒事件を隠したのでしょうか？」

エアフォイル（2024）

Android のデスクトップインタフェースにリークが発生しています。

エリクサーから派生したジョブ処理フレームワーク「Oban」が、Python 版として登場しました。

**Show HN:** 「あなたのLLMツールが送信している内容を確認できるMitMプロキシ」

**コンピュータ歴史博物館、コレクションのデジタルポータルを開設**

**五つのレベル：スパイシーなオートコンプリートからダークファクトリーへ**

**ジェリーフィン LLM / AI 開発ポリシー**

ヘレニズム時代の戦争―戦闘前に用いられた象と酒の役割

**Show HN：The HN Arcade** （「Show HN：HN アーケード」）

**Bf‑Tree：メモリサイズ超過範囲インデックスのための、読み書き最適化された現代型並行処理構造**

Microsoft によって、私は Linux に切り替えざるを得ませんでした。

**回転している間に：** *スピンロックでよく起こる問題をお聞きください*

**Show HN：ユーザースクリプト用カーソル**

Linux ネイティブ VST プラグイン ディレクトリ

**カイロス：誰もが使えるAIインターンシップ**

3Dプリントされた数学的ランプシェード（照明カバー）

テスラの利益は2025年に46 ％減少しました。

キバ―（YC W23）はスタッフエンジニアを募集しています。

トリニティ・ラージオープンな400 B スパースMoEモデル

Show HN: 「あなたのLLMツールが送信している内容を確認できるMitMプロキシ」

コンピュータ歴史博物館、コレクションのデジタルポータルを開設

五つのレベル：スパイシーなオートコンプリートからダークファクトリーへ

ジェリーフィン LLM / AI 開発ポリシー

Show HN：The HN Arcade （「Show HN：HN アーケード」）

Bf‑Tree：メモリサイズ超過範囲インデックスのための、読み書き最適化された現代型並行処理構造

回転している間に：スピンロックでよく起こる問題をお聞きください

Show HN：ユーザースクリプト用カーソル

Linux ネイティブ VST プラグインディレクトリ

カイロス：誰もが使えるAIインターンシップ

テスラの利益は2025年に46 ％減少しました。

キバ―（YC W23）はスタッフエンジニアを募集しています。