**Bf‑Tree:メモリサイズ超過範囲インデックスのための、読み書き最適化された現代型並行処理構造**

2026/01/29 7:05

**Bf‑Tree:メモリサイズ超過範囲インデックスのための、読み書き最適化された現代型並行処理構造**

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

Bf‑Tree は Microsoft Research によって Rust で書かれた新しい並列範囲インデックスです。オープンソースの Cargo クレートとして利用可能(

bf-tree = "0.1.0"
)で、メモリ容量を超えるワークロードにも対応します。このプロジェクトには研究論文と設計ドキュメントが含まれ、Microsoft の Open Source Code of Conduct に従い、標準的な
CONTRIBUTING.md
SECURITY.md
が用意されています。

主な特徴
• 例として

"key"
"value"
を挿入し、バッファに読み込み、
LeafReadResult::Found(5)
をアサートする使用方法。
• クロスプラットフォーム開発(Linux, Windows, macOS)で、Linux が最も厳密にテストされたプラットフォームです;Rust ツールチェーンが必要です。
• コード品質は CI 実行前のフォーマッティングとリントを強制する pre‑commit フックによって保証されます。
shuttle
cargo test --features "shuttle" …
)を用いた決定的な並列テストと操作シーケンスのファズテスト。
• ベンチマークスクリプトが利用可能:インメモリベンチマーク、NUMA およびハングページを含む高度な指標。
• 商標・ブランドガイドラインが適用されます;問い合わせは bftree@microsoft.com までお願いします。

本文

Bf‑Tree(ビーフツリー)

Bf‑Tree は、RAM を超えるメモリ上で動作する、読み書き最適化された並行範囲インデックスです。
Rust で実装され、Microsoft Research (MSR) が保守しています。


設計の詳細

  • 本研究論文は こちら に掲載されています。
  • 追加設計ドキュメントは こちら からご覧いただけます。

ユーザーガイド

Rust

Bf‑Tree をプロジェクトに追加するには:

[dependencies]
bf-tree = "0.1.0"

使用例:

use bf_tree::{BfTree, LeafReadResult};

let mut config = bf_tree::Config::default();
config.cb_min_record_size(4);
let tree = BfTree::with_config(config, None).unwrap();

tree.insert(b"key", b"value");

let mut buffer = [0u8; 1024];
let read_size = tree.read(b"key", &mut buffer);

assert_eq!(read_size, LeafReadResult::Found(5));
assert_eq!(&buffer[..5], b"value");

機能追加よりもプルリクエストを優先します。設計に関するご質問があれば、遠慮なくお問い合わせください。


開発者ガイド

ビルド

前提条件

  • 対応 OS:Linux, Windows, macOS(実際には Linux のみ徹底的にテスト済み)
  • Rust ツールチェーンがインストールされていること

フォーマットと lint を強制する pre‑commit フックを設定します:

# Ubuntu 環境の場合
sudo apt update && sudo apt install pre-commit
pre-commit install

ビルド

cargo build --release

テスト

テスト種別コマンド備考
ユニットテスト
cargo test
標準のユニットテストです。
Shuttle テスト(決定論的並行性)
cargo test --features "shuttle" --release shuttle_bf_tree_concurrent_operations
実行時間は約 5 分です。
フォッジテスト
fuzz/
ディレクトリに詳細があります
ランダム操作列を生成し、クラッシュや不整合を検出します。

ベンチマーク

基本ベンチマークを実行するには:

cd benchmark
env SHUMAI_FILTER="inmemory" MIMALLOC_LARGE_OS_PAGES=1 cargo run --bin bftree --release

メトリクス、NUMA バインディング、大ページを使用した高度なベンチマークは次のように実行します:

env MIMALLOC_SHOW_STATS=1 \
    MIMALLOC_LARGE_OS_PAGES=1 \
    MIMALLOC_RESERVE_HUGE_OS_PAGES_AT=0 \
    numactl --membind=0 --cpunodebind=0 \
cargo bench --features "metrics-rt" micro

コード・オブ・コンダクト

本プロジェクトは Microsoft の Open Source Code of Conduct に準拠しています。
詳細は FAQ をご覧いただくか、

opencode@microsoft.com
までお問い合わせください。


貢献

貢献方法については

CONTRIBUTING.md
を参照してください。


セキュリティ

セキュリティ報告に関する詳細は

SECURITY.md
に記載されています。


商標

本プロジェクトには Microsoft の商標やロゴが含まれる場合があります。使用にあたっては、Microsoft Trademark & Brand Guidelines を遵守してください。他社の商標についてはそれぞれのポリシーに従う必要があります。


お問い合わせ先

  • メール:
    bftree@microsoft.com

同じ日のほかのニュース

一覧に戻る →

2026/01/28 9:57

**トリニティ・ラージ** オープンな400 B スパースMoEモデル

## Japanese Translation: ``` (combining all key points with clarity):** --- ### Trinity‑Large: A Fast, Open, State‑of‑the‑Art Sparse MoE Language Model Trinity‑Large は、1 つのトークンで約 13 B パラメータ(256 エキスパート、1.56 % ルーティング分率)しか活性化しない 400 B パラメータを持つ sparse mixture‑of‑experts モデルです。10 T、4 T、3 T の三段階で **17 T** のキュレーション済みトークンを使用して訓練されました。プログラミング・STEM・推論・多言語コンテンツをカバーする合成データが用いられ、Momentum‑based エキスパートロードバランシング、1 シーケンスあたりのバランスロス、z‑loss 正則化で LM‑head ロジットを抑制し、効率的な注意機構(HSDP)と 8‑expert 並列処理が採用されました。 **リリースされたバリアント** | バリアント | 説明 | |---------|-------------| | **Trinity‑Large‑Preview** | 軽くポストトレーニングし、チャット対応。創造的執筆・物語作成・ロールプレイ・リアルタイム音声支援・エージェントタスク(OpenCode, Cline, Kilo Code)で優れた性能を発揮します。まだ推論モデルではありません。 | | **Trinity‑Large‑Base** | 完全な 17 T 事前訓練チェックポイント。ベンチマークと研究資源として使用されます。 | | **TrueBase** | 初期の 10 T チェックポイントで、指示データや LR アニーリングが含まれていません。大規模な高品質事前訓練効果を研究するのに最適です。 | 全体の作業―6か月間にわたる4つのモデル―は約 **2,000 万ドル** の費用で、**2048 台の Nvidia B300 GPU** を使用し、**33 日間** にわたって訓練されました。 **性能** - 数学・コーディング・科学的推論・原知識ベンチマークにおいて同等またはそれ以上の性能を示します。 - 推論速度は、同じハードウェア上で比較可能な重みクラスモデルより約 2–3 倍速です。 - ベンチマーク比較(Preview vs. Llama 4 Maverick): - MMLU: 87.2 vs. 85.5 - MMLU‑Pro: 75.2 vs. 80.5 - GPQA‑Diamond: 63.3 vs. 69.8 - AIME 2025: 24.0 vs. 19.3 **技術的詳細** - ネイティブコンテキスト長:**512k トークン**。Preview API はインフラ調整中に 128k と 8‑bit 量子化で動作します。 - モデルと API は Hugging Face、OpenRouter、および Arcee.ai を通じて公開されており、Kilo Code、Cline、OpenCode 用の統合がすぐに利用可能です。 **コミュニティへの関与** チームは Trinity‑Large が最先端レベルでありながら所有権と実際の使用を念頭に置いて設計されていることを強調し、ユーザーに失敗例を報告してもらうことでオープンモデルが継続的に改善できるよう奨励しています。 ```

2026/01/28 9:18

「有名な研究者が、赤ちゃんの中毒事件を隠したのでしょうか?」

2026/01/28 23:32

エアフォイル(2024)