![# Lambda 演算に基づく AI ベンチマーク
本ドキュメントでは、AI モデルの Lambda 演算で表されたプログラムの理解、簡約化、および実行能力に基づいて評価する理論的なベンチマークフレームワークを概説します。本枠組みの目的は、ハードウェア効率とは独立して、基礎的な推論能力、数学的論理、記号操作能力を評価することにあります。
## 1. スコープと目的
このベンチマークの主目的は、AI の以下の分野における熟練度を確認することです:
* **構文解析:** Lambda 項内の束縛変数および自由変数を正しく特定すること。
* **簡約戦略:** $\beta$-簡約(オプションでは$\eta$-簡約も)を効率的に適用し、正規形へ到達させること。
* **同一性検証:** 異なる二つの Lambda 表現が同じ関数を計算するかどうかを決定すること。
* **符号化の認識:** 基本データ構造(チャーチ numeral、ブール値、リストなど)の高階級な表現を特定すること。
## 2. ベンチマークタスク
### 2.1 構文解析
モデルは与えられた Lambda 項を分析し、構造的情報を出力する必要があります。
* **タスク A: 変数の束縛**
項 $\lambda x. \lambda y. ((\lambda x. x) y)$ に対して、各出現の $x$ のスコープを特定してください。
* **タスク B: アルファ変換**
次の項群がアルファ同値(alpha-equivalent)かどうかを判定してください:
1. $\lambda x. x + 1$
2. $\lambda z. z + 1$
### 2.2 簡約と実行
モデルは表現式を正規形へ段階的に簡約化する必要があります。
* **タスク A: 単純な適用**
$(\lambda x. x x) (\lambda y. y)$ をその正規形へと評価してください。
* **タスク B: チャーチ numeral の算術**
チャーチ numeral 2($\lambda f.\lambda x.f(f(x))$)とチャーチ numeral 3 の和を計算してください。最終的な答えを、5 を表す単一の Lambda 項として記述してください。
### 2.3 高階級符号化
モデルは Lambda 演算との間で特定のデータ表現をデコードまたはエンコードする必要があります。
* **タスク A: チャーチからペアノへ**
チャーチ numeral と対応するペアノ算術の定義との間の写像(マッピング)を説明してください。
* **タスク B: リストの構築**
標準的なチャーチ符号化を用いたリスト符号化(cons リスト)により、リスト $[1, 2, 3]$ を表す Lambda 項を構築してください。
## 3. 評価指標
パフォーマンスは以下の観点に基づいて測定されます:
1. **正解性:** 最終的な簡約された項や論理的結論の精度。
2. **追跡可能性:** 簡約過程での段階的推論の質と明瞭さ。
3. **簡潔性:** 余分な冗長性を排した標準表記への準拠。
---
*注:すべての数学記号は明瞭化のために LaTeX フォーマットを使用して表現してください。*](/_next/image?url=%2Fscreenshots%2F2026-04-26%2F1777157562457.webp&w=3840&q=75)
2026/04/25 20:16
# Lambda 演算に基づく AI ベンチマーク 本ドキュメントでは、AI モデルの Lambda 演算で表されたプログラムの理解、簡約化、および実行能力に基づいて評価する理論的なベンチマークフレームワークを概説します。本枠組みの目的は、ハードウェア効率とは独立して、基礎的な推論能力、数学的論理、記号操作能力を評価することにあります。 ## 1. スコープと目的 このベンチマークの主目的は、AI の以下の分野における熟練度を確認することです: * **構文解析:** Lambda 項内の束縛変数および自由変数を正しく特定すること。 * **簡約戦略:** $\beta$-簡約(オプションでは$\eta$-簡約も)を効率的に適用し、正規形へ到達させること。 * **同一性検証:** 異なる二つの Lambda 表現が同じ関数を計算するかどうかを決定すること。 * **符号化の認識:** 基本データ構造(チャーチ numeral、ブール値、リストなど)の高階級な表現を特定すること。 ## 2. ベンチマークタスク ### 2.1 構文解析 モデルは与えられた Lambda 項を分析し、構造的情報を出力する必要があります。 * **タスク A: 変数の束縛** 項 $\lambda x. \lambda y. ((\lambda x. x) y)$ に対して、各出現の $x$ のスコープを特定してください。 * **タスク B: アルファ変換** 次の項群がアルファ同値(alpha-equivalent)かどうかを判定してください: 1. $\lambda x. x + 1$ 2. $\lambda z. z + 1$ ### 2.2 簡約と実行 モデルは表現式を正規形へ段階的に簡約化する必要があります。 * **タスク A: 単純な適用** $(\lambda x. x x) (\lambda y. y)$ をその正規形へと評価してください。 * **タスク B: チャーチ numeral の算術** チャーチ numeral 2($\lambda f.\lambda x.f(f(x))$)とチャーチ numeral 3 の和を計算してください。最終的な答えを、5 を表す単一の Lambda 項として記述してください。 ### 2.3 高階級符号化 モデルは Lambda 演算との間で特定のデータ表現をデコードまたはエンコードする必要があります。 * **タスク A: チャーチからペアノへ** チャーチ numeral と対応するペアノ算術の定義との間の写像(マッピング)を説明してください。 * **タスク B: リストの構築** 標準的なチャーチ符号化を用いたリスト符号化(cons リスト)により、リスト $[1, 2, 3]$ を表す Lambda 項を構築してください。 ## 3. 評価指標 パフォーマンスは以下の観点に基づいて測定されます: 1. **正解性:** 最終的な簡約された項や論理的結論の精度。 2. **追跡可能性:** 簡約過程での段階的推論の質と明瞭さ。 3. **簡潔性:** 余分な冗長性を排した標準表記への準拠。 --- *注:すべての数学記号は明瞭化のために LaTeX フォーマットを使用して表現してください。*
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
この文書は LamBench バージョン 1 のリリースノートであり、GitHub リポジトリ(
github.com/VictorTaelin/LamBench)への直接リンクを提供しています。技術レポートや詳細な分析ではなく簡潔な告知として位置づけられるため、テスト手法、パフォーマンス指標、実装戦略などの説明は行われていません。したがって、この文書では将来の展開に関する予測やユーザー・業界への影響についての言及はなく、新しいベンチマークへのアクセスに必要な情報を提供することに専念しています。本文
github.com/VictorTaelin/LamBench バージョン 1