進化的ゲーム理論で詐欺サイクルをモデル化する

日本語訳:

要約

この記事は、詐欺行為を 「グリフト（grift）」 と呼び、進化的ゲーム理論（EGT）モデルである GSM モデル を用いて、その予測可能なサイクルを示しています。

コアモデル

戦略：
- Grifter（グリフター） – 詐欺師
- Skeptic（スケプティック） – 慎重に観察する者
- Mark（マーク） – 情報不足の参加者

ペイオフ行列（正確な値）：

Grifter -0.5 -0.5  1.5
Skeptic -0.2  0.8  0.8
Mark    -2.0  1.0  1.0

ダイナミクス： ディスクリートタイムの replicator
シミュレータが集団変化をモデル化します。

ダイナミクスとパターン

ゲームは 非移転（ロック・ペーパー・シザーズ型） です：マークはグリフターが稀少な時に繁栄し、グリフターはマークが支配的な時に繁栄します。スケプティックはグリフターが多い時に繁栄します。
シミュレーションでは軌跡が 外側へ螺旋 し、単一の安定点に収束するのではなく 準周期的サイクル を形成します。
長期的な結果としては 安定リミットサイクルまたはヘテロクリニックサイクル が考えられますが、決して平衡状態には至りません。

典型的な HDR モデルとの比較

GSM モデルは Hawks–Doves–Retaliators（HDR）フレームワーク と大きく対照的であり、後者は 60 % Hawks / 40 % Doves の ESS（進化的安定戦略） に収束します。

結論と文脈

グリフトは本質的に 周期的 です：詐欺が高まる期間の後には懐疑心が強まります。
著者はモデルの単純さを認めつつ、基本的なダイナミクスを捉えていると主張し、「すべてのモデルは誤りであるが、一部は有用だ」とジョージ・ボックスの言葉を引用します。
大恐慌、マーク・トウェインの作品、そして現代の詐欺（暗号資産のラグプルやNFTなど）といった歴史的例がこのパターンを示しています。

この改訂版要約は、元のリストからすべての主要ポイントを保持し、無根拠な推測を避けつつ、明確で簡潔な概要を提示しています。

2026年2月22日

コンピュータサイエンス 数学 Python 可視化

私たちは「詐欺の黄金時代」に突入しています。かつて冒険家が「そこに金がある」と言ってカリフォルニアやユーコンへ押し寄せたように、今日最も速く富を得る方法は、人々をだますことです。暗号資産の引き抜き（rug pull）、ミーム株、栄養補助食品、MLM――何でも即金化できるものが揃っています。

詐欺は新しい現象ではありません。大恐慌期には多くの詐欺師が出現し、映画『ペーパーミーン』や『ザ・スティング』で神話化されました。100年前、マーク・トウェインはミシシッピ川沿いで活動する無数の騙し屋とカードシャープについて書き、自身も詐欺的投資計画で財産をほぼ失いました。中世学者ウンベルトゥ・エーコは、魔術師や偽り者など詐欺に関する小説を数冊執筆し、中世の人々が迷信と不十分な記録管理によってどう繁栄したかを描きました。

現在のブームは新常態でしょうか？真実後の暗黒時代への滑り出しなのか、あるいは文明に古くから存在する周期の一つに過ぎないのでしょうか。もし循環的であれば、戦争や貧困といった外部要因が推進力なのか、それともシステム自体のダイナミクスから自然に生じるものなのか―この問いの答えは、1980年代の比較的知られざる数学理論にあると私は主張します。

進化ゲーム理論

一般に知られるゲーム理論は合理的エージェントモデルで、完全情報を持つプレイヤーが効用を最大化し、最適応答がすぐに決まり、均衡点は解けたパズルのように明確です。進化ゲーム理論（EGT） は異なります。全ての戦略が集団内に存在し、ゲームで成功するとその戦略の相対的比率が時間とともに増加していくという仮定を置きます。高い報酬を得る戦略はより一般化し、低い報酬を得るものは減少します。

ジョン・メイナード・スミスが『Evolution and the Theory of Games』で普及させた枠組みです。この本は専門家向けですが、そこに含まれる数個のアイデアは非常に汎用性が高く、一度知るとあらゆる場面で見えるようになります。

ここでは詐欺の周期を理解するために、新しいEGTモデルを提案します。これは古典的な「鷹・兎・報復者」モデル（以下HDR）に似ていますが、支払行列が異なるためまったく別のダイナミクスになります。

GSMモデル

モデルを定義するには、三つの戦略を選び、二つの戦略が相互作用したときに起こる報酬を表す行列を設定し、その後EGTの数学的手法で解析します。三つの戦略は次の通りです。

Grifter（詐欺師） – 可能な限り搾取を試みる。
Skeptic（懐疑派） – 被害に遭わないために継続的コストを払う。
Mark（信頼者） – デフォルトで信頼し、協力は低コストだが脆弱。

支払行列

	Grifter	Skeptic	Mark
Grifter	–grifter_loss	–grifter_loss	grift_gain
Skeptic	–skeptic_cost	mutual_benefit – skeptic_cost	mutual_benefit – skeptic_cost
Mark	–mark_loss	mutual_benefit	mutual_benefit

Grifterが他のGrifterやSkepticと遭遇すると、詐欺は失敗します。時間と労力を浪費し損失になります。唯一Grifterが報酬を得るのはMarkに出会ったときです：詐欺師はMarkを成功裏にだまし、大きな利益を得ます。

Skepticは詐欺に遭わないようにしますが、注意深さに伴う一定費用（教育・精査コスト）を負担します。正直な相手（SkepticまたはMark）と接触すると、互いに協力し合いますが、その際も警戒のコストを支払います。しかしGrifterと対面した場合は取引を早期に切り離すことができ、費用は懐疑派の定数だけです。

一方Markは信頼性が高く防御策がありません。別のMarkと出会えば、スムーズに協力し双方とも最大報酬を得ます。Skepticと出会っても同様で、Skepticが事前調査を済ませた後は問題なく協力でき、Markは最大報酬を受け取ります。

ただしMarkがGrifterに遭遇した時だけ、状況は悪化します。Markはだまされ、大きな損失を被ります。

パラメータは定性的結果には大きく影響しませんが、具体的値は次の通りです：

パラメータ	値	備考
mutual_benefit	1.0	協力時の相互利益
skeptic_cost	0.2	懐疑派のオーバーヘッド
grift_gain	1.5	Markをだました際の報酬
mark_loss	2.0	Markがだまされたときの損失
grifter_loss	0.5	詐欺失敗時のコスト

これらにより具体的な支払行列は：

	Grifter	Skeptic	Mark
Grifter	–0.5	–0.5	1.5
Skeptic	–0.2	0.8	0.8
Mark	–2.0	1.0	1.0

複製者ダイナミクス

報酬を集団のダイナミクスに変換するため、複製者方程式（リプリケーター）を使用します。各戦略は集団平均と比較してどれだけうまくやっているかに比例して増減します。

以下は私が用いた単純な離散時間シミュレーターです：

def replicator(populations, A, delta=0.05, N=2000):
    """
    初期ベクトル `populations`、支払行列 `A`,
    ステップサイズ `delta` と反復回数 `N` を与えると、
    2D numpy 行列として経路を返し、最終集団を1D配列で返す。
    """
    populations = np.asarray(populations, float)
    populations /= populations.sum()

    trajectory = [populations.copy()]

    for _ in range(N):
        fitness   = A @ populations
        avg_fit   = populations @ fitness
        populations += delta * (populations * (fitness - avg_fit))

        # 消滅を避け正規化
        populations = np.clip(populations, 1e-6, 1 + delta)
        populations /= populations.sum()

        trajectory.append(populations.copy())

    return np.array(trajectory), populations

完全なソースコードはJupyter Notebookとして公開しており、インタラクティブウィジェットを備えてパラメータをリアルタイムで調整できます。

結果

三戦略集団の状態はシンプルに単体（100 % Grifter, 100 % Skeptic, 100 % Mark）の頂点と、内部が混合体になるような単純形上に自然に配置されます。いくつかの異なる初期条件を持つトラジェクトリは色分けフィールドで示され、各点における進化圧力をベクトル場として重ねています。

すぐにわかることですが、各軌道は外側へ螺旋し、やがてほぼ三角形の軌道を描きます。各頂点を訪れた後、次の頂点へ向かう前にほぼ到達したように見えます。

縦方向（時間系列）で三つの集団をプロットすると、システムは単一安定点に収束せず、クォーサイクリックな周期を描きます。各戦略が支配的になる順序を取り、最終的にはその弱点となる戦略へと落ち込みます。これは「非移転」ゲーム（ロック・ペーパー・スキャーレズ）の典型であり、軌道は収束せずに回転します。

私たちのゲームが非移転である理由は、成功率が現在の集団構成に依存し、その成功が常に別の混合へと導くためです：

Mark は Grifter が稀な時に繁栄する。信頼は効率的だから。
Grifter は Mark が多い時に繁栄する。だましやすいから。
Skeptic は Grifter が多い時に繁栄する。警戒が自らを守るから。

このようなモデルでは、長期挙動は三種類あります：安定点（固定点アトラクタ）へ収束する、安定したループ（リミットサイクル）を描く、あるいは各頂点に近づき続けながら周期的に移行するヘテロキリックサイクル。質的には「周期的な循環」であり、定常状態ではありません。

鷹・兎・報復者（HDR）

対照として、よく用いられる古典的な鷹・兎・報復者モデルは安定点へ収束します。以下は同じシミュレーションを HDR の支払行列で実行した結果です。

軌道はすべて単一の点に収束: 鷹と兎が 60 %：40 % の比率で混在し、報復者は絶滅します。この安定点は進化的に安定戦略（ESS）です。

HDR が ESS に収束する理由は、報復者戦略が鷹を取り締まる際の完全コストを負担し続けるため絶滅してしまうからです。対照的に GSM の Skeptic は Grifter を罰することではなく、単に避けるだけなので生存できるのです。

結論

モデルが仮定を満たすならば示唆は明確です：詐欺は周期的であり、高い詐欺期はやがて高い懐疑期へと移行し、そこから再び学習期間が経過して次のサイクルが始まります。具体的には、現在世代の詐欺師たちは「コンアーティストの見分け方」をマスターしており、そのトリックはすぐに広く知られ、結果として詐欺行為は停滞します。

では、このモデルを信じるべきか？ まず明らかなことは「当然そうではない」という点です。これは人間行動の極端に単純化されたキャラクタリゼーションであり、すべての側面が妥当とされ得ません。例えば、各集団が周期ごとにほぼゼロになるという予測は現実世界では見られず、変化は程度的なものです。一方で、非常に単純なモデルでも現象の本質を捉えることがあります。「すべてのモデルは誤りだが、一部は有用である」―ジョージ・ボックスの名言。何より、このモデルは外部ドライバーなしにシステム自体のダイナミクスから自然と詐欺師数の変動が生じることを示唆しています。

具体的予測としては、私たちが「ピーク・グリフト」に到達したかどうかによります。私はピークに達していると考えており、そのため今後はより高い懐疑度が見込まれ、詐欺師の成功率は低下すると予想します。ただし、これはやや楽観的かもしれません。

ビジネス上の取引では注意を払うべきです――世界には裏切りが満ちています。しかし、盲目になることなく、美徳と英雄性を追求する多くの人々も存在します。
— Max Ehrmann, Desiderata