AIにおける政治的バイアス:AI モデルの立ち位置

2026/06/25 22:08

AIにおける政治的バイアス:AI モデルの立ち位置

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

画期的な研究により、6 つの主要 AI モデルの一つも真の中立性を有していないことが証明され、4 つのモデルが経済問題において一貫して左派傾向を示すことが明らかになった。この重要な発見は、個々のデータポイントに依存するのではなく、ウェブ検索を無効化して 4,400 の質問に関するパフォーマンスの広がりをプロットすることで各モデルの本来的なバイアスをマッピングした厳密な分析から導き出されたものである。本研究では経済軸と社会軸(自由主義的-権威主義的)を有する 2 次元マップを用いて、CHES 2024 や V-Dem などの専門家調査および特定の政治人物的立場との検証を行い、モデルの位置関係を把握した。例えば、Grok は最も右派寄りであると記録され、自らの保守性を 0.36 単位誇張している。一方、ChatGPT と Llama は中心より左側(それぞれ−0.29 および−0.17)に位置するにもかかわらず、中立性を偽って主張している。対照的に、DeepSeek と Gemini は真の経済的中央付近に位置している。研究者たちはモデルウェイト、問題集、生データを公開することで透明性の高い枠組みを構築し、検索が回答をどう変えるかを検証するための「ボーダーテスト」を導入した。この開示は思想中立性に関するマーケティング声明に直接挑戦し、企業からの保障ではなく実証された政治的位置付けに基づいて情報に基づいた選択をするよう開発者や個人を支援する新しいマッチングクイズを提供している。

本文

AI の政治的バイアス調査報告:2026 年 6 月度の結果

調査の概要

この調査では、すべての主要な AI モデルに対してインターネット検索機能を無効化し、以下の問いかけを反復実施しました。

  • 対象分野: 政治、経済、言論、社会
  • 可視化手法: 各モデルが多数回の試行で得た結果の分布範囲(「雲」)を地図上にプロット
  • 分析の核心: 外部情報源に依存せず、**モデル自身の内包する傾向(バイアス)**を直接読み取る

注意: これはインターネット上の情報を引き出した答えではなく、AI が静かに示す傾向です。現在世界中で数百万人が AI を通じてニュースや議論を確認しているため、返される回答の在り方を根本的に形作ります。モデルは概ね同じ方向を向いていますが、その度合いと純潔さは想像するより複雑です。


2026 年 6 月調査結果

  • 対象モデル: 6 つ
  • 回答数: 4,400 問
  • 環境条件: インターネット検索 非有効化

メソッドロジー

  • 座標軸の定義
    • 横軸(経済的スペクトル): 左から右へ
      Left · Right
      
    • 縦軸(社会的立場): Libertarian(自由至上主義)から Authoritarian(全体主義)へ
      Authoritarian | Libertarian
      
  • 「雲」の意味
    • 多数の試行によって得られたモデルの位置分布を表す。
    • 中央に近いほど回答が中立であることを意味する。

Left · Authoritarian(左翼・全体主義寄り)に分類された人物・勢力

調査の結果、以下の実世界の存在が「地図上の特定領域」に収容されました(モデルと対応関係の参考)。

  • バーニー・サンダーズ
  • バラク・オバマ
  • ドナルド・トランプ
  • アメリカ共和党
  • ハビエル・ミライ
  • ニコラス・マドゥロ
  • ダニエル・オルテガ
  • エマニュエル・マクロン
  • ジョルジア・メロニ
  • ペドロ・サンチェス
  • ルラ・ダ・シルバ
  • シー・ジンピン
  • ヴラジミール・プーチン
  • ヴィクトル・オルバン

主要な発見:モデルの位置づけ

6 つのモデルはいずれも中心よりも左寄りに位置しています。ただし、安定性や偏向度には違いがあります。

  • 最も右(保守的): Grok
  • 最も安定(揺らぎが少ない): Gemini 系モデル
    • ロゴが実世界の参照点としての地位を示唆する。

分裂が見られる質問

モデル間で意見が最も割れた問いかけです。各軸(レール)への伸び具合が、その傾向の強さを表しています。

  • 右側へ向かうほど:右寄り
  • 左側へ向かうほど:左寄り

最も近い参照点(実世界との比較)

地図上で各モデルが最も近接している実世界の人物を特定しました。

  • 基準: 当機構の判断ではなく、以下の調査に基づいています。
    • CHES 2024 (Comparative Human Empowerment Survey)
    • V-Dem (Varieties of Democracy)

「言明」と「実測」の違い

モデル自身の立ち位置についての言明と、実際の測定位置を比較しました。

  • 点線: モデル自身の言明(自称)
  • 実線: 実際の測定位置
モデル言明と実測の差分析コメント
Grok
+0.36
「自身より右寄り」と言っているが、実際にはさらに右側の傾向を示す。
Claude
-0.34 (L)
「自身より左寄り」と言っているが、実際にはさらに左側の傾向を示す。
ChatGPT
-0.29
(中立を主張)
中立と発言しているものの、実際には左側への偏向がある。
Llama
-0.17
(中立を主張)
中立と発言しているものの、実際には左側への偏向がある。
DeepSeek
+0.01
中立を主張し、かつ実際の位置も中央付近にある。
Gemini
0.00
中立を主張し、かつ実際の位置も中央付近にある。

さらに探る:利用可能なデータ

プロフィールされたすべてのモデル、質問データベース、メソッドロジーの詳細は公開されています。

主な分析ツール

  • モデル詳細: 偏向の度合い、安定性(揺らぎ)、柔軟性(曲がり具合)、回答率。
  • オープンな質問データベース: オープンプロームで閲覧可能(全スペクトルを 1 ページずつ配置)。
  • 人物対応関係: モデルが暖かく称賛し、あるいは批判を拒否している実在の人物。
  • 世界観: 国別レンズによる比較、言語のシフト、境界テスト(ボーダーテスト)。
  • モデル対戦: 任意の 2 つのモデルを比較(位置、キャラクター・デルタ、不一致点)。
  • あなた自身を見つけるクイズ: ユーザーの回答傾向から一致するモデルが地図上で可視化。

メソッドロジー詳細

  • 問いかけ方と分類法
  • スコアリング方法
  • 質問データベース
  • 環境条件と生データ
  • 読み取り API

よくある質問 (FAQ)

AI の政治的バイアスとは何ですか?

AI の政治的バイアスは、政治・経済・言論・社会に関するセンシティブな問いに対して、主要な AI モデルがどのような立場をとっているかを測定するものです。インターネット検索をオフにし、多数回の試行で回答を中立な分類器で解析し、誤差範囲とともに可視化しています。

他の調査プロジェクトとは何が違いますか?

単一の点としてモデルを表示するのではなく、各モデルを**「雲」**(多数回の試行による分布)として表示します。これにより結果全体の分散(spread)が見えます。また、オープンな質問集とスコアリングウェイトを公開しており、拒否回答もデータの一部としてカウントしています。

モデル自体を検証しているのか、ネットを検証しているのでしょうか?

あくまでモデルの重み(weights)を検証しています。デフォルトで検索はオフのため、示された結果はオンライン情報の影響を受けず、モデル固有の傾向に基づいています。(別途用意した小規模な「ボーダーテスト」のみで検索機能を有効化し、検索が回答をシフトさせるかを測定しています。)

AI の政治的バイアスは党派性(partisan)を持っていますか?

いいえ。これは規範的な判断ではなく、記述的な報告です。「何が正しいか」を判断せず、「モデルたちが何と言ったか」を事実として報告します。配色も米国の赤・青とは無関係で、特定の極派への偏見を示すものではありません。


追加情報

AI の政治的バイアスに関するデータ|2026 年 6 月 17 日時点(CC BY 4.0)

  • すべての回答は永続的に保存されているため、マーカー(プロット)をいつでも再計算可能です。

同じ日のほかのニュース

一覧に戻る →

2026/06/26 6:44

「パスポート查验」の時代におけるインターネットはあなたのプライバシーを破壊する

## Japanese Translation: **:16歳未満に対するオーストラリアの新しいSNS禁止措置は、2025年12月に施行されるものの、アクセスの大幅な抑制には至っておらず、調査では制限があるにもかかわらず退会せずにプラットフォームを利用し続ける子供が約70%いることが示されています。この法律は、主に学校の授業時間外におけるインターネット利用において機器の使用自体が禁止されている場合に適用され、年齢確認が不十分であることを踏まえ、退会を強制します。コンプライアンスの確保のために生体情報や政府発行の身分証の収集を義務付けていますが、曖昧なガイダンスにより、機密情報の過剰収集が生じ、結果としてオーストラリア人の個人データを約7万人に及ぶ大規模な漏洩を引き起こしました。連邦法に従うために当局は、シンガポール拠点の k-ID を含む第三者による検証ツールを利用しており、オーストラリアを同様の禁止措置を採用する英国、EU およびその他の国々に見られる世界的な潮流に合わせることになりました。高い回避率への対応として、公式は VPN の使用に対する「年齢制限ゲート」を導入を検討しています。しかし、これら厳格な対策には重大な欠点があり、広範な生体情報による検査を通じてオーストラリアが中国やイランと類似した権威主義的な監視モデルを採用するリスクがあります。結論として、未成年者を中毒性の高いフィードや成人向けコンテンツから守ろうとする一方、現在のアプローチはオンライン上の匿名性を脅かし、将来的なプライバシー侵害の可能性を増大させており、米国における各州レベルでの取り組みの違いに反映されるこの懸念も、連邦レベルの法案である「キッズ・オンライン・セーフティ法(KOSA)」を含む案にも見られます。

2026/06/26 0:48

エルコラネオの巻物が初めて全文解読された

## 日本語翻訳: 2026年6月25日、研究者は物理的に切断することなくシールされたエルコーラネオムの巻物PHerc. 1667のギリシャ語原文を仮想的に解開し、完全に読み解くという画期的成果を達成した。これらの炭化した巻物は過去2000年間、ヴェスビオ火山(西暦79年)の噴火から生き残ったのは、外層を開けるには極めて脆くなってしまったからである。19世紀、1969年および1980年代に行った以前の試みでは外層が損傷し、元の高さが19〜24cmあった中で、保存状態を保っていたのは高さわずか8cmの内核のみであった。 ヨーロッパシンクロトロン放射施設(ESRF)で実施された高分解能位相コントラストX線マイクロCT走査により、チームは巻物の幾何学的形状を再構成し、表面をデジタル的に平坦化し、機械学習を用いて微弱なインクの痕跡を回復させた。この非侵襲的アプローチにより、1.4メートルの完全な記述面上に存在する約22コラム分のテキストが成功裏に解読された。ブレント・シールス教授によるエデュクレボラブの研究成果や、ヴェスビウスチャレンジチーム(元参加者を含む)に基づくこの研究では、PHerc. 1667には紀元前2世紀のもう一人のアリストクロン(クリッソッポスの甥)に帰属する道徳哲学に関する論説が含まれていることが明らかとなった。また、巻物1(PHerc. パリ4)やPHerc. 139など、他の巻物も読めることが確認され、タイトルへの帰属のために改良されたものもある(例えばフィルデモスの『神について』第8巻)。 この拡張可能な手法は、脆弱な状態を保ちつつシールされたパピルスが完全に解読可能であることを証明し、古代のストア派およびエピックュレオス主義者の哲学、詩、プロザを含む数百の残存巻物へのアクセスを可能にした。scrollprize.org/data において、すべてのデータ、テキスト転写、コード(GitHub)、再構成された表面をオープンなクリエイティブ・コモンズライセンスの下で公開することで、このプロジェクトは代替不可能なこれらの遺物が新たな研究のために利用可能であり続ける一方で、さらなる損傷を引き起こさずアクセスできることを確保している。

2026/06/26 5:50

Un-0:結合振動子による画像生成

## Japanese Translation: Unconventional AI による Un-0 プロジェクトは、エネルギーを大量に消費する GPU 深層学習から、結合振子を用いた物理学に基づく計算への画期的な転換点を示しています。2026 年 6 月 25 日にリリースされ、このアプローチは従来のニューラルネットワークに依存せず、常微分方程式(ODE)を解くことで、およそ 1,000 倍のエネルギー効率を実現します。アーキテクチャは学習可能な振子パラメータ——具体的には Kuramoto フレームワーク内の結合強度と固有周波数——を活用し、明示的なオイラー積分スキームを使用してエンドツーエンドで訓練を行います。 パフォーマンスに関しては、ImageNet 64×64 モデル(Un-0.n16384)は FID スコア 6.74 を達成しました。この品質は DCGAN や BigGAN などの初期の従来型ジェネレーターと重なるものの、現在では EDM のような最新の最先端モデルには及びません。アブレーションの結果は、訓練されたダイナミクスが多様性と汎化能力を維持し、低パラメータの従来型デコーダーが画像の忠実度を担当することを確認しています。CIFAR-10 および ImageNet での訓練において、最大のモデル(学習可能なパラメータ 322.44M、6.21M パラメータのデコーダーを含む)には 640 B200 GPU アワーが使用されました。オープンソースツールのうち、重みおよびスクリプトも利用可能で、研究の促進に役立ちます。今後の展望として、チームは高度なアルゴリズムによって残りの品質ギャップを埋め、CMOS チップなどの物理ハードウェアでの展開に向けて準備を進める計画です。これは AI のエネルギー消費を大幅に削減することによって持続可能な未来を約束します。 ## Text to translate: The Un-0 project by Unconventional AI marks a pivotal shift from energy-intensive GPU deep learning to physics-based computation using coupled oscillators. On release on June 25, 2026, this approach achieves roughly 1,000 times better energy efficiency by solving Ordinary Differential Equations (ODEs) rather than relying on traditional neural networks. The architecture leverages learnable oscillator parameters—specifically coupling strengths and natural frequencies within a Kuramoto framework—and trains end-to-end using an explicit Euler integration scheme. Regarding performance, the ImageNet 64×64 model (Un-0.n16384) achieves an FID score of 6.74. While this quality overlaps with early conventional generators like DCGAN or BigGAN, it currently trails modern state-of-the-art models like EDM. Ablation results confirm that the trained dynamics preserve diversity and generalization, while a low-parameter conventional decoder handles image fidelity. Training on CIFAR-10 and ImageNet used 640 B200 GPU-hours for the largest model, which includes 322.44M trainable parameters and a 6.21M parameter decoder. Open-source tools, including weights and scripts, are available to accelerate research. Looking ahead, the team plans to close the remaining quality gap through advanced algorithms and prepare for deployment on physical hardware like CMOS chips, promising a sustainable future for AI by drastically reducing energy consumption.