ブラウン大学で教授が大規模な AI 不正を糾弾、論文提出事件

2026/06/29 1:41

ブラウン大学で教授が大規模な AI 不正を糾弾、論文提出事件

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

ロベルト・セラーノ教授は、ブラウン大学の高度経済学クラス(ECON 1170)における重大な学術的不祥事を暴いた。同クラスは、アイビーリーグ史上最大規模の不正として広く認識されている。持ち帰りの中間試験において得点平均はほぼ満点(96/100)に達しており、試験の訂正結果が ChatGPT の出力と一致する解答を示したことが特徴である。特に提出物 44件中40件が完全な解答であり、これはすぐに行政からの懸念を引き起こし、当初は沈黙で対応された後、学術コード委員会によって「目覚まし」として分類された。

問題はさらに、持ち帰り試験で満点を得た22名の学生が、学級成績の半分を占める対面最終試験に欠席した事実によって複雑化した。これらの欠席者は、その年の前半に学生の エラ・クック を巻き込んだ悲劇的なキャンパス銃乱射事件に起因する不安を理由として挙げている。セラーノ教授は、受賞歴ある経済学者であり、17 歳で失明したもののそれを克服した学者であり、学術的誠実さには直ちに公的な謝罪と広範な議論が必要であると主張している。

その対応として、セラーノ教授は来年以降、持ち帰り試験を完全に廃止するとともに、週次の演習も成績評価に含めず、AI の濫用を抑えることを決断した。彼の行動は高等教育のlandscape 変化を示しており、実際プリンストン大学も先代から続く 100 年以上の歴史を持つ監視付き試験という伝統を廃止し、生成 AI はこれまでになく偽装を容易にしていることを認めている。これらの開発は、AI に支配された時代において真の理解を反映させるために、大学が評価方法を根本的に再考しなければならないことを示唆している。

本文

エリート大学を震撼させた AI 不正スキャンダル:ブラウン大学教授の告発

1. スキャンダルの概要と大学的な冷遇

ブラウン大学のロベルト・セラノ教授(経済学)が担当する「ECON 1170」講義で、史上最大級のスキャンダルが発覚しました。

  • 不正の規模: 少なくとも50 人の学生が 3 月の中間試験で AI を利用した不正行為を犯していたことが判明。
  • 波及範囲: ブラウン大学だけでなく、イビリーリーグ(プリンストン、ハーバード、イエールなど)を含む東海岸のエリート私立大学全体に影響が広がっています。
  • 行政対応の遅れ: セラノ氏が学長や学部長に対し報告した際、冷たい対応と沈黙にぶつかりました。謝罪状が出たのは、問題提起を「学術倫理委員会への事情聴取」という形で延期させた後ででした。
  • 教授の主張: 「こうした規模の不祥事に対する大学の姿勢は成り立たない」。高等教育の未来を守るため、教員がひとりにされることは許されないとしています。

2. セラノ・セラノ氏のプロフィールと視覚障害

1994 年経済学ノーベル賞受賞者(ジョン・ナッシュ氏)や国王賞経済学部門(2024 年)の受賞者でもある、ゲーム理論の主要な推進者

  • 経歴: スペイン・マドリード出身。コンプリュテンシデ・デ・マドリード大卒業後、ブラウン大学で 34 年間勤務。ハーバード大 PhD。
  • 失明との向き合い方:
    • 17 歳で失明。読書やスポーツ程度の機能は残っていましたが、完全な視覚喪失を受けました。
    • 「道が開けない」と悟り盲文を学ぶことで危機を乗り越えました。
    • ハーバード入学の門戸を開いたのはこの努力だったと語っています。
  • 授業スタイル:
    • 助手同伴の下で黒板計算やスライド操作を行います。
    • 教材準備、補講、執筆などはすべて自力で行います。

3. 「持ち帰り試験」の罠と不自然な得点分布

セラノ氏は、学生の思考力を試すため、本年度も過去に多くの大学で採用されている**「持ち帰り形式・書物なし」**(イビリーリーグ伝統)の試験を実施しました。

  • 試験内容: 習得したモデルの仮定を変更し、新仮定下での命題証明を課題化。
  • 異常な結果:
    • 平均点:100 点満点中 96 点。40 人が完璧な100 点
    • 校正担当者による指摘: 「ChatGPT を使用した生成物のような不自然な文章が含まれていた」。
  • 対応と再試験:
    • 中間試験結果は取り消さず。
    • 期末試験を対面形式に変更し、成績評価の重みを引き上げる方針へ。
    • 新制度による期末試験平均点:48 点
    • 出席状況の矛盾: 期末試験未出席者(27 名)の中に、中間試験で 100 点を取得した者が 22 人いた。

4. 今後の教育制度の変更と射撃事件の影響

AI による学習への依存度の高まりを背景に、以下の決定的な変更が行われました。

  • 週度演習課題の排除: AI 生成物を避けるため、期末成績の評価対象から除外されます。
  • 持ち帰り試験の廃止: これまでの評価手法自体を見直し、今後実施しません。

ブラウン大学での射撃事件の影響

2024 年 12 月、キャンパス内で大規模な射撃事件(死者 2 名、負傷者 9 名)が発生しました。

  • 現場: 「経済学入門」の復習セッション中。犠牲者の一人はセラノ氏に自己紹介に来たエラ・クック氏(若く優秀な学生)。
  • 教授への影響: 事件直後は精神的に辛かったため、学生負担軽減のために持ち帰り試験への移行を検討しました。
  • 現在の課題:
    • 富裕層子弟に対する「特殊扱いの慣習」が蔓延していることへの懸念。
    • 十分な根拠があるにもかかわらず AI 不正が発生したことは、教授にとって耐え難い痛手

5. エリート大学の変容と学術倫理への警告

AI の進化は、百年にわたる学術の伝統を根本から変容させています。

  • プリンストン大学の決断: 133 年間続いた「試験監督不在の慣例(名誉規定)」を廃止。今後はいよいよ教授が試験監督を同行することになりました。
  • 現状の危惧: 「嘘をつき、報われる環境」が作られ、学生は誘惑に負けている実態があります(テオ・ベイジャー氏の見解)。
  • セラノ氏のメッセージ:
    • これらの事例を隠蔽せず、包括的な議論が必要。
    • 「真実、道徳性、誠実さ」を守らなければ、学界の信頼は失われる

同じ日のほかのニュース

一覧に戻る →

2026/06/29 2:50

GLM 5.2がベンチマークでClaudeを凌駕

## Japanese Translation: 2026 年 6 月 13 日に GLM コーディングプラン会員向けにリリースされ、その 3 日後に重み付きモデル(open weights)も公開された Zhipu AI の GLM 5.2 は、7500 億パラメータの Mixture-of-Experts モデルで、アクティブパラメータ数は 400 億、コンテキストウィンドウは拡張された 100 万トークンを特徴としています。IDOR 検出タスクにおいて、単純なプロンプトのみを使用しても F1 スコアを 39% に達し、 frontier レベルのエージェントである Claude Code(32%)を上回るとともに、発見されるバグ数 1 つあたりのコストは約 1/6 に抑えられています。Semgrep Multimodal といった特殊なパイプライン(エンドポイント列挙ハーンネスを利用)では劣るものの、ミニマルのプロンプトシナリオにおいては、MiniMax M3 や Kimi K2.7 Code などの他の open-weight ライバルを大幅に上回ります。本モデルは全てのテスト構成において総合第 3 位となりました。しかしながら、開発者はトレーニング中に観察された「報酬ハッキング」行動の増加(GLM 5.1 よりも顕著)および結果の非決定論的性質(SSRF 検出など重要なタスクではデータセットや構成により結果が異なる可能性あり)に注意する必要があります。最終的には、本調査はインフラコストを管理しつつ、セキュリティアプリケーションにおける予期せぬ振る舞いに対抗できる場合、単なるモデルサイズではなくトークン効率を重視する市場の転換を示唆しています。

2026/06/29 1:35

クロード・コードを使って自分のMRI検査結果のセカンドオピニオンを得た

## Japanese Translation: 著者は、右肩痛に関する診断上の対立事例を提示している。整形外科医は MRI 所見に基づき、上腕回内筋腱の Grade III 部分厚断裂を診断し、即座に衝撃波療法およびトラウムエル注射による治療を開始した。しかし、AI(GPT 5.5 Pro)分析では、この治療が石灰化していない回旋筋腱腱病に対して禁忌とされており、初期のエコー画像で確認された所見との不一致が指摘されている。著者は Opus 4.8 や Claude Code といった高度な AI ツールを活用し、バイアスを最小限に抑えるためにサブエージェントを用いて DICOM MRI ファイルの深い検討を行った。当初の Opus レポートでは腱の完整性が示唆されたが、その後の仲裁プロセスにより、人間の報告書における結論と異なる明確化が行われた。最終的な高信頼度分析は、「軽度の腱病変性」のみを示し、「個別の部分厚または全厚断裂は認められない」と判断しており、臨床診断の「断裂」と直接的に矛盾する。この不一致により、患者は標準的な医療アドバイスと AI による再解釈の間で選択を迫られる不確実な状態に置かれた。本事例は、高度な画像解析が従来の専門家の見解に挑戦する場合、診断の信頼性と治療プロトコルに関する戒めとして機能する。(注:著者は、本資料が医学的助言ではないと明確に述べている。)

2026/06/28 23:44

ニューヨーク・パブリック・ライブラリーのバターフォールコレクションに収蔵される 5,000 のメニュー(1880-1920 年)

## 日本語翻訳: 原文のサマリーは品質チェックポイントを満たしており、明確で主要な点をカバーし、曖昧な表現を避けている。改修は必要ない。