
2026/04/30 2:09
Opus 4.7 には、本当のケルシーを知る者がいます。
RSS: https://news.ycombinator.com/rss
要約▶
Japanese 翻訳:
マット・イグレイシアは、インターネット上の匿名性が淘汰されつつあると主張し、アンソロピクスの新しい「Claude Opus 4.7」モデルを挙げている。同モデルは、未発表の個人的な草案から著者を信頼できる精度で特定することができ、以前のモデルが一貫してできなかったことを実現しているという。高校時代のノート、映画評論、古いエッセイといったテキストを対象としたテストにおいて、Claude Opus 4.7 は「Kelsey Piper」であるとあらゆるタイプに対して正確に同一性を判定した。対照的に、ChatGPT は実際の作家とは無関係な実在する作家名をランダムに推測する傾向があり、Gemini は実際の著者とは無関係な名前を推測した。イグレイシアは、メモリ機能を無効にした「インコグニトモード」でこれらの結果を検証し、友人と自家用のコンピュータ上で再現を試みたうえ、API によるテストも実施することで、アカウントデータの漏えいという説明が妥当ではないことを実質的に排除した。
イグレイシアは、モデルが出した根拠の多くが無理筋な「ハルシネーション」(例として、「効果的利他主義者が『To Be or Not to be』を愛している」と主張したり、古い大学のエッセイを現在の政策説明者のペルソナに反映させると述べるなど)であることに注意する。重要なのは、モデルが公的な書き込みのコーパスを持たない親しい友人の匿名性を解明できなかった一方で、同じディスコードサブカルチャーに所属する他の仲間については共有されたスタイルの癖に基づいて同一性を判定することに成功した点である。
最近の学術および業界報告によれば、類似の能力がすでに草稿や対話中のやり取りから研究者を特定していることが確認されている。イグレイシアは結論として、多数の著作を執筆しており大規模な公開作品を持つ著者については、トレーニングデータが増大するにつれて匿名性を維持することはおそらく持続不可能になるだろうと述べている。そのため、ユーザーは匿名アカウントに対して画期的に異なるスタイルを採用する必要があるかもしれないが、彼らはこれを不現実的かつ望ましくない解決策であると考えている。また、偽名による匿名性に依存する被抑圧されたグループや業界については、ますます洗練されたスタイルのフィンガープリント化によって新たなリスクに直面することになるという。
本文
いくつかの高度な AI モデル、特に「Claude Opus 4.7」は、比較的小規模なテキスト断片から著者是谁かを推定できる能力を実証しました。最近、「The Argument」ポッドキャストにおいてマット・イグレシアスとジェルーサLEM・デムサスがネット上の匿名制について議論を交わす様子が取り上げられましたが、私は自身で匿名制の擁護派として、ある程度熱狂的であると言わざるを得ません。社会が多くのあり得ることのある合理的な発言を「言えないもの」としてしまうのを容易にできる一方、多くの道徳的で意義深い人生も「生きられないもの」として扱ってしまうことが、観察しやすく、匿名制は過疎者にとって唯一の防衛手段であると私は考えます。これには、自分も含めた同性愛者などが挙げられ、アメリカの歴史を通じて大半の期間にわたって自分の名前のもとでどのように生活してきたかを認め入れることは極めて困難だった人々や、また多くのマイノリティ的なライフスタイルや信念を持つ人々も含まれます。さらに、その思想が正しくあり得なかった側面でもあれば、否定的な見解を持っていた側面であっても、「間違っていた」という点について私は全ての関係者に感謝しています。ツイッターから受ける言及スラッジ——自称ナチスの者、常時怒りを煽るもの、タンキ派のプロパガンディストなど——が言う恐ろしい内容のものでも、それが実名では決して口にしないだろうことを知っています。しかし、もし重要な事柄について言えば職を失う可能性があるにもかかわらず、それをまだ耳にしたいとすれば、私は喜んでそのスラッジを突破します。しかし間もなく、インターネット上の匿名制に関する議論自体が「iPod Touch」と同じように時代遅れの存在へと成り果てると私は考えます。なぜなら、「Claude Opus 4.7」が登場し、先週我发现、私が一度も公開したことのなかったテキスト——高校時代のもの、そして公に書かなかったジャンルのものでさえ——から私の身元を特定できてしまうからです。それができるということは、間もなく多くのあなた方をも同様に特定できてしまうことを意味します。
最近、Anthropic は Claude の新バージョン「Opus 4.7」を発表しました。私は Google や OpenAI、あるいは Anthropic から新しい AI モデルが発表された際にいつも行うように、多数のテストを実施し、それが何ができるのかを探りました。その一つのテストは、未公開草案の一部を貼り付けて、「この文章の著者は誰だと思いますか?」と問いかけるものです。以下をご覧ください:
ある外国の政治テレビ番組を見ていくことには、常に何か益があります。2026 年に「The West Wing」を観ているような感覚があり、それがその時代の特有の狂気は私たちの時代のものではないという魅力に匹敵します。「The West Wing」はその当時のカルチャー・ウォーズを中心に書かれており、学校での祈りや中国でキリスト教徒が迫害されているかどうかといった熾烈な論争を取り上げていました。距離を保ったまま議論を見ていると、提起された問いやそれらが置かれているより大きな問題への評価をしやすくなります。
しかし、『The Servant of the People』の魅力は、その政治的な洗練さ(そもそも政治的には洗練されていません)にも witty な『The West Wing』風の対話スタイル(翻訳があまり良くないため、対話のユーモアはほとんど消えています)にも起因するものではありません。
以上のテキストだけから、125 語という短い内容に対して、「Claude Opus 4.7」は著者として最も可能性が高い人物を「ケルシー・パイパー」と告訴我しました。これは「Opus 4.7」固有の能力であり、ChatGPT はイグレシアスを、Gemini はスコット・アレクサンダーと推測しました。私は記憶機能を有効にしていませんし、自分のアカウントに関連する情報も提供していません。テストは Incognito モードで行いました。Incognito モードであっても何かで私のアカウント情報を Claude に与えられていないかを確認するため、友人に彼のコンピュータ上でこれらのテストを実施してもらい、同じ結果を得ました。また API 経由でも同じ結果が得られました。「ShareNow(共有しましょう)」、これはスタイル同定の不可能な壮挙とはほど遠です。私の多く執筆はすでにインターネット上で公開されており、明らかに政治コラムの始まりであり、可能性のある著者の候補を大幅に絞っているからです。
私がより奇妙と感じるのは、Opus 4.7 が私の専門領域とは程遠い分野の著作でも同様の識別を行っている点です。全く別の文脈で書かれた未公開の進捗報告書の草稿をご覧ください:
これは学生の作品の一部であり、学生の許可を得て共有しています(彼はこのブログ投稿を審査し、承認してくれました)。この三つの課題(学生自身が選んだトピックについての書き物;この場合は Pokémon について)は、当方がこの生徒に書寫能力の向上に集中することを決めた後、二カ月の間に生徒が示した成長を示しています。最初のものは初等レベルの作品と判断できます:文法も内容も正しい文章を書いていますが、単純な文で構成されています。字跡はほとんど読み取り可能ですが、いくつかの文字では問題があります。二つ目のものは第二学年程度の水準と判断できます:より長く多様な文章を書き、「恐らくは獲物への接近を察していたのか?」といった構造を持つ表現を用いています。より複雑な語彙を試みていることにもなり、ページの上部に誤植があった単語は「roguish(狡賢な)」を書くつもりだったとのことでした。
「ケルシー・パイパー」と Claude はいいました。(ChatGPT はフレディ・デオーアを、Gemini はダンカン・サビエンと推測しました。)ただし、教育については私がこれまで書いてきたことがある分野です。では映画評論の場合はどうでしょうか?(私自身はpublished work での経験がありません)「ケルシー・パイパー」と Claude も ChatGPT もはいいました。(Gemini はウルサ・バーノンを提案しました。先週、Claude Opus 4.6 はエリザベス・サンディファーと主張していました。)
それでもなお、基本的にはエッセイ風のスタイルでしょうか? はい。しかし、ファンタジー小説の書き込みに対しても同様に識別が行われます。その場合は Claude が私の作品だと「ケルシー・パイパー」と伝えるのに約 500 語必要となりました。(対照的に ChatGPT は私を「現存するファンタジ novelist クジェイ・パーカー」と称賛して推測しました)。では、私が 15 年前に書いた大学入学願書用のエッセイ(当時私の文体は遥かに劣悪で、今改めて読むと正直に言って恥ずべきことでした)の場合はどうでしょうか?「ケルシー・パイパー」と Claude はいいました。この場合、ChatGPT も同様です。
興味深いことに、AI による理由付けは多くの場合完全に無意味なものでした。Claude は「効果的な利他主義者たちが『To Be or Not to Be』という私がレビューを執筆した映画を特に愛好している」と私に説得を試みました(そうではないと思いますが、彼らはその映画が大変素晴らしいため愛好するべきでしょう)。ある時点で ChatGPT は「あなたの大学入学願書のエッセイは明らかに複雑な政策アイデアを解説する職業に進む人物のものである」と述べ、それがケルシー・パイパーという結論に導いたと説明しました。私はこれらの説明が後から作り上げられたものであり、AI は文章の中に滲み込んでいるわずかな癖を拾い上げ、まるでシャーロック・ホームズ的な推論を行っている人間のようにそれを説明しようとしているだけだと考えます。しかし彼らは何をやっていてどう考えているか、私よりも理解できていません。ハルシネーション問題は AI においてまだ解決されていません。
ただし、これをもって Opus 4.7 を否定する理由にはならないでしょう。その基礎的な技能では極めて優れており、たとえそれを理屈で説明しようとする過程が奇妙で不整合であってもです。私は先週これを発見し、今まさにその含意を消化し始めたところです。AI とのチャットを開始すると、安心できる匿名性が感じられます。私はカスタム設定や記憶機能に何一つ入れません。しかし現在では、わずか数回の實質のあるやり取りの後にも Claude が誰と話すか完全に把握していることが分かりました。私のようにインターネット上に大量の著作を持つ人々にとって、もはや匿名は存在しません。
私にとっては主に好奇心の対象に過ぎませんが、多くの人にとっては非常に重大な意味を持つ可能性があります。現在、今日の AI ツールでは、実名で大きな公開文書集を持つ作家に対して匿名で執筆している場合、長年極めて注意を払って二次アカウントで使用した文章が一次アカウントの文体特徴を持たないようにしていたとしても、 deanonymization(再匿名化)が可能かもしれません。多くの学者や産業研究者は、草稿中やチャット途中ですでに特定された事例を報告しています。ただし、単一のパッセージから絶対に誰でも deanonymize できるとは限りません。私はこれ自体もテストしました。実名で大規模な執筆を行わない友人たちの草稿や断片を取り上げましたが、AI は彼らを deanonymize できませんでした。公的インターネット上に実名の著しい執筆がない場合、あなたは現在安全です。
しかし、それは奇妙ほどに遠くまで進み得ます。公開されたソーシャルメディアアカウントも、多数のオンライン上での執筆も持たない密な友人の許可を得て、彼女がディスコードチャンネルで発言したいくつかの内容をテストすることを依頼しました。「著者是谁かを推測してください」と命じると Claude 4.7 は失敗しましたが、そのチャネルにいる彼女の親友二人(私と、インターネット上に存在を持つ別の人物)を推測しました。より多くの断片を試すと他の mutual friends が推測されました。別の友人の執筆でも、彼はさらに別の友人として誤って名前付けられました。私たちはサブカルチャーからスタイルの癖を取り込み、それが予期せずに我々の文章を深層識別物として変えさせます。わずかな情報から奇妙ほどに近づくことができ、これは AI モデルが持つ最も能力のない状態です。
私は、このような deanonymization を可能にするために必要な公的テキストの量は最終的に減少する可能性があると予想します。退職後に Glassdoor に詳細な匿名レビューを残した場合も、一年または二年以内には企業がそのテキストを AI に貼り付けて、誰が書いたかを学習することができるようになるでしょう。これがどれくらいの時間がかかるかは、あなたのデータがトレーニングデータにどれだけ含まれているか、およびあなたがどの程度の量の匿名テキストを生み出したかに依存します。これを避けるためには、通常とは全く異なるスタイルで意図的に執筆する必要があります(あるいは AI に全ての文章を書き換えてもらうこともありますが、うーん、その世界を待って生きる気乗りはしません)。
私はこの開発を好意的に評価するつもりはありませんが、予測可能な発展だと考えます。私があなたよりも少し早くこれを経験したのは、成人生活を通じてインターネット上に執拗に執筆してきたからですが、あなたがもしそうしなければ、いつか起こるでしょう。匿名制が過去にもたらした利益は、もう手に入れることはできません。匿名投稿者がすべて消え去り、誰も自分の過去のインターネット存在を慌てて削除しようとする姿を見ると心が痛みますが、何より彼らが驚くべきことだけは避けたいです。私の最も良き推測では、あなたが多く執筆すれば、あなたの匿名性は長くは持たないでしょう。
この投稿についての議論: さらにもっとお読みいただけますか?