
2025/12/15 21:12
I'm Kenyan. I don't write like ChatGPT, ChatGPT writes like me
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
記事は、ケニアの正式な教育制度によって形成された文章――厳格な文構造・平行構文・接続語句・精度への重点が特徴である――を、現在の検出ツール(困難度とバーストネス指標に依存)がAI生成と誤認識しやすいという主張を展開しています。ケニア人作家はこれらの指標で低得点になるため、特に非英語母語話者に対して偽陽性が生じやすいと述べています。本稿は、この問題をケニアの植民地時代から継承された教育遺産という文脈で位置付けており、その遺産は今日でも社会的ステータスの指標として機能しています。「人間らしい」文章の狭い定義――カジュアルな誤りや米国英語の口語表現を優先し、正式な精度を軽視する―に疑問を投げかけ、開発者と教育者に対して基準を拡大し、多様な教育背景を正当な人間スタイルとして認識するよう促しています。
本文
ある会話が何度も繰り返されているように感じます。
今回、私を本当に刺激した投稿があります。返信の中で指摘された点は非常に重要で、この議論全体をさらに苛立たせるものです:実際に英語を学ばなければならなかった人がいるという事実です。
まず説明します。
最初の出来事――おそらく「これから来る時代の兆し」と受け取るべきだった――は今年早い段階でした。数日間かけて仕上げた提案に対して次のような返信が届きました。
「このベースはとても堅実ですが、もう少し人間味を加えて書き直せますか?ちょっとChatGPTで書いたみたいです。」
「人間味」――その言葉だけで思考が揺れました。私は戻ってきたのです。
ここで重要なのは、増え続ける作家たちがこのような返信を受け取る傾向にあり、その裏には私見ですがかなり暗い側面と陰湿さがあるということです。少し待ってください、そしてその点に戻ります。皮肉の一部は祖先が笑っていたようなものです。告発者自身も完全に間違っているわけではありませんでした。
私の文章は、大規模言語モデル(LLM)の出力と何らかのDNAを共有しています。私たちは両方とも構造化され、バランスの取れた文を好みます。また、論理的な流れが疑問視されないように接続詞や遷移語を多用します。そして、時折(そして今では告発的になった)ハイフン・セミコロン・エムダッシュで関連する考えを繋ぎます。
冷静になってみると、彼らの判断ミスは「何」ではなく「なぜ」であることが分かります。彼らは起源を誤解していたのです。
—私は作家です。ケニア人であるという特別な条件も備えた作家です。そして私の結論はこうです:私はChatGPTのように書きません。
ChatGPTは奇妙で、身体がなく、世界中から情報を取り込んでいる方法で、私と同じように書くのです。あるいはもっと正確には、非常に特定の教育・社会的パイプラインを通過した数百万の人々のように書きます。このパイプラインは曖昧さを削ぎ落とし、思考を非常に特定で正式な形へと鍛え上げることを意図しています。
自己称するAI探偵たちが増えており、彼らは「証拠」を設計・詳細化し、フォロワーに対して機械的な兆候のチェックリストを与えています。
テキストが furthermore、moreover、consequently、otherwise、thusly のような語句を使っているか? 完全に平行構造で「XだけではなくYもある」という古典的表現を用いているか? 主要ポイントをきれいな論理的三連でまとめているか?
デジタル不真実の探偵たちへこう告げます。
親愛なる友よ、ケニアの教室・ボードルーム・オフィスTeamsチャットでの典型的な火曜日にようこそ。あなたが機械の指紋だと特定するものは、実際には私たちの教育の化石記録です。
私の文体の基盤はシリコンバレーでプログラムされたわけではありません。それはケニア初等教育証明(KCPE)の高圧炉で鍛えられました。私の世代と後続の世代にとって、英語作文試験―そしてスワヒリ語版 Insha ―は単なるテストではなく、通過儀礼でした。それは人生を左右する「成功か失敗か」の40分間、高圧の競走です。豊かな語彙と洗練された文構造を、極度のプレッシャーの中で駆使できるかどうかが、将来や国立高校への進学、そしてそれに伴う人生軌道を決定します。
この瞬間は例外ではありませんでした。3年間(もっと長いと言えます)にわたるすべての英語授業と宿題は、教師が作文採点時に可能な限り最高点(40点)を与えるよう設計されていました。38/40点? そのペーパーを採点する人はあなたをマルキアット・シンと同じ空気を呼吸できるほど価値ある存在だと判断したのです。
黒板に先生が流麗な筆記で書いたプロンプトを覚えてください。
「私が決して忘れない休日」
または、全体を書き終える際に「…そしてそこで私は目覚めて、それがただの夢だったと気付いた」と締めるよう要求するものもありました。テーマ自体はほぼ無関係で、本当に重要なのは実行でした。
教師から生徒へ世代を超えて伝えられる暗黙のルール、戒律が存在しました。
第一戒? ことわざや力強いオープニング文で始めること。「急ぐと浪費する」など、市場へ急いで金を忘れた話に移ります。
第二戒? 広範な語彙を示すこと。単なる walk ではなく purposefully strode、wearily trudged、または nonchalantly ambled と表現します。見たものを beheld a magnificent spectacle と描写します。私たちの演習ノートにはこうした「ワオ語」がリスト化され、その同義語・反意語が暗記させられました。
第三戒、そして最も重要な戒律? 構造です。エッセイは完璧な建物であるべきでした。序論は基礎、本文は壁、結論は屋根―物語の教訓を要約し、巧みに初めのことわざに戻して満足感と予測可能なループを作ります。段落は強力なトピックセンテンスを中心に構築されるよう教えられました。分割文(句切り)の罪と複合複雑文の美徳を学び、赤ペンで批評しながら私たちは「良い」書き方という特定モデルをトレーニングしました。過去の優秀な生徒が読上げる完璧なエッセイは、私たちにとっての訓練データでした。
この文化は高校へも受け継がれます。設定された教科書を暗記し、特定の主張について詳細に議論することで英文学の合格点を超えることが求められました。夜中にシェイクスピアを朗読できるほどです。
もちろん、このスタイルにはマイクロチップよりも古い歴史があります。それはイギリス帝国の直接的な言語継承です。私たちが学んだ英語は、現代ロンドンやカリフォルニアで流れるスラングと便利な省略形を備えた流動的な言語ではありませんでした。それは女王の英語、植民地主義者・宣教師・校長の言語でした。聖書、シェイクスピア、法律の言語です。権力のツールであり、その正確さを学ばされました。
その正式な韻律、やや古風な語彙、硬直した文法構造をマスターすることは、単に試験に合格するためではありませんでした。それはシグナルでした。教育を受けた証、文明化された証、人が物事の秩序で自らの位置を取る準備ができているという証です。
(抵抗しようとしましたが、やめられませんでした。そして恐らくあなたもそれに気づいているでしょう:3つを見る?)
独立後のケニアでは、この言語は消えませんでした。機能を変えただけです。公式言語、チャンスの言語、新たな階級と洗練さの指標となりました。その時代のチャールズ・ンジョノスやトム・ムボヤはそれを使って社会で自らの地位を示しました。「正しい」フォーマル英語を話し、書く能力が、持ち主と持たざる者を分けました。それは大学への扉、企業の仕事、村を越えた人生への鍵でした。教育制度はそれを教えることにさらに注力し、ほぼ完璧な状態で保存しました。
そしてここに、この長い歴史的ジョークのパンチラインがあります。AI、大規模言語モデルは膨大なテキストコーパスから学びますが、その多くは公式です。過去200年間に出版された書籍、学術論文、百科事典、法的文書、人類知識全体のアーカイブから学びます。機械は権威と精度を結びつけることを学びます。結果として、AIはKCPE卒業生でA点を取った英語作文を書く人のように聞こえるようになり、英国帝国の言語的幽霊を偶然再現します。
今、私たちの非常にヒューマンでアナログな訓練結果を「人工」と呼ぶ世界が、新しい技術レンズを通してそれを見るとき、その侮辱はさらに鋭くなります。いわゆるAI検出器は中立的な真実の仲裁者ではありません。彼ら自身も特定の文化・技術的世界観の産物です。
私が理解する限り、これらの検出器は「パープレキシティ」と「バーストネス」の2つを測定します。
パープレキシティ はテキストがどれだけ予測可能かを評価します。「猫が…」という文を始めると、脳とAIは floor を予測します。このように予測しやすいフレーズで満たされたテキストは低パープレキシティとなり「ロボット的」と判断されます。
バーストネス は文長・構造の変動を測ります。自然な人間の話し言葉や書き方は『短い強力な文 → 長く回る文 → もう一度短い』という「バースティ」パターンです。LLM(少なくとも初期形態)はより均一な長さで、単調なリズムを保つ傾向があります。
再び私たちの訓練を考えてみましょう。明確・論理的・予測可能であることが求められました。文構造は一貫しバランスが取れているべきでした。検出器が「人間性」を示すとする burstiness を避けるよう教えられました。優れた作文は滑らかに流れ、各文が前の文を完璧な論理で構築します。結果として、私たちは低パープレキシティ・低バーストネスのテキストを生成するよう訓練されました―これがツールが「非人間」とフラグ付けする正確な条件です。
最近の学術研究は、これらのツールが不安定であり、特に英語非母国語話者のテキストをAI生成と誤判定しやすいことを確認しています(そして再び戻ります)。皮肉は憎むほどです。あなたは一生かけて言語を習得し、その正式なルールを最も厳密に守ることで、機械が海を越えて呼ぶ「偽物」と見なされます。
したがって私の作品―あなたが見る我々の作品―で何を見るのでしょう? あなたはロボットの魂のない散文を見ているのでしょうか? それとも、標準8年生英語教師・アモロー先生の声を耳にしているでしょうか――過去の時代の切れ味のある正確なアクセントで、段落を適切なリンクフレーズで結ぶよう促す。アルゴリズムの出力なのか、それとも千もの手書きエッセイの筋肉記憶なのか。
「人間的」文章とは何かという問いは、危険ほど狭く定義されつつあります。アメリカ中心主義的な口語表現やある種の非公式で会話調のリズムを持つことが、人間性の証だとされるならば、ラグナス・バンガロール・キングストン・ナイロビから来たあなたはどうなるでしょうか? 精度が言語と読者への最高敬意であると教えられた人として。
それは同じ古い闘争の新境地です:見てもらうため、理解されるため、他者に容易に与えられる「人間性」の前提を得るため。私の文章は機械の産物ではありません。それは私の歴史の産物です。植民地主義遺産の反響であり、厳格な教育の成果であり、自国の公式言語を習得するために必要とされた努力の証です。
指を差し出して「AI!」と叫ぶ前に、一息置いてください。あなたが見ているものは人間性の欠如ではなく、別の形態の人間性である可能性があります。異なる教育・歴史・標準の結果かもしれません。単にケニア人の執筆を観察しているのです。そして私たちは長い時間、この方法で書き続けてきました。