I'm Kenyan. I don't write like ChatGPT, ChatGPT writes like me

2025/12/15 21:12

I'm Kenyan. I don't write like ChatGPT, ChatGPT writes like me

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

記事は、ケニアの正式な教育制度によって形成された文章――厳格な文構造・平行構文・接続語句・精度への重点が特徴である――を、現在の検出ツール(困難度とバーストネス指標に依存)がAI生成と誤認識しやすいという主張を展開しています。ケニア人作家はこれらの指標で低得点になるため、特に非英語母語話者に対して偽陽性が生じやすいと述べています。本稿は、この問題をケニアの植民地時代から継承された教育遺産という文脈で位置付けており、その遺産は今日でも社会的ステータスの指標として機能しています。「人間らしい」文章の狭い定義――カジュアルな誤りや米国英語の口語表現を優先し、正式な精度を軽視する―に疑問を投げかけ、開発者と教育者に対して基準を拡大し、多様な教育背景を正当な人間スタイルとして認識するよう促しています。

本文

ある会話が何度も繰り返されているように感じます。
今回、私を本当に刺激した投稿があります。返信の中で指摘された点は非常に重要で、この議論全体をさらに苛立たせるものです:実際に英語を学ばなければならなかった人がいるという事実です。

まず説明します。
最初の出来事――おそらく「これから来る時代の兆し」と受け取るべきだった――は今年早い段階でした。数日間かけて仕上げた提案に対して次のような返信が届きました。

「このベースはとても堅実ですが、もう少し人間味を加えて書き直せますか?ちょっとChatGPTで書いたみたいです。」

「人間味」――その言葉だけで思考が揺れました。私は戻ってきたのです。

ここで重要なのは、増え続ける作家たちがこのような返信を受け取る傾向にあり、その裏には私見ですがかなり暗い側面と陰湿さがあるということです。少し待ってください、そしてその点に戻ります。皮肉の一部は祖先が笑っていたようなものです。告発者自身も完全に間違っているわけではありませんでした。

私の文章は、大規模言語モデル(LLM)の出力と何らかのDNAを共有しています。私たちは両方とも構造化され、バランスの取れた文を好みます。また、論理的な流れが疑問視されないように接続詞や遷移語を多用します。そして、時折(そして今では告発的になった)ハイフン・セミコロン・エムダッシュで関連する考えを繋ぎます。

冷静になってみると、彼らの判断ミスは「何」ではなく「なぜ」であることが分かります。彼らは起源を誤解していたのです。

—私は作家です。ケニア人であるという特別な条件も備えた作家です。そして私の結論はこうです:私はChatGPTのように書きません。
ChatGPTは奇妙で、身体がなく、世界中から情報を取り込んでいる方法で、私と同じように書くのです。あるいはもっと正確には、非常に特定の教育・社会的パイプラインを通過した数百万の人々のように書きます。このパイプラインは曖昧さを削ぎ落とし、思考を非常に特定で正式な形へと鍛え上げることを意図しています。

自己称するAI探偵たちが増えており、彼らは「証拠」を設計・詳細化し、フォロワーに対して機械的な兆候のチェックリストを与えています。
テキストが furthermoremoreoverconsequentlyotherwisethusly のような語句を使っているか? 完全に平行構造で「XだけではなくYもある」という古典的表現を用いているか? 主要ポイントをきれいな論理的三連でまとめているか?

デジタル不真実の探偵たちへこう告げます。
親愛なる友よ、ケニアの教室・ボードルーム・オフィスTeamsチャットでの典型的な火曜日にようこそ。あなたが機械の指紋だと特定するものは、実際には私たちの教育の化石記録です。

私の文体の基盤はシリコンバレーでプログラムされたわけではありません。それはケニア初等教育証明(KCPE)の高圧炉で鍛えられました。私の世代と後続の世代にとって、英語作文試験―そしてスワヒリ語版 Insha ―は単なるテストではなく、通過儀礼でした。それは人生を左右する「成功か失敗か」の40分間、高圧の競走です。豊かな語彙と洗練された文構造を、極度のプレッシャーの中で駆使できるかどうかが、将来や国立高校への進学、そしてそれに伴う人生軌道を決定します。

この瞬間は例外ではありませんでした。3年間(もっと長いと言えます)にわたるすべての英語授業と宿題は、教師が作文採点時に可能な限り最高点(40点)を与えるよう設計されていました。38/40点? そのペーパーを採点する人はあなたをマルキアット・シンと同じ空気を呼吸できるほど価値ある存在だと判断したのです。

黒板に先生が流麗な筆記で書いたプロンプトを覚えてください。
「私が決して忘れない休日」
または、全体を書き終える際に「…そしてそこで私は目覚めて、それがただの夢だったと気付いた」と締めるよう要求するものもありました。テーマ自体はほぼ無関係で、本当に重要なのは実行でした。

教師から生徒へ世代を超えて伝えられる暗黙のルール、戒律が存在しました。
第一戒? ことわざや力強いオープニング文で始めること。「急ぐと浪費する」など、市場へ急いで金を忘れた話に移ります。
第二戒? 広範な語彙を示すこと。単なる walk ではなく purposefully strodewearily trudged、または nonchalantly ambled と表現します。見たものを beheld a magnificent spectacle と描写します。私たちの演習ノートにはこうした「ワオ語」がリスト化され、その同義語・反意語が暗記させられました。
第三戒、そして最も重要な戒律? 構造です。エッセイは完璧な建物であるべきでした。序論は基礎、本文は壁、結論は屋根―物語の教訓を要約し、巧みに初めのことわざに戻して満足感と予測可能なループを作ります。段落は強力なトピックセンテンスを中心に構築されるよう教えられました。分割文(句切り)の罪と複合複雑文の美徳を学び、赤ペンで批評しながら私たちは「良い」書き方という特定モデルをトレーニングしました。過去の優秀な生徒が読上げる完璧なエッセイは、私たちにとっての訓練データでした。

この文化は高校へも受け継がれます。設定された教科書を暗記し、特定の主張について詳細に議論することで英文学の合格点を超えることが求められました。夜中にシェイクスピアを朗読できるほどです。

もちろん、このスタイルにはマイクロチップよりも古い歴史があります。それはイギリス帝国の直接的な言語継承です。私たちが学んだ英語は、現代ロンドンやカリフォルニアで流れるスラングと便利な省略形を備えた流動的な言語ではありませんでした。それは女王の英語、植民地主義者・宣教師・校長の言語でした。聖書、シェイクスピア、法律の言語です。権力のツールであり、その正確さを学ばされました。

その正式な韻律、やや古風な語彙、硬直した文法構造をマスターすることは、単に試験に合格するためではありませんでした。それはシグナルでした。教育を受けた証、文明化された証、人が物事の秩序で自らの位置を取る準備ができているという証です。

(抵抗しようとしましたが、やめられませんでした。そして恐らくあなたもそれに気づいているでしょう:3つを見る?)

独立後のケニアでは、この言語は消えませんでした。機能を変えただけです。公式言語、チャンスの言語、新たな階級と洗練さの指標となりました。その時代のチャールズ・ンジョノスやトム・ムボヤはそれを使って社会で自らの地位を示しました。「正しい」フォーマル英語を話し、書く能力が、持ち主と持たざる者を分けました。それは大学への扉、企業の仕事、村を越えた人生への鍵でした。教育制度はそれを教えることにさらに注力し、ほぼ完璧な状態で保存しました。

そしてここに、この長い歴史的ジョークのパンチラインがあります。AI、大規模言語モデルは膨大なテキストコーパスから学びますが、その多くは公式です。過去200年間に出版された書籍、学術論文、百科事典、法的文書、人類知識全体のアーカイブから学びます。機械は権威と精度を結びつけることを学びます。結果として、AIはKCPE卒業生でA点を取った英語作文を書く人のように聞こえるようになり、英国帝国の言語的幽霊を偶然再現します。

今、私たちの非常にヒューマンでアナログな訓練結果を「人工」と呼ぶ世界が、新しい技術レンズを通してそれを見るとき、その侮辱はさらに鋭くなります。いわゆるAI検出器は中立的な真実の仲裁者ではありません。彼ら自身も特定の文化・技術的世界観の産物です。

私が理解する限り、これらの検出器は「パープレキシティ」と「バーストネス」の2つを測定します。
パープレキシティ はテキストがどれだけ予測可能かを評価します。「猫が…」という文を始めると、脳とAIは floor を予測します。このように予測しやすいフレーズで満たされたテキストは低パープレキシティとなり「ロボット的」と判断されます。
バーストネス は文長・構造の変動を測ります。自然な人間の話し言葉や書き方は『短い強力な文 → 長く回る文 → もう一度短い』という「バースティ」パターンです。LLM(少なくとも初期形態)はより均一な長さで、単調なリズムを保つ傾向があります。

再び私たちの訓練を考えてみましょう。明確・論理的・予測可能であることが求められました。文構造は一貫しバランスが取れているべきでした。検出器が「人間性」を示すとする burstiness を避けるよう教えられました。優れた作文は滑らかに流れ、各文が前の文を完璧な論理で構築します。結果として、私たちは低パープレキシティ・低バーストネスのテキストを生成するよう訓練されました―これがツールが「非人間」とフラグ付けする正確な条件です。

最近の学術研究は、これらのツールが不安定であり、特に英語非母国語話者のテキストをAI生成と誤判定しやすいことを確認しています(そして再び戻ります)。皮肉は憎むほどです。あなたは一生かけて言語を習得し、その正式なルールを最も厳密に守ることで、機械が海を越えて呼ぶ「偽物」と見なされます。

したがって私の作品―あなたが見る我々の作品―で何を見るのでしょう? あなたはロボットの魂のない散文を見ているのでしょうか? それとも、標準8年生英語教師・アモロー先生の声を耳にしているでしょうか――過去の時代の切れ味のある正確なアクセントで、段落を適切なリンクフレーズで結ぶよう促す。アルゴリズムの出力なのか、それとも千もの手書きエッセイの筋肉記憶なのか。

「人間的」文章とは何かという問いは、危険ほど狭く定義されつつあります。アメリカ中心主義的な口語表現やある種の非公式で会話調のリズムを持つことが、人間性の証だとされるならば、ラグナス・バンガロール・キングストン・ナイロビから来たあなたはどうなるでしょうか? 精度が言語と読者への最高敬意であると教えられた人として。

それは同じ古い闘争の新境地です:見てもらうため、理解されるため、他者に容易に与えられる「人間性」の前提を得るため。私の文章は機械の産物ではありません。それは私の歴史の産物です。植民地主義遺産の反響であり、厳格な教育の成果であり、自国の公式言語を習得するために必要とされた努力の証です。

指を差し出して「AI!」と叫ぶ前に、一息置いてください。あなたが見ているものは人間性の欠如ではなく、別の形態の人間性である可能性があります。異なる教育・歴史・標準の結果かもしれません。単にケニア人の執筆を観察しているのです。そして私たちは長い時間、この方法で書き続けてきました。

同じ日のほかのニュース

一覧に戻る →

2025/12/16 6:37

Fix HDMI-CEC weirdness with a Raspberry Pi and a $7 cable

## Japanese Translation: > **概要:** > Samsung S95B TV(論理アドレス 0x00)、Denon AVR‑X1700H(0x05)、Apple TV、PS5、Xbox Series X、Nintendo Switch 2、および `/dev/cec0` をリッスンする Raspberry Pi 4 が含まれるホームシアター構成で、テレビの入力にのみ切り替えるコンソールが原因となるオーディオルーティング問題を著者は解決します。 > Pi(論理アドレス 0x01)から AVR に「System Audio Mode Request」パケット(`15:70:00:00`)を送信することで、受信機は ARC を有効化し、すべてのコンソールオーディオをテレビではなく自身経由でルーティングします。 > 著者は Python スクリプト `cec_auto_audio` でこれを実装しており、長時間稼働する `cec-client -d 8` を起動し、TRAFFIC 行から Active Source イベント(オペコード 0x82)を解析し、以前に Set System Audio Mode(オペコード 0x72)が検出されていない場合に毎回ウェイク時にパケットを送信します。 > スクリプトは systemd サービス `cec_auto_audio.service` としてパッケージ化され、起動時に開始されます。これにより、多層の HomeKit/Eve オートメーションと比べて低レイテンシで軽量な代替手段を提供します。 > トラブルシューティングガイドには、スキャン(`echo "scan" | cec-client -s`)、トラフィック監視(`cec-client -m`)、および欠落オペコード(0x82, 0x84, 0x70, 0x72)の良いケースと悪いケースの比較が含まれます。 > 残るエッジケースとして、コンソールのスタンバイがテレビチューナーを起動させる場合や HomeKit オートメーションがアクティブなソースなしでテレビをオンにする場合などには、追加の状態機械ロジックが必要になる可能性があります。著者はコミュニティメンバーに対し、より広範なトラブルシューティングのために CEC パケットトレースを共有してもらうよう呼びかけています。

2025/12/11 8:54

Nature's many attempts to evolve a Nostr

## Japanese Translation: **要約** 人気のあるアプリケーションの普遍的な設計は、ユーザーのデータと暗号鍵を所有する単一クラウドサーバーに集中しています(「あなたの鍵がないなら、あなたのデータではない」)。この中央集権化は封建制や寡占構造を生み出します。サーバーは橋を上げてユーザーを切り離す城のような存在です。フェデレーション(例:Mastodon、Matrix)はサーバー間で通信できるようにしますが、鍵とデータは依然としてサーバーの管理下にあり、ネットワーク理論はそのようなフェデレートシステムがスケールフリー分布へ収束し、支配的なハブを生み出すと予測しています。これはGmail/ProtonMail のメール寡占や Facebook Threads の ActivityPub ノードが Fediverse を支配する現象として観察されています。 セルフホスティングは居住IPの禁止やインフラコストにより多くのユーザーが個人サーバーから離れるため、非実用的になります。ピアツーピアネットワークはユーザー所有鍵を提供しますが、拡張性、信頼できないノード、スーパーpeer の中央集権化、複雑な最終的一致メカニズム、および長い多ホップルーティング遅延に悩まされます。 Nostr プロトコルは「リレーモデル」を提案します。単純で信頼できないリレーは署名されたメッセージを転送するだけで、相互通信しません。これにより \(N^2\) スケーリング問題を回避します。ユーザーは数個(通常 2–10)のリレーユーザーに購読し、自分のデータと鍵を完全に制御でき、リレーが失敗または停止した場合でも信頼性高く離脱できます。広く採用されれば、これはユーザーに真の所有権と単一点障害への耐久性を与え、中央集権サーバーに依存する企業に対し、よりユーザー中心で分散型アーキテクチャとの競争を強いるでしょう。これにより、ソーシャルメディアやメッセージングは真の分散モデルへと再構築される可能性があります。

2025/12/12 15:47

“Are you the one?” is free money

## 日本語訳: --- ## 要約 この記事は、番組「Are You the One?」の参加者が数学モデルを用いて、最終エピソード前にほぼ確実に全ての正しいカップルを推測できる方法を説明しています。戦略的にトゥルーブースとエピソード終了時のマッチアップデータを活用することで達成されます。 - **ゲーム設定**:10人の男性と10人の女性が、色でのみ明らかになる10組の完璧なペアに分けられます。参加者はすべてのペアを正しく推測し、100万ドルを獲得します。 - **情報源**: - *トゥルーブース* は特定のペアが成立しているかどうか(バイナリ結果)を確認します。 - *エピソードマッチアップ* はそのラウンドで正しいペアの総数のみを明らかにします。 「ブラックアウト」エピソード(0件マッチ)は、そのラウンド内のすべてのペアについて否定的な情報を提供し、複数のトゥルーブースと同等の効果があります。 - **モデル**:著者は OR‑Tools の最適化フレームワークを構築し、シーズン開始時に約400万件の有効マッチング(≈4 百万)を追跡し、各イベント後に更新します。シーズン1ではエピソード8でモデルが「解読」されました。 - **情報理論**:各イベントは約1〜1.6ビットの情報量を提供します。シミュレーションでは ~1.23 bits/イベント、実際の番組データでは ~1.39 bits/イベント、最適戦略で最大 1.59 bits/イベントが得られます。全検索空間は約22ビット(10!)を必要とするため、完璧な戦略には平均して約1.1 bits/イベントが十分です。 - **結果**: - ランダムペアリングでは、カップル数に関係なく平均正解スコアは約1になります。 - 100シーズンのランダムシミュレーションでモデルを使用した成功率は74%でしたが、情報理論戦略では98%に上昇します。 - 実際の番組データ(7シーズン)では71%の成功率と約1.39 bits/イベントとなり、純粋なランダムよりわずかに優れていますが、理論的最適値にはまだ届きません。 - **今後の作業**:著者はインタラクティブなウェブツールを開発予定で、ユーザーが異なる戦略を試し、必要な情報ビット数を確認し、実際のデータとパフォーマンスを比較できるようにします。 **影響** 本研究は参加者やプロデューサーに対して効率的な質問設計のための具体的なアルゴリズムフレームワークを提供し、エンターテインメントにおける組合せ最適化とベイズ推論の実用例を示すとともに、研究者にリアルワールドケーススタディとしてさらなる探求の機会を与えます。

I'm Kenyan. I don't write like ChatGPT, ChatGPT writes like me | そっか~ニュース