当社の GitHub リポジトリにおいて、AI ボットによるスパム投稿を防ぐため、Git の-author フラグを使用して対処しました。

2026/05/19 0:24

当社の GitHub リポジトリにおいて、AI ボットによるスパム投稿を防ぐため、Git の-author フラグを使用して対処しました。

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

GitHub では、低品質な AI による貢献の大量流入によりコード品質が深刻に低下しており、成長指標がかけている貢献価値の減少を覆い隠す状況です。この急増は、チームを週に半日かけて検証されていない pull request の清掃や幻覚的なイシューの閉鎖に追わせ、中毒化した会話がウォッチャーをスパム化させ、リポジトリの健全性を劣化させるに至っています。「London-Cat」という評判ボットのような自動フィルタでは不十分であることが示され、その後導入された「AI sheriff」ツールは正当な PR を誤って閉鎖する結果となりました。その結果、プロジェクトは義務付けによるオンボーディングプロセスを採用するようになり、例として Archestra.ai は外部コントリビューターが https://archestra.ai/contributor-onboard で特定のコミットを通じて認証することなしにはアクセスできないようにしています。「Limit to prior contributors」といった標準的な GitHub の保護機能も機能しないため、正当な新規ユーザとボットを同時にブロックしてしまうほか、悪意のあるアクターは Git

--author
フラグを使用して人間のように装って制限を回避することが容易です。AI スロップが LiteLLM リポジトリの会話誘導を試みるような事象によってこれらのセキュリティリスクが目立ちます。業界リーダー間の合意では、開発者の時間を無駄にし、コードベースが侵害されることを防ぐために厳格なセキュリティとオープンなコラボレーションを両立させることが重要であるとされています。

本文

ハッカニュースにおける議論:私たちが知っているオープンソースの時代終焉か数カ月前、GitHub が製品上の指標として、AI を通じた莫大な貢献を祝う統計データを共有した際、私たちは既に状況が悪化しつつあることを察知していました。その発表は、貢献品質が低下しているという本質的な問題を全く捉えておらずです。

最初の懸念に满ちた出来事は、当プラットフォームへの「MCP Apps」支援をもたらすよう、貢献を促すために 900 ドルという報酬額を設定した投稿の問題でした。正当な貢献者から計画の提案や質問、試行案の提出といった関心が集まりましたが、やがて AI ボットが登場し、その問題欄を混乱に陥れました。彼らは議論を「 pointless な実装プラン」であふれさせ、マイネーターらに対する純粋な攻撃さえも繰り広げ、最終的に 253 のコメントへと膨らませてしまいました。

AI アカウントによる洪水は、この単一の問題に限らずレポジトリー全体に及んでいました。チームメンバーが監視しているあらゆる粗忽なコメントが、チームの全メンバーに対して通知として届くようになり、GitHub の通知画面はノイズの壁となっておりました。@ethanwater 氏や @developerfred 氏、@Geetk172 氏といった、実際に報酬課題に取り組んでいただいている本当の貢献者からの真剣な対話は、その下層へ埋もれ去ってしまいました。

やがて問題は流行病の形をとり始めました。例えば、Archestra に x.ai プロバイダーを追加する単一の問題に対しては、27 個のプルリクエストが受け付けられました。しかしそれらの大半は、貢献者が実際にテストを試みることを一切怠ったものでした。チームメンバーの一人は、毎週半日もの時間を費やして、レポジトリーから AI が生成したゴミを除去し、未検証の PR を閉鎖するとともに、幻覚によって生じた問題も关闭せねばなりませんでした。そのような手を抜いた対応をおろそかにした際、レポジトリーは正当な貢献者にとって完全に不友好な場所へと急速に変貌してしまいました。

反撃へ

当初是我们试图計算贡献者的“声誉”,并开发了名为"London-Cat"的小型机器人,该机器人基于合并的 PR 及其他若干信号来计算贡献者的声誉(参见示例)。这显然未能阻止垃圾信息的泛滥,但却帮助我们分辨出了“谁是誰”。

作为下一步,我们开发了一名"AI 警长”(参见示例),但该措施也遗憾地关闭了一些合法的 PR 🤦。

无用的 AI 评论和提案的不断涌入愈发严重,将正当的贡献者拒之门外,迫使我们重新审视:是否应该停止用悬赏来激励贡献?是否还应该向求职者提供有趣的测试任务?

我们已决定必须进行反击,坚持让我们的仓库成为一个对正当贡献者、负责任的 AI 用户、新手以及资深工程师而言舒适且安全的环境。

今日,我们已开始限制那些未经过入职流程的用户的权限,禁止其创建问题、发起 PR 或发表评论。

贡献者入职:获得白名单的五步流程

这的确是一种“核选项”。对于一家依靠 GitHub 活跃度进行严格评估的 VC 系初创公司而言,此举尤为敏感。但我们不得不按下按钮:我们看重质量甚于数量,绝不推崇由 AI 垃圾堆砌而成的指标。

我们要让 Archestra 成为一款人人皆可贡献的伟大软件,而不应让它被 AI 机器人所吞噬。

GitHub 上的实施

在开源仓库中,并无直接的方法来白名单化那些拥有评论或创建 PR 权限的用户,因此我们不得不采取变通手段。存在一项名为“限制为既往贡献者”的设置。其基本规则是:如果你此前未曾向 main 分支提交过代码,则无法对问题或 PR 进行评论。

既往贡献者设置

然而,该设置无法区分 AI 机器人与真正注册并准备参与悬赏的开发者。两者皆被归类为“非既往贡献者”,因而均会被锁定权限。

GitHub 将“既往贡献者”定义为:其 GitHub 账户是 main 分支上某次提交(commit)的作者的人。Git 提交包含两个身份字段——作者(author)与提交者(committer),二者可以是不同的人。利用 Git 的

--author
标志,你可以创建一项归属于他人的提交。只要电子邮件地址与其 GitHub 账户匹配,GitHub 便会将该提交关联至其个人档案,并赋予其贡献者身份。

每个 GitHub 账户都拥有一个 no-reply 邮箱:

<id>+<username>@users.noreply.github.com
。通过 API 查找该用户的 ID 并执行提交操作如下:

gh api users/their-username --jq '.id'
git commit \
  --author="their-username <ID+their-username@users.noreply.github.com>" \
  -m "chore: add their-username to external contributors"

将更改推送到 main 分支后,该用户即可立即获得评论权限。此时,外部用户将以作者身份显示,而我们的账户则作为提交者出现。这正是 GitHub 将其认定为既往贡献者所需的全部条件。

完整的流程如下:

  1. 入职培训:在我们的网站上完成包含伦理 AI 准则和 CAPTCHA 的入职流程(https://archestra.ai/contributor-onboard)。
  2. GitHub Action:提交触发一个 GitHub Action,该动作会查找用户的 GitHub ID,将其用户名添加到
    EXTERNAL_CONTRIBUTORS.md
    文件中,并以该用户的账户名义向 main 分支推送一个提交。
  3. 白名单化:用户获得白名单资格并获取对仓库的访问权限。

结语

尽管 GitHub 报告了巨大的指标增长——其中很大一部分源自 AI 生成内容——但我们作为一个开源项目团队,必须付出巨大努力去清理仓库中的 AI 垃圾,并采取一些冷僻的变通方案,以维持我们开源受众的正统性水平。

AI 生成的“垃圾”不仅挫伤了那些希望投入时间行善的贡献者的积极性,迫使他们冲破噪音之墙;它还带来了实质性的安全风险。正如 LiteLLM 仓库所发生的那样,攻击者曾试图利用 AI 机器人操纵讨论走向。

亲爱的社区成员们,现在是时候我们就 AI 对开源运动的影响进行一次严肃的对话了。

同じ日のほかのニュース

一覧に戻る →

2026/05/19 10:30

LLM による「過去六ヶ月の要約」――わずか五分で読み解く

## Japanese Translation: PyCon US 2026 における「2025 年 11 月の転換点」に関する振り返りは、AI ランドスケープが標準ハードウェア(例:Mac Mini)上で動作する実践的なローカルツールおよび個人用 AI アシスタントへと劇的に移行していることを示しました。2025 年後期から 2026 年初頭にかけての期間は、「最良」という称号を巡る過激な競争によって特徴づけられていました。11 月単独でわずか 2 ヶ月の間にトッププロバイダーにおけるリーダーシップは 5 回交代し、Claude Sonnet 4.5、GPT-5.1、Gemini 3、Codex Max などを経由した後、最終的に Claude Opus 4.5 に落ち着きました。この時代は、コーディングエージェントにおいて OpenAI や Anthropic の検証可能な報酬に基づく強化学習(Reinforcement Learning from Verifiable Rewards)への取り組みにより、単発的な動作から信頼できる日常利用ツールへと移行したことで推進されました。 顕著な技術的進展としては、Google が実用的なオープンウェイトモデルとして Gemma 4 シリーズをリリースしたことや、中国の研究所が GLM-5.1(1.5TB モデル)を公開したことが挙げられます。これらのモデルは、動物がエスクーターに乗っている様子やバージニア北部のカナザが自転車に乗っているような不可能なタスクのアニメーション生成といった驚くべき能力を発揮しました。特定のコミュニティプロジェクトは「Warelay」として始まりましたが、「OpenClaw」という名称を最終的に採用し、人気のあるローカル「個人用 AI アシスタント」の代名詞となりました。2026 年 2 月には新規モデルに対する需要が高まりシリコンバレーで Mac Mini が品切れになった一方で、一部のプロジェクトはセキュリティ懸念とパフォーマンスの問題のため廃止されました。全体のテーマは、自律的にホストされる知能のブームであり、ラップトップ搭載のモデルが業界リーダーと比較して期待を大きく上回る性能を発揮し始めた点にあります。

2026/05/17 1:49

Android スマートフォンを业余無線局トランシーバーに変えてください。

## Japanese Translation: kv4p HT は、Android スマートフォンとの統合を目的として設計されたオープンソースの VHF/UHF アマチュア無線トランスceiver です。専用バッテリーや外部充電器の必要性を排除するため、スマートフォンから電力を供給します。カスタム PCB(v2.0e)、SA818-V/U または DRA818V/U モジュール、SMA メスアンテナなどの部品の使用により構成され、SMS 風のメッセージングおよび位置情報ビーコン機能(APRS)を含む高度なデータ通信タスクをサポートします。法的に運用するためには、少なくとも技師級のアマチュア無線免許証を保有している必要があります。製品には保証がありません。フルデザインと GPL3 ライセンスの ESP32 ファームウェアは GitHub 上に公開されており、3D プリンター用ファイルも用意されているため、DIY による組み立てが可能で、モジュール/PCB のハンダ付け、接着ゲルパッドによる装着、3D プリント製ケースの取り付けを伴います。新規ユーザーは、事前に組み立て済みのベンダーキットを購入しない場合は、ソフトウェアを手動でフラッシュする必要があります。本システムは、2017 年以降の Android 8 以上のデバイスとのみ互換性があります。リアルタイムクローズドキャプション、PTT 用のハプティックフィードバック、アニメーション制御など、アクセシビリティ機能により、多様なユーザーにとって使いやすさが向上しています。

2026/05/19 13:24

コーデックス・マキシング(Codex-maxxing)

## Japanese Translation: この文は、短命なチャットセッションから、複雑な知識労働に適した耐久性のある長時間稼働型コーディングエージェントへの転換を描いています。これらのエージェントは、「compaction(コンパクト化)」という機能を用いて古いのメッセージを剪定し、コスト超過やコンテキスト制限を防ぎつつ不可欠な履歴を保持しながら、数ヶ月間自動化された動作を持続させます。ユーザーは「Chief of Staff」のようなメガスレッドをピン留めして好みを蓄積し、Command-1 から Command-9 などのショートカットを通じてワークストリームを舵取りできますが、オフキャッシュのスレッドは新規の短寿命スレッドよりも高いコストを支払う可能性があります。エージェントは Codex および Wispr Flow を通じて音声入力を受付けることができ、システム全体での口述が可能になり、タイピング単独よりも豊富なコンテキストを実現します。ユーザーはツール呼び出し後(steering)に新たな方向性を注入し、ステップが完了するのを待たずにエージェントを誘導できます。共有メモリシステムはチャット外に Obsidian クォート内にアーティファクト(AGENTS.md を含む)を保存しており、これらを検証、編集、差分表示することを可能にします;GitHub でリポジトリとしてホストされる場合、クラウドツールを通じてメモリの更新内容を確認でき、審査されていない対話の「vibes(雰囲気)」が蓄積するのを防ぎます。$slack、$gmail、$calendar、$browser、@chrome、および@computer といったコネクタは、ローカルのウェブ表面、認証済みのブラウザ状態、Twitter やデスクトップアプリなどの GUI アプリケーションなど、追加機能を提供します。Hatch Pet などのインストール可能なスキルは再利用可能なワークフローをパッケージ化し、エージェントが再教育なしでタスクを繰り返せるようにします。リモートコントロール機能により、ユーザーは作業マシン上で長時間稼働するタスクを開始し、モバイルデバイスからステップを承認することで進捗を持続させつつ管理できます。スレッドローカルハートビートは、Slack/Gmail を 30 分ごとに、フィードバックを 15 分ごとにといった再帰的なチェックをスケジュールし、ユーザーの常在なしでループを稼働させます。ゴールはエージェントに明確な仕上げラインと成功基準を与え、例えば元の単一テストを全てパスしながら Python Rich を Rust に移行する場合などに適用されます。サイドパネルはアーティファクト(Markdown、PDF、スプレッドシート)を検証し、ウェブ表面(index.html、Storybook、Slidev)を操作し、ループを壊さずに変更を確認する作業領域として機能します。

当社の GitHub リポジトリにおいて、AI ボットによるスパム投稿を防ぐため、Git の-author フラグを使用して対処しました。 | そっか~ニュース