Your job is to deliver code you have proven to work

2025/12/18 23:52

Your job is to deliver code you have proven to work

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

ジュニアエンジニアは、言語モデルによって生成された大きく未テストのプルリクエストを提出することがよくあり、レビュアーの時間を浪費し、開発者の責任感を損ないます。本文では、LLM を通じて追加されるコードは、手動で(関連状態を設定し、変更を実行し、結果を文書化する)と自動で(それらの手順をテストハーネスに反映したテストを書く)の両方で機能することが証明されなければならないと主張しています。Claude Code や Codex CLI のようなコーディングエージェントは、人間と同様にコードを実行し検証します。そのため、彼らも同じ機能性の証拠を必要とします。歴史的には、LLM が生成したパッチは検証なしに追加されていましたが、今日ではエージェントがテストを走らせ、問題を反復し、既存のテストスイートを拡張するためにますます利用されています。また、エージェントは一度限りの視覚チェック(例:CSS 変更のスクリーンショット取得)や CLIRunner を使った CLI ツールの実行も行うことがあります。したがって、開発者はエージェントが再利用できるように、よく構造化されパターン豊富なテストを保持しなければなりません。このシフトによりレビュアーの時間が節約され、コード品質が向上し、LLM 支援開発への厳格な責任追及とともに、テスト自動化実践も強化されます。

このバージョンは主要なポイントをすべて保持し、スクリーンショット取得についての根拠のない推論を除外し、エージェントの将来役割を過大評価せずに明確にしています。

本文

2025年12月18日

ソフトウェア開発におけるAI支援の価値を巡る議論では、いつも見かける落ち込むような逸話があります。
それは、あるクラスのLLMツールに力づけられたジュニアエンジニアが、大量でテストされていないPR(プルリクエスト)を同僚やオープンソースメンテナに投げ込み、「コードレビュー」プロセスに残りの作業を任せるというものです。

それは失礼で、他人の時間を浪費し、正直なところソフトウェア開発者としての義務怠慢にも等しい。あなたの仕事は、動作が確認できたコードを届けることです。


コードが動くことを証明する方法

コードが動くと証明するには二つのステップがあります。どちらも省略できません。

  1. 手動テスト

    • 自分で正しく動作しているのを確認しなければ、そのコードは動きません。
    • 手動テストスキルは実際に身につける必要がある真剣なスキルです:変更を示す初期状態へシステムを設定し、変更を実行し、期待した効果が現れたことを確認・デモします。
    • 可能であれば、これらの手順をターミナルコマンド一連にまとめ、出力も合わせてコードレビューコメントへ貼り付けます。
    • 難しい変更の場合は画面キャプチャ動画を撮影し、PR に添付します。
  2. 自動テスト

    • LLM ツールのおかげで今やこれが以前よりずっと容易になりました。省略の言い訳は通用しません。
    • あなたの貢献は、変更とそれを証明する自動テストを一緒にパッケージ化すべきです。実装を元に戻した場合に失敗します。
    • プロセスは手動テストと同様です:システムを既知の状態へし、変更を実行し、正しく機能したことをアサートします。

「自動テストがあるので手動テストは不要」と思って飛ばす誘惑に負けないでください。私自身も何度かやったらすぐに後悔しています。


コーディングエージェントにまず証明させる

2025年の最重要トレンドは、Claude Code や Codex CLI など、作業中のコードを実際に実行して動作確認し問題点を修正できる「コーディングエージェント」の爆発的な成長です。
これらのツールをマスターするには、変更が機能することを証明させる方法を学ぶ必要があります。

  • 彼らは同じプロセスに従います:開発中に手動テストし、次に将来の安定性を保証する自動テストを書きます。
  • CLI ツールを扱う際は Claude Code に一度だけ実行させ、後で
    Click
    CLIRunner
    などを使った自動テストへ移行します。
  • CSS の変更では、エージェントにスクリーンショットを撮らせて期待通りの変化があったか確認させます。

コーディングエージェントはテストを書くためにほとんど刺激を必要としませんので、テストコードを整理整頓し、自分好みのパターンで満たしておくことが重要です。こうすることで彼らはあなたの味覚に合ったテストコードを書きやすくなります。良いテストの趣味を身につけることも、シニアエンジニアと差別化できるスキルです。


人間が責任を担う

コンピュータは決して責任を問われません ― それはあなた人間の役割です。
ほぼ誰でも LLM に数千行のパッチを書かせてコードレビューへ提出できます。これだけでは価値がありません。重要なのは、動作することが証明されたコードを提供することです。

次回 PR を送る際には、必ず「正しく動く」ことを裏付ける証拠を添えてください。

同じ日のほかのニュース

一覧に戻る →

2025/12/19 4:08

We pwned X, Vercel, Cursor, and Discord through a supply-chain attack

## Japanese Translation: Discordの新しいドキュメントプラットフォーム、Mintlifyにおいて、`/_mintlify/_static/[subdomain]/[…route]` エンドポイントを介して配信される任意の静的ファイルに悪意あるJavaScriptを注入できるクロスサイトスクリプティング(XSS)脆弱性が判明しました。16歳の高校生研究者は、Discord のドメインを指すSVG内にコードを埋め込み、そのリンクを開いた際にスクリプトが実行されることで、このサプライチェーン脆弱性を検証し、Mintlify の全顧客に影響する可能性があることを示しました。この欠陥は「xyzeva」という友人によって独立して確認され、両者は協力してテストと開示を行いました。報告後、Discord はドキュメントの公開を2時間停止し、以前のプラットフォームに戻し、すべての Mintlify ルートを削除(インシデントリンク: https://discordstatus.com/incidents/by04x5gnnng3)し、Mintlify は Slack を通じて問題を修正しました。研究者たちは合計で約11,000ドルの報奨金(Discordから4,000ドル、残りは Mintlify から)を受け取りました。この事例は、Twitter (X)、Vercel、Cursor、Discord 自体など多くのハイプロファイルユーザーに脅威を与える可能性がある単一のサードパーティコンポーネントのリスクを浮き彫りにし、外部サービスへのより厳格な検証と広範なセキュリティ監査の必要性を強調しています。

2025/12/17 6:04

Texas is suing all of the big TV makers for spying on what you watch

## Japanese Translation: > **概要:** > テキサス州司法長官ケン・パクストンは火曜日にソニー、サムスン、LG、ヒセン、TCL を対象に訴訟を提起し、同社のテレビが自動コンテンツ認識(ACR)を使用して視聴者の視聴内容を秘密裏に記録していると主張した。ACR はテレビ番組、ストリーミングサービス、YouTube、セキュリティカメラ、Apple AirPlay/Google Cast、および HDMI 接続デバイスなど、多岐にわたるソースから視聴覚データを取得し、訴訟ではメーカーがユーザーに対して隠れたまたは曖昧な開示で ACR の起動を促すと主張されている。サムスンとヒセンは 500 ミリ秒ごとにスクリーンショットを取得し、パクストンはデータがユーザーの知識なしに各社へ送信され、ターゲティング広告のために販売されると述べている。訴訟はテキサス州詐欺取引慣行法(Deceptive Trade Practices Act)を引用し、民事罰金およびテキサス州居住者からの ACR データ収集・共有・販売の停止を求めている。パクストンはまた TCL とヒセンの中国との関係に懸念を示し、同社のテレビを「中国支援監視デバイス」と呼んでいる。訴訟は Vizio が 2017 年に FTC およびニュージャージー州と合意した 220 万ドルの和解金を参照しており、類似の主張があったことを示している。サムスン、ソニー、LG、ヒセン、および TCL はまだコメント要請に応じていない。パクストンは「テレビを所有することは、ビッグテックや外国対立勢力に個人情報を渡すことを意味しない」と述べ、プライバシー保護への重点を強調した。

2025/12/19 3:55

How China built its ‘Manhattan Project’ to rival the West in AI chips

## Japanese Translation: **改善された要約** 深圳の研究所が、極紫外線(EUV)リソグラフィを使用して高度な半導体チップを製造できるプロトタイプを完成させました。EUVリソグラフィは、人間の髪の数千倍薄い回路をシリコンウェーハに刻むプロセスです。この機械は工場全床面積のほぼすべてを占める規模で、2025年初頭に完成し、現在テスト中です。元ASMLエンジニアがオランダ企業のEUV装置を逆解析して構築したもので、西側企業が長らく独占してきた技術です。プロトタイプが意図通りに機能すれば、中国はより細密な回路を持つチップを製造できるようになり、AIシステムやスマートフォン、高度兵器の性能向上につながります。この進展は、西側の独占的半導体製造能力から重要な技術が移転する可能性があり、世界のサプライチェーンと競争構造を変えることになるでしょう。