「やっぱりもっと落ち着いて、スピードを落とすべきだという考え」

2026/03/25 23:07

「やっぱりもっと落ち着いて、スピードを落とすべきだという考え」

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:


要約

この記事は、AiderやCursorなどのAIコーディングエージェントが普及している一方で、それらを唯一の開発ツールとして使用すると脆弱で保守しにくいソフトウェアになると警告しています。企業による「フリーホリデー」アクセスや98 %稼働率の約束が急速な採用を促進しますが、AWSの障害やMicrosoftがすべてのWindowsコードはAIで書かれたと主張した事例など、実際の問題が品質の課題(UIバグ、重複した抽象化、過剰な複雑さ、大規模プロジェクトでの低い再現率)を示しています。人間による監視なしにこれらのエージェントは「ボブー」を継続的に生成し、時間とともに増大する保守コストやミッションクリティカルな失敗のリスクを高めます。

この問題を緩和するために、開発者はAI使用を限定した範囲で、ミッションクリティカルではないタスクにとどめ、人間が最終品質ゲートとして機能するようにすべきです。推奨される実践方法は次の通りです:

  • エージェントに評価関数を与え、起動時間など狭い指標のみを測定させ、より広範な品質側面は測らない。
  • ペアプログラミングでエージェントと協働し、コア設計や主要コンポーネントを手書きで作成し、ドメイン固有のテストに焦点を当てるなど、品質ゲートを強制する。
  • 開発ペースを遅らせ、人間が再現性問題をレビューし、必要に応じてリファクタリングできるようにする。

これらの対策を無視すると、企業はより頻繁なバグ、高い維持費、信頼性を失ったソフトウェア産業に直面する可能性があります。主旨は明確です:規律、主体性、人間関係が完全自動化されたエージェント駆動開発の落とし穴を回避するためには不可欠であるということです。

本文

2026‑03‑25

カメの顔は私が業界を見ている姿です


すべてが壊れている

  • ソフトウェア環境は脆弱化しており、98 % の稼働率が例外ではなく常態になっています。
  • ユーザーインターフェースには QA チームで検出できるはずの奇妙なバグが残っています。
  • 企業は「コードの100 % は AI によって書かれた」と主張しつつ、メモリリークや UI の欠陥、機能不全、クラッシュを投げ込んでいます。

エージェントと仕事をしたくない理由

  • 中毒=規律:目的は最短時間で最大量のコードを書き出すことになり、品質が無視されます。
  • エージェントは監督なしにオーケストレーション層として使われることが多く、「ダークファクトリー」が生まれ、ソフトウェアは検証されずに進化します。
  • 機能的プロトタイプを作っても、人間の介入が必要で、本番品質へスケールできません。

学習ゼロ・ボトルネックなし・遅延痛の重積

  • エージェントは学習ループがないため同じミスを繰り返します。
  • 人間開発者はボトルネックで、エラーはゆっくり蓄積され、気づいた時に修正できます。
  • オーケストレーションされたエージェントの軍団は、多数の小さな“ブーボウ”を生み出し、信頼できないコードベースと不安定なテストへと急速に膨らみます。

学習した複雑性の商人

  • 多様なデータで訓練されたエージェントは、不必要な抽象化や重複を伴うアーキテクチャを生成します。
  • 彼らはローカルで作業し、全コードベースや過去の決定を見ることができないため、人間が作った企業システムに似た混乱をより速く生み出します。

エージェント検索の再現率低下

  • リファクタリングに必要なすべての関連コードを見つけるのは難しく、大規模コードベースでは再現率が低下します。
  • 既存コードが抜けると重複や不整合が発生し、複雑性がさらに悪化します。

今のうちにエージェントを使うべき方法(私見)

  1. タスクを適切に範囲設定

    • エージェントが独立して動ける短期・非クリティカル作業に限定。
    • 起動時間など関連メトリクスのみを測定する明確な評価関数を用意し、コード品質は除外。
  2. 人間の監視を維持

    • エージェントをツールとみなし、最終的な品質ゲートは自分自身。
    • 生成されたコードは本番ブランチへマージ前にレビューする。
  3. 遅延と摩擦を導入

    • エージェントが1日あたりに書くコード量を制限し、レビュー容量に合わせる。
    • アーキテクチャ・API 契約・コアモジュールは手作業またはペアプログラミングで設計し、理解を保持。
  4. 探索のためにエージェントを活用

    • 「ゴムくま」的役割としてアイデアを投げ合い、素早くプロトタイプ化。
    • 実装可能なスニペットを抽出し、手作業で洗練。
  5. 再現率向上の反復

    • コードベースのインデックスやベクトルストアを強化して検索支援。
    • エージェントが過去の失敗から学べるようフィードバックループ(例:
      AGENTS.md
      にエラー記録)を設置。

最終的な結論

  • エージェントは強力ですが、万能ではありません。
  • 規律・主体性・人間の判断が保守可能なシステムには不可欠です。
  • 速度と慎重な監視をバランスさせることで、エージェントの長所を活かしつつ弱点を緩和できます。

このページはクッキーや個人情報の収集を行わず、あなたのプライバシーを尊重しています。

同じ日のほかのニュース

一覧に戻る →

2026/03/26 6:11

テスラ・モデル 3 のコンピュータをデスク上で稼働させ、事故車から取り出した部品を使用しています。

## 日本語訳: ## 要約: この記事では、セキュリティ研究のためにテスラ・モデル 3 MCU(モーター制御ユニット)の取得とセットアップ方法を説明しています。テスラのバグバウンティプログラムが研究者に車両内の脆弱性発見を奨励していることを強調し、筆者はeBayから安価な部品(約 $200–$300)を購入し、DC電源と最大8 Aまで供給可能な12 Vアダプタで組み立てました。さらに、Rosenbergerケーブル(パーツ番号1067960‑XX‑E)が必要で、個別販売されていないためダッシュボードロウムを購入しました。BMW LVDSコネクタを使った初期試行ではMAX16932制御チップがショートし、筆者は現地で修復して2つの機能的MCUを得ました。テスラの電気参照書にケーブル部品番号が確認されています。次のステップとして、MCUのユーザーインターフェース、ネットワークインターフェース(CANバス、ポート 22のSSH、ポート 8080のREST‑ライクAPI)を探索し、システム稼働時にファームウェアを抽出する可能性があります。これらの方法でルートアクセスを取得すると、研究者はテスラの「Root Access Program」のための重要な脆弱性を特定でき、車両セキュリティの向上につながる可能性があります。 ## 要約骨格 **本文が主に伝えたいこと(メインメッセージ)** 筆者はテスラ・モデル 3 MCUを取得し設定する方法を示し、その電源供給とネットワークサービスへのアクセス手順を強調しています。 **根拠/推論(なぜこう言われているか)** - テスラのバグバウンティプログラムは研究者に脆弱性発見を促している。 - 筆者はeBayから安価な部品($200–$300)を購入し、DC電源と最大8 Aまで供給可能な12 Vアダプタで組み立てた。 - 配線には特定のRosenbergerケーブル(パーツ番号1067960‑XX‑E)が必要で、個別販売されていないためダッシュボードロウムを購入した。 **関連ケース/背景(文脈・過去事例・周辺情報)** - BMW LVDSコネクタを使用した初期試行は失敗し、即席配線でMAX16932制御チップがショートした。 - 損傷したチップは現地で修復され、2つの機能的MCUが得られた。 - テスラ公開電気参照書に必要なケーブル部品番号が記載されている。 **今後起こりうること(本文中の将来展望/予測)** 筆者はMCUのユーザーインターフェース、ネットワークインターフェース、CANバスを探索し、システム稼働時にファームウェアを抽出する計画だ。 **影響(利用者・企業・業界への影響)** SSH(ポート 22)またはREST‑ライクAPI(ポート 8080)でMCUにアクセスできれば、研究者はテスラのバグバウンティ「Root Access Program」のための根本的脆弱性を特定し、車両セキュリティ向上に寄与する可能性がある。

2026/03/26 3:16

ARC‑AGI‑3(アーク・AGI・3)

## Japanese Translation: ARC‑AGI‑3は、AIエージェントを真に適応的かつ継続的な学習へと導く新しい対話型推論ベンチマークです。モデルに探索・目標追求・環境変化への世界モデリングを課し、単発の回答ではなく効率的なスキル獲得と長期計画を評価します。完璧なスコア(100 %)は、エージェントがすべてのゲームで人間よりも優れたまたは同等の性能を示し、多様なタスクにおける習熟度を証明することを意味します。 ベンチマーク設計は、事前学習済み知識なし、明確な目標、有意義なフィードバック、およびブルートフォース記憶化を防ぐ新規性を重視しています。開発者向けには、エージェントの意思決定が構造化されたタイムラインに記録される再生可能実行、使いやすいAPI、環境アクセスとエージェント統合用の包括的ドキュメント、およびリアルタイムでエージェント挙動を確認できるUIが提供されています。 ARC‑AGI‑3は迅速な反復と透明性のある評価を奨励し、研究者が多様なシナリオで継続的に学習可能なAIシステムを構築する手助けとなります。ユーザーはプラットフォーム上のインタラクティブインターフェースを通じて「エージェントをテストしよう!」と呼びかけられ、プレビュー再生でエージェント挙動を反復的にテスト・検査できます。

2026/03/26 5:27

EUは、依然としてあなたの個人メッセージや写真をスキャンしようとしています。

## Japanese Translation: ## 改訂概要 保守党(欧州人民党)は、無差別スキャンに関する議会の以前の「NO」決定を覆すため、4月26日木曜日に新たな国会投票を求めています。彼らはこの決定を逆転させることが民主主義への攻撃であり、プライバシー権を明白に無視する行為だと主張し、「No means no」というスローガンのもと支持者を集結させています。この要求は、議会が無差別スキャンを承認しなかったことに続くものであり、保守党はこれを政府の過剰介入として捉え、民主主義原則および個人プライバシーを侵害するものと見ています。今後の投票結果は、そのような広範なデータ監視ツールが実施可能かどうかを決定し、市民のプライバシー保護を再構築するとともに、管轄区域内のテクノロジー企業の規制慣行にも影響を与える可能性があります。

「やっぱりもっと落ち着いて、スピードを落とすべきだという考え」 | そっか~ニュース