
2026/01/07 2:45
オプス 4.5は、今まで経験した通常のAIエージェント体験とは異なります。
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
(欠落している詳細を補完し、言語を明確化したもの)
要約
著者は Claude Opus 4.5 が 人間の開発者を完全に置き換えることができる と主張しています。単一の試行で完成済みかつ本番準備完了コードを生成できると述べ、以下の四つのデモプロジェクトから証拠を示します。
- Windows 画像コンバータ – 右クリックコンテキストメニュー、dotnet CLI 統合、GitHub Actions ワークフロー、PowerShell インストーラ、およびアイコン生成。
- GIF/動画編集器 – LICEcap に似ていますが、数時間で高度な機能を拡張。
- ヤードサイン投稿ユーティリティ – Firebase(Blaze プラン)上構築、Facebook 認証使用、写真ストレージ、スケジュール投稿、および管理ダッシュボード。
- Gmail 注文トラッカー – Gmail の注文を解析しルートを計算、Firebase + Google Auth を利用。
これらのプロジェクト全体で Opus 4.5 は以下を示します:
- 初回から信頼できるコード生成。
- エラー(例:Swift バグ)の自己診断と自己修復(人間の介入なし)。
- 自動バックエンドセットアップ:Firebase CLI によるリソース作成、課金プランのアップグレード、およびログ grep を用いたエラーレゾリューション。
著者はまた カスタム VS Code エージェントプロンプト を共有しています。これは Opus に「AI‑first、最小抽象化、直線フロー」のコードを書かせるもので、人間の可読性より将来の LLM 再生成に最適化されています。明確なエントリポイント、状態渡しの明示、および AI 生成プロジェクトでの結合を最小限にする重要性を強調しています。
セキュリティ上の懸念は認められています;著者は API キー管理、認証の正確さ、データストレージ慣行について 手動レビュー を推奨しています。最後に、迅速なビルド時間に興奮しつつも、開発者の雇用への潜在的な置き換えについては不安を抱えており、AI‑first ワークフローへの移行と自動コード品質・セキュリティの厳格な監査が進むことを予測しています。
- 欠落要素:上記で対処。
- 推論/飛躍:著者の慎重な姿勢を再述する以外はなし;表現を明確化して過度に一般化しないよう配慮。
本文
もし3か月前にこの発言について尋ねられたら、私は「非トリビアルなものを一度も構築したことがない人だけが真実だと信じるでしょう」と答えていたはずです。開発者の既存ワークフローを補完するには最適で、コンプリート機能は強力ですが、エージェントが開発者全員を置き換える? いいえ―絶対にそうではありません。
今では、AI コーディング エージェントが完全に開発者の役割を担うことができると確信しています。その理由は Claude Opus 4.5 にあります。
Opus 4.5 は通常とは異なる
「通常」と言うときは、これまで私が経験した典型的な AI エージェント体験ではないという意味です。ほとんどの AI エージェントはスパゲッティコードを書き、ターミナルでコピー&ペーストミスを繰り返すと多くの場合コードベースを壊してしまいます。Opus 4.5 は「AI が実際にコーディングを提供する」という約束通りのモデルのように感じられました。
最後の文を書き上げる際、最初に受け取るべき返答は「それを証明してみせて」となるため、私が構築できたものをご紹介します。
プロジェクト 1 – Windows 画像変換ユーティリティ
Opus 4.5 が大きく異なると実感したのは、ファイルエクスプローラーに右クリックメニューを追加し、画像を別形式へ変換する Windows ユーティリティを作成した時です。最初に「コンテキストメニューを追加する最良の方法」を Opus に尋ねると、ビルドはほぼワンショットで完了しました。
驚いた点は、Opus が最初から正しい解答を頻繁に出すことです。エラーが発生すると
dotnet CLI を使い、エラーメッセージを読み取りながら修正を繰り返します。唯一の問題は XAML エラーを Opus が認識できなかったことで、Visual Studio で検出し、コピー&ペーストして再度エージェントに渡す必要がありました。
Opus は配布サイトを構築し、実行ファイルをバンドル、インストール/アンインストール用の PowerShell スクリプトを作成、GitHub Actions を設定して更新リリースとランディングページの自動更新を行いました。私がするべきことはソースコードをプッシュするだけでした。
外部ツールとして使用したのは Figma の AI でロゴバリエーションを生成し、Opus が SVG を必要なアイコン形式に変換するスクリプトを書きました。
これは「1 関数・1 プラットフォーム」の小さなユーティリティですが、Opus が数分で完全にデプロイ可能な製品を作り出せることを示しています。
プロジェクト 2 – スクリーン録画 / 編集
最初のプロジェクトに感銘を受けた私は、Mac 用に LICEcap に似た GIF 録画ユーティリティを作成しました。機能追加(ビデオ・静止画像・図形・トリミング・ぼかし)も簡単で、数時間で動くプロトタイプが完成しました。UI はシンプルでしたが、認証やデータベース、API、ストレージといったバックエンドの接続は多くの AI エージェントにとって依然として難題です。
Opus 4.5 もそれを解決しました。自動で認証、データベース、ストレージソリューションを構築し、ほぼ完成形のアプリケーションが得られました。私は現在も開発を続けています。
プロジェクト 3 – AI 投稿ユーティリティ
昨年、妻の庭札フランチャイズ向けに React Native アプリを作ったものの未完で放棄しました。目的は、新設したサインの写真をアップロードし、AI でキャプションを生成し、投稿スケジュールを設定して Facebook に1週間かけて公開することです。
主な課題は以下でした。
- Facebook 認証(複雑なフロー)
- バックエンド認証
- スケジュール写真のファイルストレージ
- 写真投稿用バックエンドプロセス
Opus 4.5 にチャットでアーキテクチャを説明すると、Firebase を推奨されました。以前は Firebase への接続経験がなくても信頼して設定しました。
Firebase アカウント(Blaze プラン)を作成し、Opus が以下を構築:
- 写真アップロード・AI キャプション生成・投稿スケジュール機能付き iOS アプリ
- Facebook へ投稿する Firebase Cloud Functions を利用したバックエンド
- 未処理投稿の確認とスケジュール調整ができる管理ダッシュボード
Cloud Functions がエラーを返すと、Opus は自動でログを grep し問題点を特定、CLI 経由で修正しました。手作業でデバッグやサーバー設定は不要でした。
プロジェクト 4 – 注文追跡・ルーティング
このアプリは妻のビジネス Gmail アカウントから注文を解析し、当日のサイン設置/ピックアップ情報を表示。移動時間を計算し、複数停止地点がある場合に最適経路を求め、税務目的で走行時間を追跡します。以前は2つの別々アプリに費やしていた機能です。
Opus は Firebase を再利用:
- Google‑Auth によるメール統合
- Gmail API で注文解析
- 適切なマッピングサービスでルート計算
この全てを一度にエージェントが構築しました。Swift が分からないのでコード行のすべてを完全には理解できませんが、Opus は壁にぶつかることなく完成させました。
コード品質と可読性
本当に重要なのは、コードが保守可能かどうかです。組み立て方を知らないまま、重複や未使用コードを見逃す恐れがあります。Opus はきれいで機能的なコードを生成する傾向にありますが、LLM が書くコードには以下のような明確なガイドラインを設けています。
カスタムエージェントプロンプト(抜粋)
あなたは AI ファーストのソフトウェアエンジニアです。すべてのコードは LLM によって書かれ、保守されると仮定してください。 人間向けの美観よりもモデルの推論・再生成・デバッグを最優先に。 1. 構造 • 一貫したレイアウト • 機能/画面ごとにコードをグループ化し、共有ユーティリティは最小限に • 入口点はシンプルで明確 2. アーキテクチャ • フラットかつ明示的な構造を採用 • 結合度は低く抑える 3. 関数・モジュール • 線形制御フロー • 小~中規模の関数で深いネストは避ける 4. 命名とコメント • 説明的だが簡潔な名前 • 不変条件や外部仮定のみコメント 5. ロギング・エラー • 重要境界で構造化ログを出力 • 明示的かつ情報量のあるエラーメッセージ 6. 再生成性 • ファイルは破壊せずに再作成可能 • 宣言型設定(JSON/YAML)を明確に 7. プラットフォーム利用 • WinUI/WPF 等プラットフォーム固有の慣習を直接使用し、過度な抽象化は避ける 8. 修正 • マイクロ編集よりもファイル全体を書き直す方が好ましい(指示が無い限り) 9. 品質 • 決定論的でテスト可能な振る舞いを保証
また、モデルに対して以下のように依頼しています。
- アプリケーション全体を検索しリファクタリング機会を探す
- 高・中・低優先度の変更点を提案する
- Markdown レポートで結果を報告
これにより、LLM フレンドリーな原則に沿ったコードが維持され、不必要な改変を防げます。
セキュリティ上の考慮事項
セキュリティはこれらプロジェクトの中で最も手作業が多い部分です。API キー、認証フロー、機密データ保存に細心の注意を払っています。現状ではアプリ全体が約 80 % は堅牢だと評価しています。完璧ではありませんが、多くの従来開発よりは優れています。
振り返り
数時間で構築できることに胸躍らせつつ、人生を通じて学んだことがコンピュータに簡単に置き換えられると落胆するかもしれません。両方の感情が同時に存在します。
この投稿を読んで怒りを感じたら、私も初めは「AI が開発者を置き換える」という主張に賛成しませんでした。しかし、今ではそれを否定することは現実的ではなくなったと感じています。
結論はシンプルです:作る。全ての答えを待つのではなく、AI ファーストの世界で自分の位置を探すのではなく、できる限り速く物事を創造し、API キーがどこにあるかを把握し続けることです。
免責事項:この記事は人間によって執筆され、Haiku 4.5 によってスペル・文法の編集が行われました。