オプス 4.5は、今まで経験した通常のAIエージェント体験とは異なります。

2026/01/07 2:45

オプス 4.5は、今まで経験した通常のAIエージェント体験とは異なります。

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

(欠落している詳細を補完し、言語を明確化したもの)

要約

著者は Claude Opus 4.5 が 人間の開発者を完全に置き換えることができる と主張しています。単一の試行で完成済みかつ本番準備完了コードを生成できると述べ、以下の四つのデモプロジェクトから証拠を示します。

  1. Windows 画像コンバータ – 右クリックコンテキストメニュー、dotnet CLI 統合、GitHub Actions ワークフロー、PowerShell インストーラ、およびアイコン生成。
  2. GIF/動画編集器 – LICEcap に似ていますが、数時間で高度な機能を拡張。
  3. ヤードサイン投稿ユーティリティ – Firebase(Blaze プラン)上構築、Facebook 認証使用、写真ストレージ、スケジュール投稿、および管理ダッシュボード。
  4. Gmail 注文トラッカー – Gmail の注文を解析しルートを計算、Firebase + Google Auth を利用。

これらのプロジェクト全体で Opus 4.5 は以下を示します:

  • 初回から信頼できるコード生成。
  • エラー(例:Swift バグ)の自己診断と自己修復(人間の介入なし)。
  • 自動バックエンドセットアップ:Firebase CLI によるリソース作成、課金プランのアップグレード、およびログ grep を用いたエラーレゾリューション。

著者はまた カスタム VS Code エージェントプロンプト を共有しています。これは Opus に「AI‑first、最小抽象化、直線フロー」のコードを書かせるもので、人間の可読性より将来の LLM 再生成に最適化されています。明確なエントリポイント、状態渡しの明示、および AI 生成プロジェクトでの結合を最小限にする重要性を強調しています。

セキュリティ上の懸念は認められています;著者は API キー管理、認証の正確さ、データストレージ慣行について 手動レビュー を推奨しています。最後に、迅速なビルド時間に興奮しつつも、開発者の雇用への潜在的な置き換えについては不安を抱えており、AI‑first ワークフローへの移行と自動コード品質・セキュリティの厳格な監査が進むことを予測しています。


  • 欠落要素:上記で対処。
  • 推論/飛躍:著者の慎重な姿勢を再述する以外はなし;表現を明確化して過度に一般化しないよう配慮。

本文

もし3か月前にこの発言について尋ねられたら、私は「非トリビアルなものを一度も構築したことがない人だけが真実だと信じるでしょう」と答えていたはずです。開発者の既存ワークフローを補完するには最適で、コンプリート機能は強力ですが、エージェントが開発者全員を置き換える? いいえ―絶対にそうではありません。

今では、AI コーディング エージェントが完全に開発者の役割を担うことができると確信しています。その理由は Claude Opus 4.5 にあります。

Opus 4.5 は通常とは異なる

「通常」と言うときは、これまで私が経験した典型的な AI エージェント体験ではないという意味です。ほとんどの AI エージェントはスパゲッティコードを書き、ターミナルでコピー&ペーストミスを繰り返すと多くの場合コードベースを壊してしまいます。Opus 4.5 は「AI が実際にコーディングを提供する」という約束通りのモデルのように感じられました。

最後の文を書き上げる際、最初に受け取るべき返答は「それを証明してみせて」となるため、私が構築できたものをご紹介します。


プロジェクト 1 – Windows 画像変換ユーティリティ

Opus 4.5 が大きく異なると実感したのは、ファイルエクスプローラーに右クリックメニューを追加し、画像を別形式へ変換する Windows ユーティリティを作成した時です。最初に「コンテキストメニューを追加する最良の方法」を Opus に尋ねると、ビルドはほぼワンショットで完了しました。

驚いた点は、Opus が最初から正しい解答を頻繁に出すことです。エラーが発生すると

dotnet
CLI を使い、エラーメッセージを読み取りながら修正を繰り返します。唯一の問題は XAML エラーを Opus が認識できなかったことで、Visual Studio で検出し、コピー&ペーストして再度エージェントに渡す必要がありました。

Opus は配布サイトを構築し、実行ファイルをバンドル、インストール/アンインストール用の PowerShell スクリプトを作成、GitHub Actions を設定して更新リリースとランディングページの自動更新を行いました。私がするべきことはソースコードをプッシュするだけでした。

外部ツールとして使用したのは Figma の AI でロゴバリエーションを生成し、Opus が SVG を必要なアイコン形式に変換するスクリプトを書きました。

これは「1 関数・1 プラットフォーム」の小さなユーティリティですが、Opus が数分で完全にデプロイ可能な製品を作り出せることを示しています。


プロジェクト 2 – スクリーン録画 / 編集

最初のプロジェクトに感銘を受けた私は、Mac 用に LICEcap に似た GIF 録画ユーティリティを作成しました。機能追加(ビデオ・静止画像・図形・トリミング・ぼかし)も簡単で、数時間で動くプロトタイプが完成しました。UI はシンプルでしたが、認証やデータベース、API、ストレージといったバックエンドの接続は多くの AI エージェントにとって依然として難題です。

Opus 4.5 もそれを解決しました。自動で認証、データベース、ストレージソリューションを構築し、ほぼ完成形のアプリケーションが得られました。私は現在も開発を続けています。


プロジェクト 3 – AI 投稿ユーティリティ

昨年、妻の庭札フランチャイズ向けに React Native アプリを作ったものの未完で放棄しました。目的は、新設したサインの写真をアップロードし、AI でキャプションを生成し、投稿スケジュールを設定して Facebook に1週間かけて公開することです。

主な課題は以下でした。

  • Facebook 認証(複雑なフロー)
  • バックエンド認証
  • スケジュール写真のファイルストレージ
  • 写真投稿用バックエンドプロセス

Opus 4.5 にチャットでアーキテクチャを説明すると、Firebase を推奨されました。以前は Firebase への接続経験がなくても信頼して設定しました。

Firebase アカウント(Blaze プラン)を作成し、Opus が以下を構築:

  • 写真アップロード・AI キャプション生成・投稿スケジュール機能付き iOS アプリ
  • Facebook へ投稿する Firebase Cloud Functions を利用したバックエンド
  • 未処理投稿の確認とスケジュール調整ができる管理ダッシュボード

Cloud Functions がエラーを返すと、Opus は自動でログを grep し問題点を特定、CLI 経由で修正しました。手作業でデバッグやサーバー設定は不要でした。


プロジェクト 4 – 注文追跡・ルーティング

このアプリは妻のビジネス Gmail アカウントから注文を解析し、当日のサイン設置/ピックアップ情報を表示。移動時間を計算し、複数停止地点がある場合に最適経路を求め、税務目的で走行時間を追跡します。以前は2つの別々アプリに費やしていた機能です。

Opus は Firebase を再利用:

  • Google‑Auth によるメール統合
  • Gmail API で注文解析
  • 適切なマッピングサービスでルート計算

この全てを一度にエージェントが構築しました。Swift が分からないのでコード行のすべてを完全には理解できませんが、Opus は壁にぶつかることなく完成させました。


コード品質と可読性

本当に重要なのは、コードが保守可能かどうかです。組み立て方を知らないまま、重複や未使用コードを見逃す恐れがあります。Opus はきれいで機能的なコードを生成する傾向にありますが、LLM が書くコードには以下のような明確なガイドラインを設けています。

カスタムエージェントプロンプト(抜粋)

あなたは AI ファーストのソフトウェアエンジニアです。すべてのコードは LLM によって書かれ、保守されると仮定してください。
人間向けの美観よりもモデルの推論・再生成・デバッグを最優先に。

1. 構造
   • 一貫したレイアウト
   • 機能/画面ごとにコードをグループ化し、共有ユーティリティは最小限に
   • 入口点はシンプルで明確

2. アーキテクチャ
   • フラットかつ明示的な構造を採用
   • 結合度は低く抑える

3. 関数・モジュール
   • 線形制御フロー
   • 小~中規模の関数で深いネストは避ける

4. 命名とコメント
   • 説明的だが簡潔な名前
   • 不変条件や外部仮定のみコメント

5. ロギング・エラー
   • 重要境界で構造化ログを出力
   • 明示的かつ情報量のあるエラーメッセージ

6. 再生成性
   • ファイルは破壊せずに再作成可能
   • 宣言型設定(JSON/YAML)を明確に

7. プラットフォーム利用
   • WinUI/WPF 等プラットフォーム固有の慣習を直接使用し、過度な抽象化は避ける

8. 修正
   • マイクロ編集よりもファイル全体を書き直す方が好ましい(指示が無い限り)

9. 品質
   • 決定論的でテスト可能な振る舞いを保証

また、モデルに対して以下のように依頼しています。

  • アプリケーション全体を検索しリファクタリング機会を探す
  • 高・中・低優先度の変更点を提案する
  • Markdown レポートで結果を報告

これにより、LLM フレンドリーな原則に沿ったコードが維持され、不必要な改変を防げます。


セキュリティ上の考慮事項

セキュリティはこれらプロジェクトの中で最も手作業が多い部分です。API キー、認証フロー、機密データ保存に細心の注意を払っています。現状ではアプリ全体が約 80 % は堅牢だと評価しています。完璧ではありませんが、多くの従来開発よりは優れています。


振り返り

数時間で構築できることに胸躍らせつつ、人生を通じて学んだことがコンピュータに簡単に置き換えられると落胆するかもしれません。両方の感情が同時に存在します。

この投稿を読んで怒りを感じたら、私も初めは「AI が開発者を置き換える」という主張に賛成しませんでした。しかし、今ではそれを否定することは現実的ではなくなったと感じています。

結論はシンプルです:作る。全ての答えを待つのではなく、AI ファーストの世界で自分の位置を探すのではなく、できる限り速く物事を創造し、API キーがどこにあるかを把握し続けることです。

免責事項:この記事は人間によって執筆され、Haiku 4.5 によってスペル・文法の編集が行われました。

同じ日のほかのニュース

一覧に戻る →

2026/01/01 15:15

**球状ヘビ**

## Japanese Translation: **概要** インターフェースは、矢印キーまたは画面上のボタンでナビゲートし、結果を公開リーダーボードに送信し、そのリーダーボードをページから直接閲覧できるようにします。これらすべての機能は GitHub 上で入手可能なオープンソースコードから構築されているため、開発者は実装を検証・フォーク・拡張することができます。

2026/01/07 6:10

プロバイオティクス摂取後の口腔マイクロバイオームシーケンス研究

## Japanese Translation: > 本研究では、BioGaia の市販オーラルプロバイオティクス「Prodentis」(*Limosilactobacillus reuteri* の2株を含む)が、30日間の自己投与試験中に口腔内で定着できるかどうかを検証しました。事前・治療中・治療後、および停止から1週間後の4つの唾液サンプルを Oxford Nanopore 技術と Plasmidsaurus を用いて解析しました。*L. reuteri* のリードは検出されず、最も近い一致は約91 % の類似度に留まりました。これは定着がなかったか、または検知限界以下のレベルであったことを示唆しています。 > 口腔マイクロバイオームは変化しました:Prodentis を中止した後、*Streptococcus salivarius* が全細菌に対して <2 % から約20 % に上昇しました。同時に *S. mitis* は急激に減少(≈15 % → 1 %)し、総合的な Streptococcus の割合はほぼ一定のままでした。これは *S. salivarius* がニッチを占有して置き換えたことを示唆しています。さらに *Veillonella tobetsuensis* は 2.1 % から 5.7 % に増加し、成長する *S. salivarius* が生成する乳酸に支えられた可能性があります。いずれのサンプルにも赤複合体(P. gingivalis, T. forsythia, T. denticola)は検出されませんでした。 > シーケンス解析は便利で費用対効果が高く、4サンプルに対して総額 240 ドルで済みました。高品質な ONT リード(中央値 Q 23、約1,500 nt)が得られました。この結果は口腔プロバイオティクスの定着検出の難しさを浮き彫りにし、短期間でも製品がマイクロバイオームを再構築できることを示しています。Prodentis は風味が良く、一時的な口腔健康効果を提供する可能性がありますが、本実験ではプロバイオティクス株の定着は検出されませんでした。将来的には、より高用量や代替投与システムを試し、定着と長期的影響を評価する研究が期待されます。

2026/01/07 5:24

**ハッカー全員へ:お金の仕組み(2024)**

## Japanese Translation: --- ## Summary 記事「Calling All Hackers」は、cts(別名 gf_256)が *Phrack* Volume 0x10、Issue 0x47、Phile #0x11 of 0x11 に掲載したもので、ハッカーが自らの技術スキルを持続可能なビジネスに転換できると主張しています―ただし、基本的な金融リテラシーを習得し、暗号資産やベンチャーキャピタル界隈で広く蔓延している投機的ハイプを避ける必要があります。 cts は「shitcoin」のポンプ&ダンプ手法と、「Western Way」と呼ばれるものを対比しています。後者は依然としてハイプに頼っていますが、実際の価値創造を主張しています。彼はトークンローンチの仕組みを説明し、取引所、市場メーカー、創業者、ベンチャーキャピタル(SAFT契約を含む)の役割を指摘します。同記事は、100×リターンに執着するベンチャーキャピタルを批判し、多くのVCファンドがパワーロウ分布に依存しているため創業者が高リスクな賭けへと押されることを指摘しています。 株主、従業員、顧客、コミュニティ間の緊張について語り、株主価値がしばしば他のステークホルダーを犠牲にして優先されると主張します。この短期的な焦点はレイオフや製品品質の低下、「カルトリーダー」CEO の登場につながり、持続可能なモデルよりもハイプによって推進されるケースがあると述べています。 ハッカーへの実務上の示唆としては、以下があります:プライベートでしっかり統治された企業を構築すること、責任を持って資金調達を行うこと、長期的なビジョンを維持すること、そして評価額の膨張などの虚栄心に駆られた指標を避けること。記事は Airbnb Class A株のSEC提出資料、Moxie Marlinspike のブログ投稿、Twitter スレッドなど具体的なソースを引用し、エクイティ構造とVC行動を示しています。 cts はハッカーコミュニティ(CTFチーム、Phrack スタッフ、Zellic メンバー)に感謝し、将来のテクノロジー生態系を形作りたいハッカーには、体系的な経済と金融を理解することが不可欠であると強調しています。付録では、IB、PE、HF、VC などの金融用語をハッカー向けに風刺的に定義したリストをユーモラスに掲載しています。 主旨は:ハッカーが金融リテラシーと持続可能なビジネス慣行を受け入れれば、よりレジリエントなテックエコシステムを構築し、VC の期待を真の価値創造へシフトさせ、エクイティ・ガバナンス・ステークホルダーのバランスに関する業界全体の規範に影響を与えることができるという点です。