
2026/06/13 14:44
牧羊犬:史上最も危険なAI モデルによるゲーム
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
Anthropic のモデルは以前「危険すぎる」と判断されていたものが、ユーザーによって一連の応答で待ちに待った「Shepherd's Dog」ゲームを構築することだけを求められ、成功裏にテストされました。20 ユーロを超えるコストを要する 45 分の推論セッションの後、AI は外部依存関係なしで完全な自立型の HTML ファイルとして、2,319 行のコードを生成しました。ユーザーはこの結果を、AI モデルが初めて一回のやり取りで具体的な完全なゲームアイデアを成功裏に作成した事例であると記述し、それを楽しく見ているとしています。同様のタスクに対して以前にテストされたモデルは、公開されている GitHub アーカイブにおいて文書化されている通り、完成品を提供できませんでした。インストールなしでインタラクティブなデモを直接プレイするには、vnglst.github.io/when-ai-fails/shepards-dog/claude-fable-5/index.html を訪れてください。以前失敗したモデルの結果を見るには、github.com/vnglst/when-ai-fails/blob/main/shepards-dog/README.md にアクセスしてください。この成就是、かつて排除されていた AI システムが現在では複雑なクリエイティブなアサインメントを信頼して取り扱えることを示しており、これにより高レベルのタスクに対してそれ以前に考えられていたよりも安全である可能性があることを示唆し、急速プロトタイプ化のアプローチを再構築する可能性があります。
本文
アンソロピックから「危険すぎる」と評されるモデルが作成した『Shepherd's Dog』を体験する
数日前、アンソロピックは**「世界に見せるには危険すぎる」と評されたモデルをリリースしました。
筆者は個人でのベンチマークとして、このモデルが「長年抱えていたゲームのアイデアを一発で作成できるか」**を試みることにしました。
試行プロセスと成果
推論セッション
- モデルは非常に長時間の推論セッションから開始しました。
- トークン消費量は €20 以上、かつ 45 分以上に及ぶ高額なリソースを消費しました(!)。
最終結果
- 無事に「『Shepherd's Dog』が完了しました」と報告されました。
- 成果物は依存関係なしの単一の
ファイルです。index.html - コード行数:2,319 行。
⚠️ これはAI モデルが初めて一発でこのような複雑なものを私に作成できたケースです。
ゲーム体験
動画をご覧いただくか、ご自身でゲームをプレイすることをお勧めします。非常に面白く、筆者の想像通りでした。
プレイ方法
参照資料
- 以前のモデルによる他の試行例:
github.com/vnglst/when-ai-fails/blob/main/shepards-dog/README.md