
2026/04/11 3:35
オープンクローはメモリが信頼できず、いつ壊れるか予測できません。
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
要約:
著者はNonBioSのOpenClawシステムを評価し、約7分間のYouTubeデモでフレッシュなLinux VM上に完全自動化された展開が行われ、人手介入なしで実現したことを指摘しています。それ以来、NonBioSのインフラストラクチャーを通じて約千件のデプロイメントが実施されました。ユーザーはVMを起動し、OpenClawを立ち上げ、WhatsAppやDiscordに接続します。エンジニア、創業者、および運営者はシステムを「週単位」で展開しており、週末のテイキングだけではありません。
プラットフォームはインストール・実行・メッセージングアプリとの統合、GPT/Claudeへの呼び出し、シェルコマンドの実行が可能ですが、すべてのデプロイメントで正当な本番利用ケースは現れませんでした。唯一の例外はWhatsApp経由で送信されたニュース要約ボットです。「チーム全体を自動化する」や「3人分の従業員を置き換える」といった主張は、マーケティング宣伝か制御実験にすぎません。
核心問題は不安定なメモリであり、OpenClawの永続的エージェントは著者が「戦略的忘却(Strategic Forgetting)」と呼ぶ現象を起こし、予測不能に文脈を失い誤情報(例:間違ったメール詳細の送信)を生成します。このため、個人メールやカレンダー、メッセージングアプリに接続する際には安全性への懸念が生じます。著者はメモリ信頼性が向上するまで、隔離されたVMで実験を行うことを推奨しています。
結果として、OpenClawはメール・カレンダー・メッセージングを含む重要なワークフローの本番生産性ツールではなく、教育用または概念証明(PoC)プラットフォームとして残る可能性が高いです。長期記憶管理の将来的進歩により業界全体で安全に展開できるようになるかもしれませんが、現時点では実行上のギャップがあるため、即座に使用できるソリューションとは言えません。
本文
私たちは、NonBioS が Fresh Linux VM に OpenClaw を自動的にデプロイできることを示す YouTube 動画を制作しました。完全に人手不要で、開始から終了まで約 7 分です。この動画は、NonBioS がオープンソースソフトウェアなら何でも実行できるというデモとして意図されていましたが、予想以上の成果を上げました。それ以来、インフラストラクチャー経由で OpenClaw をデプロイした件数は約千件に達し、人々は VM を起動し、OpenClaw を稼働させ、WhatsApp や Discord と接続して「ジェンセン・ホウが言う個人 AI のオペレーティングシステム」と呼ばれるこのツールを実際に試すようになっています。
私は自分のネットワーク内でも複数のエンジニア、創業者、テクニカルオペレーターと話し合い、OpenClaw を独立してデプロイした人々が実際に時間を費やしてそれを有用にしようとしているケースを確認しました。週末だけでなく、数週間もの間、本格的に設定し、動かそうと真剣に取り組んでいる人もいました。
そこで私が見つけたのは「正当なユースケースがゼロ」という事実です。 不公平になりたくないので言います。OpenClaw は偽物ではありません。インストール、起動、メッセージングアプリへの接続、Claude や GPT との対話、シェルコマンドの実行といった機能を備えた実際に存在するソフトウェアです。
しかし千件以上のデプロイやネットワーク内での会話、LinkedIn と Twitter 上の投稿を調べても、一つも厳密に検証されたユースケースは見つかりませんでした。
根本的な問題は「メモリ」です。OpenClaw は常駐型エージェントとして設計されており、永続的に動作し続けることが想定されています。しかしそのメモリは信頼性が低く、最悪の場合いつ壊れるか予測できません。
実際の運用で何を意味するか考えてみてください。あなたが OpenClaw に代わってメールを送るよう依頼したとします。誕生日パーティーの計画に関する会話スレッドを追跡していて、3 人が出席確認し、1 人が辞退しました。OpenClaw は更新メールを送信しますが、誰が辞退したかという文脈を失っています。その結果、間違った情報で全員にメッセージを送り、あなたはそれに気づくことができませんでした。自律型エージェントの目的は「毎回出力を確認する必要がない」ことです。
このように、常に検証を要する自律型エージェントは、追加手順付きのチャットボットにすぎません。
次のリリースで修正されるバグではなく、OpenClaw がコンテキストを管理する方法そのものに起因する根本的な制約です。エージェントが動き続けると、コンテキストは満杯になり、重要な情報さえ忘れ去られることがあります。損害が発生した後で初めて何が失われたかを知るしかありません。
私は NonBioS でこの問題に取り組んできました。私たちのアプローチは「Strategic Forgetting(戦略的忘却)」と呼ばれ、長期タスクを通じて AI エージェントを一貫して保つことが最も難しいエンジニアリング課題だと実感しています。単に日・月・年ごとにファイルを分けるメモリ構造を作るだけでは解決できません。人間の脳は「過去一ヶ月で起きた重要なこと」を高レベルで覚えておく一方、特定の日の詳細を呼び出す必要はありません。すべてを同時に覚えておき、重要でない細部は忘れる―これが Strategic Forgetting の核です。
調査したデータやユーザーとの対話、オンライン投稿を総ざらいした結果、本当に機能するユースケースは「毎日のニュース要約」だけでした。OpenClaw はあなたの関心テーマをウェブで検索し、要約して WhatsApp へ朝に送る――これが唯一の実用的なアプリケーションです。
パーソナライズされた日次速報は確かに便利ですが、Zapier ワークフローや任意の LLM API、ChatGPT のスケジュールタスク、または数十年前から存在する他のツールで同じことができます。専用サーバーを運用し、環境に root アクセスを持つ 25 万星規模の GitHub プロジェクトを必要とせずとも朝刊ニュースを取得できるのです。
OpenClaw に関する投稿の大半は「チーム全体を自動化した」「従業員3名を置き換えた」「寝ている間にビジネスを運営するエージェントがいる」といったマーケティングヘイプを捉えるためのものです。人々は現在 OpenClaw のコンテンツが高いエンゲージメントを得ることを知っており、それを生み出すことで報酬を得ています。インセンティブは正確性ではなく、観客です。
私はそのような投稿の背後にいる人々と話しました。深掘りすると、彼らが構築したものは既存の AI ツール(ChatGPT, Claude など)で簡単に実現できるか、あるいは週末プロトタイプとしてデモでは動くが本番タスクを任せるには信頼できないという二つのケースでした。誰も嘘をついているわけではありません。多くの人は自分たちの構築に真剣に取り組んでいると感じています。しかし「一度 OpenClaw でクールなことができた」から「毎日重要なタスクに頼っている」というギャップがあります。後者のケースは見つかりませんでした。
OpenClaw 周辺の安全性は十分に文書化されており、再度掘り下げる必要はありません。この環境で人々がメール、カレンダー、メッセージングアプリと OpenClaw を接続し、信頼性の低いメモリを持つエージェントを個人 PC 上で動かすという状況を踏まえると、私たちが NonBioS のデプロイ動画を作成した理由は明らかです。実験する際には最低でも隔離された VM で行い、侵害があなたの個人情報に波及しないようにすべきだという点です。これがテーブルステークスであり、多くの人はそれを守っていません。
私の率直な見解としては、週末に時間があって新技術に手を出すことが好きなら OpenClaw は魅力的な実験です。AI エージェントの仕組みやデモと本番とのギャップ、コンテキスト管理の重要性について学べます。素晴らしい教育体験になります。
しかし、現在の状態で OpenClaw に本格的に時間を投資するかどうかを検討しているなら、遠慮なくスルーして構いません。生産性革命を逃すわけではありません。ただ朝刊ニュースダイジェストと YAML ファイル設定に費やす膨大な時間を失ってしまうだけです。OpenClaw の背後にあるアイデアは正しいです。AI エージェントが実際のコンピュータ上で真面目に動く時代は到来しており、私たちは NonBioS で毎日それを構築しています。ただし、メモリ問題が解決され、長時間・数日間にわたり「重要なことを覚えて、不要なことを忘れる」自律型エージェントを信頼できるようになるまで、残りは演劇に過ぎません。