Letta Code

2025/12/17 5:51

Letta Code

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

Letta Code は、セッションをまたいで保持され、時間とともに改善するメモリ優先型コーディングエージェントです。各セッションは、エージェンティック・コンテキスト工学、長期記憶、およびスキル学習によって学習する永続化されたエージェントに結び付けられています。このツールは、TerminalBench 上で最も人気のあるモデル非依存型オープンソースハーネスであり、Claude Code、Gemini CLI、Codex CLI などのプロバイダー固有のハーネスと同等またはそれを上回り、Terminus 2 を凌駕します。ユーザーは

/init
コマンドでメモリを初期化し、ローカルコードベースを徹底的に調査したり、保存されたメモリブロックを介してシステムプロンプトを書き換えたりできます。明示的な反省/学習は
/remember
コマンドで呼び出されます。スキル学習では、DB マイグレーション、PostHog ダッシュボード、API ベストプラクティスなどの繰り返しパターンをバージョン管理された
.md
ファイルとしてキャプチャし、エージェント間で共有できます。エージェントは過去の会話を保存し、組み込み
/search
コマンドは Letta API を介してベクトル検索、全文検索、またはハイブリッド検索をサポートします。メモリがなくてもモデルプロバイダー間で性能は同等であり、最先端モデルだけでなく特定のプロバイダーハーネスにも適しています。インストールは簡単です(
npm install -g @letta-ai/letta-code
)し、エージェントは Letta Developer Platform またはセルフホステッド Letta サーバー上で実行できます。

本文

Letta Code は、時間をかけて学習するエージェント向けに設計されたメモリ優先型コーディングエージェントです。
独立したセッションではなく、各セッションは利用とともに改善される永続化済みエージェントに紐付けられます。TerminalBench での #1 モデル非依存 OSS ハーネスとして位置づけられ、自社モデル向けハーネス(Claude Code、Gemini CLI、Codex CLI)と同等の性能を実現します。


継続的学習 & コーディングエージェントのメモリ

今日のエージェントは貴重な経験を蓄積しています。

  • ユーザーの好みやフィードバックを受け取る。
  • 重要なコード部分をレビューする。
  • スクリプトやコマンド実行などのアクションから結果を観測する。

しかし、現在この経験はほとんど浪費されています。Letta エージェントは次の方法で学習します:

機能説明
エージェンシー・コンテキスト工学タスクごとにエージェントのコンテキストを最適化。
長期メモリセッション間で知識を蓄積。
スキル学習エージェント(または他者)が学習したパターンを再利用可能にする。

エージェントと共に作業すればするほど、コンテキストとメモリが豊かになり、性能向上につながります。


メモリ初期化

  • /init
    を実行して、既存プロジェクトについてエージェントに学習させます。
    • ローカルコードベースを深く調査し、メモリを形成、システムプロンプトをメモリブロックで書き換えます。
  • エージェントは自動的に学習しますが、
    /remember
    を使って反省を明示的に呼び出すことも可能です。

スキル学習

繰り返しやパターンベースのタスク(例:API パターン、DB マイグレーション)はスキルとして教えることができます。

  • 複雑な作業を通じてエージェントに指導する。
  • スキル学習をトリガーし、後でエージェントや他者が参照できるようにする。

寄稿されたスキル例:

  • スキーマ変更時の DB マイグレーション生成
  • PostHog CLI を使ったダッシュボード作成
  • API 変更のベストプラクティス

スキルは単純な

.md
ファイルであるため、Git リポジトリでバージョン管理でき、スキルをサポートする任意のコーディングエージェントで利用可能です。


永続化された状態

エージェントは Letta API を介して過去の会話(他のエージェントのものも含む)を検索できます。
組み込み

/search
はベクトル、全文検索、またはハイブリッド検索でメッセージやツールを迅速に見つけることができます。


性能 & 受容

  • モデル非依存 OSS コーディングハーネス:Letta Code は Terminus 2 などの従来の主要ハーネスよりも優れた性能。
  • 全てのモデルプロバイダーにおいて、プロバイダー固有ハーネスと同等のパフォーマンスを実現。
  • メモリがなくても、最先端モデルであれば専用ハーネスと同様に高い性能を発揮。

まずは始めよう

  1. インストール

    npm install -g @letta-ai/letta-code
    

    またはソースからのインストール(詳細は公式ドキュメント参照)。

  2. 利用

    • Letta Developer Platform で使用。
    • 自前ホスティングの Letta サーバーでも可。

時間とともに改善される永続化・学習可能なコーディングエージェントをお楽しみください!

同じ日のほかのニュース

一覧に戻る →

2025/12/17 6:14

Prediction: AI will make formal verification go mainstream

## Japanese Translation: > 記事は、人工知能がソフトウェアが仕様を満たしていることを数学的に証明する「形式検証」を、ニッチな研究活動から日常のエンジニアリング実務へと導くと主張しています。Coq、Isabelle、Lean、F*、Agda などの証明支援ツールはすでに OS カーネル、コンパイラ、暗号スタックなど大規模システムを形式的に検証することを可能にしています。現在では言語モデル型コーディングアシスタントが実装コードとそれに付随する証明スクリプトの両方をドラフトでき、極小の検証済みチェッカーは無効な証明を拒否し、AI エージェントが幻覚(hallucinate)した場合には再試行を強制します。2009 年に公開された seL4 マイクロカーネル(8,700 行の C コードで 20 人年と 20 万行の Isabelle コード)が示すように、従来は労力集約的な検証が行われてきましたが、世界中で数百人程度の専門家しかそのような証明を作成できず、コストはバグ修正費用を上回ることも多いです。著者は AI がこれらのコストを低減するにつれて、より多くのソフトウェアが形式検証され、人間によるレビューではなく AI 生成コードに依存するようになると予測しています。残された最大の障壁は正確な仕様書を書くことです——仕様書作成は証明より容易ですが、それでも専門知識を要します。AI は自然言語での要求を形式的に翻訳する手助けができるかもしれませんが、ニュアンスの損失リスクがあります。広範な採用はバグと脆弱性を削減し、エンジニアリングワークフローを再構築し、仕様書作成に関する新たなスキルを要求しますが、文化的受容こそが主流化への主要障壁となります。

2025/12/17 1:54

alpr.watch

## Japanese Translation: 米国全土の自治体は急速に監視技術を導入しており、既に8万台以上のカメラが設置されています。 新しいプラットフォーム **alpr.watch** は、市議会の議題リストから「flock」「license plate reader」「ALPR」などのキーワードをスキャンし、それぞれの議論をマップ上にピン留めします。住民はこれらのシステムについて議論が行われている場所を確認でき、必要に応じて行動を起こすことができます。ユーザーはメールアドレスで登録すると、自分のエリア内の会議通知を受け取ることが可能です。 12月中旬以前に収集された全データは未検証です。今後提出される情報は正確性を確認するためにモデレートされます。 **ALPR** システムは、24時間365日すべての通行車両からナンバープレートデータを取得し、読み取り、保存します。最大規模のメーカーの一つである **Flock Safety** は、そのユニットを直接近隣住民や警察署に販売しています。カメラは機関・管轄区域間でデータを共有し、数百万の米国人を追跡する監視ウェブを構築します。これらのシステムは、意図された範囲を超えて拡張されることが多く、例えば移民取り締まりに使用されたり、恒久的なインフラストラクチャーとなったりします。 Electronic Frontier Foundation(EFF)、ACLU、Fight for the Future、STOP、Institute for Justice、および地域コミュニティグループなどのプライバシー擁護団体は、すでにこれらの動向を監視しています。 *この改訂された要約はリストからすべての主要ポイントを反映し、未確認推測を含まず、メインメッセージを明確かつ簡潔に保っています。*

2025/12/17 4:20

No Graphics API