2026/05/21 1:53

Show HN：Dari-docs — 並列動作を行うコーディングエージェントを活用して、ドキュメントを最適化しませんか。

RSS: https://news.ycombinator.com/rss

要約▶

Japanese Translation:

概要:
Dari-docs は、人工知能エージェント向けのドキュメントの評価と改善を目的としたコマンドラインツールであり、特にエージェントがタスクを完了する際に行き詰まることを防ぐために、それらが十分明瞭であることを保証します。人間向けに作成された従来のガイドとは異なり、このシステムは開発者エージェントによるドキュメントとの相互作用をシミュレーションすることで、エージェント対応フォーマットの問題に対処します。エージェントが失敗した場合、ツールは曖昧な表現、一貫しない用語、または欠落しているセットアップ手順といった具体的な失敗箇所を特定し、そのフィードバックに基づいて編集の提案を生成します。本ツールには、dari.dev 上でホストされる「Managed モード」と、自組織内の dari.dev オルガニゼーションに対してデプロイされたエージェントに作用する「Self-managed モード」の 2 つのデプロイモードが用意されています。Managed モードでは

dari-docs auth login

を実行し、Self-managed モードでは dari.dev API キーとデプロイ済みエージェントが必要です。基本的な使用方法としては、現在のファイルを検証するために

dari-docs check

を実行するか、プロジェクトディレクトリ（例：

.dari-docs/updated/

）に直接提案された改善をダウンロードするために

dari-docs optimize

を実行します。ツールを利用するには、まず

curl -fsSL https://raw.githubusercontent.com/mupt-ai/dari-docs/main/install.sh | bash

を使用してバイナリをインストールしてください。基礎となるエージェントは、プロンプト、スキル、セットアップスクリプト、および

dari.yml

マニフェストを含むフォルダからなる通常のエージェントプロジェクトを利用します。完了の確認は

--wait

フラグを使用したローカルでの実行、または

dari-docs runs download

という特定のサブコマンドによる方法で行うことができます。また、新しい Managed アカウントには 5 ドル相当の無料クレジットが付与されます。ドキュメントでは、Managed ビリング、GitHub Actions 統合、タスクファイル、バンドルの選択、ライブ検証用シークレット、エージェントのカスタマイズについてカバーされており、結果として組織がホスト型および自己ホスト型の環境両方でエージェントによる操作エラーを削減し、検証プロセスを合理化することを支援します。

本文

あなたのドキュメントを、最も能力の低いエージェントでも確実に実装できるよう質の高いものにしてあげてください。

dari-docs は、ドキュメントがエージェントにとって十分に明確かどうかを検証するための CLI ツールです。このツールは、あなたのドキュメントをシミュレーションされた開発者エージェントに送信し、彼らに実際のタスクの完了を委ねます。どこで詰んでいるかを報告するとともに、そのフィードバックに基づいてドキュメントの修正안을生成することもできます。「なんとなく理解できそう」という状態から、「エージェントが実際にタスクを完了できる」状態へとドキュメントの品質を転換する 데 に使用してください。

なぜ dari-docs なのか？

かつては「開発者がいつかは見つけ出せる」ということが良質なドキュメントの基準とされていました。しかし、それではもはや不十分です。
読み手が進化系エージェント（AI エージェント）である場合、曖昧さは測定可能です。用語の不一致、隠れた前提条件、散らばったコンテキスト、そしてセットアップ手順の欠如などはすべて、エージェントがタスクに失敗したり、ドキュメントの意味を推測するためにコンテキストを浪費したりする可能性を高めます。
dari-docs は、エージェントが読解できるドキュメントのために繰り返可能なフィードバックループを提供します：タスクを定義し、シミュレーションされたユーザーを実行し、失敗箇所を検査し、必要に応じて編集されたドキュメントを取得します。

機能概要

シミュレーションされた開発者でドキュメントを検証 — エージェントは、あなたが提供したドキュメントのみを使用して具体的なタスクを試行します。
タスクを阻害する曖昧さを検出 — 欠落しているコンテキスト、不明確なセットアップ、用語の不一致、そしてエージェントが推測せざるを得なかった箇所について報告します。
修正案を生成 — テスターからのフィードバックを地元の環境でレビュー可能な編集されたドキュメントへ最適化します。
マネージドモードまたはセルフマネージドモードでの実行 — ホストされている dari.dev ドキュメントサービスを使用するか、あるいは自分自身の dari.dev オーガ化されたエージェントに対して実行するか選べます。
通常のエージェントプロジェクトの使用方法 — テスターとエディターは、プロンプト、スキル、セットアップスクリプト、および dari.yml マニフェストからなるフォルダ構成だけです。

インストール

インストールスクリプトで最新版的 dari-docs バイナリをインストールし、その後 CLI が利用可能であることを確認してください：

curl -fsSL https://raw.githubusercontent.com/mupt-ai/dari-docs/main/install.sh | bash
dari-docs --help

クイックスタート

マネージドモードは、ホストされた dari.dev ドキュメントサービスと別の dari.dev ドキュメントクレジットバランスを使用します。新規アカウントは 5 ドル分の無料クレジットから開始されます。

ドキュメントリポジトリ内から：

ドキュメントのチェックを実行：

dari-docs check . \
  --managed \
  --task "SDK をインストールして最初の API コールを行う"

このコマンドはマネージドモードでの実行を提出し、実行 ID を出力します。同じコマンド内で完了までの待ち時間を含めるには

--wait

を追加してください。

修正案を生成：

dari-docs optimize . \
  --managed \
  --wait \
  --task "SDK をインストールして最初の API コールを行う"

--wait

フラグを使用して、編集されたファイルはリポジトリを変更することなく

.dari-docs/updated/

ディレクトリにダウンロードされます。このフォルダをレビューし、準備が整ったら変更をあなたのリポジトリにコピーしてください。

仕組みについて

dari-docs にドキュメントディレクトリまたはパブリックドキュメント URL を指定し、一つ以上のタスクを提供します。
CLI はローカルのドキュメントをバンドルするか、チェッカーエージェントがインターネットアクセス権限を持って検査できるパブリックドキュメント URL を渡して、ホストされた Dari ドキュメントエージェントに実行を提出します。
テスターエージェントはタスクの完了を試み、ドキュメントが進行を阻害した箇所を報告します。
ローカルな実行アーティファクトを取得するには、
```
dari-docs runs wait
```
、
```
dari-docs runs download
```
を使用するか、あるいは
```
--wait
```
フラグを渡してください。
```
optimize
```
を実行すると、エディターエージェントがドキュメントの変更案を提案します。
提案された編集は、レビューのために
```
.dari-docs/updated/
```
にダウンロードできます。

シミュレーションされたユーザーは単純な dari.dev エージェントです。マネージドモードでは、ホストされた Dari ドキュメントのテスターおよびエディターエージェントが自動的に使用されます。もしエージェントのプロンプト、スキル、セットアップスクリプト、または

dari.yml

をカスタマイズしたい場合は、セルフマネージドモードを使用してください。

マネージドモード対セルフマネージドモード

モード	使用シーン	必要事項
マネージド	最も迅速なセットアップとホストされた実行を望む場合	`dari-docs auth login` の実行が必要
セルフマネージド	自分自身の dari.dev オーガ内の実行を望む場合	dari.dev API キーおよびデプロイ済みエージェントが必要です

ほとんどのユーザーは最初に対策としてマネージドモードから始めるべきです。

ドキュメント

マネージドモードと請求
GitHub Actions
タスクファイルと繰り返しチェック
バンドルの選択
ライブ検証シークレット
エージェントのカスタマイズ
セルフマネージドでの使用方法
ローカル開発

同じ日のほかのニュース

一覧に戻る →

2026/05/20 22:43

GitHub、悪意のある Visual Studio Code エクステンションによる 3,800 リポジトリの侵害を確認。

## 日本語翻訳: GitHub は、従業員が悪意のある Visual Studio Code (VS Code) 拡張機能のインストールによって、約 3,800 の内部リポジトリが侵害された重大なセキュリティインシデントを確認しました。主な影響は、機密性の高い GitHub 内部のソースコードと、ハッカーグループ「TeamPCP」がサイバー犯罪フォーラムで所持していると主張する約 4,000 つのプライベートリポジトリの漏洩可能性がある点にあります。このインシデントは、ソフトウェアサプライチェーン内で長年見られる課題を浮き彫りにしており、過去には悪意のある拡張機能が認証情報を窃取したりマルウェアを配布したりするために利用されてきました。特に以前の年には、数百万回のインストール数を誇りながらセキュリティリスクにより削除されたトロージャン化された VS Code 拡張機能や、クリプトStealing の拡張機能、データを漏洩させる AI ベースのコーディングアシスタントを含む他のインシデントもありました。これら過去の事例は外部ユーザーを標的としたものであったのに対し、今回のインシデントは GitHub の自前のインフラストラクチャと開発チームに限定されており、これらの内部リポジトリの外に保存された顧客データに影響があったという証拠はありません。

2026/05/21 6:33

Google がウェブに対して「宣戦布告」に出たとして言われている。

## Japanese Translation: Google は、オープンウェブのリンクを AI が生成したサマリー（「AI オーバービュー」）に置換する活動を積極的に進めており、これは閉鎖的で管理されたインターネットを創出するというリスクを孕んでいます。現在、ウェブは開かれた文化的リソースとして扱われるべきですが、Google は自社の独占的なニーズを満たすために情報を文脈から切り離し、既存のデータを報酬なしの原材料として使用し、事実上その独り占め体制を支えています。このアプローチは、かつて企業が行ってきた「壁の中庭（walled gardens）」建設の試みに酷似しており、不制御された外部世界に対して安全でフィルタリングされたインターフェースを提供しています。この動きはリンクから LLM 生成のレスポンスへ移行するものであり、時々誤っている答えを提供することで、ウェブに対する Google の独占的な管理層を確立し、ウェブサイト、ユーザーの創作活動、デジタルアートが synthetic generation に餌を与える限り、それらを無関係にしてしまうという脅威をもたらしています。業界基準がこの優越性に適応して変化するリスクもあり、将来的には早期のアール「slopified AOL」に類似した、劣化しアルゴリズムによってキュレートされたプラットフォームとなる可能性があります。アクセスは Google のアルゴリズムが「関連する」と判断したコンテンツに限られます。主な影響は、デフォルト設定に依存するユーザーの情報多様性の低下です。真理および文化へのアクセスの独占に対抗するためには、個人はすぐにデジタル習慣を「De-googlify」する必要性に直面しており、代替検索エンジンへ移行し、Chrome を避ける必要があります。情報の独占化へのこのシフトはオープン標準にも脅威を与え、Google の「安全な」抽象化と対照的に、参加型ウェブに対して非難ラベルが適用される可能性があります。記事は Patreon での呼びかけで締めくくり、本文はクリエイティブ・コモンズアトリビューション・シェアアライク 4.0国際ライセンスの下で提供されていることを示しています。

2026/05/18 11:04

N トークン毎秒とは、実際にはどのような速度なのでしょうか？

## 概要：この報告書の中核的なメッセージは、ローカル LLM のパフォーマンスが単なる生速度だけでは決定されるのではなく、主にコンテンツタイプとハードウェアの制約に大きく依存することである。スループットベンチマークは、コード、テキスト、思考／推論、エージェントの 4 つの明確なストリーミングモードを明らかにしており、同等のトークン率においてでも識別子の高い密度のためプロース（文章）に比べてコードが著しく遅く感じられる。補足のために、本研究では長い識別子を分割する特定のパターン付き BPE（Piece-wise Byte Encoding）方式のトークナイゼーション手法を使用しており、例えば「processUserInput」は「process」「User」「Input」に分けられ、句読点や演算子もトークンとして扱われる。これは tiktoken や Claude のトークナイザーなど一般的なツールとは異なる。テスト範囲は広く、Raspberry Pi クラスのデバイスから 4090 などのハイエンド GPU、Groq などのクラウドサービスまでをカバーしている。重要な知見として、ハイエンドシステムではハードウェアが 1 秒あたり最大 800 トokens を処理できる一方で、実際のユーザー体験は人間の視覚処理速度で決定される上限に達し、極限スピードにおいてはボトルネックは計算能力からシフトして、人が画面を閲覧または視聴する速さという要因に移行する。したがって、これらのモデルを展開する企業は、これらの 4 つの特定のストリーミングモードに合わせて期待値と最適化戦略をカスタマイズし、ユーザーのニーズに合わせる必要がある。