
2026/01/20 22:10
**Show HN:** *Ocrbase ― PDF → .md/.json ドキュメントOCRおよび構造化抽出API*
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
OCRBaseは、PaddleOCR-VL-0.9B(最高精度)を採用した最先端のオープンウェイトOCRモデルを使用して、大規模にPDFを構造化されたJSONへ変換する自己ホスト型サービスです。ユーザー定義スキーマに対応し、JSON結果だけでなくMarkdownも返すことができます。本プラットフォームはジョブをキューイングし、数千のドキュメントを同時に処理可能です。型安全なTypeScript SDK、Reactフック、およびWebSocket通知によってリアルタイムでジョブ進捗を確認できます。OCRBaseはDockerとBunが動作する任意のインフラ上で稼働し、クイックスタートコード例ではSDKクライアントの作成、"parse"ジョブの提出、およびMarkdown出力の取得方法を示しています。Self‑Hosting Guideにはオンプレミス環境へのデプロイ手順が記載されています。本プロジェクトはMITライセンス(LICENSE参照)です。APIアクセス、オンプレミス展開、またはご質問がある場合は、adammajcher20@gmail.com までお問い合わせください。
本文
OCRBase
PDFを大規模に構造化データへ変換。先進のオープンウェイトOCRモデルと型安全なTypeScript SDKで実現。
特徴
- 最高水準のOCR – PaddleOCR‑VL‑0.9B による高精度テキスト抽出
- 構造化抽出 – スキーマを定義し、JSON を取得
- スケールに対応 – キュー駆動で数千件のドキュメント処理
- 型安全 SDK – TypeScript 完全サポート、React Hooks 付き
- リアルタイム更新 – WebSocket 通知でジョブ進捗を把握
- セルフホスティング対応 – ご自身のインフラ上で実行可能
クイックスタート
import { createOCRBaseClient } from "ocrbase"; const client = createOCRBaseClient({ baseUrl: "https://your-instance.com" }); // ドキュメントを処理 const job = await client.jobs.create({ file: document, type: "parse" }); const result = await client.jobs.get(job.id); console.log(result.markdownResult);
React Hooks や高度な使い方は SDK ドキュメントをご覧ください。
セルフホスティング
デプロイ手順は Self‑Hosting Guide をご参照ください。
必須環境: Docker、Bun
アーキテクチャ
(詳細は省略)
ライセンス
MIT – 詳細は
LICENSE をご確認ください。
お問い合わせ
API 利用・オンプレミス導入・その他質問は下記までご連絡ください。
adammajcher20@gmail.com