HN 公開:Parsewise (YC P25) – ドキュメント間で推論を行うための API

2026/07/01 22:48

HN 公開:Parsewise (YC P25) – ドキュメント間で推論を行うための API

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

Parsewise は、構造化されていないドキュメントを正確でスキーマ準拠のデータに変換し、かつ完全な系譜と出典を保ち続ける変革的な API を導入しています。Palantir や Bain といったエリート企業の 10 年以上にわたる経験に基づき構築されたこのソリューションは、ファイル数制限、高いレイテンシ、入力形式の制約などの LLM の限界に対処するために、モデル最適化単体からのアプローチではなく、「人間が利用するハネス」へ重点を移し、信頼性と検証時間を最適化しています。標準的なアプローチとは異なり、Parsewise は矛盾する情報を解決し不確実性を強調するための明示的な規則を持つ自己改善型エージェントを採用しています。その独自のアーキテクチャは、vLLM を高速な解析のために用い、大規模モデルを高レベルの意思決定のために使用し、RAG サンプリングを回避して網羅的な価値探索を実現します。この技術はモデル非依存(視覚的推論では Gemini で最も優れた結果を示す)であり、プライベートネットワークでの展開も可能なクラウド非依存です。Databricks OfficeQA ベンチマークにおいて Claude Fable を上回ることで業界最良のパフォーマンスを達成しています。単語レベルの出典を提供し、一貫性の不一致を明示的にフラグ(警告)することで、AI 生成の結果に対する不可欠な信頼を構築します。利用者は、公衆 API エンドポイントを通じてこれらの機能を探索したり、保険契約書や転写された通話など複雑な情報源からの抽出を示すデモビデオを活用したりすることで、時間のかかる手動検証プロセスから自動化され信頼性の高いデータ抽出への変革に乗り込むことができます。

本文

HN ランチ:Parsewise – 文書間を横断した「推論」を実現する ETL API

コンセプトと課題の解決

  • 構造化されたデータ変換
    • 非構造化データ(PDF、Excel など)を一括投入し、スキーマに準拠した形式へ自動変換。
    • 単なるポイントごとの抽出ではなく、**複数の文書を超えて解決された値の線形性(トレース可能性)**を保証。
  • 解決する課題
    • システム側の制約: 処理可能ファイル数、入力形式、コスト、レイテンシの問題。
    • 人間側の課題: 「結果を素早く検証する手段がない」という痛手。
  • 提供価値
    • 技術チームが非構造化データの ETL を簡素化。
    • 事業領域の専門家を連携させ、即時検証可能な仕組みを提供。

クライアントの声

「保険契約書 PDF、通話記録、メールなどの情報からデータを抽出したいです。単にページごとにスキーマへ押し込めるのではなく、『エージェント的な』アプローチを求めています。情報は複数の文書にまたがる可能性があり、何を抽出すべきかを**「推論」できる機能**が必要です。」

創業者の背景と強み

  • 長年の経験: 構造化データ変換および分析・統合分野で約 10 年間の経験。
  • 主要メンバー:
    • Greg: Palantir で古典的な ETL と AI の組み合わせたワークフロー開発に携わった実績。
    • Max: Bain で金融セクターにおける高度な複雑なデータ分析を行っていた経験。
  • 対象顧客との親和性: 金融や複雑なドメイン知識が必要な既存顧客の状況と強く一致。

テクノロジーと仕組み

  • 処理フロー
    1. PDF や Excel を含む数百〜数千件のファイルを一度に受入。
    2. すべての値が複数文書レベルで単語単位まで遡って確認可能なデータを出力(vLLM 使用)。
    3. 効率的な大規模・網羅的な検索には小規模モデルを使用。
    4. 解決意思決定や不整合の提示には、より大規模なモデルを採用。
  • 自己改善型アジェント定義
    • ユーザーが定義:許容される情報源、値の統合ロジック、不確実性の有無などのルール。
    • 最終ユーザーにハイライトされた結果: 推論の根拠を明確にする設計。
  • デプロイとモデル
    • モデルやクラウド環境を選ばず、プライベートネットワーク内での展開も可能
    • Gemini モデルを用いた視覚的推論で特に優れた結果。
    • Databricks OfficeQA ベンチマークにおいて SOTA を達成し、Claude Fable を上回る堅牢な「根拠に基づく推論」を実現。

「網羅性」と「検証可能性」への重点

  • RAG との違い
    • サンプリングではなく、与えられたクエリに対して関連するすべての値を網羅的に発見
    • 単なるデータパース(第一段階)を超えた深い分析が可能。
  • 人間中心の設計 (Human Harness)
    • モデルの最適化だけでなく、導入時の摩擦点である**「検証可能性」**を最優先。
    • 信頼性の確立に必要な時間とクリック数を最小化するアプローチ
    • 出力結果への信頼性向上に注力。

コミュニティへのご招待

  • トライアル実施: 複雑な文書課題への対応を試してみてください。
  • フィードバックの歓迎:
    • 製品の拡張アイデアや品質向上に向けた提案を心からお待ちしております。
    • コミュニティからの声を製品開発に反映させていきます。

同じ日のほかのニュース

一覧に戻る →

2026/07/02 7:03

ZCode:GLM-5.2 ハーネス

## Japanese Translation: ## サマリー: ZCode は、Deep GLM-5.2 の機能を「エージェント型」のワークフローに統合することでソフトウェア開発を革命化し、エンジニアがレガシーなモノリシックアーキテクチャからリアルタイム機能のデプロイへと移行することを可能にします。当プラットフォームは、Goals を通じた長期間にわたるタスクへの継続的な計画をサポートし、ユーザーが WeChat、Feishu、Telegram などのメッセージングアプリを通じてセッションを導くことを可能にします。提供されるのは柔軟な 3 つの料金プランです:小規模なリポジトリ向けで Base ユーザー数に基づいた「ライトウェイト(軽量)プラン」16.2 ドル/月、中規模なリポジトリ向けでユーザー数を 5 倍にし厳選されたツールを含んだ「プロフェッショナルプラン」64.8 ドル/月、大企業向けに専用リソースと新モデルへの優先アクセスを提供する「ハイボリュームプラン」144 ドル/月の 3 つです。MacOS と Windows の両プラットフォームに対応しており、ZCode は複雑な推論タスクにおいて AI の速度を最適化しながらも、チームを開発の最前線に保ち続けます。(注:料率と特典は変動する可能性があります。最終詳細については z.ai をご参照ください。)

2026/07/01 23:20

初めて、細胞から作られたものが成長・分裂した

## Japanese Translation: 生物学者は、非生命の素材から成長し、DNA を複製し、分裂する合成細胞を構築することに成功し、人工的なシステムにおいて細胞周期の主要な機能を遂行した。ミネソタ大学のケイト・アダマラ氏率いるチームが主導するこの研究は現在未公開であり、査読もされていないものの、ジャック・シュストゥーク氏(芝加哥大学)ら専門家からは、「非生命物質から生命を生み出す」という「聖杯」への画期的な一歩として称賛されている。シブレン・オット氏(ストアテンハ化学研究所)は、同細胞は現在の定義において本当に「生きている」とは言えないと指摘しつつも、この成就是、死んだ物質から生命を生み出す科学の進展を大幅に促進したとしている。

2026/07/02 7:48

運動不足の健康な人でも細胞内のエネルギー産生が早期に低下することが判明

## 日本語翻訳: 年齢約 42 歳で運動を習慣化していない健康な成人でも、疾病の発症前に著しい細胞レベルの劣化が見られます。コロラド大学アンスシュ医学部によって実施され、*Clinical Bioenergetics* に公開された研究では、9 名の非活性男性と 10 名の有活動な男性(平均約 42 歳)を比較し、定期的な好気性運動の欠如(週 150 時間未満)が、細胞内の糖や脂肪をエネルギーに変換する「エンジン」となるミトコンドリア機能を急激に低下させることを明らかにしました。非活性男性では、最大酸素利用量が 38% 減少し、負荷時の血液中の乳酸値は 60% 上昇しました。また、主要な燃料処理タンパク質も著しく機能不全を起こしており、MPC1 の活性が有活動レベルの約 49% に低下し、CPT1 酵素の活性は有活動レベルの半分程度まで減少し、糖と脂肪の両方を処理する能力が損なわれていることを示しました。全体として、ミトコンドリアの効率は複数の項目で約 28% から 36% の減少が見られました。共同著者の Iñigo San Millan(イニゴ・サン・ミリャン)は、「40 歳で健康でありながら非活性であることは、現在既に細胞への損傷変化が進行しており、10〜15 年後の健康に影響を与える可能性がある」と指摘し、糖尿病、アルツハイマー病、がんなどの疾患を引き起こす可能性があると述べました。この劣化を早期に検出するための介入対策を可能にするには、心臓血管・呼吸器運動テストと乳酸分析による非侵襲的検査が有効です。研究チームは、より大規模で多様な臨床試験を実施する計画であり、特定の運動プログラムや新規薬剤によってミトコンドリアの健康を回復させることができるかどうかを検証するために、女性の参加者も含む併行研究も行う予定です。