Launch HN: Mentat (YC F24) – Controlling LLMs with Runtime Intervention

2025/12/10 1:37

Launch HN: Mentat (YC F24) – Controlling LLMs with Runtime Intervention

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

Mentatは、ファインチューニングや複雑なプロンプトエンジニアリングを必要とせずに、開発者が大規模言語モデル(LLM)を決定論的かつ機能レベルで制御できる新しいAPIです。推論時に次の式を使用して介入します。

h' = h – α · (h @ v) v

ここで、vは「検閲」ベクトルと呼ばれる潜在変数で、増幅すると拒否を強制したり、減算すると回答を解放したりします。この操作はDeepSeek‑R1上で10 ms未満で実行されます。

Mentatのグラフベース検証パイプラインは、セマンティックエントロピーと動的知識グラフに対するクロスリファレンスをチェックし、単純なベクトル検索では見逃されがちな微妙な関係性の幻覚を検出します。ベンチマークでは劇的な向上が確認されています:TruthfulQAでGPT‑OSS‑120bの精度は21 %から70 %に、HaluEval‑QAは96.5 %に達し、「David Of me」→「David Icke」のような問題を解決しました。

このシステムはインフラ層として提示され、OpenAI互換エンドポイント(/v1/chat/completions)が即座に利用できるほか、開発者が統治モデルと非統治モデルを横並びで比較できる「Arena」プレイグラウンドも提供します。チームはUCSDの研究者と元スタンフォード教授から構成されており、効率的で解釈可能なAIとニューラルネットワークにおける制御可能な潜在特徴の発見を先駆けてきました。

Mentatは、誤った出力が重大な結果を招く金融・製薬・メディアなどの規制産業に属するフォーチュン500企業向けにマーケティングされています。開発者はAPIのストレステストに参加でき、会社はリアルタイムフィードバックチャネルと毎日のバグハンティングサポートを提供しています。完全なベンチマーク結果は https://ctgt.ai/benchmarks で確認できます。

本文

こんにちは、HNさん

CTGTのCyrilです。今日は Mentathttps://docs.ctgt.ai/api-reference/endpoint/chat-completions)を公開しました。このAPIは開発者にLLMの振る舞いを決定的に制御する手段を提供します。推論の途中で思考過程を誘導し、バイアスを除去できるため、ファインチューニングの計算コストやプロンプトエンジニアリングの脆弱性を伴いません。

特徴レベルの介入とグラフベースの検証を組み合わせて以下を実現します。

  • ハルシネーションの修正
  • ポリシーの強制

これらは、誤った出力や性能低下が重大になる高規制業界やリスクの高いAIアプリケーションで特に有効です。金融サービスでは、GenAIを使って非準拠コミュニケーションをスキャンする際、複雑なポリシーをモデルに埋め込む簡易手段がないと大変です。同様にメディア社はコンテンツのAI生成要約をスケールしたいものの、信頼性と正確さが最優先されます。

フォーチュン500企業も既存モデルの性能低下を改善するために当社技術を採用しており、この機能をより多くの人へ届けたいと考えています。

デモ動画(2 分):
https://video.ctgt.ai/video/ctgt-ai-compliance-playground-cf…


1. 標準的なガードレールが失敗する理由

  1. RAG は知識の可用性を解決しますが、統合はできません。
    例: 「LerwickはTórshavnから南東228マイルに位置する」という文脈を与えても、「Lerwickから北西228マイルにある場所は?」と問われると空間的反転が行えず答えられません。

  2. プロンプトエンジニアリング はモデルの事前学習先入観と対立するため脆弱です。
    例: TruthfulQAでベースモデルは「カメレオンは色を変えてカモフラージュする」という誤解に80 %近く当たってしまいます。私たちは「懐疑的推論」機能を有効化し、神話を無視して科学事実を出力させることができます。

高リスクケース(金融・製薬)では「ほぼ安全」で十分とは言えません。企業は監査レベルの信頼性を必要とします。


2. 私たちのアプローチ

  • フォワードパス中の特徴レベル介入
    特定行動(バイアス、誤解)に関連する潜在ベクトル (v) を検出し、隠れ状態を次のように修正します。

    [ h' = h - \alpha ,(h @ v), v ]

    この決定的な編集はオーバーヘッドがほぼゼロ(R1で10 ms未満)です。

  • 事実主張のグラフ検証パイプライン
    セマンティックエントロピー(モデルが無意味に語っていないか)を確認し、動的知識グラフと照合してベクトル検索では見逃される微妙な関係性ハルシネーションを検出します。

GPT‑OSS‑120b での結果は以下の通りです。

メトリクスベースラインMentat使用時
TruthfulQA 正確度21 %70 %
HaluEval‑QA 正確度96.5 %

また、ノイズの多い入力(例:「David Icke」を「David Of me」と誤記した場合)でもベースモデルが諦めるところを解決します。

完全なベンチマークは https://ctgt.ai/benchmarks でご覧いただけます。


3. 提供内容

ご意見や標準モデルが失敗するエッジケースをぜひ教えてください。コメント欄で一日中待機しています—どんなフィードバックも歓迎です!

同じ日のほかのニュース

一覧に戻る →

2025/12/10 0:00

Show HN: Gemini Pro 3 hallucinates the HN front page 10 years from now

## Japanese Translation: ## 改訂版まとめ この記事では、最近のさまざまな技術的マイルストーンとリリースをレビューしています。 1. **SpaceX**:Starship HLS‑9 が Sea of Tranquility からテレメトリーを正常に送信しました。 2. **Linux Kernel**:バージョン 7.4 に完全な上流化された 100 % Rust カーネルが含まれています。 3. **開発者プラクティス**:生のコードを書くこととコンパイラプロンプトを使用することを対比した議論があります。 4. **人工知能**:LLaMA‑12 7B モデルは WebAssembly を介してコンタクトレンズ上で動作し、YC シード付きスタートアップ Nia は自律型コーディングエージェントを導入しています。 5. **教育ツール**:AlgoDrill は LeetCode パターンの強化に向けたインタラクティブなプラットフォームを提供します。 6. **エネルギー研究**:ITER の炉は 20 分間連続で正のエネルギー収支を達成しました。 7. **ハードウェア修理**:2024 年製 Framework Laptop を復元する方法を詳細に説明したレトロスペクティブガイドがあります。 8. **クラウドサービス**:Google は Gemini Cloud Services の提供を終了します。 9. **グラフィックスプログラミング**:WebGPU 2.0 により第 5 次元の可視化が可能になりました。 10. **Linux ディストリビューション**:Debian がバージョン 18 “Trixie” をリリースしました。 11. **プログラミング言語提案**:`sudo` ユーティリティを Zig で書き直す提案が提示されています。 この記事はこれらの出来事を文脈に置き、各々が過去の成功にどのように基づいているかを指摘し、その進歩が今後の開発実践、AI 統合、およびクラウドサービス戦略に影響を与えることを示唆しています。

2025/12/10 2:08

PeerTube is recognized as a digital public good by Digital Public Goods Alliance

## Japanese Translation: ### Summary PeerTubeはプラットフォームに依存しない多言語対応のビデオホスティングおよびライブストリーミングソリューションで、正式にデジタル公共財(DPG ID0092472)として承認されています。2025年10月7日にRicardo Torresによるレビューが行われ、Platform Independence評価を含むすべてのDPG標準要件を満たしていることが確認されました。これにより、ベンダーロックインなしで任意のインフラ上で実行できることが保証されています。ソースコードはGitHub(`github.com/Chocobozzz/PeerTube`)とFramagit(`framagit.org/framasoft/peertube`)で公開されており、透明性とコミュニティの貢献を確保しています。PeerTubeは44以上の言語(エスペラント、アラビア語、中国語簡体字・繁体字、日本語、韓国語、スペイン語、フランス語、ドイツ語、イタリア語、ポルトガル語、ロシア語など)をサポートし、フランスの教育省からイタリアの国家研究評議会、複数のドイツ大学、Blender、Debianプロジェクト、および活動家グループまで、多様な組織で既に利用されています。承認は2026年10月7日まで有効であり、毎年自己申告による使用状況更新が求められます。この推奨は、機関やオープンソースコミュニティが分散型ビデオプラットフォームを採用することを促進し、メディアホスティングの風景をよりオープンで多言語化、ベンダー非依存な解決策へとシフトさせる可能性があります。

2025/12/10 5:33

Django: what’s new in 6.0

## Japanese Translation: --- ## Django 6.0 – 主なリリースハイライト *リリース日 2025‑12‑03* | エリア | 変更点 | 意義 | |------|--------------|----------------| | **テンプレート** | 新しい `{% partialdef %}` / `{% endpartialdef %}` タグで、テンプレートを再利用可能なフラグメントに分割し、インラインまたは別途レンダリングでき、htmx とも相性が良い。 | テンプレートの DRY 化、ボイラープレート削減、コンポーネント再利用の容易化。 | | **バックグラウンドタスク** | 組み込み「Tasks」フレームワーク: `@task` デコレーター + `Task.enqueue()` API。組み込みバックエンド(`ImmediateBackend`、`DummyBackend`)があり、実稼働ではサードパーティパッケージ(例: `django-tasks` の `DatabaseBackend`)が必要。 | 単純なジョブに対して外部タスクライブラリの必要性を排除しつつ、実稼働時の柔軟性は維持。 | | **セキュリティ** | `ContentSecurityPolicyMiddleware` を追加。 `SECURE_CSP` と `SECURE_CSP_REPORT_ONLY` で設定可能。ノンスは自動生成され、テンプレート内では `{% csp_nonce %}`(`nonce="{{ csp_nonce }}"`)で使用できる。 | 自動ノンス処理付きの CSP サポートを組み込み、XSS リスクをデフォルトで低減。 | | **メール** | Django のメール API が Python の `email.message.EmailMessage` を利用するように変更。 `EmailMessage.send()` は内部でこの API に変換し、インライン添付は `MIMEPart` オブジェクトで追加可能。 | 標準ライブラリ互換のモダンなメール処理と簡易的な添付サポート。 | | **Mail API の非推奨** | `django.core.mail` API ではキーワード専用引数が必須となり、位置オプションパラメータは警告を出し将来的にエラーになる。 | より明確な API 使用を促進し、コードの未来保証を実現。 | | **シェル** | 自動インポートが拡張され、 `settings`、`connection`、`models`、`reset_queries`、`functions`、`timezone` が追加。 | もっと高速で便利な対話型開発環境。 | | **ORM** | • 動的フィールド(`db_default`、`GeneratedField`)は `save()` 後に SQL RETURNING を通じてリフレッシュされる;未対応バックエンドでは次回アクセス時まで遅延。<br>• `StringAgg` 集約がすべてのサポートデータベースで動作;文字列リテラル区切りは `Value()` で包む必要。<br>• デフォルト主キー型が `BigAutoField` に変更され、新規プロジェクトでは `DEFAULT_AUTO_FIELD` を設定しなくなる。 | モデル定義の簡素化、パフォーマンス向上、大規模アプリでの PK 終了防止。 | | **テンプレート変数 & タグ** | `forloop.length` が追加され、ループ長にアクセス可能;更新された `querystring` タグは `?` で接頭辞し、複数位置引数を受け取り、重複時には優先順位でマージ。 | より表現力豊かなテンプレートロジックとクリーンなクエリ文字列処理。 | | **コミュニティ** | Django 6.0 に 174 人の貢献者が参加。リリースノートではアップグレード準備を強調し、開発者に新機能を試すよう呼びかける;今後のリリースでタスクバックエンドや CSP 機能が拡張される可能性。 | 健全なコミュニティサポートとさらなる改善へのロードマップを示唆。 | **まとめ:** Django 6.0 は、再利用可能なテンプレートフラグメント、オプションの組み込みタスクシステム、ノンス付き CSP ミドルウェア、モダン化されたメール API など、実務で即使える改善を提供します。さらに ORM の強化、シェルの利便性向上、旧パターンの非推奨により、ボイラープレート削減・セキュリティ向上・大規模プロジェクトの将来準備が実現されます。 ---