Leanstral バージョン 1.5

2026/07/01 5:44

Leanstral バージョン 1.5

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

2026 年 6 月 30 日にリリースされた、更新された Lean 4 形式化証明工学モデル v1.5 は、自動化された定理証明および自動形式化に特化して設計された自由な人工知能です。この高度なシステムは、高い効率性を誇るアーキテクチャを特徴とし、総パラメータ数 119B にわたる全パラメータと 65 億のアクティブパラメータを持ち、25 万 6 千トークンの大規模コンテキストウィンドウをサポートします。主な機能には、会話および関数呼び出しのための組み込みエージェント、さらに音声認識や文字起こしなどの新興能力が含まれます。また、並列化バッチ処理、OCR、ドキュメント問答機能、ならびに FIM、埋め込み、モデレーションなど他のツールを通じて、業界標準のワークフローを統合しています。ゼロコストという条件下で、自動形式化作業のプロセスを標準化し、手動による証明工学に必要な時間を大幅に削減することを目的としています。

Text to translate:

Released on June 30, 2026, the Updated Lean 4 formal proof engineering model v1.5 is a free artificial intelligence designed specifically for automated theorem proving and autoformalization. This advanced system features a highly efficient architecture with 119B total parameters and 6.5B active parameters, supporting massive 256k context windows. Key functionalities include built-in agents for conversation and function calling, alongside emerging capabilities such as text-to-speech transcriptions. The model also integrates industry-shifted workflows via parallelized batching, OCR, document question-and-answer features, and other tools like FIM, embeddings, and moderations. With zero cost, it aims to standardize autoformalization processes and significantly reduce the time required for manual proof engineering.

本文

Lean 4 形式化証明工学モデル v1.5 (2026 年 6 月 30 日)

自動的定理証明および自動形式化に最適化された、最新版のアップデートです。

モデル仕様

  • 総パラメータ数: 1190 億
  • アクティブなパラメータ数: 65 億
  • 処理速度: 高速
  • 性能: 最適化済み
  • 対応モードリティー: テキスト、OCR、注釈付き情報
  • コンテキストウィンドウ: 256k
  • 料金額:
    $0

主な機能

  • チャット補完
  • 関数呼び出し
  • エージェントとの対話
  • 組み込みツール
  • シュトラチャード出力(構造化された出力)
  • 予測済み出力
  • PrefixOCR
  • 注釈機能(構造化された境界ボックス抽出)
  • ドキュメント Q&A
  • FIM 埋め込み
  • モデレーション
  • トランスクリプション
  • 音声からテキストへの変換 (TTS)
  • タイムスタンプ付与
  • バッチ処理

同じ日のほかのニュース

一覧に戻る →

2026/07/01 2:59

Claude Sonnet 5

## Japanese Translation: Claude Sonnet 5 は、プレミアム向けの Opus モデルに限定されていた高度な自律型機能を大幅に安価な価格で提供することで、AI のアクセシビリティにおいて大きな転換をもたらしました。これにより、性能格差は縮小しつつも、厳格な安全基準を維持しています。低廉なコストにもかかわらず、評価結果ではリスクのある行動が少ないことが示されており、Agent 型コンテキストにおいては Sonnet 4.6 よりも安全性が高く、開発などの危険なサイバーセキュリティタスクを実行する能力が限定的であるためデフォルトでサイバー防御機能が有効化されています。技術的な向上点には、初期コストを上げることなく処理効率を改善する新しいトークナイザーが含まれており、同じ入力が 1.0–1.35 倍多くのマッピングされたトークンに対応しますが、導入価格(入力/出力トークンあたり 2 ドル/10 ドル)を設定することでこの移行をほぼ費用対中立とします。2026 年 8 月 31 日以降には、標準的な価格(入力/出力トークンあたり 3 ドル/15 ドル)が適用されます。本モデルは、ブラウンフィールドコードの保守、多段階のソフトウェアエンジニアリング、法務調査など複雑なワークフローにおいて卓越したパフォーマンスを発揮します。チャット、Cowork、Claude Code、プラットフォーム全体におけるレート制限を引き上げることで、高度なエフォートレベルに伴う高いトークン利用量を対応可能です。最近のベンチマークスコアの見直しは、実際の品質低下を意味するものではなく、評価方法の更新によるものです。例えば、「コスト対性能チャート」の更新(変更ログ:2026 年 6 月 30 日)や、「Humanity's Last Exam」と OSWorld-Verified 評価におけるスコアの再計算は、標準的な手法を用いた実世界でのパフォーマンスをより正確に反映しています。Sonnet 5 は、無料プランからエンタープライズまでのすべてのサブスクリプションレベルで最適なデフォルト選択となり、広くユーザー層の即時かつ安全な導入を可能にします。

2026/07/01 0:44

Claude Code がリクエストに対してステガノグラフィーを用いて暗記している

## Japanese Translation: 地元の Claude Code バージョン 2.1.196 の最近の検査により、特定の条件下でシステムがデベロッパーのプロンプトに暗黙的に隠しデータを注入するセキュリティ慣行が発見されました。これは透明性の高い対策ではなく裏口を介したシグナルに依存することで信頼性を損ない、`ANTHROPIC_BASE_URL` が設定されており、かつシステムの時-zone が中国と一致するか、または特定の API ホスト名が検出された場合にのみコードがトリガーされます。これらの条件下で、プロンプトの句読点を改変—具体的には "Today's" のアポストロフィを、および日付の区切り文字を一括線からスラッシュに変更する—with 見えないユニコードマーカーを埋め込む。さらに、バインaries 内に base64 文字列として保存されたドメインおよびキーワードリスト(「DeepSeek」や「Zhipu」などの用語を含む)は XOR でデコードされ、潜在的な API リセラーまたはモデル蒸留攻撃を検出します。後端の脅威(無権限のプロキシなど)をブロックすることを意図されていますが、この論理はカスタムセットアップを使用する正当な開発者を懲罰し、AI に送信されるコンテキストに検出データを直接エンコードします。幸運にも、これらの特定の設定がないユーザーは変更を見ませんが、トリガー条件を満たす者はパッチが適用されるまで改変されたプロンプトを受けます。著者は、プロンプトの句読点にシグナルを隠すことは開発者の信頼を侵害し、セキュリティには明示的なポリシーに依存すべきだと主張しています。この機能をバイパスするのは、ホスト名の修正、時-zone の調整、またはバインりパッチ適用によって容易であると考えられています。

2026/07/01 6:29

脳波から単語へ:手術を必要としない新たなコミュニケーションの道筋

## Japanese Translation: 研究者らが、非侵襲的脳記録からリアルタイムでテキストへの変換を行えるエンドツーエンドの AI パイプライン「Brain2Qwerty v2」を公開しました。本システムは、磁気共鳴法(MEG)を用いて 10 時間にわたって 9 名の被験者から記録された約 2 万 2,000 の文を学習データとし、生信号に対してエンドツーエンドの深層学習を適用するとともに、ノイズの多い神経入力を活用するため到大規模言語モデルを微調整しています。一般化単語精度は 61% に達しており、これにより他の非侵襲的手法で一般的であった約 8% より著しく改善されました。最適な条件下では個人ごとの性能は最大 78% に向上し、すべての文の半分以上が 1 つ以下の子音エラーで復号化されました。パフォーマンスはデータ量に対して対数線形に拡張するため、規模拡大だけでもさらなる進歩が可能であることが示唆されます。v1 および v2 の完全な学習コードは、パートナー組織である BCBL よりも提供された v1 データセットとともに公開され、AI エージェントがパイプラインの最適化を支援し、最終的な構成はエンジニアによって手動で選択されました。この研究成果は、500 万ドル規模のデジタル・ブレイン・プロジェクトの一環として、Tribev2(知覚)、NeuralSet(拡張処理)、NeuralBench(評価)などとの並行して、オープンな基礎脳のモデルを推進しています。目的は、侵襲性脳プロスタネースと非侵襲的なアクセシビリティのギャップを埋め、脳病変の影響を受けた数百万人の患者に対してより迅速な診断・治療を可能にしつつ、孤立した研究活動を超えてオープン神経科学を進めることです。