**GLM‑4.7:コーディング機能の進化**

2025/12/23 3:46

**GLM‑4.7:コーディング機能の進化**

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

(combining missing details, removing unfounded inferences, keeping clarity):**


Summary

GLM‑4.7 は GLM‑4.6 に対し、複数の面で大幅な性能向上を示しています:

  • コーディングベンチマーク: SWE‑bench (+5.8 % で 73.8 %)、SWE‑bench Multilingual (+12.9 % で 66.7 %)、Terminal Bench 2.0 (+16.5 % で 41 %)。
  • ツール使用 & ウェブ閲覧: τ²‑Bench と BrowseComp において顕著な向上を示し、モデルのツール実行とウェブサイトナビゲーション能力が改善されています。
  • 複雑推論: HLE ベンチマークで +12.4 %(42.8 %)に達し、チャット・創作執筆・ロールプレイシナリオでの性能も向上しています。

リリースには、新しい 思考モード — Interleaved Thinking, Preserved Thinking, Turn‑level Thinking — が含まれ、ツール使用と複雑なエージェント操作を強化します。GLM‑4.7 は 17 の評価テスト(例:MMLU‑Pro, GPQA‑Diamond, AIME 2025, IMOAnswerBench, LiveCodeBench‑v6)で競合他社より優れた性能を示しています。

Availability

  • API アクセス: Z.ai、OpenRouter などのパートナー経由で利用可能。ユーザーは「glm‑4.7」を選択するか、API リクエストで直接呼び出すことができます。
  • ローカルデプロイメント: 重みは HuggingFace と ModelScope に公開されており、vLLM および SGLang 推論用の公式ドキュメントがあります。
  • 価格とアップグレード: GLM Coding Plan の購読者は自動でアップグレードされます。新規ユーザーは Claude レベルの性能を約 1/7 の価格で、使用量上限が 3 倍になるメリットがあります。

Ecosystem impact

リリースはすでに人気のコーディングエージェント(Claude Code, Kilo Code, Cline, Roo Code)へ統合されており、Vibe Coding の UI 改善と同時期です。手頃な価格で高性能なコーディング支援とオープンウェイトを提供することで、GLM‑4.7 はソフトウェア開発ワークフロー全体のコスト低減と生産性向上が期待されています。


Key points retained: All major quantitative gains, new thinking modes, benchmark superiority, availability channels, pricing structure, local inference support, and ecosystem integrations are explicitly mentioned. Unnecessary inferences have been removed, and vague phrasing (e.g., “clear performance boost”) has been replaced with concrete data.

本文

GLM‑4.7 – 新しいコーディングパートナー


コア機能

  • 多言語対応のエージェント型コーディングとターミナルタスク
    • SWE‑bench: 73.8 % (+5.8)
    • SWE‑bench Multilingual: 66.7 % (+12.9)
    • Terminal Bench 2.0: 41 % (+16.5)
  • 「思考してから行動」 – Claude Code、Kilo Code、Cline、Roo Code の複雑タスクで顕著な成績向上。
  • Vibe Coding – クリーンでモダンなウェブページとレイアウト・サイズが正確に再現された洗練されたスライドを生成。
  • ツール使用 – τ²‑Bench と BrowseComp のウェブブラウジングタスクで優れた性能。
  • 複雑推論 – HLE(Humanity’s Last Exam)で 42.8 % (+12.4) を達成。

ベンチマーク実績

BenchmarkGLM‑4.7GLM‑4.6Kimi K2 ThinkingDeepSeek‑V3.2Gemini 3.0 ProClaude Sonnet 4.5GPT‑5 HighGPT‑5.1 High
Reasoning
MMLU‑Pro84.3883.2884.6885.0988.1887.5887.5887.0
GPQA‑Diamond85.7881.0884.5882.4991.9893.4888.7888.1
HLE24.8117.2223.9255.1357.5153.7265.3257.7
HLE (w/ Tools)42.830.4444.9485.8482.0352.242.7
AIME 202595.793.9935.9359.1987.0974.0994.690
HMMT Feb 202597.189.2849.9257.5779.2839.63.3
HMMT Nov 202593.587.7890.2902.2933.8189.2
Agents
IMOAnswerBench82.073.578.6883.3835.8678.0
LiveCodeBench‑v684.982.8831.1890.7640.7487.0
Code Agent – SWE‑bench Verified73.868.073.4761.7727.7496.7
SWE‑bench Multilingual66.753.861.170.2–68.0555.3
Terminal Bench Hard33.323.630.63539.4330.33543.0
Terminal Bench 2.041.024.535.746.4542.24835.7
Agent Browsing
BrowseComp52.045.1–51.4–24.1549.500.8
BrowseComp (w/ Context Manage)67.557.560.26765.92
BrowseComp‑ZH66.649.5623.650–42.463.0
τ²‑Bench87.475.274.385.390.7872.822.482.7

備考: ベンチマークは小数点以下二桁で四捨五入しています。


その他のハイライト

  • コーディングエージェント互換性 – Claude Code、Kilo Code、Roo Code、Cline などで利用可能。
  • 価格 – GLM‑4.7 は Claude 系モデルの約1/7 の料金で、使用上限が3倍に拡張されています。
  • ローカルデプロイ – HuggingFace と ModelScope から重みをダウンロードでき、vLLM や SGLang をサポート。

思考モード

モード説明
Interleaved Thinking各応答/ツール呼び出し前に思考する。
Preserved Thinking複数ターンのコーディング会話で推論を保持。
Turn‑level Thinkingターンごとに思考を有効/無効化してレイテンシと精度を調整。

詳細: https://docs.z.ai/guides/capabilities/thinking-mode


API アクセス


デプロイと設定

タスク推奨設定
デフォルトtemp 1.0, top‑p 0.95, max tokens 131072
マルチターン (τ²‑Bench / Terminal Bench 2)Preserved Thinking を有効化
Terminal Bench / SWE‑bench Verifiedtemp 0.7, top‑p 1.0, max tokens 16384
τ²‑Benchtemp 0, max tokens 16384

ショーケースプロンプト

  • フロントエンド開発 – ダークモード、太字見出し、アニメーション付きティッカー、チャンクリーチップ、磁力型CTAを備えた HTML サイトを構築。
  • ボクセルアート環境 – 1つの自己完結型 HTML ファイルで桜が咲く鮮やかな庭園を作成。
  • ポスターデザイン – パリ風ポスター:エレガント、ロマンチック、ファッション志向の美学。
  • スライド作成 – GLM‑4.7 の Interleaved & Preserved Thinking を起点に開始。

すべてのベンチマークと機能は、GLM‑4.7 の現在の状態を反映しています。

同じ日のほかのニュース

一覧に戻る →

2025/12/23 4:15

**イラスト付きトランスフォーマー**

## Japanese Translation: 記事は「Attention is All You Need」で紹介されたTransformerアーキテクチャと、従来の再帰型や畳み込み型ニューラル機械翻訳モデルに比べてその注意力ベース設計がトレーニングを高速化する方法について説明しています。 Transformerはエンコーダスタック(通常6層)とデコーダスタック(同じく6層)で構成されます。各層には以下の要素があります: 1. **自己注意**では、トークン埋め込み(512次元ベクトル)がクエリ・キー・バリュー行列にそれぞれ64次元へ射影されます。ドット積スコアは \(\sqrt{64}\) で縮小し、softmax を適用して値を重み付けし、合計します。 2. **マルチヘッド注意**では、各層に8セットの Q/K/V 射影が使用されます。すべてのヘッドからの出力は連結され、最終的な重み行列 \(W_O\) を通じて射影されます。 3. フィードフォワードニューラルネットワーク(ReLU の間にある2つの線形層)。 すべてのサブレイヤは残差接続とその後のレイヤ正規化で包まれています。 位置エンコーディング(512次元の正弦/余弦ベクトル)は埋め込みに加算され、モデルがトークン順序を知り、訓練時より長いシーケンスを扱えるようにします。デコーダでは自己注意がマスクされ、将来位置は \(-\infty\) に設定されるため、オートレグレッシブ生成が保証されます。 最終的なデコーダ出力は線形射影されてロジットベクトル(次元はターゲット語彙サイズ ≈10 000 単語)となり、その後 softmax で単語確率を得ます。訓練では、これらの分布とワンホットエンコードされた目標トークン間のクロスエントロピー損失が最小化され、逆伝播により最適化されます。 デコーディングは貪欲法またはビームサーチで行うことができ、記事では将来的にデコーディング戦略と大規模語彙や長いシーケンスへの訓練を改善する予定だと述べています。本文は元論文、Tensor2Tensor コード、Jupyter ノートブック、および後続のTransformerバリアントを参照し、Twitter での訂正を歓迎しています。 産業界において、Transformers を採用すると NLP プロジェクトが加速し、翻訳品質が向上し、言語集約型サービスへの展開が拡大します。

2025/12/23 4:37

**超音波による癌治療:サウンドウェーブで腫瘍と戦う**

## Japanese Translation: ### Summary HistoSonics の Edison システムは、水で満たされた膜を通じて高強度超音波を届け、腫瘍内部で崩壊する空洞泡を生成し、周囲の健康な組織を保護しながらがん細胞を機械的に液化します。この技術は 2001 年にミシガン大学で Zhen Xu によって発見されました。彼女は 20 MPa を超える負圧のマイクロ秒バーストが過熱なしに泡を作り出せることを示し、後に 2009 年に HistoSonics を設立して商業化しました。 FDA は 2023 年に肝臓腫瘍用として Edison を承認しました。主要な腎臓癌研究は 2026 年に完了予定で、その後規制承認が期待されます。大規模な膵臓試験(5 年生存率 13 % を目標)が進行中で、初期結果では深部病変の成功した焼灼と良好な耐容性が示され、ヒストトリッピーを他治療法と組み合わせることで残存疾患に対処し免疫応答を誘発できる可能性が示唆されています。 HistoSonics は、その目的に特化したデバイスが物理学、生物学、および生体医学工学を統合し、ロボット制御・コンピュータガイドシステムで繊維組織(例:血管)を保護しつつ液化腫瘍残渣の自然除去を可能にすると主張しています。技術はまた、がんタンパク質を露出させることで免疫応答を刺激し、免疫療法と組み合わせた際に全身性抗腫瘍活性を高める可能性があります。 新しいガイダンス技術—超音波ではなく X 線画像—と治療エコーを解析するフィードバックシステムが開発され、組織破壊のリアルタイムモニタリングが改善されています。 2025 年 8 月にジェフ・ベゾスの所有グループが HistoSonics を 22.5 億米ドルで取得し、研究開発と市場拡大への新たな資源を提供しました。成功すればヒストトリッピーは肝臓・腎臓・膵臓以外の癌にも非侵襲的手術オプションを広げ、音波をがん治療における変革的モダリティとして位置付ける可能性があります。

2025/12/23 4:30

**「ガーベジ・コレクション・ハンドブック」**

## Japanese Translation: ## 改訂版の概要 新しい「The Garbage Collection Handbook」では、過去60年間にわたる研究を一冊の分かりやすいリファレンスへとまとめ、並列・増分・同時実行・リアルタイムなど主要なガベージコレクション技術を網羅しています。 本書は、1996年に発表されたリチャード・ジョーンズのクラシック版および2012年に出版された第2版(当時の分野の状態を捉えていた)を基盤とし、永続性とエネルギー意識型GCに関する90ページ以上の新章、更新された擬似コード、図解、および約3,400件の論文を網羅した包括的なオンラインデータベースを追加しています。 電子書籍には37,000以上のハイパーリンクが含まれており、章・節・アルゴリズム・図表・用語集項目・索引項目、およびオリジナル研究論文へと直接アクセスできます。データベースはほぼすべて電子的に入手可能なエントリーの要旨、URLまたはDOIを提供し、BibTeX、PostScript、PDFとして検索・ダウンロードが可能です。 初版の中国語訳および日本語訳は2016年に出版され、本書の国際的な影響力を示しています。 ハンドブックのデジタルプラットフォームは新しい研究成果とともに継続的に拡充され、GC の動作やベンチマークデータについて詳細な洞察を求める開発者・言語設計者・商用コレクター・研究者にとって不可欠なリソースとなっています。

**GLM‑4.7:コーディング機能の進化** | そっか~ニュース