2025-12-23

日付別ニュース一覧

カードをクリックすると全文、Hacker Newsのリンクから元記事へ移動できます。

日付で読む

02/032026-02-03 02/022026-02-02 02/012026-02-01 01/312026-01-31 01/302026-01-30 01/292026-01-29 01/282026-01-28 01/272026-01-27 01/262026-01-26 01/252026-01-25 01/242026-01-24 01/232026-01-23 01/222026-01-22 01/212026-01-21 01/202026-01-20 01/192026-01-19 01/182026-01-18 01/172026-01-17 01/162026-01-16 01/152026-01-15 01/142026-01-14 01/132026-01-13 01/122026-01-12 01/112026-01-11 01/102026-01-10 01/092026-01-09 01/082026-01-08 01/072026-01-07 01/062026-01-06 01/052026-01-05 01/042026-01-04 01/032026-01-03 01/022026-01-02 01/012026-01-01 12/302025-12-30 12/292025-12-29 12/282025-12-28 12/272025-12-27 12/262025-12-26 12/252025-12-25 12/242025-12-24 12/232025-12-23 12/222025-12-22 12/212025-12-21 12/202025-12-20 12/192025-12-19 12/182025-12-18 12/172025-12-17 12/162025-12-16 12/152025-12-15 12/142025-12-14 12/132025-12-13 12/122025-12-12 12/112025-12-11 12/102025-12-10 12/092025-12-09 12/082025-12-08 12/072025-12-07 12/062025-12-06 12/052025-12-05 12/042025-12-04 12/032025-12-03 NaN/NaN2025-12-99

イラスト付きトランスフォーマー

## Japanese Translation: 記事は「Attention is All You Need」で紹介されたTransformerアーキテクチャと、従来の再帰型や畳み込み型ニューラル機械翻訳モデルに比べてその注意力ベース設計がトレーニングを高速化する方法について説明しています。 Transformerはエンコーダスタック（通常6層）とデコーダスタック（同じく6層）で構成されます。各層には以下の要素があります： 1. **自己注意**では、トークン埋め込み（512次元ベクトル）がクエリ・キー・バリュー行列にそれぞれ64次元へ射影されます。ドット積スコアは $\sqrt{64}$ で縮小し、softmax を適用して値を重み付けし、合計します。 2. **マルチヘッド注意**では、各層に8セットの Q/K/V 射影が使用されます。すべてのヘッドからの出力は連結され、最終的な重み行列 $W_O$ を通じて射影されます。 3. フィードフォワードニューラルネットワーク（ReLU の間にある2つの線形層）。すべてのサブレイヤは残差接続とその後のレイヤ正規化で包まれています。位置エンコーディング（512次元の正弦/余弦ベクトル）は埋め込みに加算され、モデルがトークン順序を知り、訓練時より長いシーケンスを扱えるようにします。デコーダでは自己注意がマスクされ、将来位置は $-\infty$ に設定されるため、オートレグレッシブ生成が保証されます。最終的なデコーダ出力は線形射影されてロジットベクトル（次元はターゲット語彙サイズ ≈10 000 単語）となり、その後 softmax で単語確率を得ます。訓練では、これらの分布とワンホットエンコードされた目標トークン間のクロスエントロピー損失が最小化され、逆伝播により最適化されます。デコーディングは貪欲法またはビームサーチで行うことができ、記事では将来的にデコーディング戦略と大規模語彙や長いシーケンスへの訓練を改善する予定だと述べています。本文は元論文、Tensor2Tensor コード、Jupyter ノートブック、および後続のTransformerバリアントを参照し、Twitter での訂正を歓迎しています。産業界において、Transformers を採用すると NLP プロジェクトが加速し、翻訳品質が向上し、言語集約型サービスへの展開が拡大します。

2025/12/23 4:15

日付別ニュース一覧

**イラスト付きトランスフォーマー**

**超音波による癌治療：サウンドウェーブで腫瘍と戦う**

**GLM‑4.7：コーディング機能の進化**

**「ガーベジ・コレクション・ハンドブック」**

先週の停電後、NIST の時刻は UTC と比べて 5 µs 遅れていました。

**フロックはAI搭載カメラをインターネットに公開――私たちは自らを追跡した**

**大型コードベースへのLLMスケーリング**

パスキー・ボット構築で学んだこと (Note: The original title is short, so the translation preserves its brevity while conveying the meaning.)

**Tc – テオドール・キャルヴィンによる言語非依存テストフレームワーク**

**Uplane（YC F25）** *創業エンジニア（フルスタック＆AI）を募集しています*

**Show HN:** *Google Sheets で「粘土」のような体験を実現*

**史上最大級のCRT：ソニーPVM‑4300**

ビンス・ザンペラ（『コール オブ デューティ』や『バトルフィールド』の開発者）が逝去しました。

『クランシー・シガルを追い求めて（2021）』

ジミー・ライは自由のための殉教者です。

**SQL の台頭：誰もが知っておくべき第2言語**

**ユニバーサル推論モデル** - パス率：*ARC1*で **53.8 %** - パス率：*ARC2*で **16.0 %**

ヘンジファインダー

常に **TCP_NODELAY** になっています。

古代の記念碑が冬至を称える

カリフォルニア州全域で顧客を怒らせた、公共事業会社の利益を高く保つことを決めた州規制当局の投票結果 (Note: The translation maintains the original length and conveys the meaning accurately.)

イラスト付きトランスフォーマー

超音波による癌治療：サウンドウェーブで腫瘍と戦う

GLM‑4.7：コーディング機能の進化

「ガーベジ・コレクション・ハンドブック」

先週の停電後、NIST の時刻は UTC と比べて 5 µs 遅れていました。

フロックはAI搭載カメラをインターネットに公開――私たちは自らを追跡した

大型コードベースへのLLMスケーリング

Tc – テオドール・キャルヴィンによる言語非依存テストフレームワーク

Uplane（YC F25）創業エンジニア（フルスタック＆AI）を募集しています

Show HN: Google Sheets で「粘土」のような体験を実現

史上最大級のCRT：ソニーPVM‑4300

ビンス・ザンペラ（『コールオブデューティ』や『バトルフィールド』の開発者）が逝去しました。

SQL の台頭：誰もが知っておくべき第2言語

ユニバーサル推論モデル - パス率：ARC1で 53.8 % - パス率：ARC2で 16.0 %

常に TCP_NODELAY になっています。