古代英語(紀元5〜6世紀頃)まで遡る、最も初期の記録に残っている英語テキストを理解し、取り扱うことができます。さらに、中世英語(11〜15世紀頃)や近代前期英語(16〜17世紀)といった後期の段階についても訓練されており、これらすべての時代から出てきたテキストを読んだり解釈したり、議論することが可能です。

2026/02/18 23:56

古代英語(紀元5〜6世紀頃)まで遡る、最も初期の記録に残っている英語テキストを理解し、取り扱うことができます。さらに、中世英語(11〜15世紀頃)や近代前期英語(16〜17世紀)といった後期の段階についても訓練されており、これらすべての時代から出てきたテキストを読んだり解釈したり、議論することが可能です。

RSS: https://news.ycombinator.com/rss

要約

日本語訳:

概要:
PhD言語学者 Colin Gorrie が執筆した記事「The Dead Language Society」は、架空の旅行ブロガーが沿岸村 Wulfleet を訪れる様子を追ったものです。ブログ投稿が進むにつれて、ブロガーの書き方は3つの歴史的時代―ジョージアン(19世紀初頭)、エリザベス朝(1600年代)および中世(1700年以前)―を通じて変化します。Gorrie はこの物語手法を用いて、英語のスペリングと文法は1700年以来ほぼ安定していることを示しつつ、より古いテキストでは異なる文字や綴りが使われていたことを説明しています。

強調される主要な印刷上の変化には、19世紀初頭の印刷で長 s(ſ)が消失したこと、不規則なスペリング(1700年以前)、/u/ と /v/ の両方に「v」を使ったこと、そして thorn (þ)、yogh (ȝ) などの古典的文字が存在したことが挙げられます。記事はまた、1700年前の英語では「thou」が丁寧な単数代名詞として使用されていたこと、1250年以降にラテン語由来の語彙が減少しドイツ語系統が顕在化したこと、そして古英語の豊富な屈折形が自由な語順を可能にしていたが、中英語を通じて徐々に単純化されたことにも触れています。

ブログの物語構成では、ブロガーは1400年代に「the Master」(狼のような存在)という生き物に遭遇し、1300年代には死刑宣告を受け、1200年代には女性に殺され、最終的に1000年代に彼女と結婚する――これらは言語変化が劇的な歴史的転換と共存する様子を示しています。

記事は、遠く過去や未来を見ると英語の書き方がほぼ認識できなくなることを結論付け、何世紀にもわたる言語の流動性を強調します。この洞察は、言語研究・教育・デジタルテキスト処理に有用であり、学者・教師・開発者が古い英語テキストとより効果的に取り組む手助けとなります。

本文

「夜のウィットビー、ジョン・アトキンソン・グリムショー(1836–1893)」

ロンドンから海岸へ向かう列車に乗る男がいる。彼はウルフリーと呼ばれる町を訪ねている。小さく古い、ボスワースフィールドの戦い以来ピントを注ぎ続けてきたパブがあるような場所だ。彼はそれについてブログを書こうとしており、胸を高鳴らせている。

到着し、チェックイン。オンラインで選んだかわいいB&Bへ歩いて行く。そして、まるで 25 年前の軽快な LiveJournal スタイルであたかも自分がその旅人になったように全てを書き上げる――彼は少しやり過ぎている。

しかし投稿を進めるにつれ、言葉遣いはだんだんと古びていく。一つずつ時代を越え、スペリングも文法も変わり、知らない単語が登場する。ブログの声はやがてジーザイ王朝の日記人、エリザベス世紀のパンフレット作家、中世の年代記者へと移行していく。

投稿の真ん中頃には、まるで別言語を話すかのように書かれている。
しかしそれは外国語ではない。ただし全て英語だ。

物語自体は実際に起きたことではない:ブログを書いている人も町も。ですが、使われている言葉はリアルである、少なくとも現実的だ。私自身が各時代の英語を知っている限りで作り上げたものだ。

これは千年にわたる英語を一つのブログ投稿に凝縮したものだ。読み進めてみて、どこから難しくなってくるか、どこで完全に諦めてしまうかを注意深く観察してほしい。そして私と会いに来れば、その言語(そしてブログを書いた人)が何を経験したのか教えてあげよう。

あなたは The Dead Language Society を読んでいる。35,000 人以上の読者が英語の隠れた歴史を探求している。私はコリン・ゴリ―、博士号取得済みの言語学者であり、1,500 年にわたる奇妙な英語への案内人だ。

毎週水曜日に発行する。有料購読者はすべての号とアーカイブ、そして私が最も誇りに思う実用ガイド(歴史的テキストを自分で読む方法、言語の真髄への率直な見解、そして Beowulf や次回の Sir Gawain and the Green Knight を読み進めるライブブッククラブ)にアクセスできる。


「さて、やっと皆が最近話題にしていた町、ウルフリーに到着した」

ここへ来るまで決して楽ではなかった。ロンドンから遠いはずのこの場所がどれほど近くて、逆にどうしてアクセスが難しいかは馬鹿げている。発音できない名前の町へ列車で行き、そこからバスに乗り換える必要があった。その全日程は単に到着するだけで過ぎ去ってしまう。

正直言えば、今までのところ完全に価値がある。はい、典型的なイギリス沿岸町だ:カモメ、石畳の通り、そして…何かを感じるとコートを羽織りゴシック小説の中にいるように歩きたくなる。正直に言えば、その必要は本当にあるのだろうか? :)

ここでは皆がとても親切に見える。B&Bへの道で、バス停近くに潜んでいた奇妙な男を追われたこともあった。少し怖かった。ウルフリーへ行くなら、この奇妙な男に注意してほしい。具体的だが、それだけではちょっと変だった。

さて、そのB&Bは…興味深い。LOL。ホットタップとコールドタップを分けているなど、すべてが整っている。私は「ベッド」部分の機能を確認しようとしている。明日の朝に「朝食」のことを更新する予定だ。もし近くにインターネットカフェがあれば。

安眠計画は夜明け前に起きたことで台無しになった。窓が開いたようで、確かに閉めていたと自信満々だったのに。暗闇を見ても何も見えず、原因がわからない。窓を再び閉じたものの、ショックで眠れなかった。私は恐怖しやすい人間ではないと思うが、この出来事は確かに私を不安にさせた。

朝が来ると、下階にある落ち着いたダイニングルームで適度だが十分な食事を用意されていた。食後、レストランの女主人(このような施設を運営することが期待される尊敬できる女性)に感謝し、町中を散策する決心をした。海風は前日の出来事と夜を忘れさせ、ただ「窓は夜に開くのか?」という疑問を残す。誰に尋ねようか分からなかったが、調べることにした。

日中町周辺を散策し、空腹になった私は宿屋で夕食を求めた。見つけるのは簡単だった。ひとりで座り、酒場人が提供するものを注文した。料理の質についてはあまり考えず、飢えという大きな力により哲学者になることもある。

その場所は十分魅力的だった。テーブルにはろうそくが灯されており、地元民たちは楽しげに笑っていた。私は自分を訪れた町の人々より優越だと考える旅人ではない。むしろ彼らと同じ遊びに加わり、楽しく過ごすことにした。彼らは正直で友好的だった。

唯一私の好調さを乱したのは、一瞬だけ昨日追いかけてきた男が群衆の中にいるように見えたときだ。ただの空想だったに違いない、何かが消えるまでに急速に消えてしまった。私は神経の弱さを自責し、もう一杯飲んでそれを落ち着けた。

やっとエンターテイメントが終わる頃、宿へ戻ろうとしたが、足取りは不安定だった。先ほどまで飲みすぎていたこともあったので、読者に国の宿屋人の寛大さを警告しようと思った――それは慎重さよりも多いものだ。私は港辺へ辿り着く。

ウルフリーに最初に来たとき、港を見る機会がなかった。疲れていたため宿で寝るほうが良いと判断した。旅人の真実として、体力が尽きるとすべてのものが見えなくなるということはよく知られている。だが今私はその光景を目にし、驚愕した。漆黒の夜空では星も月のかけらさえ見えなかった。人々がそうして終わるように、私は倒れることなく、港辺へ辿り着いた。

心は深く反省で満ちていた。暗い通りを進み、知っているはずのある路地へとたどり着く。これは歓迎すべき光景だったが、不安な思考に陥った瞬間もあった。誰かに追われているような感覚があり、振り返って確認したものの、何も見つからない。

やっと宿の扉を見つけ、偶然と設計どちらとも言える場所で眠ることにした。飲み物で混乱し、説明できない恐怖で心が揺れていた。私は天命に身を委ね、これ以上考えないよう決意した。

その夜は前の夜ほど悩まされず、寝る前にドアを閉めておけば力が入っても開けられないと確信した。このウルフリーは奇妙で、私はそれを誰もが書いたような場所だと言える。私は仕事に専念し、恐れることなく記録する。

朝になるとすべての不安が消えたかのようだった。町の人々は一夜で多種多様な市場を築き上げ、人間も動物も行き来していた。本当に驚くべき光景だ!

その集団を見るうちに、男性が近づいてきた。彼は私を怖がらせたが、すぐに農民であることが分かった。「鳥はいかがですか?」と彼は言った。「鶏は太っており、安く手に入ります。」私は「いいえ、ありがとう」と答えた。彼は粗野で話し方も悪い。

人々の間を歩き、市場や町並みを通過するとき、再び危険が迫ることを恐れつつ慎重に周囲を見ると、同じ男性が再び現れた。私は彼に対して何と言うべきか分からず、答えもできなかった。

「そのマスターは誰だ?」と尋ねたら、彼は「ここへ来て、自分で見せる」と言った。私は彼を追い求められ、逃げることができないと思った。数多くの仲間に囲まれ、私の手足を縛り、彼らが呼ぶマスターへと連れて行かれた。

そのマスターは実際には悪魔だったようだ。黒いマントをまとい、一言も発しなかった。顔は獣であり、狼の牙や鼻を持ち、尾は長く、耳は狼のように長かった。暗闇で輝く目が火のようだった。

「何故お前といるのだ?」私は震えながら尋ねた。「どんな罪を犯した」と聞かれたとき、彼は冷たい声で答えた。「ここで死ぬだろう」と告げ、私を叩いた。血が口から流れ、恐怖が心に襲った。私は言葉も動けず、身体は鉛のように重くなった。

その悪人は私の痛みを笑い、慈悲や哀れみなしに嘲笑した。「終わりだ」と彼は言い、私は再びウルフリーを離れることができないと呑気に語った。

――ここでブログは終了する。署名も「読んでくれてありがとう」も無し。たった数文の古典的な言葉だけが残る。

あなたはどこまで読み進められましたか?私と一緒に戻り、何が起きたかを語ろう。

同じ日のほかのニュース

一覧に戻る →

2026/02/22 9:29

**Claude コードの使い方:計画と実行の分離**

## 日本語訳: 記事は約9か月の経験に基づくClaude Codeを使用するための規律あるワークフローを提示しています。研究、計画、および実行を分離し、各フェーズが進む前に承認済みのマークダウンアーティファクトを生成することを強調しています。 1. **リサーチ (research.md)** – Claude は対象フォルダーを徹底的にスキャンし、ユーザーが検証しなければならない詳細レポートを作成します。表面的な読み込みは推奨されません。 2. **計画 (plan.md)** – コードスニペット、ファイルパス、トレードオフ、および説明を含む別のマークダウン計画が用意されます。組み込みのプランモードは拒否され、この編集可能なドキュメントが採用されます。 3. **注釈サイクル** – ユーザーはエディタで計画をレビューし、インラインメモや制約を追加して「まだ実装しない」ガード付きで再送します。このサイクルは計画が完全に受理されるまで繰り返されます。 4. **実行** – 実装前に詳細なTODOリストが計画に追加されます。その後、著者は固定プロンプト「implement it all…」を発行し、Claude にすべてを実行させ、計画内の完了状況を更新させ、不必要なコメントや未知のタイプを避け、型チェックを継続的に実行させます。 5. **修正** – 実行中にユーザーは簡潔な修正(多くの場合単一文)を提供します。フロントエンドでの修正にはスクリーンショットや既存パターンへの参照が含まれる場合があります。 6. **制御と永続性** – 著者はアーキテクチャ的なコントロールを決して手放しません。Claude の提案を評価し、必要に応じて変更またはスキップします。3つのフェーズすべてが単一の長時間セッションで行われ、計画ファイルは自動圧縮を通じて保持され、主要な参照として機能します。 マークダウンファイルを共有可変状態として維持することで、このアプローチはノイズの多いチャットインタラクションを減らし、追跡性を向上させ、大規模プロジェクト全体で一貫したインターフェースを保ちます。

2026/02/22 9:21

**回答** 実際には、ほとんどの最新コンパイラは「決定的(deterministic)」です。 同じソースコードと同一のコンパイルオプション(使用するコンパイラのバージョンや基盤となるプラットフォームを含む)を与えれば、何度実行しても同一のオブジェクトファイルまたはバイナリが生成されます。 ただし、いくつか注意すべき点があります。 | 要因 | 決定性への影響 | |------|----------------| | **コンパイラ実装** | よく設計されたコンパイラは決定的ですが、不具合のあるものではそうでない場合もあります。 | | **ビルド環境** | OS、CPU アーキテクチャ、またはライブラリのバージョンが異なると、ソースコード自体に変更がなくても出力が変わることがあります。 | | **非決定的なパス** | 例としてランダム化されたレジスタ割り当てなど、一部の最適化は性能調査のために意図的にばらつきを導入します。 | | **タイムスタンプ/ビルドメタデータ** | バイナリにはしばしばタイムスタンプやビルド識別子が埋め込まれます。 これを削除(例:GCC/Clang の `-Wl,--build-id=none`)すると、バイト単位で完全に同一の出力が得られます。 | したがって、環境を統制し安定したコンパイラリリースを使用すれば決定的な結果が期待できます。 セキュリティや監査目的で確実な再現性が必要な場合は、**Reproducible Builds** のようなツールを使い、非決定的データを除去する手順を踏むと良いでしょう。

## Japanese Translation: 記事は、ソフトウェアビルドにおける真の決定論が実現しづらい理由を説明しています。入力状態のすべての部分―ソースコード、コンパイラフラグ、ツールチェーンバイナリ、環境変数、ファイルシステムレイアウト、ロケール、クロック、カーネル動作、さらにはハードウェア並列性までも―を完全に指定しなければ、「ノイズ」が出力の漂移を引き起こします。 再現可能ビルドの実践は、ツールチェーンを凍結し、タイムスタンプを正規化(`SOURCE_DATE_EPOCH`)、揮発性メタデータを除去し、`-ffile-prefix-map` でパスを標準化し、ヘルミティックコンテナ内でビルドし、アーカイブを決定的に作成(`ar -D`)することでこれらの問題を緩和します。そうしても、GCC 18574 のようなバグが示すように、内部ポインタハッシュの不安定性は同一ソースから生成されるコードを変化させる可能性があります。 コンパイラ契約はビット単位での同一性ではなく、セマンティクス(観測可能な I/O、揮発性アクセス、アトミック保証)の保持に焦点を当てています。不定動作がこの保証を弱めるため、再現可能ビルドはより厳格な要件となります。`__DATE__/__TIME__` のようなエントロピー源、デバッグ情報内の絶対パス、ロケール依存のソート(`LC_ALL`)、並列ビルドの競合順序、ランダムシード、ネットワークフェッチはすべて再現性を破る要因となり得ます。ASLR がコンパイラパスに間接的に影響することも同様です。 歴史的には、2013 年以降の Debian の再現可能ビルド取り組みが、同一ソースから同一アーティファクトを作ることを主流化し、コンパイラ・リンカ・パッケージング・ビルドシステム全体で意図的な設計が必要であることを示しています。 将来に向けて、記事は LLM で支援される開発チームが決定論的検証ゲート―制約付き入力、テスト可能な出力、再現性のある CI パイプライン―を導入して信頼できるデプロイを確保する必要があると主張しています。完全な決定論は必須ではありませんが、予測可能な振舞いと検証可能性は本番システムに不可欠です。 主要な結論は、多くのエコシステムが多くの境界ケースで意図的な取り組みを通じて再現可能ビルドをサポートしているということですが、Ken Thompson の「Reflections on Trusting Trust」からの根本的な警告は残ります―コンパイラは信頼できるように見えても妥協され得るのです。

2026/02/22 5:57

**HN掲示:NVMe→GPU バイパスでCPUを経由せず、単一のRTX 3090上でLlama 3.1 70B を動作させる**

## Japanese Translation: **NTransformer** は、依存関係のない軽量 C++/CUDA エンジンであり、ユーザーが PCIe 上でモデル層をストリーミングし、オプションで高速直接 I/O 用に NVMe を使用することで、70 B 変種を含むフルサイズ Llama モデルをコンシューマ GPU 上で直接実行できるようにします。 - **Resident mode(レジデントモード)**:Llama 3.1‑8 B Q8_0 は 10 GB の VRAM だけで 48.9 トークン/秒を達成し、tiered‑auto モードは 10.3 GB を使用して 48.8 トークン/秒を提供します。 - **70 B model(70 B モデル)**:ストリーミング(mmap)のみでは非常に遅く (0.006 トークン/秒、7.3 GB)、tiered auto はスループットを 0.2 トークン/秒まで向上させ、23.1 GB を消費します。Q4_K_M のレイヤー・スキップを使用すると速度が 0.5 トークン/秒に上昇し、わずか 22.9 GB で済みます。これは単一 RTX 3090 + 48 GB RAM システムでのプレーン mmap に対して 83 倍速です。 - **Bandwidth bottleneck(帯域幅ボトルネック)**:PCIe Gen3 x8 (~6.5 GB/s) がデータ転送を制限します。Q4_K_M は VRAM に 10 層多く収容でき (36 層対 26 層)、tier‑B 転送が削減され、スループットが向上します。 - **Layer‑skip(レイヤー・スキップ)**:コサイン類似度キャリブレーションを使用して、1 トークンあたり 20–80 層を最小限の品質低下でスキップし、大規模モデルの推論速度を向上させます。 - **Architecture(アーキテクチャ)**:3 タイヤの適応型キャッシュが VRAM‑resident、ピン留め RAM、および NVMe/mmap タイヤを自動的にサイズ決定します。エンジンはすべての GGUF 量子化 (Q4_0, Q8_0, Q4_K_M, Q5_K, Q6_K, F16, F32) をサポートし、レジデント、tiered‑auto、layer‑skip、および self‑speculative decoding の 4 種類の自動選択データパスを提供します。 - **System requirements(システム要件)**:Linux (Ubuntu kernel 6.17+)、CUDA 13.1、gcc‑14/g++‑14、CMake 3.24+、NVIDIA GPU CC 8.0+ (RTX 3090 テスト済み)。直接 I/O 用に別の PCIe スロットに NVMe SSD が必要です。セットアップスクリプトはカーネルモジュールをパッチし、AMD IOMMU を無効化し、NVMe を VFIO にバインドします(DMA 分離について注意)。 - **NVMe‑direct pipeline(NVMe 直接パイプライン)**:各層 (~670 MB for 70 B Q6_K) は約 202 ms の NVMe コマンドで CUDA‑ピン留めステージングメモリに読み込まれ、非同期 DMA により GPU バッファへ転送され、デュアルバッファ間で計算と重ね合わせて実行されます。 - **Roadmap(ロードマップ)**:完成済みフェーズ—基盤、SLEP ストリーミング、最適化、NVMe direct。今後の作業には speculative decoding の仕上げと公開 C API の追加が含まれます。 NTransformer は、大規模モデルをコストの高いサーバーインフラなしでコンシューマ GPU 上にローカル実行できるようにすることで、推論コストを低減し、オンプレミス AI サービスのレイテンシを削減し、研究・産業界全体での採用拡大を促進します。