2026/01/13 0:09

「かつて人間だったコンピュータ」

RSS: https://news.ycombinator.com/rss

元のHacker News記事へ ↗

要約▶

日本語訳：

要約

本文は「コンピュータ」という言葉が、もともとの意味である計算を行う人間の事務員から、後に続く電子機器へと進化した過程を追っています。主要な歴史的節目は次の通りです：

1785年、イギリス東インド会社：人間コンピュータが評価されていないインド製品の関税を計算しました。ウィリアム・リチャードソンは1784年12月3日にコンピュータとして誓約し、その記録はHouse of Commons（下院議事録）に残っています。この文書では、チャールズ・バベッジが「両親の目の中でまだ輝く星」とされ、電子機器が存在しなかったことを強調しています。
1903年、米国海軍天文台：ウィリアム・M・ブラウンやジョン・C・ハモンドら複数の人間コンピュータが雇用されました。エバレット・I・ヨウェルは6か月間勤務しました。この名簿は、人間計算が20世紀初頭まで続いていたことを示しています。
1960年代まで：人間コンピュータと電子コンピュータが共存していました。これはHidden Figuresで強調されており、女性たちはスライドルールや機械式計算機を使って手作業で計算しました。

語源的証拠は「calculate（計算する）」が長らく正確な推定を意味してきたことを示しています。1656年のGlossographiaでは「calculo」を「帳簿を作る、計算する」と定義し、1604年のトーマス・ブラントの辞書には「reckon（推定する）」「account（会計）」「impute（割り当てる）」「register（記録する）」が収載されています。これらの初期定義は、現代口語で「reckon」が軽い推測を意味する使われ方と対照的です。

本文には、「ruler（尺）」「protractor（分度器）」などの珍しい語源に関するユーモラスな逸話も含まれています。また、将来の職業として「Programmer（プログラマー）」が同様の命名パターンに従う可能性を冗談交じりで推測しています。

総じて、本稿は「コンピュータ」という用語が人々から装置へと移行した過程を、植民地行政、科学観測、初期計算機におけるジェンダー労働の文脈で示しています。

本文

コンピュータに対するよくある不満の一つは、理解しにくいという点です。イギリス東インド会社に関する次の苦情をご覧ください。

「未課税インド商品に係る税務を担当する監査人と計算者は、東インド会社の売上を確認し、販売された商品の数量と価格を記録します。この帳簿は会社と合意され、その後監査人と計算者が税金を決定し、受取人がそれらを証明書に入力します。
計算は、税務の種類数や、それらを決定するために必ず使用されるさまざまな規則から非常に難しくなっており、その結果、この業務を処理できる人がほとんどいないか、あるいはそれを行う手段を得ることができません。」

ウィリアム・リチャードソン氏の聴取記録；宣誓証言、1784年12月3日
下院議事録（1785年）

何？ 1785年には英国公務員はコロニアル会計を行うためにExcelを立ち上げていませんでした（引用必須）。チャールズ・バベッジでさえ、両親の目の中ではまだ小さな輝きに過ぎませんでした。

引用された文章では Computer は人間です。かつては雇用主のために重要な合計を算出するプロフェッショナル・コンピュータ（人）が存在しました。そして現代のコンピュータと同様に、これらの人間のコンピュータも理解しづらいことがありました。手作業で税務監査や会計を行う想像してみてください—この特定の税務用コンピュータは雇用するのが非常に難しい仕事だったのです。

コンピュータは実際の人間でした。彼らには名前がありました。時には、コンピュータという職位は他者との短期的なギグ（業務）であったこともあります。以下は米国海軍天文台報告書からの一例です：

1903年6月30日までに一年間にわたり計算部門に配属された天文台職員：
    • コンピュータ ウィリアム・M・ブラウン
    • コンピュータ ジョン・C・ハモンド
    • コンピュータ エヴェレット・I・ヨウエル、6か月間。
    • コンピュータ ハーバート・R・モーガン。
    • コンピュータ エレノア・A・ラムソン

その他のコンピュータ クララ・M・アップトン、2か月間。
その他のコンピュータ アーサー・B・ターナー、6週間。
その他のコンピュータ レリア・J・ハーヴィー、6週間。
その他のコンピュータ エッタ・M・イートン、8か月間。
その他のコンピュータ ジョン・R・ベントン、2か月間。
その他のコンピュータ エラ・A・メリット、7か月間。
その他のコンピュータ サミュエル・F・リクセイ、4か月間。
その他のコンピュータ デロンザ・T・ウィルソン、5か月間。
その他のコンピュータ チャールズ・E・ヨスト、2週間。

敬具
W.S. エイヒクベルガー
米海軍数学教授

1903年天文台年次報告書

映画『Hidden Figures』で語られるように、人間のコンピュータは1960年代まで電子コンピュータと共存していました。実際の人々—主に女性が—手作業で計算を行い、表・スライドルール・機械式電卓などを駆使しました。もちろん Calculator（計算者） も同様に人間でした。

1656年の Glossographia は英語辞典の中でも最古の一つです：

Calculate (calculo)：帳簿を作る、数え上げる
Compotist (compotista)：帳簿を作る者、計算者、またはコンピュータ

トーマス・ブロントの Glossographia（1604）では「reckon」は難しい語とみなされず、「計算する」や「数える」という意味でした。1604年版の A Table Alphabeticall には次のように記載されています：

account, reckon – 計算、帳簿または合計
impute, reckon, or assigne – 非難する、あるいは責任を課す
register, kalender – 帳簿

この時代の「reckon」は、現代の軽い推測や仮説という意味とは大きく異なり、「計算」や「数値・財務的正確性」を示していました（したがって the day of reckoning という表現も同様です）。

少しユーモアを添えて

Ruler（直線定規）は、王権のように「ラインを引く者」から派生しました。
Protractor は会議を長引かせる役割を担っていた人で、新しい角度を考慮することで議論が拡大していました（この職務は今日でも残っていると言われています）。
Washer‑dryers はもともと同一人物でしたが、専門化の進展と強力な労働組合のおかげで二つに分離されました。二人はもう再び出会うことはありません。
Liquor はここでは定義できないほど下品です—私自身も彼女をほとんど知りません！
そして話題が高まるなら、Programmer が次にツールの支配者になるかもしれません。昔の計算者やコンピュータのように、その人々もまた理解しづらい存在です。

同じ日のほかのニュース

一覧に戻る →

2026/01/13 4:27

了解しました！内容は明確で簡潔に保ちます。余分な改行や不必要な記号は入れず、リストがある場合は読みやすいようにきちんとインデントします。他にご要望がございましたら、お気軽にお知らせくださいね！

## Japanese Translation: **改訂された概要** CoworkはClaude Maxをベースにしたリサーチプレビュー・ツールで、現在はmacOSアプリを通じてMaxサブスクライバー向けに利用可能です。ユーザーが自分のコンピュータ上の特定フォルダへのClaudeのアクセス権を付与すると、そのフォルダ内のファイルを読み取り・編集・作成できるようになります。これにより、ダウンロードの整理、スクリーンショットからスプレッドシートを生成すること、散在したメモからレポートをドラフトするなどのタスクが便利に行えます。標準的なチャットとは異なり、CoworkはAIにより大きな主体性を与えます。AIはタスクを計画し、実行し、進捗状況を提供します。このツールはClaude Codeと基盤を共有しており、非コーディングの文脈でもコード風の対話が可能です。ユーザーは既存のコネクター（例：ドキュメントやプレゼンテーション）をリンクしたり、Chromeとのペアリングでウェブ閲覧を行ったりして機能を拡張できます。AIは複数タスクをキューに入れ、並列実行することで前後のチャットを減らします。制御権はユーザーに残ります：Claudeが見るフォルダとコネクターを選択し、大きな操作を行う前にプロンプトが表示されます。ただし、誤った指示でファイルが削除されたり、プロンプトインジェクションが発生するリスクもあるため、安全対策は継続的に開発中です。このプレビューはフィードバックを集めることを目的としており、将来のリリースではデバイス間同期、Windowsサポート、強化された安全機能、および拡張されたコネクターオプションが追加される可能性があります。Coworkは個人向けにファイル整理を効率化し、手動監視を保ちながらファイルベースのワークフローを自動化する制御可能なAIアシスタントとして設計されています。

2026/01/13 1:04

**TimeCapsuleLLM：** 1800年〜1875年のデータのみで訓練された大規模言語モデル (Note: The length is preserved while using natural, polite Japanese.)

## Japanese Translation: ``` ## Summary TimeCapsule LLM プロジェクトは、歴史的な英語データのみを使用して言語モデルをゼロから構築し、現代のバイアス（「Selective Temporal Training」）を排除します。 - **Model evolution** - *v0* (16 M パラメータ、nanoGPT ベース) は約187 MB の1800年代テキストで訓練され、1800年代風の言語を生成しましたが、一貫性のない文になりました。 - *v0.5* (123 M パラメータ、引き続き nanoGPT) はコーパスを約435 MB に拡張し、文法・句読点を改善しましたが、高い幻覚と OCR ノイズに悩まされました。 - *v1* (700 M パラメータ、Phi 1.5 ベース) は約6.25 GB のデータで訓練され、歴史的事件や人物を正確に思い出せるようになりました。 - *v2mini‑eval1* (300 M パラメータ、90 GB London コーパス全体の15 GBサンプル) はわずか10 K ステップで訓練され、トークナイズ問題により「Who is Charles Dickens?」のような文字化けした出力が生成されました。 - *v2mini‑eval2* (v2mini‑eval1 と同じサイズ・データ) はチャールズ・ダーウィンについて極めて不連続なテキストを生成しました。 - **Dataset** 完全版 v2 データセットは1800–1875 年のロンドンテキストで 90 GB を含み、136,344 ドキュメントから構成されています。15 GB のサンプルは Hugging Face（https://huggingface.co/datasets/haykgrigorian/TimeCapsuleLLM-London-1800-1875-v2-15GB）で公開されています。 - **Training setup** *v0/v0.5* は GeForce RTX 4060 GPU、i5‑13400F CPU、および 16 GB RAM を使用しました。 *v1* と *v2mini‑eval1* はレンタル NVIDIA A100 SXM GPU 上で訓練されました。 - **Tokenization & evaluation** 時代固有のスペリングと語彙に対応するカスタムトークナイザー（vocab.json & merges.txt）を構築しました。出力は言語的正確さ、幻覚率、およびトークナイズ品質で評価され、バイアス統計は別途 v2 バイアスレポートに記載されています。 - **Future work** 今後の計画として、完全版 90 GB v2 データセットへの拡張、トークナイザーパイプラインの改良、およびより深いバイアス分析を実施します。 - **Impact** このプロジェクトは、歴史家・教育者・AI‑ethics 開発者が時代に即した言語モデルを必要とする際に有益であり、現代バイアスを減らすための時間的選択訓練（temporal selective training）の具体例として NLP コミュニティにも貢献します。 ```

2026/01/13 5:26

ファブリス・ベルラール氏のTS Zip（2024）

## 日本語訳： **概要** ts_zip は、GPU を活用したテキスト圧縮ツールであり、RWKV 169M v4 大規模言語モデル（パラメータを 8 ビットに量子化し、BF16 で評価）を使用してトークン確率を予測し、その予測に基づいて算術符号化を適用します。従来のツールよりも高い圧縮率を達成しています： - alice29.txt – **1.142 bpb**（21,713 B） - book1 – **1.431 bpb**（137,477 B） - enwik8 – **1.106 bpb**（13,825,741 B） - enwik9 – **1.084 bpb**（135,443,237 B） - linux‑1.2.13.tar – **1.021 bpb**（1,196,859 B）。 RTX 4090 上では、ツールは約 1 MB/s の速度で圧縮し、同程度の速度で解凍します。システムに少なくとも **4 GB の RAM** があることが前提です。ts_zip は実験的なものであり、バージョン間の後方互換性は保証されません。また、その性能評価は GPU／CPU またはスレッド数に依存せず、決定論的に行われます。この手法はプレーンテキストファイルで最も効果を発揮し、バイナリデータではエントロピーの削減がほとんど得られません。主に英語で訓練されていますが、他言語やソースコードにも比較的適切に対応します。ダウンロードリンク： - Linux tarball: `ts_zip‑2024‑03‑02.tar.gz` - Windows ZIP: `ts_zip‑2024‑03‑02-win64.zip` 将来のリリースでは、圧縮率をさらに向上させ、言語サポートを拡大し、可能ならファイルタイプの取り扱いを追加しつつ、ハードウェア間で評価が再現できるようにすることを目指します。GPU リソースを持つユーザー（データアーカイブ担当者や大量テキストコーパスを管理する開発者など）にとって、速度を犠牲にせず高い圧縮率を実現できる最適なツールです