**発見されたUnix V4テープの初期分析**

* テープには、早期のUnix V4オペレーティングシステムの生データコピーが保存されています。  
* 主な構成要素:
  - カーネルバイナリ(`/sbin/rc`、`/sbin/init`)
  - コアユーティリティ(`/usr/bin/*`、`/bin/*`)
  - `/src/` 配下のソースファイル(Cとアセンブリ)
  - `README`・`COPYING` にあるドキュメント
* 注目すべき点:
  - `makefile` は最適化フラグを付けずに `cc` を使用しています。  
  - システムコールは直接アセンブリ(`syscall.s`)で実装されています。  
  - ユーザーアカウントは存在せず、デフォルトでシングルユーザーモードが設定されています。  
* 次の推奨手順:
  1. バイナリの整合性をチェックサムで確認する。  
  2. モダンなエミュレータ上でソースをコンパイルし、互換性を検証する。  
  3. 後続のUnixリリースとの違いを文書化する。

2025/12/24 3:22

**発見されたUnix V4テープの初期分析** * テープには、早期のUnix V4オペレーティングシステムの生データコピーが保存されています。 * 主な構成要素: - カーネルバイナリ(`/sbin/rc`、`/sbin/init`) - コアユーティリティ(`/usr/bin/*`、`/bin/*`) - `/src/` 配下のソースファイル(Cとアセンブリ) - `README`・`COPYING` にあるドキュメント * 注目すべき点: - `makefile` は最適化フラグを付けずに `cc` を使用しています。 - システムコールは直接アセンブリ(`syscall.s`)で実装されています。 - ユーザーアカウントは存在せず、デフォルトでシングルユーザーモードが設定されています。 * 次の推奨手順: 1. バイナリの整合性をチェックサムで確認する。 2. モダンなエミュレータ上でソースをコンパイルし、互換性を検証する。 3. 後続のUnixリリースとの違いを文書化する。

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

1970年代の第4版リサーチ Unix マグネティックテープが、2025年7月にユタ大学で発見され、無事に復元されました。このテープには、ソースコード、コンパイル済みバイナリ、およびカーネルを含む完全なシステムダンプが収められています。ただし、GitHub の Unix History Repository へはソースとカーネルファイルのみがアップロードされ、ライセンス上の問題を避けるためにすべてのコンパイル済みバイナリは削除されています。

第4版リサーチ Unix(1973年11月リリース)は、PDP‑11 アセンブリではなく初期の C 言語で書き直されたカーネルの大部分を導入しました。その内容は第5版に非常に近く、Research‑V4 と Research‑V5 のスナップショット間でファイル一覧とコミット履歴を比較することで差異が特定されます。ユニークな第5版ファイルには

c13.c
c21.c
c2h.c
cmp.c
、および
ldfps.s
が含まれます。Git blame 分析では、第4版は v4 から 75,676 行、v3 から 6,590 行、v2 から 168 行を取り入れたのに対し、第5版は 11,181 行の新規行を追加しつつ、52,238 行が v4、3,296 行が v3、168 行が v2 から採用されました。

各リサーチエディションの平均コミットタイムスタンプは次のとおりです:V1 1972‑06‑20、V2 1972‑05‑31、V3 1973‑03‑10、V4 1974‑03‑06、V5 1974‑11‑28、V6 1975‑06‑15、V7 1979‑01‑25。第4版と第5版の約8か月間隔は、急速な開発期間を示しています。

著者マッピングは手動で作成したマップファイルを使用して更新され、不足している著者データは正規表現により Ken Thompson と Dennis Ritchie にデフォルト設定されました。元のベル研究所メンバーからの貢献も取り入れ、Ken Thompson が SNOBOL III インタプリタ開発者であり、Robert H. Morris が数学ライブラリ/エミュレータ実装者であることが確認されました。

復元とリポジトリへの追加は、当時手書き資料にしか存在しないと考えられていた初期 Unix ソースコードを保存する重要性を際立たせます。これにより研究者・歴史家・開発者は、オペレーティングシステムの進化を深く理解できる本物のコードを手に入れ、レガシーソフトウェアのアーカイブ作業の重要性を再認識できます。

本文

複数のニュースメディアが、2025年7月にユタ大学で発見された1970年代製の「Fourth Edition Research Unix」磁気テープと、その成功裏に行われた復元作業について報じました。これは重要な発見です。これまで、Fourth Edition のマニュアルだけが残っていると考えられていたからです。

ここ数日間で私はそのテープのソースコードを GitHub にホストされている Unix History Repository に取り込み(こちらでご覧いただけます)そしてコード構成を調査しました。Fourth Research Edition Unix は、1973年11月に有名な AT&T Bell Laboratories からリリースされました。この版の大きな進展は、システムカーネルの大部分を PDP‑11 アセンブリ言語ではなく、高水準言語(初期の C)で書き直したことです。

テープにはソースコードだけでなく、コンパイル済みバイナリとカーネルを含む完全なシステムダンプが収められています。Unix History Repository に組み込むために、通常ソース管理下に置くファイルのみを残す形でバイナリは削除しました。

find $dir -name '*.[oa]' | xargs rm
rm -rf $dir/bin $dir/usr/bin $dir/usr/games $dir/lib $dir/dev
rm $dir/etc/{lpd,init,msh,getty,mkfs,mknod,glob,update,umount,mount}
rm $dir/unix
rm $dir/usr/mdec/[tm]boot $dir/usr/sys/conf/mkconf $dir/usr/fort/fc1
rm $dir/usr/c/cvopt $dir/usr/lib/suftab

Unix History Repository に含まれる他のソーススナップショットと同様に、(合成) Git コミット日時はファイルタイムスタンプから導出され、コミット作者は手作業で作成したマップファイルから取得します。既存の V4 作者マップを前後の Unix Research 版に関する情報をもとに更新しました。ソースコード内に作者情報が欠けているファイルには kendmr(Ken Thompson と Dennis Ritchie、システム主開発者)を明示的に付与し、

. *
正規表現でデフォルトとして未記入の詳細をマークしました。

元 Bell Labs Unix 開発チームのメンバー数名が協力してくれ、SNOBOL III インタプリタ(Ken Thompson)や数学ライブラリ・エミュレータ(Robert H. Morris)の実装者など、一部詳細を埋める情報を提供してくれました。テープの内容は Fifth Edition に近いと主張する声もありますが、これは Unix マニュアル版は正式に番号付けされている一方で、配布ソフトウェアテープは当時単一の Unix 開発コンピュータ上にあったものをコピーしたものがほとんどだったためです。

二つのバージョン間の違いを確認するためにまずベースファイル名を比較しました。

normalize() {
  sed 's|.*/||' | sort -u
}

comm -3 \
  <(git ls-tree -r --name-only Research-V4-Snapshot-Development | normalize) \
  <(git ls-tree -r --name-only Research-V5-Snapshot-Development | normalize)

このコマンドは、二つのリリースでのみ出現するベースファイル名を表示し、以下のファイルが Fifth Edition に追加されたことを示しました。

c13.c
c21.c
c2h.c
cmp.c
ldfps.s

つまり C コンパイラは数ファイル増加し、

cmp
(比較)ユーティリティは C で書かれたという事実です。

さらに掘り下げるために

git blame
を使い、各版のファイルが前版からどの部分を取り込んだかを調べました。

# 各版について
for ref in Research-V4-Snapshot-Development \
  Research-V5-Snapshot-Development ; do
  echo $ref
  # その版の全ファイルに対して
  git ls-tree -r --name-only $ref |
    grep -Ev 'README|LICENSE|\.pdf|\.ref' |
    xargs -I '{}' git blame -M -M -C -C $ref -- '{}' |
    sort |
    uniq -c |
    awk '{("git show " $2 " | awk '\''/Synthesized-from:/{print $2}'\'') | getline ver; total[ver] += $1 }
      END {for (v in total) print v, total[v]}'
done

出力は次の通りで、Fourth Edition のコード行構成を示しています。

v4 75676
v3 6590
v2 168

新規素材が多く、以前の版から約10 %が取り込まれたことが分かります。
Fifth Edition の対応結果は次のとおりです。

v5 11181
v4 52238
v3 3296
v2 168

これにより、Fourth Edition の52,000行が Fifth Edition にも含まれている一方で、新たに約11,000行のコードが追加されたことが明らかです。

最後に各リリースに含まれるファイルの平均タイムスタンプを調べました。

# 各 Research Edition について
for v in $(seq 1 7) ; do
  ref=Research-V$v-Snapshot-Development
  printf '%s\t' $ref
  git ls-tree -r --name-only $ref |
    grep -Ev 'README|LICENSE|\.pdf|\.ref' |
    xargs -I@ git log -1 --format=%at $ref -- @ |
    date -I -d @$(awk '{s += $1} END {printf("%.0f", s / NR)}')
done

結果は以下のとおりです。

V1 1972-06-20
V2 1972-05-31
V3 1973-03-10
V4 1974-03-06
V5 1974-11-28
V6 1975-06-15
V7 1979-01-25

これらは Fourth Edition が Fifth Edition より約8か月前に完成したことを示し、当時のシステム進化速度を考えると重要な期間です。(また、First と Second Editions のタイミング不一致も検証する必要があります。)

同じ日のほかのニュース

一覧に戻る →

2025/12/24 2:33

ファブリス・ベルラドが MicroQuickJS をリリース

## Japanese Translation: GitHubの最新オファリングは、AI駆動のコード作成、統合開発ワークフロー、および組み込みセキュリティを一つの体験に融合した統一プラットフォームです。 - **AIツール**:CopilotとSparkは開発者がより高品質なコードを書き、プロンプトを管理し、外部サービスへ接続するのを支援します。 - **ワークフロー**:Actionsは任意のワークフローを自動化し、Codespacesは即時にクラウド開発環境を提供します。Issues、Plans、およびCode Reviewはチームが作業を追跡し変更点をレビューできるようにし、すべて単一パイプライン内でハンドオフを減らします。 - **セキュリティ**:Advanced Securityはビルド時に脆弱性をスキャンし、シークレット保護は認証情報の漏洩を事前に防止します。 - **対象ユーザー**:エンタープライズから中小チーム、スタートアップ、非営利団体まで、アプリモダナイゼーション、DevSecOps、DevOps、およびCI/CDなどのユースケースで利用可能です。 - **対応業界**:ヘルスケア、金融サービス、製造、政府機関その他多数。 - **追加リソース**:ドキュメント、ブログ、変更履歴、マーケットプレイス、イベント/ウェビナー、電子書籍/レポート、ビジネスインサイト、スキルトレーニング、サポート、コミュニティフォーラム、Trust Center、およびパートナープログラムがすべて利用可能で、チームの成功を支援します。 - **エンタープライズソリューション**:GitHub Enterprise PlatformにはAdvanced Security、Copilot for Business、プレミアムサポート、24/7 エンタープライズレベルサービスなどのAI駆動開発プラットフォームと追加機能が含まれ、それぞれ階層化された価格モデルで提供されます。 これらの機能を組み合わせることで、あらゆる規模の組織においてコード生成をより迅速かつ安全に行い、ワークフローを効率化します。

2025/12/24 6:54

**X‑ray:PDF 文書における不適切な赤字消去(レダクション)を検出するための Python ライブラリ**

## Japanese Translation: --- ## Summary x‑rayは、PDF文書内の不適切な赤字(黒い四角形が背後にあるテキストを完全に覆えていない)を自動で検出するPythonライブラリです。PyMuPDFでPDFをスキャンし、四角形の形状を特定してページコンテンツ上に重ね合わせ、各形状が実際に隠された情報を遮蔽しているかどうかをテストします。不適切な赤字はJSON(またはPython辞書)として報告され、ページ番号、境界ボックス、および隠されたテキストがリスト化されます。 ### Installation ```bash uv add x-ray # 既存のuvプロジェクトに追加 pip install xray # 標準的なpipインストール ``` インストールせずに実行することも可能です: ```bash uvx --from x-ray xray <PDF_URL> ``` ### Usage *コマンドライン:* ```bash xray path/to/file.pdf xray https://free.law/pdf/example.pdf # バッチURL cat urls.txt | xargs -n 1 xray ``` *Python import:* ```python import xray bad_redactions = xray.inspect("some/path/to/file.pdf") # `inspect` は str、pathlib.Path、URL(https://)、または PDF コンテンツの bytes を受け取ります。 ``` ### Output このツールは、ページ番号をキーとし、不適切な赤字オブジェクトのリストを値とするJSONを出力します。各オブジェクトには `bbox` タプルと隠された `text` が含まれます。モジュールとして使用した場合、同等のPython辞書が返されます。 ### Project context - Free Law Projectで数百万件のPDFを監査し、法的透明性を確保するために使用されています。 - GitHub上でオープンソース化されており、貢献にはCLAへの署名が必要で、issues経由で管理されます。 - リリースはGitHub Actionsで自動化されており、手動リリースでは `CHANGES.md`、`pyproject.toml` の更新、タグ付け、およびPoetryによる公開を行います。 - BSDライセンス(許諾型)で配布されています。 x‑rayの軽量なインストールと明確なレポート機能は、法務テック企業や規制当局、オープンデータイニシアチブが不備のある赤字を迅速に特定し、コンプライアンスと透明性を維持するのに役立ちます。

2025/12/24 4:35

テレンス・マリック『Disciples』

## Japanese Translation: テレンス・マリックの独特な美学―長いモンタージュ、自然光、詩的ナレーション、そして従来の物語構造への拒否――は、そのスタイルを直接模倣せずに採用する新しい映画作家たちの波を呼び起こしました。 代表例としてラメル・ロス監督の『ニッケル・ボーイズ』(2024年)が挙げられます。この作品はコールソン・ホワイトヘッド小説の改編で、ベストピクチャー賞ノミネートを獲得しました。ロスはマリックの『The Tree of Life』に触発され、その制作に関わったプロデューサーの一人が手助けしたといいます。彼は監督のアプローチを第一人称視点と断片的な詩性へと翻訳し、没入型の神話的物語を創造していますが、それでも独自性を保っています。 他の現代映画監督――クロエ・ザオ(『ノマドランド』)、クリント・ベンツリー(『Train Dreams』)、デイヴィッド・ゴードン・グリーン(『ジョージ・ワシントン』)、そしてローラ・ダン――はマリックの視覚言語を響かせますが、表面的な模倣を避けるために自らの感性と融合させる必要があります。A.J. エドワーズ(『The Better Angels』)やデイヴィッド・ロウリー(『Ain’t Them Bodies Saints』)による試みは、スタイルフレームワーク内で真の人間性を捉える難しさを示しています。 マリックのキャリアは、『Badlands』と『Days of Heaven』という初期叙事詩から始まり、20年間の休止期間を経て、『The Thin Red Line』『The New World』『The Tree of Life』などの後期作品へと進化しました。彼の作品は常に精神性・自然・人間存在を探求しつつ、批評家から高い評価を受ける一方で、ボックスオフィスでは稀にしかヒットしません。マリックの総合的な目標――失われた精神性とアメリカ映画を再接続すること――は、芸術的解放とハリウッドの従来の物語期待との間で緊張を生み出します。 この記事では、マリックの美学と制作手法が多くの人々にインスピレーションを与えている一方で、本当の影響力は表面的な技術を単純に模倣するのではなく、それらの要素を自分自身の物語ビジョンへと翻訳することにあると主張しています。