
2026/03/26 4:41
**個人百科事典**
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
改訂版要約
著者は、オープンソースのMediaWikiインスタンスが家族史を保存しつつデータをローカルに保管するための「個人百科事典」として機能できることを示しています。プロジェクトは祖母の家から1,351枚の古い写真を収集し、画面比率やフィルム種別などの物理的属性でグループ化することで始まりました。祖母へのインタビューから得た背景情報は、実際のWikipedia記事にリンクされた複数のWikiページへと変換されました。
著者はMediaWikiをローカルにクローンし、2011年の王室結婚テンプレートを使用して祖父母の結婚式のWikipedia風ページを作成しました。インフォボックス、キャプション、およびリンクを追加し、2晩で完全な背景記事を完成させました。この例は、失われる可能性があるメディアを保存できる百科事典ソフトウェアの有効性を示しています。
r/genealogy からの協力により、ワークフローは音声文字起こしと言語モデル(Claude Code)を含むよう拡張されました。例えば、Claude Code はEXIFメタデータ、銀行取引履歴、Uberの乗車記録、および Shazam のトラック情報を 2012 年のコーグ旅行フォルダー(625 枚の写真)と 2022 年のメキシコシティ旅行フォルダー(291 枚の写真/343 ビデオ)の画像ディレクトリからクロス参照しました。これにより、レストラン、サッカーチーム、移動時間、および会場で流れた音楽を特定できました。
著者はまた、大規模なテキストデータセット(約10万件の Facebook/Instagram/WhatsApp メッセージとボイスノート)に対して同じプロセスを適用し、相互接続されたページ間で友情や人生のエピソードを追跡しました。この作業は、ユーザーがデータエクスポートをアップロードし、言語モデルを使用してレビュー用のページをドラフトできるようにするローカルかつオープンソースのMediaWikiである公開サイト whoami.wiki に進化しました。すべての個人データはプライベートなままで保たれます。
主なポイント:
- 改訂版要約には、写真、クラスタリング、インタビュー、テンプレート使用、2晩で完成した記事、r/genealogy との拡張、EXIF と Claude Code の例、外部データのクロス参照、大規模テキストコーパス、whoami.wiki への進化など、すべての主要ポイントが含まれています。
- 新たな推論は追加されず、広範な影響に関する推測的主張は削除されています。
- メインメッセージは明確で理解しやすいままです。
本文
昨年、パンデミックの後初めて祖母の家を訪れた際に、散らばった古い写真が詰まった棚を見つけました。そこには1,351枚もの写真があり、祖父母の20代前半から、母親が赤ちゃんだった頃、そして私が中学生時代まで…最初のスマートフォンを手に入れた頃以降はすべてオンラインでバックアップしているためです。
写真は散乱状態だったので、一枚ずつ確認しながら整理する時間を取りました。最初のグループ分けは、縦横比やフィルム種別といった物理的属性に基づいていました。例えば、祖父が20代半ばの頃に撮影された32 mm正方形の白黒写真という集まりです。
整理を終えると、物語の断片がちらりと浮かびました―しかしそれは一瞬で脆弱でした。あるグループは祖父母の結婚式のもののように見えたものの、EXIFメタデータが存在しなかったため時系列は不明確でした。
そこで祖母に座り、写真を並べ替えてもらい、結婚式について思い出せることを語ってもらいました。彼女の表情は光り輝き、フォトから記憶が蘇り、数十年眠っていた詳細が再び浮上しました。私は全てを書き留め、写真に写る人物の名前も記録しました――それらは叔父や叔母の若い頃の姿でした。
インタビュー後、50年前に起こった出来事と写真を結びつけた複数ページのメモができました。歴史的な内容だったので、冗談として、整理してWikipediaページとしてまとめてみようと思いました。MediaWikiをクローンし、ローカルインスタンスを立ち上げて編集作業に入ります。
2011年の王室結婚式を参考に、クラシックな情報ボックスとリードパラグラフでページを書き始めました。その後残りの内容をセクションに分け、日付・名前・場所・座席配置など確認できるものを埋め込みました。写真全てをスキャンし、どこに入れるか決定し、キャプションも添えました。
人物を言及するたびに空のスタブページへリンクしましたが、後になって既存のWikipedia記事へリンクできることに気づき、場所・儀式・政治状況・関連法改正など幅広い文脈を提供する実際の記事へ接続しました。
二晩で全体像を整えた記事を書き上げました。その作業は、失われてしまうかもしれないメディアと知識を保存するエンサイクロペディアソフトウェアの力を改めて実感させるものでした。
その後も続けました。すべての写真を繋げるためにページを書き、r/genealogyで口述歴史の記録方法を学び、音声転写や言語モデルを使って編集プロセスを楽にしました。
時間が経つにつれ、人々とさまざまな人生イベントを結び付ける多くのページを書きました。エンサイクロペディア形式は、独自には見つからない情報を結び付けるのに便利でした―例えば祖父母の結婚式で歌っていた一人の歌手が実は私を出産した看護師だったという発見です。
物理写真の裏側にあるストーリーをすべて掘り起こした後、次にデジタル写真と動画(Google Photos)へ切り替えました。デジタル写真にはEXIFメタデータが付いており、撮影日時や時折座標も確認できます。
インタビューなしで、言語モデルだけでページを作成できるか試してみたのが最初の実験です。2012年にコーグへ家族旅行で撮った625枚の写真フォルダをClaude Codeに渡し、Wikiページを書き起こすよう依頼しました。ImageMagickでコンタクトシートを作る手助けも示唆しています。
数分以内に、時間帯ごとの旅行内容を詳細にまとめた魅力的なドラフトが生成されました。モデルは位置情報を持っていませんでした―タイムスタンプとビジュアルだけだったのですが、写真から場所を特定し、忘れていたスポットも拾いました。また、見えるものから交通手段も推測しました。
人物が誰か分かったら、自動でキャプションに反映。詳細なアウトラインはあるものの物語性が不足していたため、私自身のエピソードを追加するとモデルは必要に応じて挿入しました。
コーグ旅行は写真のみで構成されましたが、2022年のメキシコシティ旅行では291枚の写真と343本の動画(iPhone 12 Pro撮影)をEXIFメタデータにGPS座標付きで持ち込みました。Google Mapsのロケーションタイムライン、Uberトリップログ、銀行取引、Shazam履歴もエクスポートし、Claude Codeに段階的に渡しました。
複数回実行して得られた成果は:
- 銀行取引と位置情報を照合しレストランを特定。
- 写真で映っているサッカー試合を、銀行記録から見つけたTicketmaster請求書とマッチング。
- Uberログを使い移動時間・ピックアップ/ドロップオフ地点を決定。
- Shazamトラックで会場で流れた音楽(例:キューバ料理店でのキューバンソング)を記述。
- フォローアップで夜間撮影のメディアをフィルタし、ギター奏者のフレームを見つけてページに引用。
MediaWikiの構造はこれら編集に適していました。新しいデータ源ごとに、実際のWikipedia寄稿者が行うように修正を加えました:トークページで欠落点を明確化し、カテゴリでテーマ別にまとめ、リビジョン履歴で変更を追跡―すべて何も構築せずに済みます。
初めは記憶のギャップを埋める作業だったが、モデルは忘れられた詳細を浮かび上げ、異なるデータソースをクロスリファレンスしてくれました。Facebook、Instagram、WhatsAppアーカイブ(約10万件のメッセージと数千件の音声メモ)もエクスポートし、Claude Codeに渡しました。
モデルはメッセージを通じて友情の軌跡を追い、人生のエピソードを抽出し、複数ページに織り込みました。友人たちに共有すると、一枚一枚読んでみたがってくれました。
この段階で私は家族歴史プロジェクトではなく、個人エンサイクロペディアを構築していると気づきました。ページごとにデータをまとめ、既に存在する情報から結び付けることで、私の人生を体系化・閲覧可能な形で保存したのです。
そこで whoami.wiki をオープンソースプロジェクトとして公開します。MediaWikiを基盤にしており、言語モデルは訓練データからWikipediaの慣例を理解しています。自分のデータエクスポートを持ち込み、エージェントがページを作成しレビューできる仕組みです。祖母の結婚式に関するページも王室結婚式と同じ方法で作れますし、親友については公的人物として扱われます。
このエンサイクロペディアをまとめる経験は、Facebookタイムライン初期の日々を思い出させました。完成したページを閲覧し、人やイベント間のリンクを辿り、忘れた詳細に出会うことができました。技術以上に残ったのは物語でした。祖母の人生を書き上げることで、彼女がシングルマザーだった時代、決断したこと、示したレジリエンスなどを知りました。彼女は私が想像していたよりも強かったのです。
友情を振り返ると、ほぼ忘れていた優しさの瞬間に気づきました。友人たちが私のために尽くしてくれた日々。ページ上でそれらが整理されているのを見ると、電話を取り出して連絡したくなります。エンサイクロペディアは単なるデータ整理ではなく、人生の中の人々へより注意深く向き合うきっかけになりました。
今日、whoami.wiki をオープンソースプロジェクトとしてリリースします。自分のマシンでエンサイクロペディアを動かし、データは手元に残ります。どんなモデルでも読み取れます。このプロジェクトはまだ初期段階ですが、興味があればこちらから始めてみてください。そして感想を教えてください!
Vishnu Dut、Sarah Cheon、Andy Law、Vishhvak Srinivasan、Raghav Rmadya に早い段階のドラフトを読んでもらい、素晴らしい提案をしてくれたことに感謝します。