**ランダム整数のエントロピー**

情報理論において、*エントロピー* \(H\) は、確率変数が取る結果に対する平均的な「驚き」や不確実性の量を定量化します。  
離散型で整数値を取り得る確率変数についても、エントロピーは他の任意の離散分布と同じ式で定義されます。

---

### 1. 一般的な公式

ランダム整数 \(X\) が異なる値  
\(\{x_1, x_2, \dots , x_n\}\) を取り、確率
\(P(X=x_i)=p_i\)(\(p_i \ge 0\)、かつ \(\sum_{i=1}^{n} p_i = 1\)とすると、

\[
H(X) \;=\; -\,\sum_{i=1}^{n} p_i \log_2 p_i .
\]

- **単位**:ビット(対数の底が \(2\) の場合)。  
  自然対数 (\(\ln\)) や常用対数 (base‑10 log) を使うと、結果はナットやバンになります。

---

### 2. よくあるケース

| 分布 | エントロピー式 |
|------|----------------|
| **一様分布** \(\{1,\dots,N\}\) | \(H = \log_2 N\) ビット |
| **幾何分布**(成功確率 \(p\)) | \(H = -\,\dfrac{(1-p)\log_2(1-p)+p\log_2 p}{p}\) |
| **ポアソン分布**(平均 \(\lambda\)) | \(H \approx \tfrac12\log_2(2\pi e \lambda)\)  (\(\lambda\) が大きいとき) |

---

### 3. 本質的な直感

- 大きい範囲の **一様整数** は不確実性が高く、可能な値が増えるごとに等しい確率を持つ結果数が2倍になるため、エントロピーは1ビットずつ増加します。
- 分布が極端に偏っている(例えばある結果だけが支配的)場合、変数はほぼ決定論的となり、エントロピーは 0 に近づきます。

---

### 4. 実践例

公平な6面ダイスを振ると、\(X \in\{1,\dots,6\}\) で \(p_i=1/6\)。

\[
H(X)= -\,6 \times \frac16 \log_2 \frac16 = \log_2 6 \approx 2.585~\text{ビット}.
\]

したがって、1回のダイスロールは約 **2.59 ビット** の情報を伝えます。

---

### 5. 重要なポイント

ランダム整数のエントロピーは、その確率分布に対するシャノンエントロピーであり、標準的な離散型エントロピー式で計算されます。具体的な値は、すべてその分布の確率に依存します。

2026/02/05 18:47

**ランダム整数のエントロピー** 情報理論において、*エントロピー* \(H\) は、確率変数が取る結果に対する平均的な「驚き」や不確実性の量を定量化します。 離散型で整数値を取り得る確率変数についても、エントロピーは他の任意の離散分布と同じ式で定義されます。 --- ### 1. 一般的な公式 ランダム整数 \(X\) が異なる値 \(\{x_1, x_2, \dots , x_n\}\) を取り、確率 \(P(X=x_i)=p_i\)(\(p_i \ge 0\)、かつ \(\sum_{i=1}^{n} p_i = 1\)とすると、 \[ H(X) \;=\; -\,\sum_{i=1}^{n} p_i \log_2 p_i . \] - **単位**:ビット(対数の底が \(2\) の場合)。 自然対数 (\(\ln\)) や常用対数 (base‑10 log) を使うと、結果はナットやバンになります。 --- ### 2. よくあるケース | 分布 | エントロピー式 | |------|----------------| | **一様分布** \(\{1,\dots,N\}\) | \(H = \log_2 N\) ビット | | **幾何分布**(成功確率 \(p\)) | \(H = -\,\dfrac{(1-p)\log_2(1-p)+p\log_2 p}{p}\) | | **ポアソン分布**(平均 \(\lambda\)) | \(H \approx \tfrac12\log_2(2\pi e \lambda)\) (\(\lambda\) が大きいとき) | --- ### 3. 本質的な直感 - 大きい範囲の **一様整数** は不確実性が高く、可能な値が増えるごとに等しい確率を持つ結果数が2倍になるため、エントロピーは1ビットずつ増加します。 - 分布が極端に偏っている(例えばある結果だけが支配的)場合、変数はほぼ決定論的となり、エントロピーは 0 に近づきます。 --- ### 4. 実践例 公平な6面ダイスを振ると、\(X \in\{1,\dots,6\}\) で \(p_i=1/6\)。 \[ H(X)= -\,6 \times \frac16 \log_2 \frac16 = \log_2 6 \approx 2.585~\text{ビット}. \] したがって、1回のダイスロールは約 **2.59 ビット** の情報を伝えます。 --- ### 5. 重要なポイント ランダム整数のエントロピーは、その確率分布に対するシャノンエントロピーであり、標準的な離散型エントロピー式で計算されます。具体的な値は、すべてその分布の確率に依存します。

RSS: https://news.ycombinator.com/rss

要約

日本語訳:

概要(改訂版):
この記事では、区間 ([N,2N]) から一様に選ばれた整数 (n) の情報量を調べます。(n) を素因数分解すると
[ n=\prod p_i^{a_i} ] となり、各素数 (p_i) に対する確率分布は [ P(p_i)=\frac{a_i\log p_i}{\log n} ] で与えられ、この分布のシャノンエントロピーを求めることが問題となります。
解析を容易にするため、著者らはまず平方自由整数に限定します。この場合、各素因数は (N) 個の文字からなるランダム置換のサイクルに対応し、これらの長さはポアソン・ディリクレ ((0,1)) 過程に従います。固定されたサイクル長 (i) について、そのようなサイクル数 (X_i) は平均 (1/i) のポアソン分布に近似されます。
各 (i)-サイクルはエントロピーに [ -\frac{i}{N}\log!\left(\frac{i}{N}\right) ] を寄与します。すべてのサイクル長について合計すると、期待寄与は [ \sum_{i=1}^N \frac{i}{N}\bigl(\log N-\log i\bigr). ] 第一項は (\sum_i iX_i=N) であるため (\log N) に等しく、第二項は
[ \frac{1}{N}\sum_{i=1}^N \log i \approx \log N-1 ] と Stirling の近似を用いて評価できます。したがって期待エントロピーは [ E[H];\approx;\log N-(\log N-1)=1. ] 数値実験では、有限の (N) に対して平均エントロピーがわずかに 1 未満であることが確認され、これは有限サイズ効果を反映しています。
論文は最後に、エントロピー自体が分布的に収束するか(平均だけでなく)、その指数関数であるパープレキシティが明確な期待値を持つかどうかを問い、素因数分解統計と情報理論的概念(エントロピー・パープレキシティ)との関連を示し、エルドウス–カク定理に非公式の類似性を引き出しています。

本文

素因数分布のエントロピー

(n) を ([N,2N]) から一様に選ばれた整数とする。
その素因数分解を

[ n=\prod_{i}p_i^{,a_i} ]

と書く。

各素数 (p_i) が「(n) の大きさ」に与える寄与は

[ w_i=\frac{a_i \log p_i}{\log n}, \qquad \text{すなわち}\qquad \sum_i w_i=1. ]

したがって ((w_1,w_2,\dots)) は (n) の素因数上の確率分布になる。
疑問は「この分布のエントロピーはいくらか?」である。


簡易モデル:平方自由整数

平方自由整数に限定すると、各素数は最大でも一度しか現れない。
そのとき分布は

[ w_i=\frac{\log p_i}{\sum_j \log p_j}, ]

となり、典型的な素因数の大きさは (N) 個の文字列上のランダム置換におけるサイクル長と同じ挙動を示す。
実際、大きな平方自由整数の素因数集合は、等確率置換のサイクル長集合(Poisson–Dirichlet ((0,1)))と同一分布になる。

したがってエントロピーを調べるために次の組合せ的設定で研究できる:

置換モデル – (N) 個の文字列上のランダム置換をサイクルに分解する。
各サイクルには確率 (\frac{\text{サイクル長}}{N}) を割り当てる。


期待エントロピーの計算

(X_i) を置換中の (i)-サイクル数とする。
大きな (N) に対して、変数 (X_i) は平均 (\frac1i) の独立ポアソン乱数として近似できる。

(i)-サイクルがもたらすエントロピーは

[ -\frac{i}{N}\log!\left(\frac{i}{N}\right) ]

で、そうした (X_i) 個のサイクルがあるので、全体の貢献は

[ -\frac{i}{N}X_i,\log!\left(\frac{i}{N}\right) = \frac{i}{N}X_i\bigl(\log N-\log i\bigr). ]

すべてのサイクル長について和を取ると

[ H=\sum_{i=1}^{N}\frac{i}{N}X_i,\log N -\sum_{i=1}^{N}\frac{i}{N}X_i,\log i . ]

第一項。
(\sum_{i} iX_i=N) であるから、最初の和は単に (\log N) になる。

第二項。
(E[X_i]=1/i) を使うと

[ E!\left[\frac{i}{N}X_i,\log i\right] =\frac{1}{N},\log i, \qquad E!\Bigl[\sum_{i=1}^{N}\frac{i}{N}X_i,\log i\Bigr] =\frac{1}{N}\sum_{i=1}^{N}\log i. ]

スターリング公式より

[ \sum_{i=1}^{N}\log i = \log(N!) = N\log N - N + O(\log N). ]

したがって

[ E!\Bigl[\sum_{i=1}^{N}\frac{i}{N}X_i,\log i\Bigr] = \log N - 1 + o(1). ]

まとめ。

[ E[H]=\log N-\bigl(\log N-1\bigr)+o(1)=1+o(1). ]

ゆえに 期待エントロピーは (N\to\infty) のとき 1 に収束する


補足とさらなる疑問

  • この計算はポアソン変数の第一二次モーメントだけを使っているため、
    大きな (N) では高階修正は無視できる。したがって収束は堅牢である。

  • 実際の整数(平方自由でない場合)では指数 (a_i>1) が追加項として現れるが、
    これらは極限においてエントロピーへの影響を消失させる。

  • エントロピーから求める パープレキシティ (\exp(H)) は (e) に収束する。
    その分布は、加算的算術関数の古典的なエルデス–カック現象と同様に鋭く集中する。


結論

素因数サイズを正規化して作られた確率分布(あるいはランダム置換のサイクル長)
そのエントロピーは 1 ビット に収束し、従ってパープレキシティは (e) になる。
これは平均的にランダム整数が「有効な」素因数をほんの少しだけ持つという直感と一致する。

同じ日のほかのニュース

一覧に戻る →

2026/02/09 23:37

ディスコードは、来月から完全な利用権を得るために顔スキャンまたは本人確認書類(ID)の提出を求めるようになるそうです。

## Japanese Translation: Discord は、すべてのアカウントを「ティーン向け」設定にデフォルト化し、ユーザーが成人であることを証明しない限りは実行される世界規模の年齢確認システムを導入しています。未確認メンバーは、年齢制限付きサーバーへの参加や閲覧、ステージチャネルでの発言、グラフィックコンテンツの表示ができません。これらのサーバーは確認までブラックスクリーンとして表示され、新規加入時にも同じチェックが行われます。不明なユーザーからのフレンドリクエストには警告が出力され、見知らぬ連絡先からのプライベートメッセージは別の受信箱に振り分けられます。 Discord の以前の英国/オーストラリアでの試験では、フォトモードハックが検知され、1 週間以内に修正されました。10 月には旧ベンダーからデータ漏洩事件が発生しました。新システムは、生体認証や個人情報を保存しない別のサードパーティプロバイダーと提携しています。AI 年齢推定手法はデバイス上でローカルに実行され、データはオフデバイスへ送信されず、誤分類があった場合はユーザーがアピールしたり ID 写真をアップロードしてすぐに削除することができます。さらに Discord は「年齢推論」モデルを使用し、ゲーム種別・活動パターン・勤務時間シグナルなどのユーザーメタデータを解析して追加手順なしで成人を自動承認します。 Discord は回避策を防止するために広範なバグテストを行い、一部離脱が見込まれるものの、離れたユーザーを再度引き戻すことを目指しています。このイニシアチブは、世界的な児童安全規制によって推進される年齢確認義務化への業界全体の動きと整合性があります。ほとんどのユーザーは日常使用に大きな変化を感じませんが、主な影響は明示的またはグラフィックな成人コンテンツへのアクセス制限の強化です

2026/02/10 1:26

**プロジェクト概要** Walmart の 3.88 インチアナログ時計を、ESP‑8266 ベースの Wi‑Fi 時計に変換します。 --- ### 必要な材料 - Walmart の 3.88″ アナログ時計 1 個 - ESP‑8266 NodeMCU または Wemos D1 Mini 1 個 - DS3231 リアルタイムクロックモジュール(オプション、オフライン時の時間保持用) 1 個 - 10 kΩ プルアップ抵抗(I²C 用) 1 本 - ジャンパー線 - はんだごて&はんだ - ケースまたは取り付けハードウェア ### 配線図 ``` ESP8266 時計 D2 ----> CLK (クロック信号) D4 ----> DT (データ信号) GND <---- GND VIN <---- VCC(USB/AC アダプタからの5 V) ``` *DS3231 を使用する場合:* - SDA ↔ A4 - SCL ↔ A5 - VCC ↔ 3.3 V - GND ↔ GND ### ソフトウェア手順 1. **Arduino IDE の設定** - ESP8266 ボードパッケージをインストール。 2. `config.h` に Wi‑Fi 認証情報を入力。 3. ライブラリをインストール: - `ESP8266WiFi`, `NTPClient`, (必要に応じて)`TimeLib`。 4. 以下の機能を備えたスケッチをアップロード: - Wi‑Fi 接続 - NTP で時刻取得 - D2/D4 の PWM を使って時計のポテンショメータを駆動 5. 動作確認 – 時計の針がずれたらキャリブレーションを調整。 ### キャリブレーション - 12 時間ダイヤルで既知の時刻に合わせてください。 - コード内の `pwmMin` と `pwmMax` を調整し、針が正確に合うようにします。 --- #### ヒント - 時計本体の電源と ESP‑8266 の電源は分離してノイズを抑えます。 - 電子部品は安全性のためケースで覆い、ESP 部品には十分な換気を確保してください。 - 手動同期用にボタンを追加することも検討すると便利です。

## Japanese Translation: ## 要約 このプロジェクトは、安価なアナログ石英時計をインターネット接続型デジタル時計に変換します。WEMOS D1 Mini ESP8266 が Arduino スケッチを実行し、ステッピングモーターを駆動させます。ESP8266 は NTP サーバーから現在の UTC 時間を **15 分ごと** に取得し、時計に表示されている時間と比較します。この比較は **1 秒あたり 10 回** 行われます。もし時計が遅れていた場合、マイクロコントローラはモータコイルへ短い **(~30 ms) のバイポーラパルス**(`PULSETIME` 定数で調整可能)を送信し、秒針を前進させます。 アナログの動きには位置センサがないため、システムは各針(時・分・秒)の位置を毎秒 Microchip の **47L04 Serial EERAM**(4 kbit SRAM と EEPROM バックアップ)に保存します。初回起動時、ESP8266 はウェブページを提供し、ユーザーが初期針位置を設定できるようにします。その後の再起動では、EERAM に保存されたデータから継続します。初期化後は、ステータスウェブページで SVG/Canvas またはプレーンテキストを用いて時計表面を表示できます。 時計は NTP 時間取得を通じて自動的に **夏時間(DST)** を調整し、この設計は IoT コントローラがレガシー機械装置を復活させつつ、低コストで簡単に構築できることを示しています。

2026/02/10 5:49

アメリカはタングステンの供給問題に直面しています。

## 日本語訳: --- ## Revised Summary 米国は年間約10 000 tのタングステンをほぼ全て輸入しており、その80%以上が中国からで、2015年以降国内採掘は行われていないため、深刻な供給リスクに直面しています。中国による輸出管理は米国企業が必要とするライセンスを取得できなくし、サプライチェーンをさらに厳しく制限しています。保守的な成長仮定では、需要は10年で約77 %増加し、従来用途では年間15 000 t以上に達すると予測されます。もし核融合炉が稼働すれば(1基あたり約250 t、推測で200基)、総需要は年間60–70 000 tへと急増する可能性があります。この不均衡により、市場価格は既に過去最高水準に達しています。 世界の生産量(年間約80 000 t)は中国が支配しており、ベトナム・ロシア・北朝鮮はわずかな割合しか占めていません。米国の過去の取り組み―軍事調達プログラムやトランプ時代にカザフスタンと結んだ取引―はギャップを埋めるには不十分でした。 タングステンの米国内での重要用途は、切削・掘削工具(約60 %)、兵器(約10 %)、半導体(約5 %)、光伏(約1 %)およびその他(約24 %)です。これらの材料に依存する産業は供給制限、高コスト、特に防衛や新興核融合技術で生産ボトルネックを経験する可能性があります。 重要な戦略的課題が浮上します:なぜ中国がタングステン生産を支配しているのか?米国の採掘はなぜ停止したのか?国内再供給に必要な変更点は何か?将来のブーム/バーストサイクルに耐えうるサプライチェーンを構築するにはどうすればよいか。これらの課題への対処は、予測される需要急増に対するレジリエンスを確保するために不可欠です

**ランダム整数のエントロピー** 情報理論において、*エントロピー* \(H\) は、確率変数が取る結果に対する平均的な「驚き」や不確実性の量を定量化します。 離散型で整数値を取り得る確率変数についても、エントロピーは他の任意の離散分布と同じ式で定義されます。 --- ### 1. 一般的な公式 ランダム整数 \(X\) が異なる値 \(\{x_1, x_2, \dots , x_n\}\) を取り、確率 \(P(X=x_i)=p_i\)(\(p_i \ge 0\)、かつ \(\sum_{i=1}^{n} p_i = 1\)とすると、 \[ H(X) \;=\; -\,\sum_{i=1}^{n} p_i \log_2 p_i . \] - **単位**:ビット(対数の底が \(2\) の場合)。 自然対数 (\(\ln\)) や常用対数 (base‑10 log) を使うと、結果はナットやバンになります。 --- ### 2. よくあるケース | 分布 | エントロピー式 | |------|----------------| | **一様分布** \(\{1,\dots,N\}\) | \(H = \log_2 N\) ビット | | **幾何分布**(成功確率 \(p\)) | \(H = -\,\dfrac{(1-p)\log_2(1-p)+p\log_2 p}{p}\) | | **ポアソン分布**(平均 \(\lambda\)) | \(H \approx \tfrac12\log_2(2\pi e \lambda)\) (\(\lambda\) が大きいとき) | --- ### 3. 本質的な直感 - 大きい範囲の **一様整数** は不確実性が高く、可能な値が増えるごとに等しい確率を持つ結果数が2倍になるため、エントロピーは1ビットずつ増加します。 - 分布が極端に偏っている(例えばある結果だけが支配的)場合、変数はほぼ決定論的となり、エントロピーは 0 に近づきます。 --- ### 4. 実践例 公平な6面ダイスを振ると、\(X \in\{1,\dots,6\}\) で \(p_i=1/6\)。 \[ H(X)= -\,6 \times \frac16 \log_2 \frac16 = \log_2 6 \approx 2.585~\text{ビット}. \] したがって、1回のダイスロールは約 **2.59 ビット** の情報を伝えます。 --- ### 5. 重要なポイント ランダム整数のエントロピーは、その確率分布に対するシャノンエントロピーであり、標準的な離散型エントロピー式で計算されます。具体的な値は、すべてその分布の確率に依存します。 | そっか~ニュース