
2026/02/17 4:55
**Show HN の現状:2025**
RSS: https://news.ycombinator.com/rss
要約▶
Japanese Translation:
要約
この記事は2019年から2025年までのShow HN投稿を階層的トピックモデルで分析し、マクロ経済動向・行動変化・投票詐欺の証拠を明らかにしています。
主な発見は次のとおりです:
- 量対スコア:2025年は投稿数が最大ですが、10点以上になる確率は約11%に留まり、平均スコアは過去どの年よりも低いです。
- トップカテゴリ:最高スコアを獲得した2025年のトピックは DIY ハードウェア IoT プロジェクト、オープンソースプロジェクト、エラーハンドリング&デバッグ、プログラミング言語インタプリタ、およびライフナラティブです。
- スコア分布:CDFプロットは3つの明確なスコアグループを示します:2022年ピーク時代、2021/23/24年に一貫して高いパフォーマー、そして2025年の低スコアクラスタ。
- AIスパイク:2024年から2025年への傾斜プロットは「Agent Connectivity」「AI Coding」「AI Automation」などのAI関連トピックの急上昇を強調しますが、これらの投稿は初期アップボートを受けるものの、広範なオーディエンスの関与を維持できず—投票リングやニッチ興味とマスマーケット魅力との不一致が示唆されます。
- オーディエンスセグメンテーション:技術読者は「New/Show」ページを支配し、DIYプロジェクトは技術系および一般フロントページの両方の観客を惹きつけます;AIトピックは主に技術層に訴求します。
- 実践的指針:著者はMike McCourt の Gelman スタイル階層混合効果モデルを参照し、HNでの最適投稿タイミングについて述べています。
総じて、本記事はShow HN投稿パフォーマンストレンドをデータ駆動で検証し、2025年におけるAIコンテンツの台頭と低調、およびこのオーディエンスをターゲットとするクリエイターへの示唆を提示しています。
本文
マクロ経済学・DIYハードウェアとAI駆動型投票プール
私はサイトが立ち上げられた時点からすべての Show HN 投稿をダウンロードし、階層的トピックモデルで解析しました。
目的は「Hacker News コミュニティが何に興味を持つか」を知ることでした。その過程でマクロ経済的傾向、投票リング/詐欺の証拠、投稿寿命を通じた行動の微妙な変化を発見しました。
Hacker News は何が好きなの?
図 1 – 全 Show HN 投稿のツリーマップ。
まず年でグループ化し、その後高レベルトピックグループ、さらに細かいトピックへと分けています。各ボックスは「100 点以上を獲得する確率」で色付け(濃い=高確率、薄い=低確率)。
再現可能なコード
pip install sturdy-stats-sdk plotly
from sturdystats import Index import plotly.express as px index = Index(id="index_f2ffe2f7901845c59c15aab45685fa3c") df = index.queryMeta(""" WITH t AS ( SELECT UNNEST(sum_topic_counts_vals) AS topic_vals, UNNEST(sum_topic_counts_inds)-1 AS topic_id, -- duckdb は 1-indexed year(published::DATE) AS year, score FROM doc) SELECT topic_id, year, count(*) AS n_posts, avg(score) AS avg_score, avg((score > 10)::int) AS p10, avg((score > 100)::int) AS p100 FROM t WHERE topic_vals > 5 GROUP BY topic_id, year ORDER BY topic_id, year; """, paginate=True) tmp = index.topicSearch(limit=500).set_index("topic_id").to_dict() df["topic"] = df.topic_id.apply(tmp["short_title"].get) df["topic_group"] = df.topic_id.apply(tmp["topic_group_short_title"].get) df.dropna(inplace=True) # 高い証拠を必要とする場合 df["P(score>100)"] = ( df.p100 * df.n_posts + 2) / (df.n_posts + 50) fig = px.treemap( df, path=["title", "year", "topic_group", "topic"], values="n_posts", color="P(score>100)", color_continuous_scale="greens", height=600 ) fig.update_layout(title_text="Show HN パフォーマンス") fig.show()
インタラクティブなツリーマップで年やトピックグループを掘り下げられます。
主な観察点:
- 2025 のボックスは他のどの年よりも大きい。
- 2025 は明らかに薄く(100 点以上になる確率が低い)。
2025 – 最もパフォーマンスの良いトピック
| トピック | P(score > 100) |
|---|---|
| DIY ハードウェア IoT プロジェクト | 0.0939 |
| オープンソースプロジェクト | 0.0880 |
| エラーハンドリング & デバッグ | 0.0787 |
| プログラミング言語インタプリタ | 0.0771 |
| ライフストーリー | 0.0676 |
2025 年のトップトピックは、2022 年平均投稿と同じ確率で 100 点に到達します。これは注目すべき差異です。
年ごとのパフォーマンス
投稿が ≤ N 点を獲得する確率の累積和を年別に可視化したもの。三つの顕著なグループが見られます:
- 2025 – 最も低い確率(≈ 11 % が 10 点以上)。
- 2022 – 60 点獲得確率は同等。
- 2021, 2023, 2024 – 依然として高パフォーマンス。
pip install sturdy-stats-sdk seaborn matplotlib
from sturdystats import Index import seaborn as sns import matplotlib.pyplot as plt index = Index(id="index_f2ffe2f7901845c59c15aab45685fa3c") df = index.queryMeta(""" SELECT year(timestamp::TIMESTAMP) AS year, score FROM doc ORDER BY doc_id; """, paginate=True) plt.figure(figsize=(10,6)) Xmax = 100 tmpdf = df[df.year > 2020].copy().sort_values("year") tmpdf["year"] = tmpdf.year.astype(str) tmpdf["score"] = tmpdf.score.apply(lambda x: min(x, Xmax)) sns.displot(tmpdf, x="score", kind="ecdf", hue="year") plt.title('Score Distribution by Year (CDF)', fontsize=14, weight='bold') plt.xlabel('Score', fontsize=12) plt.ylabel('Density', fontsize=12) plt.xlim(10, Xmax) plt.ylim(.75, 1.0) plt.tight_layout() plt.show()
2025 の低下に対する可能性のある説明
-
ソフトウェア求人市場とリモートワーク – COVID 後のテックブームで 2022 年にエンゲージメントが高まりました。続く景気後退と士気低下が 2025 の弱いパフォーマンスを説明するかもしれません。
-
AI 主導型コンテンツ – AI がコンテンツ作成を加速し、浅い投稿の洪水を生み出しています。2022 年以降の投稿増加率が指数関数的に上昇していることから、この仮説は支持されます。
2025 を掘り下げる
スローププロット:トピックの重要度変化(2024 → 2025)
負のスロープ(減少)は赤、正のスロープ(増加)は青で表示。
「Agent Connectivity」「AI Coding」「AI Automation」など AI 関連トピックが急上昇し、AI コンテンツへのシフトを示唆しています。
トピックの成功度
期待値と実際値を比較したプロット:
- “AI Automation” はバイラル投稿で若干過剰パフォーマンス。
- ほとんどの AI トピックは期待に対して低調;「死亡象限」は主に AI 関連。
- “Document Ingestion & Retrieval” は大幅に期待を上回り、他の AI トピックを支援している可能性。
- DIY ハードウェア IoT プロジェクト が青色線で圧倒的優位—真実味と魂が響いています。
オーディエンスセグメンテーション
Hacker News には二つのオーディエンスがあります:
- 「New」と「Show」ページを閲覧するハードコア技術読者。
- フロントページに集まるマス・マーケット層。
主な結論:
- DIY ハードウェアのパフォーマンスは主に第一オーディエンスが牽引し、フロントページでの露出で増幅されます。
- AI トピックは 10 点を超えるとパフォーマンスが低下;技術読者は他コミュニティより AI に興味が薄いようです。
- AI 投稿に投票リングが存在する可能性もあり、スタートアップ資金調達や企業投資の増加が兆候。
最適な投稿タイミングは?
最初に尋ねた質問は「いつ投稿すべきか?」でした。単純な SQL クエリでベースラインを算出しましたが、Mike McCourt は Gelman スタイルの階層的混合効果モデルを用いてより深い洞察を得ました。(詳細は省略;完全な方法論はオリジナル分析をご参照ください。)
投稿時間とエンゲージメントのヒートマップが続きます。
まとめ
- 2025 年は投稿量が増えているものの、1 投稿あたりのパフォーマンスは低下しています。
- AI トピックは頻度が急増している一方で期待に対し低調です。
- DIY ハードウェアは技術志向読者を中心に継続的にヒットしています。
- 経済的変動(ポスト COVID ブーム、リモートワーク)と AI コンテンツの増加が観測されたトレンドを説明している可能性があります。
上記の再現可能なコードスニペットを実行して、自分でデータを探索してみてください。