2026-01-31

日付別ニュース一覧

カードをクリックすると全文、Hacker Newsのリンクから元記事へ移動できます。

日付で読む

02/032026-02-03 02/022026-02-02 02/012026-02-01 01/312026-01-31 01/302026-01-30 01/292026-01-29 01/282026-01-28 01/272026-01-27 01/262026-01-26 01/252026-01-25 01/242026-01-24 01/232026-01-23 01/222026-01-22 01/212026-01-21 01/202026-01-20 01/192026-01-19 01/182026-01-18 01/172026-01-17 01/162026-01-16 01/152026-01-15 01/142026-01-14 01/132026-01-13 01/122026-01-12 01/112026-01-11 01/102026-01-10 01/092026-01-09 01/082026-01-08 01/072026-01-07 01/062026-01-06 01/052026-01-05 01/042026-01-04 01/032026-01-03 01/022026-01-02 01/012026-01-01 12/302025-12-30 12/292025-12-29 12/282025-12-28 12/272025-12-27 12/262025-12-26 12/252025-12-25 12/242025-12-24 12/232025-12-23 12/222025-12-22 12/212025-12-21 12/202025-12-20 12/192025-12-19 12/182025-12-18 12/172025-12-17 12/162025-12-16 12/152025-12-15 12/142025-12-14 12/132025-12-13 12/122025-12-12 12/112025-12-11 12/102025-12-10 12/092025-12-09 12/082025-12-08 12/072025-12-07 12/062025-12-06 12/052025-12-05 12/042025-12-04 12/032025-12-03 NaN/NaN2025-12-99

Show HN: 私は自分の中国語（普通話）の声調を直すため、9Mパラメータの音声モデルを訓練しました。

## Japanese Translation: > **概要:** > AISHELL‑1 と Primewords から約300時間分の文字起こし済み中国語音声を用い、SpecAugment と4台の RTX 4090 GPU を使用して、約9 Mパラメータのコンフォーマーモデル（Conformer）を訓練しました。ネットワークは40 msごとにトークン確率を出力し、Viterbi アルゴリズムでピンイン音調トークン列（各音節＋音調がユニークなトークン；中性音調はトーン5へマッピング）に沿ってアラインメントを強制します。語彙には1,254個のトークンと `<unk>`、`<blank>` が含まれます。 > このモデルでは Token Error Rate（TER）が約 5.3 %、音調精度が約 98.3 %です。INT8 量子化によりサイズを約37 MB から約11 MB に縮小し、TER は +0.0003 の増加のみで済みました。先頭の無音によるアラインメントミスを修正するため、 `<blank>` 確率が0.7 を超えるフレームは採点前に除外しました。 > 最終的な量子化モデル（約13 MB のダウンロード）は ONNX Runtime Web 経由でブラウザ上で完全に実行され、リアルタイムの発音フィードバックを可能にします。今後は Common Voice などの会話データセットを取り入れ、カジュアルまたは子供の話し言葉（通常より速く変動が大きい）に対する頑健性を向上させる予定です。 **短縮版（すべてのポイントを網羅）:** > **概要:** > AISHELL‑1/Primewords から約300時間分の中国語音声で、SpecAugment と4× RTX 4090 を用いて9 Mパラメータのコンフォーマーを訓練しました。40 ms ごとにトークン確率を出力し、ピンイン‑音調語彙（1,254トークン＋`<unk>`、`<blank>`）で Viterbi アラインメントを行います。TER は約 5.3 %、音調精度は約 98.3 %です。INT8 量子化によりモデルサイズが約11 MB に縮小され、TER は +0.0003 の増加のみでした。先頭無音のバグは、高い `<blank>` 確率（閾値0.7）を持つフレームを除外することで修正しました。13 MB の ONNX Runtime Web バージョンはブラウザ内で完全に動作し、即時発音フィードバックを提供します。将来的には会話データを追加してドメインシフトへの対処を図ります。

2026/01/31 9:51

日付別ニュース一覧

**Show HN:** 私は自分の中国語（普通話）の声調を直すため、9Mパラメータの音声モデルを訓練しました。

ペアウェブ：WebTorrent を利用した分散型ウェブサイトホスティング

**Stonebraker氏のCAP定理とデータベースに関する論考**

住宅プロキシネットワーク最大規模を破壊 (Note: If a more natural phrasing is desired, one could say 「最大規模の住宅用プロキシネットワークを混乱させる」.)

**「Kimi K2.5 技術レポート（PDF）」**

**HNに投稿：** 「言語学習用に作ったAI会話パートナーでスピーキング練習をしています」

**Ask HN:** 「なぜフィット感のあるファラデー・iPhone ケースは存在しないのでしょうか？」

HTTP猫 (HTTP Cats)

「Moltbook」はそのままカタカナで「モルトブック」と表記します。

**PとNP、および計算難度：ルール理論的アプローチ**

**Ask HN:** 「メモやリンクはたくさん集めるのですが、それを実際に行動に移すことが難しい…」という経験はありますか？

Rootsは、ゲームサーバー向けにDockerコンテナを管理するゲームサーバーデーモンです。

**Show HN：Foundry – 繰り返し作業をワンクリックコマンドに変えるツール**

**メール実験：外部画像のフィルタリング**

確かに、米国経済の崩壊は近いうちに訪れるに違いありません。

「コードは手頃です。会話（または議論）をご覧いただけますか？」

Show HN：Amla Sandbox – AI エージェント向け WASM ベースの bash シェルサンドボックス

公開されているOllama AIインスタンスが17万件以上発見されました

**製品のようにドキュメントを構築する**

**Quack‑Cluster:** 「クワック・クラスタ―：DuckDB と Ray を利用したサーバーレス型分散 SQL クエリエンジン」

**家庭用コンピュータハイブリッド**

Show HN: 私は自分の中国語（普通話）の声調を直すため、9Mパラメータの音声モデルを訓練しました。

Stonebraker氏のCAP定理とデータベースに関する論考

「Kimi K2.5 技術レポート（PDF）」

HNに投稿：「言語学習用に作ったAI会話パートナーでスピーキング練習をしています」

Ask HN: 「なぜフィット感のあるファラデー・iPhone ケースは存在しないのでしょうか？」

PとNP、および計算難度：ルール理論的アプローチ

Ask HN: 「メモやリンクはたくさん集めるのですが、それを実際に行動に移すことが難しい…」という経験はありますか？

Show HN：Foundry – 繰り返し作業をワンクリックコマンドに変えるツール

メール実験：外部画像のフィルタリング

Show HN：Amla Sandbox – AI エージェント向け WASM ベースの bash シェルサンドボックス

製品のようにドキュメントを構築する

Quack‑Cluster: 「クワック・クラスタ―：DuckDB と Ray を利用したサーバーレス型分散 SQL クエリエンジン」

家庭用コンピュータハイブリッド