HN で公開:電話のマイクによるリアルタイム呼吸検知とバイオフィードバック

2026/06/03 1:02

HN で公開:電話のマイクによるリアルタイム呼吸検知とバイオフィードバック

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

Project shii·haa は、外部ウェアラブル機器の必要性なく、スマートフォンのマイクロフォンを介してリアルタイムの呼吸バイオフィードバックを実現する画期的なウェルネスアプリケーションです。医療機器とは異なり、このツールは診断や治療の主張を行わず、自然な生理機能をモニタリングするための自己認識支援手段として機能します。システムは完全にオンデバイスで動作し、生音データをローカルで処理し、あらゆるデータアップロードを拒否することで厳格なプライバシーを確保しています。呼吸位相を推定し完了したサイクルを追跡するために、シグナル処理、状態遷移のための有限状態機、データ品質レイヤーによる 3 レイヤのパイプラインを使用します。ルールベースの検出と、時間の経過とともにフィードバックを微調整する機械学習を組み合わせており、ライブ検出ロジックを直接駆動させることなく、自動利得制御や一時的な音などのモバイルオーディオ特有の課題に対処しながら適応します。

現在、このアプリは 4-7-8 テクニックなどのガイドされたパターンをサポートしていますが、ユーザーの実質的な限界を尊重するため、極限まで高いペースを強制することはありません。パーソナルレゾナンス機能は今や検証段階ですが、将来的なアップデートでは心拍変動(HRV)データを組み込んでより深い適応を実現する可能性があります。オープンライセンス(CC BY 4.0)で公開されているドキュメントは、開発者にライブオーディオ分析のための革新的なフレームワークを提供しています。現在にはアクセスにはアカウント作成と 14 日の無料トライアルが必要ですが、ゲストモード/ローカル専用モードは将来的に実装されるものの、現時点では利用できません。結局のところ、このプロジェクトはゲーミフィケーションや外部センサーよりもユーザーのプライバシーとハードウェア効率を最優先する強力なバイオフィードバックを提供することで、業界の新基準を設定します。

本文

shii·haa:呼吸検出システム

「アプリが注意を逸らさず、逆に呼吸へのフィードバックを通じて自己認識を高めることはできるのか?」——それがこのプロジェクトの原点です。

ウェアラブル機器もコーチも不要。スマホ一つで静かにあり、マイクがあなたの呼吸を聴き取り、忠実に反映させる技術です。

仕組みと特徴

基本機能

  • 端末内処理:スマホマイクの音声を読み取り、すべての音響解析は端末内で完結します。生音声ストリームは外部へ流出しません
  • 呼吸フェーズ検出:吸気・呼気・遷移・保持の各フェーズを推定し、呼吸サイクルをリアルタイムで追跡します。
  • 即時フィードバック:インターフェースが呼吸に即座に応答するため、ユーザー自身が視覚的・触覚的に信号を感じ取れます。

技術的なアプローチ

この課題の本質は「聞き取る」ことです。静寂や車音、ファン音といった雑多なノイズの中から、現在のフェーズを正確に再構築します。

3 つのレイヤー構造

  1. シグナル処理
    • 音声ストリームを短いウィンドウで分割し、エネルギー測度やスペクトル特徴(周波数分布など)を抽出します。
    • 吸気は高周波側にエネルギーが集まり乱流が大きく、呼気は低く滑らかな傾向があります。単一ウィンドウではなく連続したシーケンス全体を見て判断します。
  2. 呼吸状態機械(Breathing State Machine)
    • フェーズ判定を孤立させず、状態遷移経路(例:吸気→呼気)を追跡します。
    • 環境変化に合わせて閾値を適応的に再較正し、一時的な変動と本質的なフェーズ変化を区別します。
  3. データ品質レイヤー
    • ノイズ過多や曖昧なウィンドウは「棄却」し、推測を行いません。
    • **「正直に失敗する」**方針:自信満々の誤った判定よりも、「わからなかった」と判断することを優先します。

機械学習とエンジニアリング

  • ML はブラックボックスではなく、フィードバックの精査品質チェック済みの例を元にモデルを改善するために制限的に使用されます。
  • ライブ体験の実行はルールベースパイプラインで行われます(ML はそれを洗う役割)。
  • 多くの工学的努力は、モバイル音響特有のクセ(スマホの違い、配置の違い、自動利得制御との戦いなど)を扱い、「面白い」処理に費やされていません。

現状と注意点

位置づけと限界

  • 実用アプローチ:shipping アプリ内で動作するものですが、未だ完成された科学的成果ではありません
  • 精度について:臨床的な基準真値に対する検証研究中です。公開スマホ単体システムの精度はウェアラブルベースに比べて著しく低いのが現実です。
  • 目的ウェルネスおよび自己認識のためのツールであり、医療機器ではありません。

今後の方向性(ガイド付き呼吸)

  • フィードバックのチャネル:検出自体が目的ではなく、セッション中の安定性をユーザーに還元します。
  • 個人固有の共鳴範囲:個人の生理学的バランスが取れるペース(約 1 分 6 回/呼など)を検出された安定性や HRV データと組み合わせ、固定数値からユーザーに合わせて適応させる方向性です。

※ これは完成機能ではなく、臨床的主張ではありません。

技術ドキュメント

詳細な情報は以下のドキュメントを参照してください:

  • docs/method.md
    :検出パイプラインの組み立て方
  • docs/research-pitch.md
    :検証研究と構成理由
  • docs/privacy-and-design-constraints.md
    :マイク利用範囲に関する制約

よくある質問 (FAQ)

音声データはアップロードされますか?

いいえ。パイプラインは単語認識や文字起こしを目的としていません。生音声は端末内で処理され、外部に流出しません。保持されるのは品質チェック済みの材料のみです。

アカウント作成は必須ですか?

現在公開されているアプリでは必要です。呼吸検出画面へアクセスするにはサインアップが必要で、14 日間の無料トライアルが可能です(ローカル専用モードの開発はありますが、未実装です)。

これは医療機器ですか?診断できますか?

いいえ。診断・治療を行わず、臨床的検証もされていません。めまいや不快感を感じたらすぐに停止してください。

4-7-8 や他の呼吸法を強制しますか?

いいえ。保持を含む複数のガイドパターンをサポートしますが、ユーザー自身の呼吸を反映させることが目的です。早すぎるまたは過度な呼吸は強制しません。ユーザーのコントロールにあります。

なぜスマホアプリですか?CLI はダメですか?

スマホマイクこそがセンサーです。リアルタイムに近い速度でのフィードバックレンダリングが必要なため、テキストターミナルには対応していません。

胸ベルトや HRV センサーは必須ですか?

不要ではありません。マイク単独でも動作します。バンドやストラップは検証研究用または個人固有の共鳴範囲推定時のオプションです。

アプリはオープンソースですか?

このリポジトリは手法と研究の提案を文書化したもので、アプリ全体のソースコードではありません。ドキュメントは CC BY 4.0 で公開されています。

どのようなフィードバックが有益ですか?

Android/iOS のマイクキャプチャ特性、自動利得制御(AGC)、デバイス間の違いなど、モバイル音響に関する具体的な情報やシグナル処理の詳細が特に貴重です。

ご利用方法

実際に生体フィードバックを感じてみたい場合は以下のリンクからアプリを試してください:

開発者:Felix Zeller (felix@shiihaa.app)


ライセンス

本ドキュメントは CC BY 4.0 ライセンスの元で公開されています。詳細は

LICENSE
ファイルをご参照ください。

同じ日のほかのニュース

一覧に戻る →

2026/06/03 3:47

MAI コード 1 のフラッシュ処理

## Japanese Translation: 以下の内容は、Key Points List に含まれていた欠落していた具体的な指標およびデータポイントを統合しつつ、明瞭さを維持した改良されたバージョンです。 **Improved Summary:** MAI-Code-1-Flash は、実稼働環境で使用される GitHub Copilot harness を直接トレーニングによって訓練され、現実世界の agentic タスクを処理するコーディング AI における画期的な進歩を表します。以前の手法では正確性と効率性は排他的なものとして扱われていましたが、本モデルはこれらがシームレスに共存できることを実証しました。適応的なソリューション長制御を活用し、推論の深さを動的に調整することで、単純なリクエストには簡潔に応答し、複雑な問題にはより多くの予算を割く仕組みです。その結果、開発者は競合製品である Claude Haiku 4.5 に比べて最大 60% も少ないトークンで有用な出力をより早期に受け取り、レイテンシと運用コストを大幅に削減できます。 同じプロダクション harness 内での多様なデータセット(SWE-Bench Verified、SWE-Bench Multilingual、SWE-Bench Pro、Terminal Bench 2)を含む評価が、優位性の高いパフォーマンスを確認しました。MAI-Code-1-Flash は、テストされたすべてのコアコーディングベンチマークにおいて Claude Haiku 4.5 を凌駕し、多様で現実世界のタスクである SWE-Bench Pro で注目される +16 ポイントのリード(51.2% vs. 35.2%)を達成しました。これらの結果は、MAI-Code-1-Flash を使用する場合、より高い正確性と更大なる効率がもはやトレードオフではないことを検証し、インタラクティブなコーディングワークフローを滑らかにしつつ、全体の生産性を最適化するためのトークン投資を実現します。

2026/06/03 5:30

BYD の車部品 CT 走査検査

## Japanese Translation: 主な洞察は、現代のペットボトルが数十年前進化する工学によって最適化されており、シュリンクラップ、積み重ね、粗悪な取扱いなどに対して耐え抜き、産業物流に適合するように設計されているにもかかわらず、開封した後は実用的な使用時間がわずか数秒しかないという点にあります。この耐久性のパラドックスは、長距離輸送での耐久性に大規模な投資を行いながら製品を瞬時に廃棄するという重大な非効率性を浮き彫りにしています。重量のあるガラス(コカ・コーラの 1899 年の製瓶;エビアンが数世紀の陶器製の壺の使用の後、1908年にガラスへ転換)からプラスチックへの進化は、コスト、安全性、重量削減によって推進されました。初期のプラスチック試作には、モンサント社の「Easy-Goer」アクリロニトリルコポリマー(1975 年)があり、それが漏出と動物毒性に関する懸念から 1977年にFDA にて禁止されました。これにより、デュポン社が Polyethylene Terephthalate(PET)を導入した 1967–1973 年へと道が開かれました。1970年代後半には、大型の 2リットルボトル用の PET 生産が始まり、初期デザインは最大 96 g の重量を持ち、接着剤を用いたベースと 0.3–0.4 mm の壁厚を特徴としていました。1990年代初頭の革新としては、接着剤を使用しない「Petaloid」ベースや、より薄い壁(例:アクアフィナで約 0.2 mm)を採用するものがあり、材料使用量を大幅に削減しました。それ以降のさらなる進歩—例えば、ニージャラ・ボトルリング社の Eco-Air デザインが厚さ 0.17 mm 以下を達成し、1998年から現在にかけてプラスチック使用量を 60%削減した事例や、半リットルボトルが 2000年代中期のバージョンと比較して 75%少ないプラスチックを使用した事例—は、継続的な効率向上を反映しています。これらの進歩は企業の戦略とも整合しており、ネスレ社がペリエ社を買収(1992年)や、ペプシ/コカ・コーラがアクアフィナとダサニを中〜後半の 1990年代に発売したことは、ソーダ販売の減少への対応として行われました。しかし環境上の課題は依然として残っています。リサイクルシステムが材料の分離や汚染管理—if 特に破砕されたガラスが多材料ストリームに混入し、新しい容器にとって使用不可能になる—を失敗した場合、これらの良質に設計されたボトルは多くが埋め立て地に行き着いたり、下位利用されたりします。将来の進歩には、スマートなデザイン、厳格な材料分離プロトコル、改善されたリサイクルインフラストラクチャを通じて、サプライチェーンの耐性と廃棄物削減を調和させる必要があります。 ## Text to translate: The primary insight is that modern water bottles represent decades of advanced engineering optimized for robust industrial logistics—surviving shrink-wrapping, stacking, and rough handling—even though they have only seconds of practical use once opened. This durability paradox highlights a major inefficiency: investing heavily in long-haul resilience while discarding the product instantly. The evolution from heavy glass (Coca-Cola's 1899 bottling; Evian's switch to glass in 1908 after decades of earthenware jugs) to plastics was driven by cost, safety, and weight reductions. Early plastic attempts included Monsanto's "Easy-Goer" acrylonitrile copolymer (1975), which faced FDA bans in 1977 due to leaching and animal toxicity concerns, paving the way for DuPont's Polyethylene Terephthalate (PET) introduced around 1967–1973. By the late 1970s, PET production for large two-liter bottles began, with early designs weighing up to 96 g, featuring glued bases and wall thicknesses of 0.3–0.4 mm. Innovations in the early 1990s, such as "Petaloid" bases that eliminated glue and thinner walls (e.g., Aquafina at ~0.2 mm), cut material use significantly. Further advances since then—such as Niagara Bottling's Eco-Air designs under 0.17 mm thickness, which achieved a 60% plastic reduction from 1998 to today, and half-liter bottles using 75% less plastic than mid-2000s versions—reflect ongoing efficiency gains. These advances also align with corporate strategy: Nestlé's acquisition of Perrier (1992), and Pepsi/Coke launching Aquafina and Dasani in the mid-to-late 1990s, all in response to declining soda sales. Yet environmental challenges remain. If recycling systems fail to separate materials or manage contamination—especially with crushed glass mixed into multimaterial streams that become unusable for new containers—these well-engineered bottles often end up landfilled or downcycled. Future progress must reconcile supply chain resilience with waste reduction through smarter design, stricter material separation protocols, and improved recycling infrastructure.

2026/06/03 4:27

「グメールが私をおろかに思っている」と感じたので、退社しました。

## Japanese Translation: 著者は、嫌悪感と軽慢さを感じてしまう強制的な AI 機能のため、16 年使用してきた Gmail アカウントを恒久離脱することにした。具体的な問題は、不要なメッセージの要約、自動補填された返信文、そして「メールを書いてください」、「Tab で改善する」など、ユーザー自身がメールを作成できないか、あるいは受信者への時間の価値が低いことを示唆するような常駐的なプロンプト(促し)が含まれる。一部の AI 機能はオフにすることもできるが、それを行うことで自動的なスレッド分類といった長く使い続けられ有用な機能を犠牲にせざるを得なくなる。著者は、これらの強制的な機能が真のユーザーニーズを満たすためではなく、言語モデルの利用指標を人為的に高めるための意図的な戦術であることを疑っている。Google の従来からある安定したサービスや、fediverse を通じて独自ドメインと接続して使用している Fastmail での良好な第一印象とは裏腹に、著者はこの移行を Google エコシステムからの故意の断絶——単なるクライアントの切り替えではない——と捉えている。著者は連絡先を移す予定だが、歴史のあるメールスレッドはインポートせず、「不快な経験」として記述する後に「きれいな決別」を図る打算である。この状況はより広範な懸念を示している:技術企業は、ユーザーの自律性や長期的な信頼よりもエンゲージメントデータを優先することで、忠実な顧客を失うリスクを抱えている。 ## Text to translate: Improved Summary: The author is permanently leaving their 16-year-old Gmail account due to mandatory AI features they find intrusive and disrespectful. Specific issues include unsolicited message summaries, pre-filled replies, and persistent prompts ("help me write," "Tab to improve") that imply the user cannot compose emails themselves or that recipients do not deserve their time. While some AI features can be disabled, doing so forces users to sacrifice long-standing, useful functions like automatic thread categorization. The author suspects these unsolicited features are intentional tactics to artificially inflate language model usage metrics rather than serve genuine user needs. Despite Google's historically stable service and positive first impressions with Fastmail (which they have connected their custom domain to and use via the fediverse), the author views this move as a deliberate break from Google's ecosystem—not merely a client switch. They plan to migrate their contacts but will not import historical email threads, seeking a "clean break" after what they describe as a "bad taste" experience. The situation highlights a broader concern: tech companies risk losing loyal customers by prioritizing engagement data over user autonomy and long-term trust.