FUTO スワイプ:新たなスワイプタイピングモデル

2026/06/24 2:50

FUTO スワイプ:新たなスワイプタイピングモデル

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

主なイノベーションは「FUTO Keyboard」というプライバシーを最優先とした Android アプリであり、クラウドサーバーの必要性なくデバイス上で迅速かつ正確なスワイプタイピングを可能にします。データをローカルに保持することで、キーストロークを外部ネットワークへ送る際に生じる一般的なセキュリティリスクを排除します。推論はオンデバイスで実装されており、サーバーサイドデモと比べてはるかに低いレイテンシを実現しています。ミリ秒単位で入力を処理し、エラーレートは 1% を下回ります(具体的には、ビーム幅 300 を使用したテストセットにおいて、トップ 4 の失敗率は約 4%、エラー率は 1% 未満です)。

技術の基盤となるのはオープンなモデルファミリ(Encoder、ContextLM、Decoder)で、総パラメータ数 2,494,767 のうち有効パラメータは 1,364,271 です。低性能向けスマートフォンを最適化しています。「swipe-library」という C++ ライブラリが推論とビームサーチを担当し、スワイプパスから単語予測への変換を行います。学習は効率的で、ワークステーション用 GPU 1 台のみで完了しました。開発者は 2024 年 8 月にデータセット収集を開始し(100 万件以上のユーザーのスワイプデータを収集)、2025 年 3 月に MIT ライセンスの下で HuggingFace にフィルタリングされた 100 万件のスワイプデータをリリースしました。モデルは FUTO モデルライセンス、推論ライブラリは GPL の下に利用可能です。エンドユーザーへの謝示は長期投資合意の一部として必須であり、速度とプライバシーを最優先とするオフラインモバイル入力の持続可能なエコシステムを支えています。

本文

FUTO Swipe: 高速で正確なオフラインスワイプタイピングシステム

今日から完全オフライン対応の Android キーボードアプリ「FUTO Keyboard」で利用可能です。また、モデルをダウンロードしてご自身でも構築することもできます。

本ページはサーバーサイドで動作するデモサイズですが、実際の運用ではオンデバイス実行となるため大幅な遅延低減が実現します。

背景とライセンスの意義

長らく優れたモバイル向けスワイプタイピングは、プライバシー侵害的なキーボードアプリや非ライセンスの私有ライブラリに限定されていました。「FUTO Swipe」はこの課題を解決するオープンなモデル群およびアルゴリズムファミリーです。

  • 目的: 「FUTO Keyboard」の開発のために作られました。
  • 公開方針: より広いコミュニティでの利用を歓迎します。
  • ライセンス: 長期的な投資であるため、エンドユーザーに対して明確な帰属表示をお願いしています。(詳細は ライセンス を参照)

データセットの構築

2024 年 8 月、

swipe.futo.org
ドメインでスワイプ入力データの収集キャンペーンを開始しました。

  • 収集方法: ウィキペディア由来の文章を表示し、単語ごとのスワイプ入力をユーザーにおこなって収集。
  • データ量: 100 万件以上のスワイプデータを収集(低品質なものは除外済み)。
  • 公開情報: 2025 年 3 月にMIT ライセンスの下に公開され、現在 HuggingFace で入手可能です。
  • 活用法: モデルの訓練および異なるスワイプタイピングシステムの評価に大規模に活用されています。

モデル群の構成と性能

当アーキテクチャには以下の 3 つのモデルタイプが含まれています。

1. エンコーダーモデル

  • 特徴: 汎用的なレイアウト不可知・言語不可知モデル。
  • 用途: 一般的なケースでのスワイプタイピング予測に用いられます。
  • 性能: 最先端の精度は提供していません。

2. ContextLM モデル

  • 特徴: 単一言語ごとに訓練された非常に軽量な言語モデル。
  • 仕組み: 文脈内における無意味な単語を除外することで予測品質を向上。
  • 訓練データ: テキストデータのみの利用で可能。

3. デコーダー

  • 特徴: 特定の言語とレイアウトに特化したモデル。学習した特徴により最高水準の精度を実現。
  • 現状: 専用のスワイプ入力データを必要とするため、QWERTY 配列・英語用デコーダーのみが提供されています。

パフォーマンス指標

エンコーダー、ContextLM、デコーダーの 3 つを組み合わせ、ビーム幅を 300 と設定した場合:

  • Top-4 失敗率: テストセットでは約 4% に抑えられています。
  • 誤差率: 語彙外ケースを除けば 1% 未満 です。

注記: これらの数値はベンチマークに依存するため実環境での結果にはばらつきが生じる可能性があります。しかし、大手科技企业のキーボードと同等の実績を有すると考えております。

メモリーフットプリントとハードウェア要件

モデルサイズは極めて小さく、低スペックデバイスでもミリ秒単位での動作が可能となっています。

  • エンコーダー: 635,140 パラメータのみ。
  • デコーダー追加: さらに 304,155 パラメータを付加。
  • ContextLM(最大規模):
    • 総パラメータ数: 2,494,767
    • そのうち埋め込み層: 110 万(計算寄与なし)
    • アクティブなパラメータ数: 1,364,271

この小ささがもたらす環境負荷の低さ:

  • トレーニング環境: 高性能な GPU は最大1 シードワークステーション程度で済みます。

C++ ライブラリ「swipe-library」

モデルからの予測値だけでは実用的ではなく、辞書制約付きのビーム検索を行い、最も可能性の高い候補を特定する必要があります。

  • 機能: スワイプパスから単語予測までの全体推論、デコーディング、ビーム検索を一括で実現。
  • 言語: C++ で記述された**「swipe-library」**を開示済みです。

オープンソースへの公開と将来性

FUTO Swipe を使って何かを創造したい方は、FUTO モデルライセンスおよび GPL ライセンスの下での利用が可能なモデル群と推論ライブラリをご用意しております。

  • 対応デバイス: スマートフォンはもちろん、ノートパソコンのトラックパッドでも利用可能です。
  • 詳細情報: 具体的な訓練方法やアーキテクチャの詳細については、論文を準備中です。

同じ日のほかのニュース

一覧に戻る →

2026/06/24 3:40

ジェリーの地図

## Japanese Translation: 「ジェリーのワールド」は、1963 年夏にニューヨーク・コールドスプリングに住むアーティスト・ジェリーによって開始された、架空の都市を巨大な円形地図として機能させる、独自性の高い二次元アートプロジェクトである。4,000 点以上の個々のパネル(8x10 インチ)が N、S、E、W の座標を用いて配置されており、本作は二つの明確な時代へと発展してきた。時代 1(1963–1983)では軽量なタイプライター用紙が使われ、パネルは時系列順に積み重ねられていたが、時代 2(2003–現在)では再生された重紙を用い、座標順でパネルを配置し、自動化されたシステムを採用している。創作プロセスは、約 100 枚のユニークなカードからなる専用デッキによって厳密に管理されており、これらカードには描画サイズ、絵混ぜの色調調整、アーカイブ作業、ブログ投稿などの管理業務などランダム化された指示が含まれている。各カードサイクルは数分から数日続き、巨大な黒または赤の数字に基づいて作業ユニット(1 インチ正方形)を指し示す。実行にはアクリル絵具、マーカー、コラージュ、インクジェット印刷などのメディアが用いられる。プロジェクトはベースレイヤー、ザ・バッド、ザ・レッドディメンション、ブラックネッズ、ザ・ジグurat フェーズ、ザ・フロード、そしてリ・バーストといった段階的な概念層を通じて進行する。元々屋根裏部屋に保管され、アーティストの息子であるヘンリーによって数十年後に再発見された本作は、現在では公的展覧会やデジタルアーカイブとの統合を達成しており、環境に優しい素材の使用と創造的かつ管理業務を含む意思決定を導く厳格なルールベースのワークフローを通じて、現代アートの持続可能性への転換を浮き彫りにしている。 ## サマリー: 「ジェリーのワールド」は 1963 年に開始され、現在も継続中の二次元アートプロジェクトであり、架空の都市を巨大な円形地図として機能させる独自性の高いものである。その最も顕著な特徴は、約 100 枚のユニークなカードからなる専用デッキによって駆動される厳格でランダム化されたシステムである。これらのカードには実行とアーカイブ作業に関する独自の指示が含まれており、描画サイズから絵混ぜの色調調整に至るまで、各工程を決定する。このシステムにより、作品は純粋な直感に頼らずルールに基づくガイダンスによって発展する。プロセスは特定のルールに従い、カードの色に基づいて方向が変化し、その結果としてザ・バッドやザ・レッドディメンションといった段階的な層が構築される。元々はニューヨークのコールドスプリングで制作された物理的な作品は、アーティストの息子によって数十年後に再発見された。第一世代では軽量な紙が使われたが、現在のフェーズでは再生素材と自動化されたシステムを採用しており、デジタルアーカイブで引退した作品を保存しながらも新たなパネルを生成したり既存のセクションを完了させることができる。この堅固なワークフローは、一貫した管理ルーチンを強制することで協力者に影響を与え、環境に優しい素材の使用や展覧会における公的関与を通じて現代アートにおける持続可能性への転換を強調している。 ## キーポイント一覧 - 1963 年夏、アーティスト・ジェリーはニューヨーク・コールドスプリングで架空の都市の地図を描き始めたが、それは彼の屋根裏部屋に保管されており、後に息子であるヘンリーによって再発見された。 - プロジェクトは現在、4,000 点以上の個々の 8 インチ x10 インチのパネルからなる二次元的な「バーチャルワールド」アートプロジェクトであり、中央を起点として N、S、E、W の座標を用いて近似円形に配置されている。 - 実行にはアクリル絵具、マーカー、彩色鉛筆、インク、コラージュ、そしてインクジェット印刷が重紙上に用いられ、これは規則および約 100 枚のユニークなカードからなる専用デッキからのランダム生成された指示によって決定される。 - 各カードサイクルは前回の作業が完了するまで開始されず、数分から数日かかる;タスクとは、カード上の巨大な黒または赤の数字で指定された作業ユニット(1 ユニット=1 インチ正方形)をカバーすることを指す。 - カード指示は次の 5 つのカテゴリーに分類される:上位次元への進歩(バッド、レッド、ブラック、ジグurat)、隣接する 4 パネルのスプラッター塗装、新しいシードパネルの作成、新しい色調の混合、および連続する 9 パネルのスクリーン印刷。 - アドдиショナルなアーティスト指示には、マスターの更新/複製、ファイルからのパッチワークまたは写真の使用、数字の追加/削除、デッキからのカードの除去/追加、ブログ投稿や販売価値の計算などの管理業務が含まれる。 - ヘルパー指示には、デジタルライブラリー用のパネルのスキャン、引退したパネルのソート/アーカイブ、現在のパネルのコピー作成、アーカイブインベントリを更新する作業が含まれる。 - 作業方向はカードの色によって決定される:黒は地図 perimeter 周りの時計回りの進行を示し、赤は反時計回りの進行を示す。 - 新しいパネルは「新しいパネル」カードを描画するか、アートのセクションを完了するために生成され、常に親ページと同じ「中心」点を保ち、「その日の色」を使用する。 - プロセスは次の層で表現される:ベースレイヤー(パッチ、塗られたバンド、コラージュ、シティスクエア)、ザ・バッド(白/黑白/グレー/黒のコラージュ)、ザ・レッドディメンション(ソリッドレッドのコラージュ)、ブラックネッズ、ザ・ジグurat フェーズ、ザ・フロード(ブルーのコラージュ)、そしてリ・バースト(クラフト紙)。 - プロセスは二つの明確な時代へと発展した:時代 1(1963–1983)では軽量なタイプライター用紙が使われ、ゲストアーティストはいなかった、パネルは時系列順に積み重ねられた;時代 2(2003–現在)では再生された紙が使われ、デッキ駆動の自動化システムを採用し、展覧会が開催され、パネルは座標順に積み重ねられている。

2026/06/24 3:00

Swift パッケージインデックス、Apple に加入

## Japanese Translation: ## 日本語翻訳: 元のサマリーは明確で、正確かつ完全です。変更する必要はありません。 ## 翻訳対象のテキスト: (必要であればここに貼り付け;なければそのまま元の文章を繰り返す):元のサマリーは明確で、正確かつ完全です。変更する必要はありません。

2026/06/21 21:49

Gaussian Splats の印刷

## 日本語翻訳: 結晶体(crysta.ai)からの Teng Xu から、著者の昆虫の一つを贈り物として印刷する申し出がなされました。プロジェクトは 3D ギャウシャンスプラッツを活用しており、これは重なる半透明の球体がシーンを表すものであり、それらは Minecraft のレベルに似た不透明度を変えるインクを混合させるボクスル化され、特殊な 3D プリンター上で層ごとに印刷されて琥珀の現代版(「クリスタル」)が作成されました。最終的な物理的印刷物はいくぶん暗く茶色がかったものでありましたが(これは線形空間でのトレーニングによるもので、パイプラインの調整が必要だった可能性があります)、チームは球面調和関数を用いたゼロレベルでの直接トレーニングを最優先し、見取り方向依存色の制限を克服しました。このアプローチにより、印刷された蜂を通過する光などといった複雑な有機的効果が可能となり、興味深い器官のような構造が明らかになりました。ただし、可視なスプラットのアーティファクトや細い毛の半透明性は課題となりました。Crista AI は最近、ボクスルベースの構造物内のこれらの要素の配置とスケールを簡素化するためのベータ版エディタをリリースしました。今後、MagicaVoxel などのツールからの直接インポートサポートを追加したり、内联プレビュー機能を強化したりすることで、アーティストへの障壁を大幅に下げることができ、従来のボクスルモデリングと現代的な AI レンダリングを橋渡しすることが可能です。著者はスプラッツを MagicaVoxel にインポートすることに興味を持ち、読者には Crista AI の X でさらに例の印刷物を参照するよう案内しました。