**Ableton MCP の実験**

2025/12/30 11:43

**Ableton MCP の実験**

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

著者は、LLM(大規模言語モデル)がAbleton Liveのペアプログラマとして機能し、自動化ツールと完全なマッシュアップワークフローを迅速に作成できることを示しています。
単一の休日休暇中に70以上のカスタムツール呼び出しと動作するマッシュアップデモを構築しました。

.als
ファイル形式を逆解析して、欠落していた機能(テンポ/ボリュームオートメーション、ワープマーカー)を追加し、
vocal_to_midi()
のような高レベルのヘルパーも導入しました。
また、2つの Replicate エンドポイント ―
jhurliman/allinone-targetbpm
(テンポ分析用)と
jhurliman/music-flamingo
(音楽理論生成用)をデプロイし、それらをワークフローに統合しました。
Max4Live パッチに切り替え可能な WAV レコーダーを追加して、オーディオ出力をプログラムでキャプチャできるようにしました。マッシュアップは Deft & Lewis James – Octo(インストゥルメンタル)と GloRilla – Yeah Glo!(ボーカル)から構築され、テンポ/キーの修正、プレイリスト生成、および LLM ガイド付き Ableton チュートリアルを経て反復しました。SoundCloud にアップロードし、不具合を指摘・修正・再圧縮して第三版をリリースした結果、LLM ペアプログラマが Ableton および DAW ワークフローの学習を加速できることが実証されました。
コード、ワークフロードキュメント、およびプルリクエストは
jhurliman/ableton-mcp/pull/1
で入手可能です。

本文

私は休暇中にAbletonとMCP(マイクロサービス・プロトコル)を試し、70以上のオートメーションツール呼び出しとミャッシュアップ曲を作成しました:
https://soundcloud.com/jhurliman/octo-glo


ableton-mcp の発見

Abletonのオートメーション機能を調べている際に、ahujasid/ableton‑mcp を見つけました。これはコミュニティで文書化されたPython API経由でツール呼び出しLLMとAbleton Liveを橋渡しするMCPサーバーです。
Claude Codeをダウンロードし、Opus 4.5に切り替えて AbletonMCP をインストールさせ、次にAbletonを起動しました。

標準装備であれば、Sessionビューの基本的な作成・編集は十分でしたが、Arrangementビューやデバイス・チェーン、ミキシング、その他多くの「実際のDAW」ワークフローには対応していませんでした。


ableton‑mcp の拡張

楽しい部分は、現代のLLMがドキュメントを検索し、新しいMCPツールを追加・テストしながらほぼ閉じたループで反復できる点です。
Python APIに露出されていないAbleton機能については、Opus 4.5 が

.als
ファイル形式の十分な逆解析を行い、テンポ/ボリュームオートメーションやワープマーカーを注入することができました。

低レベルの配管が整ったら、より高レベルのツール構築に挑戦しました。例えば

vocal_to_midi()
は以下です:

  • ボーカルトラックの音声を解析し、
  • 発音開始点を大まかなフォニームクラスへ分類し、
  • それらのフォニームカテゴリを標準的な Drum Rack MIDI ノートにマッピングします。

目的は「ボーカルからドラムを作る」よりも、ドラムグルーヴとボーカルを合わせる際の微小なフェーズ・タイミング調整を助ける構造化された表現を得ることでした。


LLM に耳を与える

より良いツールでも、多くの試行は一発限り、または人間が緊密に関与する必要がありました。
核心的な制約は明らかでした:モデルは自分が何をしているか「聞けない」ことです。

これを解決すべく、Max4Live パッチでシンプルな WAV ファイルレコーダーを作成し、オン/オフ切替可能にしました。これはAbletonから音声を取得する唯一のプログラム的手段と見えました。

次に2つの Replicate エンドポイントをデプロイ:

  • jhurliman/allinone‑targetbpm
    mir-aidj/all-in-one
    のフォークで、トラックの構造解析結果を返します。
    フォークでは
    min_bpm
    max_bpm
    を公開し、私は
    [91, 181]
    を好むので遅いトラックは2倍にカウントされます。
  • jhurliman/music-flamingo – 音声+プロンプトを受け取り、音楽理論知識で微調整されたモデルからテキスト出力を返します。

これらを使ったクローズドループのエージェント化反復はまだ深く検証していませんが、現在までに有用な構築ブロックとして機能しています。


実際のミャッシュアップ作成

多くのツールを接続した上で、「クリップ編集」や「EQ調整」以上の複雑なものを試みました。
好きなインストゥルメンタルベーストラック、Deft & Lewis James – Octo から始め、テンポ(オンラインでは誤記載が多い)とキーを決定し、候補となるボーカルマッチのプレイリストを依頼して約12曲ほど聴き比べました。

  • GloRilla – Yeah Glo! がすぐに興味深い組み合わせに思えました。
    2日間の自動化と手作業、LLMによる「AbletonでXをやる方法」チュートリアルを通じて、アップロードしたくなるような作品が出来上がりました [1]

学び

Ableton、ミャッシュアップ制作、そしてDAW全般についてはまだ表面に触れただけです。
しかし AbletonMCP を使って数日間で得られたAbletonへの理解は、数週間のブログやYouTubeよりも多かったです。
DAW用のペアプログラマがいることで、自分一人でゼロから完成品に至る自信がつき、少なくとも学習初期段階では実際に役立ちました。

この実験中に生成されたすべてのコードと、ミャッシュアップ作成時に使用した粗いワークフローのドキュメントは https://github.com/jhurliman/ableton-mcp/pull/1 で公開しています。


[1] アップロード直後に複数の疑問点を発見し、修正に戻りました。その後、最終的なコンプレッサーとトラックボリュームを再マスタリングする必要があると判断。3回目のアップロードで完了です。

同じ日のほかのニュース

一覧に戻る →

2026/01/04 1:20

**2025年におけるハッカーニュースで最も人気のあるブログ一覧**

## Japanese Translation: --- ## 要約 この記事は、投稿量、総投票数、およびフロントページへのリーチで評価された2025年の最も影響力のあるHacker Newsブロガーをランキングしています。 - **Simon Willison** は、1,000件以上(118本の全文)にわたる公正なAIツールレビューに焦点を当てた投稿で3年連続王者となっています。リンクブログスタイル―短い引用やコメント付きリンクのみ—は手間が少なく高価値なコンテンツを提供します。 - **Jeff Geerling** が2位にランクインし、10,813投票を集めてわずか9ポイントで3位を抜きます。100万人以上のサブスクライバーを持つYouTubeクリエイターであり、自動生成されたトランスクリプトを避けたテキスト中心の投稿を書いて、HN上で読みやすさを高めています。 - **Sean Goedecke** が新たなパワーハウスとして登場します。2025年に140件の投稿と47件のフロントページヒットを記録し、最も人気のある「How I ship projects at big tech companies」投稿は年間トップ100に入っています。技術職への明確な意見とビッグテック組織政治の解説でエンジニア層に共感されています。 - **Brian Krebs** は常にトップブロガーとして残り、2025年には政治的に重いトランプ時代の言論自由ストーリーを投稿し、一時的に#1になりましたがモデレーションで削除されました。 - **Neal Agarwal** はインタラクティブアートとビジュアルエッセイでフロントページを支配し、投稿の約半分が#1に達します。「Stimulation Clicker」は2025年で4番目に人気のある投稿です。 - **John Gruber** が6位で終わり、2011年以来最高の一年となり、2020年以来初めてトップ10入りしました。潜在的なシャドウバンを疑問視したことで注目されました。 - **Mahad Kalam** は単一投稿リストのトップに立ち、その年で最も投票されたエントリーです;**Byrann Huang** が続き、3位の投票数を記録しました。 この記事は2025年の完全なトップ100リストが別途文書化されていることを指摘し、将来の発表をほのめかしています。これらのランキングは読者がテックニュースにどのように関与するか、AI・職場文化・政治に関する議論を形作り、Hacker Newsや類似プラットフォームでのコンテンツ戦略のベンチマークとなります。

2025/12/29 1:12

**Ed25519‑CLI – Ed25519署名システム用コマンドラインインターフェース**

## Japanese Translation: ドキュメントは、Ed25519 用の lib25519 コマンドラインツールがどのように機能するかを説明しており、主に 3 つのユーティリティ―`ed25519-keypair`、`ed25519-sign`、`ed25519-open` に焦点を当てています。 * `ed25519-keypair` はランダムな鍵ペアを生成します:公開鍵をファイルディスクリプタ 5 に書き込み、秘密鍵を fd 9 に書き込みます。 * `ed25519-sign` は fd 8 から秘密鍵を読み取り、stdin(fd 0)からメッセージを読み取って署名し、署名済みメッセージを stdout(fd 1)に出力します。 * `ed25519-open` は fd 4 からアリスの公開鍵を読み取り、stdin(fd 0)から署名済みメッセージを読み取って検証し、復号された平文を stdout(fd 1)に書き込みます。 検証失敗時、`ed25519-open` はコード 100 で終了し、出力は行いません;他のエラーではすべてのツールが非ゼロで終了し、成功時にはゼロで終了します。 CLI は lib25519 の一部であり、X25519 暗号化と Ed25519 署名の両方を実装しています。2 つの X25519 ツールも存在しますが、別途ドキュメント化されています。現在のドキュメントバージョンは「Ed CLI」ウェブページ用で 2024.02.18 です。関連ユーティリティには `x25519-cli(1)` と `lib25519(3)` が含まれます。 これらのツールにより、ユーザーはシェルから直接暗号操作をスクリプト化したり、他言語で FFI を介して lib25519 の C API を呼び出すことで、安全な認証ワークフローをソフトウェアプロジェクトに組み込むことが可能になります。

2026/01/04 6:58

「一歩だけ踏み出しましょう」

## Japanese Translation: (全ての重要ポイントを組み込んでいます)** この文章は、大きな目標を設定すると扁桃体が闘争・逃走反応を起動し、ストレスや回避行動、進捗の停滞を引き起こすと説明しています。対照的に、目標を小さく段階的に分解することでこの反応を迂回し、不安を軽減しながら安定した行動が可能になります。実践的な戦術は次の通りです: - 「次に何をすべきか?」と自問すること; - 完全感覚でビジュアライゼーションを用いること; - 本全体ではなく1ページだけ読むこと; - ドアの近くにランニングシューズを置く(あるいは新しいものがない場合は注文しておく)ことで歩き始める。 これら小さな問題―例えば靴を持っているかどうか―を解決することで、後で大きな障害になるのを防げます。靴を履いたり短い散歩を終えたりといった控えめな報酬を祝うことは進捗を強化します。毎日1つの小さなステップ(例:1週間ドアにシューズを置き、次にそれらを履く)を繰り返すことで勢いが生まれ、各行動が徐々に長距離散歩や最終的には大きな野心へと導きます。マイクロアクションの累積効果は、個人開発コーチングや職場での目標設定において、生産性と幸福感を高めるために有用であることを示しています。

**Ableton MCP の実験** | そっか~ニュース