記事のサマリー(TL;DR)
- Stable Audio 3.0 は4モデル構成(最大2.7Bパラメータ)。large モデルは6分20秒の楽曲生成が可能
- small SFX・small・medium の3モデルはオープンウェイト公開。large は API・セルフホスティングのみ、売上100万ドル超の企業はエンタープライズライセンスが必要
- Warner Music Group・Universal Music Group との契約に基づく完全ライセンスデータで学習。Suno・Udio が直面する訴訟リスクとの対比が鮮明
国内音楽制作・クリエイターツール事業者が注目すべき点
Stable Audio 3.0 の最大の特徴は「完全ライセンスデータ」による学習です。国内でも音楽生成AIの商用利用には著作権法上の不確実性が残っており、JASRAC や NexTone が管理する楽曲を学習データに含む海外サービスの使用には慎重な判断が求められています。今回 Stability AI が Warner Music Group・Universal Music Group と事前にライセンス契約を締結した上でモデルを構築したことは、商用利用を検討する国内の映像制作会社・広告代理店・ゲームスタジオにとって、法務リスクの低い選択肢として評価できます。また、small SFX モデル(459Mパラメータ)はオンデバイス音声生成向けに設計されており、モバイルアプリや組み込み機器への統合を検討している開発者にとっても実用的な出発点となります。一方、大手音楽プラットフォームやレーベルとの提携を持たない中小サービスは、Suno・Udio の訴訟の行方を注視しながら、ライセンス体制の整備を先行させる必要があります。
詳細
Stable Audio 3.0 の4モデル構成
Stability AI(Stable Diffusion を開発した企業)は、音楽・サウンド生成の新モデルファミリー「Stable Audio 3.0」をリリースしました。ラインアップは以下の4モデルです。
| モデル名 | パラメータ数 | 最大生成時間 | 提供形態 |
|---|---|---|---|
| small SFX | 459M | 約2分 | オープンウェイト |
| small | 459M | 約2分 | オープンウェイト |
| medium | 1.4B | 6分20秒 | オープンウェイト |
| large | 2.7B | 6分20秒 | API・セルフホスティング(有償) |
small・small SFX の2モデルはオンデバイスでの音声・音楽生成を想定した設計です。medium・large はいずれも6分20秒のフル楽曲を生成でき、楽曲構造とメロディーの一貫性を維持できると同社は主張しています。これは2024年にリリースした Stable Audio 2.0 が生成できた最大時間の2倍以上に相当します。
オープンウェイトの拡大と商用利用条件
2024年に公開された Stable Audio Open は最大47秒の楽曲生成に対応していましたが、今回の Stable Audio 3.0 ではオープンウェイトのまま6分20秒まで対応範囲が広がりました。large モデルは API 経由またはセルフホスティングの有償サービスとしてのみ利用可能で、年間売上が100万ドル(約1.5億円)を超える企業はエンタープライズライセンスの取得が必要です。
ライセンス問題と音楽レーベルとの連携
音楽生成AI業界では、Suno・Udio が米国レコード会社各社から著作権侵害訴訟を受けており、学習データのライセンス確保が事業継続の鍵になっています。Stability AI は2024年に Warner Music Group および Universal Music Group とライセンス契約を締結しており、今回の Stable Audio 3.0 は完全にライセンスされたデータで構築されたと説明しています。Google や ElevenLabs も音楽生成モデルを投入するなか、ライセンス体制の有無が競合との差別化軸になりつつあります。
プロ向け製品と音楽業界人材の採用
Stability AI はプロフェッショナルミュージシャン向けの新製品スイートを開発中であることを明かしましたが、具体的な機能の詳細は未公表です。Universal Audio と Fender でチーフ・デジタル・オフィサーを歴任した Ethan Kaplan 氏が、同社のプロ向け音楽事業を統括する役職に就任します。音楽業界の幹部を採用して信頼性を高める動きは業界全体に広がっており、Suno は Merlin 元 CEO の Jeremy Sirota 氏をチーフ・コマーシャル・オフィサーとして招聘。ElevenLabs もインディー音楽出版社 Kobalt 出身の Derek Cournoyer 氏を音楽事業の戦略リードに起用しています。