事業紹介 事業紹介トップ 経営データ分析基盤 Claude / MCP 導入 育つ業務アプリ 複雑な SaaS を専用 UI に Shopify Plus 移行・拡張 生成AI 活用(Multi AI) SEO / AIO / 広告運用 顧問・アドバイザリ インフラ構築 自社メディア投資・開発
Claude Claude / MCP 総合 Claude Cowork Claude Code Claude Design MCP サーバー実装
Shopify Plus Shopify Plus トップ EC-CUBE からの移行 大手カートからの移行 Shopify 通常プラン
実績
業界ニュース 業界ニュース トップ AI ニュース └ Claude └ ChatGPT・Codex └ Gemini └ その他 Shopify ニュース SaaS ニュース お知らせ(自社発信)
会社情報 お問い合わせ
2026.05.22

Stability AI が Stable Audio 3.0 を発表——6分超の楽曲生成が可能な音楽AIモデル群

記事のサマリー(TL;DR)

  • Stable Audio 3.0 は4モデル構成(最大2.7Bパラメータ)。large モデルは6分20秒の楽曲生成が可能
  • small SFX・small・medium の3モデルはオープンウェイト公開。large は API・セルフホスティングのみ、売上100万ドル超の企業はエンタープライズライセンスが必要
  • Warner Music Group・Universal Music Group との契約に基づく完全ライセンスデータで学習。Suno・Udio が直面する訴訟リスクとの対比が鮮明

国内音楽制作・クリエイターツール事業者が注目すべき点

Stable Audio 3.0 の最大の特徴は「完全ライセンスデータ」による学習です。国内でも音楽生成AIの商用利用には著作権法上の不確実性が残っており、JASRAC や NexTone が管理する楽曲を学習データに含む海外サービスの使用には慎重な判断が求められています。今回 Stability AI が Warner Music Group・Universal Music Group と事前にライセンス契約を締結した上でモデルを構築したことは、商用利用を検討する国内の映像制作会社・広告代理店・ゲームスタジオにとって、法務リスクの低い選択肢として評価できます。また、small SFX モデル(459Mパラメータ)はオンデバイス音声生成向けに設計されており、モバイルアプリや組み込み機器への統合を検討している開発者にとっても実用的な出発点となります。一方、大手音楽プラットフォームやレーベルとの提携を持たない中小サービスは、Suno・Udio の訴訟の行方を注視しながら、ライセンス体制の整備を先行させる必要があります。

詳細

Stable Audio 3.0 の4モデル構成

Stability AI(Stable Diffusion を開発した企業)は、音楽・サウンド生成の新モデルファミリー「Stable Audio 3.0」をリリースしました。ラインアップは以下の4モデルです。

モデル名 パラメータ数 最大生成時間 提供形態
small SFX 459M 約2分 オープンウェイト
small 459M 約2分 オープンウェイト
medium 1.4B 6分20秒 オープンウェイト
large 2.7B 6分20秒 API・セルフホスティング(有償)

small・small SFX の2モデルはオンデバイスでの音声・音楽生成を想定した設計です。medium・large はいずれも6分20秒のフル楽曲を生成でき、楽曲構造とメロディーの一貫性を維持できると同社は主張しています。これは2024年にリリースした Stable Audio 2.0 が生成できた最大時間の2倍以上に相当します。

オープンウェイトの拡大と商用利用条件

2024年に公開された Stable Audio Open は最大47秒の楽曲生成に対応していましたが、今回の Stable Audio 3.0 ではオープンウェイトのまま6分20秒まで対応範囲が広がりました。large モデルは API 経由またはセルフホスティングの有償サービスとしてのみ利用可能で、年間売上が100万ドル(約1.5億円)を超える企業はエンタープライズライセンスの取得が必要です。

ライセンス問題と音楽レーベルとの連携

音楽生成AI業界では、Suno・Udio が米国レコード会社各社から著作権侵害訴訟を受けており、学習データのライセンス確保が事業継続の鍵になっています。Stability AI は2024年に Warner Music Group および Universal Music Group とライセンス契約を締結しており、今回の Stable Audio 3.0 は完全にライセンスされたデータで構築されたと説明しています。Google や ElevenLabs も音楽生成モデルを投入するなか、ライセンス体制の有無が競合との差別化軸になりつつあります。

プロ向け製品と音楽業界人材の採用

Stability AI はプロフェッショナルミュージシャン向けの新製品スイートを開発中であることを明かしましたが、具体的な機能の詳細は未公表です。Universal Audio と Fender でチーフ・デジタル・オフィサーを歴任した Ethan Kaplan 氏が、同社のプロ向け音楽事業を統括する役職に就任します。音楽業界の幹部を採用して信頼性を高める動きは業界全体に広がっており、Suno は Merlin 元 CEO の Jeremy Sirota 氏をチーフ・コマーシャル・オフィサーとして招聘。ElevenLabs もインディー音楽出版社 Kobalt 出身の Derek Cournoyer 氏を音楽事業の戦略リードに起用しています。