にっしーですぜ。先週、宮古島の農家さんのFacebook動画を手伝ってたんですよ。マンゴーの収穫動画で、映像自体はスマホで撮ったやつがすごく良くて。でも「BGMどうしよう」ってなった。
フリーの音源サイトを漁ったら、「あ、このBGM、どこかで聞いたことある」ってやつに全部当たるんですよね。被るんです、みんな使うから。かといって有名どころの曲を使うとYouTubeでミュートになったりする。
「じゃあAIで作るか」ってなって、使ったのが Stable Audio でした。
動画BGMの困りごと、あるある
「BGMを用意する」って地味に面倒です。宮古島の事業者さんと話してると、こういう話をよく聞くんですよ。
まず、フリー音源は被る。フリー素材サイトの定番曲って、他のみんなも使ってる。「あ、あのYouTube動画のBGMと同じだ」ってなると、せっかくの動画の個性がちょっと薄れる気がする。
あと、著作権で消える問題。YouTubeやInstagramで既存の曲を使うと、消音処理が入ったり最悪削除になったりする。特に観光業や飲食業でインバウンド向けに動画を上げてる場合、英語圏・アジア圏の権利管理が厳しくて「なぜか消えてた」が起きやすい。
そして、ちゃんとした素材を買うと高い。業務用の音源ライブラリってサブスク月数千円〜数万円するものもあって、動画を毎月何本も作るわけじゃないお店には割に合わない。
この3つが全部解決するのが、AIでオリジナルBGMを作るやり方かなと思うんですよね。
Stable Audio 2.5:インストとBGMと効果音の主軸
Stability AIが出してる音楽生成AIで、2026年5月時点の現行バージョンが Stable Audio 2.5 です。
何がいいかって、インスト・効果音・BGMに特化してること。歌入りの楽曲より、「環境音」「効果音」「BGM」をテキストで細かく指定して作るのが得意なんですよ。「波の音とピアノが混ざった落ち着く雰囲気」とか「チェックアウト音っぽいポップな効果音」みたいなやつが出てくる。
使い方はシンプルで、Stable Audioのウェブサイトにアクセスして、テキストでどんな音が欲しいかを入力するだけ。英語で入力するのが精度的に良くて、「calm ambient piano, ocean sound, no vocal, 60 seconds」みたいな感じで指定します。翻訳が面倒なら「calm relaxing bgm no vocal」くらいのシンプルな英語でも十分動きます。
長さは30秒から数分まで指定できて、無料プランでも一定の生成ができます。商用利用したいならProプランがあって、2026年5月時点では月11.99ドル(日本円で1,800円前後の感覚)。商用プランの詳細は公式サイトで確認してください、価格は変わることがあるので。
「効果音も作れる」のが地味に大きくて、「ドアのチャイム音」「波の打ち寄せる音」「カフェの食器の音」みたいな環境音を細かく作れます。SNS動画のBGMだけじゃなく、店頭の音環境を整えたい場合にも使えると思うんですよね。
SUNO v4.5でインストBGMを作る話
「SUNOって歌入り楽曲のやつでしょ」って思ってる人が多いと思うんですけど、実はインストBGMも作れるんですよ。
お店のテーマソング、SUNOで作ってみたの記事でも書いたんですが、v4.5には「Instrumental」モードがあって、歌なしの楽器だけバージョンで出力できます。この使い方だと、「メロディが立ったBGM」「ドラマチックな雰囲気の曲」を作るのにSUNOは向いてる印象があります。
Stable AudioとSUNOの違いを一言で言うと、Stable Audioは「環境音・効果音・シンプルな雰囲気BGM」が得意、SUNOは「メロディが主役の楽曲BGM」が得意、という感じかなと思ってます。どっちが偉いとかじゃなくて、動画の目的に合わせて使い分けるイメージです。
Stable AudioとSUNOの使い分け
迷ったときの目安を書いておきます。
- Stable Audio向き
- – 環境音・効果音が欲しい(水の音、店内の音、自然音など)
– 商品紹介動画のサラッとした背景音楽
– 説明動画や操作マニュアル動画の静かなBGM
– 音が主役にならないようにしたい動画 - SUNO向き
- – メロディが記憶に残るような店舗テーマ曲
– リール動画やショートで「この曲なんだろう」ってなる引力が欲しい
– 周年記念やイベント動画に合う盛り上がる感じの曲
どっちを使うかは「動画の中で音に注目させたいか、させたくないか」が一つの判断基準になるかなって思います。商品の良さを伝えたい動画では音は脇役の方がいい場合が多いので、そういうときはStable Audioの環境音系がハマりやすい気がします。
宮古島で試した3例
実際にやってみた話を正直に書きます。
観光宿のWEB動画BGM
伊良部島の民宿のオーナーさんが、HP掲載用の短い紹介動画を作ってたんですよ。夕陽と海の映像で、30秒くらいのやつ。「雰囲気に合うBGMが見つからない」って相談されて、Stable Audioで試してみました。
プロンプトは「ambient relaxing warm piano ocean sunset 30 seconds no vocal」みたいな感じで入れたら、いくつか出てきた中に「あ、これちょうどいい」ってのがあった。オーナーさんに聴かせたら「これで全然いける!」って言ってもらえた。生成から選定まで10分くらいでした。
飲食店のSNS動画に効果音
平良の居酒屋さんが、料理が出てくる瞬間を撮った短い動画を作ってて。「料理が置かれる瞬間に合うポップな音が欲しい」って話になって、効果音をStable Audioで出しました。
「short pop chime effect cheerful food serving」で生成して3〜4パターン試したら、ちょうど良いのが出た。既製品の効果音みたいな「いかにも感」が薄くて、自然にハマる感じのやつ。
農家のFacebook動画BGM
冒頭で書いたマンゴー農家さんの話です。「収穫作業の動画に合う、明るいけど落ち着いた感じ」というリクエストで、「uplifting gentle acoustic guitar harvest nature calm no vocal」で出したら、2本目で「これがいい」ってなりました。
「被らない」「消されない」「費用がかからない」の3つが揃うのが、やっぱりAIで作る一番のメリットだなと実感しましたよ。
始め方は5分
手順を書いておきます。
- Stable Audioのサイトにアクセス(stableaudio.com)
- アカウントを作る(メールアドレスだけで登録できます)
- テキストでどんな音が欲しいかを入力(英語推奨、シンプルでOK)
- 長さを指定して生成(30秒から試すと感覚が掴みやすい)
- 気に入ったら保存(複数生成して選ぶのが正解)
無料枠で最初は十分試せます。「あ、これ使えるかも」ってなったら商用プランに上げる流れで良いと思います。
英語プロンプトで迷ったら、まず 「calm bgm no vocal 30 seconds」 から始めてみて。シンプルでも出てきます。
やらかしポイント
やってしまいがちな失敗、正直に書いておきます。
長すぎる曲を作ろうとして時間をかけすぎた、というのがまず一個。「3分の動画に合わせて3分ちょうどのBGMを」って考えると、生成と確認に時間がかかる。短い素材を繋いだ方が早い場合もあります。編集ソフト側でループ再生させるのも手です。
あと、メロディが主張しすぎてうるさくなることもある。「明るい感じ」というプロンプトから、予想より派手なメロディが出てきて「BGMの主張が強すぎる」ってなる。「no melody」「ambient」「background」をプロンプトに足すと抑えられます。
一番やっちゃいけないのが著作権の利用条件を確認しないこと。「AIで作ったから大丈夫」ではなくて、Stable Audioの商用利用の条件はプランによって変わります。商用で使うなら使用前に必ず公式の利用規約を確認してください。無料プランは商用NGです。
一回触ってみてほしい
「BGMは既製品を探すもの」という感覚、あると思うんですよね。僕もそうでした。でもStable Audioで試してみたら、テキスト入れて30秒待って聴いてみる、それだけでした。
最初からドンピシャのやつが出なくても全然良くて、3〜5パターン出して「これかな」を選ぶ作業が楽しい。音楽の知識も要らないし、機材も要らない。
宮古島で動画を作ってる人、これ一回やってみて。無料から触れるから損はないです。
音や動画周りのAIで他に気になるなら、お店のテーマソング、SUNOで作ってみたでは歌入りのオリジナル曲を作る話を書いてます。写真1枚から動画、Runway/Lumaで動かすと合わせると「音と映像」のAI活用が一気に広がると思います。どのAIが何に向いてるかの全体像はやりたいこと逆引き:このAIならこれができる50連発で確認してもらえると。
ONEstaでは宮古島の事業者さん向けにこういうAIの使い方の相談も乗ってます。「うちの業種ではどう使うか」「動画作りに使ってみたいけど分からない」、気になったら気軽に連絡してみてください。