PR

AIと考えるラウドネス・ウォーの現在と未来(後編)

AIと考えるラウドネス・ウォーの現在と未来(後編) AIと音楽
この記事は約5分で読めます。
ソルティ
ソルティ

AIが進化すれば、楽曲のダイナミズムを予測・補完して修正できますか?

AI
AI

AI音声処理能力が進化すれば、過度に圧縮された音楽を元に戻すことが可能になるかもしれません。

前回の記事では、音楽業界最大の課題「ラウドネス・ウォー (音圧戦争)」の成り立ちとその問題点について、AIと対話しながら迫りました。常に大音量で流れる楽曲には”難聴のリスク”があります。

音楽鑑賞する若者のイメージ画像
Soraによるイメージ画像

音楽業界は”ラウドネス・ノーマライゼーション(音量正規化)”を導入し、再生時の音量は自動調整されますが、最終的な音量を決定するのはユーザー自身のため、音圧戦争の根本的な解決に至っていません。

音声編集ソフトのイメージ画像
Geminiによるイメージ画像

今回は、私が実践する海苔音源への対処法をご紹介しながら、進化したAIによって実現する可能性がある「ダイナミックレンジ復活」の未来予測についてもお伝えします。最後までお楽しみください。

ソルティ
ソルティ

それでは早速見ていきましょう!

ラウドネス・ウォーの未来|音声編集ソフトを用いた波形復元とAI進化で起こる「ダイナミックレンジ復活」の可能性

スポンサーリンク

音声編集ソフトによる波形の復元:iZotope RX-7の利用例

De-Clip機能で波形を復元

私の音声編集ソフトiZotope RX-7に搭載されている「De-Clip」は、過度の圧縮によってクリッピング(0dbを超える)した波形を”アルゴリズムの補完”で修復することができます。

RX-7に表示された音楽の波形
RX-7に表示された楽曲。これはレッド・ツェッペリンの「天国への階段」です。

実際にダイナミクス復活を再現しましょう。上記の「天国への階段」はクリッピングがない完璧な状態ですが、あえてゲインを4db増幅させて”クリッピングだらけの海苔音源”を擬似的に再現します。

わざとクリッピングさせた「天国への階段」の音源
4dbボリュームを増幅させた「天国への階段」。中盤から後半部分がクリッピングを起こしています。

ゲイン調整のみを行った場合

最初はゲインを単純に4db下げてみます。下図が4db減退させた波形です。単純にゲインを下げると0dbで切れた波形の先端部分が復元できないため、単に「ボリュームが小さい海苔音源」が出来上がります。

海苔音源のゲインだけを下げた図
0dbを超えた波形をゲイン調整で-4db下げた図。波形の先端が不自然に揃っています。

De-Clip機能を利用した場合

下図はDe-Clipによる復元です。De-ClipはAIアルゴリズムを活用して”失われた波形の先端部分”を補完し、ナチュラルな波形に復元してくれました。聴覚上も自然な感じで、強弱が復活してダイナミックレンジも改善します。

De-Clip機能で4db減退させた音源
De-Clip実行後。この後ゲイン調整を行う方が”自然な波形”になります。

De-Clipの出力結果は音源によって異なり、思い描いたような形にならないこともありますが、強弱を表すダイナミックレンジは間違いなく改善するため、音圧至上主義の音源改善におすすめです。

音楽鑑賞をしている女性のイメージ画像
Geminiによるイメージ画像

なお、アーティストの楽曲を改変した時点で、その楽曲はアーティストが意図したものとは違うものになります。自分の聴覚を守るための「個人の趣味」として楽しみましょう。

AI
AI

De-Clip機能は、擬似的でも圧縮音源に”本来のダイナミクス”を取り戻して、リスニング体験を向上させられます。DR値も改善できる点が素晴らしいですね。

ソルティ
ソルティ

De-Clip実行後の海苔音源は、耳に優しいマイルドな聴き心地になります。

AIによる「ダイナミックレンジ復元」の未来予測

AI
AI

AIが元音源を解析し、コンプレッションやリミッティングの影響を取り除いて、楽曲本来の「ピーク」や「クレッシェンド」を復元する未来が考えられます。

ラウドネスウォーの犠牲者となった海苔音源は、波形で確認すると0dbに接した部分が平らに潰れています。三角形であるべき部分が消え、不自然な平面が連続してしまっている状態です。

クリッピングを起こした海苔波形の画像
海苔波形の例。大部分で本来あるべきピーク(波形の頂点)が失われています。

AIはこうした音源を分析し、周波数帯域やダイナミクスが「本来どのような音量差を持つべきか」推測できます。類似した楽曲のデータを参照することによって、精度の高い予測も可能になるそうです。

その後AIは、過度の圧縮によって潰れた波形を本来の自然で伸びやかな波形に復元していきます。この際”複数の波形パターン”を出力・提示できるため、ユーザーが好きなパターンを選べる仕組みです。

ダイナミクス修正イメージ
De-Clip機能を用いた波形の復元。未来のAIはこれ以上に高精度な出力をしてくれる可能性があります。

「無くなった部分にAIが余計なデータを足しているだけでは?」という疑問が浮かびますが、AIデミックス技術はこうした懸念を払拭しました。AIのダイナミックレンジ復元も同じ未来となるでしょう。

ソルティ
ソルティ

高度なAIはダイナミックレンジをほぼ完璧に復元できると思います。

AIダイナミックレンジ復元の課題

ダイナミックレンジ復元が容易な音源もあれば、難しい音源も存在します。例えばアーティストが意図的に全ての音を「潰れた状態」で録音した場合です。この場合AIが原音をある程度”予測”しながら補完する必要があります。

AIによる音源調整のイメージ画像
Soraによるイメージ画像

課題を克服するため、最終判断を”人間の耳”で下すプロセスは必須です。作業工程はAIに任せ、出力結果に対して”ゴーサイン”を出すのは、未来においても常に「人間の役目」になるでしょう。

ソルティ
ソルティ

人間とAIが協業すれば、AIダイナミックレンジ復元は進化しそうです。

まとめ

音楽産業の加熱が生み出したラウドネス・ウォー(音圧戦争)の被害者は、間違いなく音楽を愛するユーザーです。現在も戦争は一部で続いており、世界10億人の若者が難聴のリスク(外部リンク)に曝されています。

難聴のリスクのイメージ画像
Geminiによるイメージ画像

現在の音楽ファンは「自分で身を守る」必要に迫られています。好きなアーティストの楽曲を人生で長く聴き続けるためには「何が必要なのか」を、一度立ち止まって考える時ではないでしょうか。

ソルティ
ソルティ

最後までお読み頂き、ありがとうございました!

ソルティ92
この記事を書いた人
ソルティ

「AIと考えるブログ」著者|過去の職歴:Webライター・書店員・レコード店員|AIと一緒に過去・現在・未来を見ながらトピックの本質に迫ります|仕事仲間はChatGPT・Gemini・Grok

ソルティをフォローする
AIと音楽
シェアする
ソルティをフォローする

コメント

タイトルとURLをコピーしました