
音源編集ソフトのAIが進化すれば、楽曲のダイナミズムを予測・補完しながらデータを修正できますか?

AIの音声処理能力が進化すれば、過度に圧縮された音楽を「元に戻す」ことが可能になるかもしれません。
前回の記事では、音楽業界最大の問題である「ラウドネス・ウォー (音圧戦争)」の成り立ちとその問題点について、AIと対話しながら迫っていきました。常に大音量で流れる楽曲は、WHO(世界保健機構)が警告する”難聴のリスク”があります。

現在の音楽業界は「ラウドネス・ノーマライゼーション(音量正規化)」を導入しており、楽曲再生時のボリュームは自動調整されますが、最終的なボリュームを決定するのはユーザー自身であり、音圧戦争の完全な解決には至っていません。
後編となる今回は、私が実践している海苔音源(0db付近に音が張り付いている楽曲)への対処方法をご紹介しながら、未来の進化したAI音声編集ソフトで実現するかもしれない「ダイナミックレンジ復活」の可能性についてお伝えします。

それでは早速見ていきましょう!
「ラウドネス・ウォーの未来」を考える:市販の音声編集ソフトを用いた波形の復元・AIが進化した未来で起こる「ダイナミックレンジ復活」の可能性
音声編集ソフトによる波形の復元 (iZotope RX-7の利用例)
De-Clip機能の活用で波形を復元

De-Clip機能を利用すれば、圧縮されすぎた音源に「本来のダイナミクス」を取り戻し、リスニング体験を向上させることができます。DR値も改善できる点が素晴らしいですね。
私が普段愛用する音声編集ソフトはiZotope社のRX-7で、このソフトに搭載されている「De-Clip機能」は、過度の音圧によってクリッピングした(0dbを超えた)波形部分をアルゴリズムの補完で修復できるデジタルツールです。

このDe-Clip機能がどのように役立つのか、実験してみましょう。上記に示した「天国への階段」の音源はクリッピングのない完璧な波形ですが、あえてゲインを4db増幅させ、クリッピングだらけの海苔音源を擬似的に再現してみます。

最初はゲイン調整ツールで海苔音源に対処してみます。下図は4db減退させた様子です。単純にゲインを下げると0dbで切れた”波形の先端部分”が復元できないため、聴覚上は全く変わらない「ボリュームが小さい海苔音源」になってしまいます。

次はDe-Clipによる処理です。De-ClipはAIアルゴリズムを活用して”失われた波形の先端部分”を補完させ、ナチュラルな波形に復元でしてくれました。聴覚上は非常に自然な感じとなり、強弱が生まれてダイナミックレンジも改善します。

RX-7のDe-Clip機能で出力される結果は音源によって異なり、時には思い描いていたような形にならないこともありますが、DR値で表されるダイナミックレンジは間違いなく改善するため、海苔音源の改善におすすめです。
一般的にダイナミックレンジの数値が大きい音源は耳に優しく、数値が低いものほど長時間の大音量鑑賞で耳に悪影響を及ぼすため、私はこのシステムをラウドネス・ウォーの犠牲者に利用して、リスニング体験を改善しています。
注意点として、アーティストの楽曲を改変した時点でその楽曲は”アーティストが意図したものとは違うもの”になります。また、改変した楽曲をネットで配信する行為は法律違反です。あくまで個人の趣味として楽しみましょう。

De-Clip実行後の音源は、耳に優しくマイルドな聴き心地になりますよ。
AIによる「ダイナミックレンジ復元」の未来

音源編集ソフトのAIが高度な進化を遂げた場合、楽曲が持つダイナミックレンジを正しく予測・補完しながらデータを修正することはできると思いますか?

AIの音声処理能力が進化すれば、過度に圧縮された音楽を「元に戻す」ことが可能になるかもしれません。
2022年に発売されたビートルズの「リボルバー (スペシャル・エディション)」(外部リンク)の新ステレオミックスでは、過去に分離が不可能とされたミックス済みの楽器と音声を「AIデミックス技術」で分離する作業が行われました。

AIデミックス技術は、ビートルズ最後の新曲「ナウ・アンド・ゼン」の制作過程でも用いられ、楽曲の元となったジョン・レノンの古いデモテープからジョンのボーカルとピアノ、ノイズを綺麗に分離することにも成功しています。

現在のAIは、非常に高い精度でミックスされた音源を判定・識別しながら抽出することが可能であり、その技術はダイナミックレンジ復元にも役立つはずです。ここからはAIが考えるダイナミックレンジ復元のプロセスを見ていきましょう。
AIが考える「失われたダイナミックレンジ」の復元プロセス

AIは元の音源を解析し、コンプレッションやリミッティングの影響を取り除きながら、本来のピークやクレッシェンドを復元するプロセスを実行していきます。
前項で取り上げた通り、ラウドネスウォーの犠牲者となった楽曲は、デジタル波形で確認すると0dbに接した部分が潰れている特徴があります。鋭角な三角形であるべき部分が消え、不自然な平面になってしまっているのです。

AIはこうした音源を分析し、周波数帯域やダイナミクスが「本来であればどのような音量差を持つべきなのか」を推測できます。この際、過去の類似した楽曲のデータを参照することによって、精度の高い予測が可能になります。
その後AIは、過度のコンプレッションなどによって潰れてしまった波形を、本来の「自然で伸びやかな波形」へと復元していきます。理論的には複数のパターンを出力・提示できるため、好きな復元パターンを選べるはずです。

「無くなった部分にAIが余計なデータを足しているだけでは?」という疑問が浮かびがちですが、前述のAIデミックス技術はこうした懸念を払拭する結果を残しました。AIのダイナミックレンジ復元も”同じ精度”で実現することでしょう。

高度な機能を持つAIは、高い精度でダイナミックレンジを復元できると思います。
AIダイナミックレンジ復元の課題

AIのダイナミックレンジ復元は理論的には可能で、今後の技術進歩によって実現される可能性は高いですが、そこにはいくつか課題もあります。
ダイナミックレンジの復元が容易な音源もあれば、困難を極める音源も存在します。例えばアーティストが意図的に全ての音を潰れた状態で録音した場合です。この場合AIが原音をある程度”予測”しながら補完する必要があります。

またAIは、AIダイナミックレンジ復元の課題として「芸術的意図の理解」も挙げており、これも確かに難しい問題です。つまり「どこまでがアーティストが意図した音なのか」という線引きの判断を下すのが難しいのでしょう。
これらの課題に対処するために、最終的な判断を「人間の耳」で下すプロセスが求められると思います。作業工程はAIに任せながら、出力された結果に対して”ゴーサイン”を出すのは、人間が行う大切な役割になるはずです。

人間とAIが協力する形を取れば、ダイナミックレンジ復元は進化できそうです。
まとめ
音楽産業の競争が加熱した結果生まれた「ラウドネス・ウォー(音圧戦争)」。その被害者は、間違いなく音楽を愛するユーザーです。現在もこの戦争は一部で続いており、世界で10億人の若者が「難聴のリスク」に曝されています。

この状況に対処すべく、今回は個人でもできる「De-Clip」機能を用いたダイナミックレンジの改善、そしてAIによる高度なダイナミックレンジ復元の未来をお伝えしました。デジタル音源は、調整次第で”耳に優しい音”になります。
最も効果的なのは、アーティストとレコード会社が過去の音源を反省し、ダイナミックレンジを復活させたバージョンをリリースすることですが、一部にそうした動きは出ているものの、完全に差し変わることはないでしょう。
今はユーザーが自分の環境に気を配り、長時間の音楽鑑賞で耳にダメージを負わない取り組みが求められます。好きなアーティストの楽曲を長く聴き続けるためには何が必要なのか、一度立ち止まって考える時です。

最後までお読み頂き、ありがとうございました!
コメント