
デジタル音声編集ソフトの「クリックノイズ除去」機能に、AIはどれだけ関与していますか?

「クリックノイズ除去」機能において、AIは近年ますます重要な役割を果たすようになっています。
以前の記事では、アナログレコードをデジタル音源に変換する話題を取り上げました。今回はその変換過程において、ポップ音やクリック音などの「ノイズ除去」を行っていく過程についてお話をさせていただきます。

アナログレコードの再生時、メディアの状態や視聴環境に応じて様々なノイズが発生しますが、デジタル変換したファイルを市販の音声編集ソフトで処理することによって、これらのノイズを大幅に低減・削除できます。
本記事では現在私が実際に利用しているiZotope社の「RX-7」を例に、アナログレコード特有のパチパチ音(クリックノイズ)を除去する過程をお見せしつつ、AIの関与で進化する可能性がある「ノイズ除去の未来」にも迫ります。

それでは早速見ていきましょう!
アナログ音源のデジタル化における「クリックノイズ除去」の実例と進化したAIが実現する「ノイズ除去の未来」を考察
クリックノイズ除去の流れ
私のアナログレコード取り込み環境は、「TEAC TN4D」→「KORG DS-DAC-10R」→「Mac」という接続です。アナログ音源をデジタルに変換する音声編集ソフトには「AudioGate」(外部リンク)を利用しています。

AudioGateからWAV形式で出力した楽曲をiZotopeのRX-7で開くと、目視で音楽が持っている「波形」を確認できます。下図が実際にアナログレコードの楽曲を取り込んだ画面で、音が大きい場所は波形も大きくなっています。

この画面をよく見ると、針が刺さったような「鋭い波形」が複数箇所に散見されます。これがアナログ再生時に「パチッ」という音として聞こえていたノイズです。デジタル変換を行うことで、ノイズを「可視化」できるのです。
アナログレコード表面に付いた「キズ」由来のノイズは、手作業のクリーニングでは完全に除去できません。デジタルファイル化してノイズ除去を行うと、こうしたキズ由来のノイズを綺麗に消し去ることができます。
「De-Click」の仕組み
RX-7に搭載されている機能「De-Click」は、レコードのパチパチノイズを効果的に除去できます。iZotope公式によると、De-Clickは様々な原因によって発生する「短いインパルス・ノイズ」を除去するためのツールです。
De-Clickにはプリセットで複数のアルゴリズムがあり、それぞれ「異なる効き方」をしますが、私がアナログレコードのノイズ除去に適していると思ったのは「Multi-Band (Random Clicks)」になります。

「どれくらいの強さでノイズ除去を行うか」を決めるのは「Sensitivity」のスライダーです。この項目の数値を自分で設定し、その後画面右下の「Render」ボタンを押すと、選択した範囲の波形でノイズ除去が開始されます。
Sensitivityの最大値は「10」です。私は通常「3.5」でノイズ除去を行い、それでも取りきれない場合には「5」以上の数値へ徐々に上げています。最も効果が強まる「10」は、よほどノイズが酷い場合以外は使いません。

数値はお好みで。ただしあまり数値が小さいとノイズを取りきれません。
クリックノイズ除去作業の実際
では、波形を拡大して見やすくした上で、実際にDe-Clickを動作させてみましょう。下の画像は処理前と処理後の画面です。縦に走るオレンジ色の細い線がノイズ成分で、処理後にこれがどうなるかに注目してください。

De-Clickを実行後、下の画像ではノイズ成分がほぼ消えたことが分かります。これは数値を「3.5」に設定してかけた場合の結果ですが、うっすら残る場合には数値を上げて再実行すれば、細い縦線のノイズは完全に消えます。
ノイズ除去を行うことでパチパチ音は消え去り、その結果非常に聴きやすく、また見通しの良い音源へと変わります。これがアナログをデジタルへ取り込むことの「恩恵」を一番体感できる瞬間だと私は思うのです。

ただしDe-Click機能は万能ではなく、「楽曲が元々持っている成分」も一緒に除去してしまう危険性があるため、作業を行う場合には十分な注意が必要です。特に「Sensitivity」の数値を上げる際はリスクが伴います。
元の波形を保ったままノイズを除去するコツは、楽曲全体に均一なDe-Clickを行うのではなく、実行範囲を予め決めておくことです。波形が変わってしまい「やり過ぎた」と感じた場合には、巻き戻して作業をやり直しましょう。

Photoshopと同じく、RX-7は作業を簡単に巻き戻せるので便利です。
範囲選択と画面の拡大
下の画像は、私が所有するピンク・フロイドのアルバム「狂気」のB面でノイズ除去を行っている場面です。点線で選択したR(右トラック)の範囲に埃が原因と思われるクリックノイズがあるため、これを指定して取り除きます。
この場面で気を付けたいのは、ノイズのすぐ後にドラムのアタック音が入っていることで、これを一緒に選択してしまうと、ドラム本来の鋭い衝撃音が影響を受けて減退します。範囲選択が難しい場合は、画面を拡大してみましょう。

波形を拡大すると、ノイズ成分もハッキリと目視できます。そして次に発生するドラムの鋭いアタック音を選択せず、綺麗にノイズ部分だけを選んでDe-Clickを実行できるため、処理後に聴覚上の違和感は発生しません。
De-Clickの選択範囲には、ある程度の「長さ」が必要です。あまりに狭い範囲を選択すると、アルゴリズムが「本来の働き」をしなくなってしまうので注意してください。また選択範囲が短すぎると画面にも警告が出ます。

将来的にアルゴリズムが「アタック音」と「ノイズ」を区別し、正確なノイズ除去をしてくれる可能性もありますが、現状はソフトによってもノイズ除去の結果は異なり、時にDe-Clickが裏目に出ることもあるので注意してください。
エンヤ(Enya)の楽曲など、ほぼドラム音が入っていない声楽やシンセ、オーケストラ主体の構造を持つ楽曲では、De-Clickは大いにその力を発揮しますが、現状のアルゴリズムはバンド形式のロックやポップスで苦戦します。

ただ、以前は不快に感じたポップ音やクリックノイズが綺麗に除去されることで、中古レコードの聴覚上の格付けも「VG」から「EX」へ、時には「NM」まで引き上げることができるため、この機能は本当に便利です。
ちなみに「VG」「EX」「NM」というのは中古レコードの状態を示す言葉で、VGは「Very Good」、EXは「Excellent」、NMは「Near Mint」を意味し、VGが最も悪い状態で、NMが新品同様の状態を指しています。

こだわると作業時間も増えますが、その分完成品のクオリティーと精度は高まります。
AIの進化で起こる「ノイズ除去の未来」

未来ではAI技術の進化によって、ノイズ除去の精度と効率が大幅に向上するでしょう。
一昔前に存在していたデジタルノイズの除去プロセスは、「特定の周波数」や「音のピーク」だけを検出して取り除く仕組みを持っていましたが、現在はAIのアルゴリズムによって、さらに高度なノイズ除去が可能です。

De-Click機能を持つRXシリーズのアルゴリズムに用いられているのは、AIが機械学習した「膨大なノイズパターン」で、こうしたパターンを元に、アルゴリズムは様々なクリック音やポップ音を検知・除去しています。
機械学習が進み、深層学習(ディープラーニング)で「原音」を補完できるようになれば、AIは様々な音楽の質感やニュアンスを維持しながら、ノイズ成分だけを分析・抽出して「完璧なノイズ除去」を行うこともできるはずです。

こうしたAI特化型のノイズ除去システムは、キズや粒子ノイズが乗った映像フィルムの修復や、雑音で聴き取り辛くなった音声の輪郭復元などにも活用できるので、貴重な視聴やアーカイブの復元・保存にも役立ちそうです。

アナログの遺産を最先端のデジタルで復元する未来が見えてきました!
まとめ
CDやダウンロード音源とは異なり、アナログレコードは物理メディアの特性上、鑑賞時に「ノイズとの戦い」が起こります。ノイズはクリーニングである程度まで防ぐことができますが、完全には除去できないものです。

こうしたノイズを「アナログの味」として捉える人もいますが、その一方でアナログをデジタルファイル化し、市販の音声編集ソフトでノイズを除去しながらリスニングを楽しむという、私のような趣味を持つ人達もいます。
記録を保存するための「アナログ→デジタル化」
私がアナログをデジタル化する理由は「音楽をより良い状態で聴きたい」というオーディオマニア的な発想から来るものですが、手持ちのアナログに何かあった場合のことを考え、「バックアップを取る」意味合いもあります。

映画・音楽業界では、すでにアナログマスターを「デジタルで保存」する動きが出ています。これはマスターテープが劣化を続けることへの対抗策でもあると共に、後世に「人類の遺産」を残すための実践的な取り組みです。
紙であれフィルムであれレコードであれ、「アナログ媒体」が一度失われると、人類の歩みを記録したメディアを二度と閲覧できない事態に陥ります。クラウド保存もできるデジタルの積極的な活用は必須だと思うのです。

最後までお読み頂き、ありがとうございました!
コメント