
高音質な音楽ファイルのネックは容量の大きさです。新たなファイル形式は登場しますか?

将来的には新形式や技術が登場し、ストレージを気にせずに高音質のファイルを楽しめる可能性が高いです。
近年はデジタル音楽ファイルが主流ですが、圧縮されたデジタルファイルは原音の忠実性を失い、原音を保持できる高音質なファイルは容量が大きいというバランス問題は、熱心な音楽愛好家の頭を常に悩ませる課題と言えます。

今回は代表的なデジタル音楽ファイル形式をおさらいしつつ、AIが進化することで実現する可能性がある「音楽ファイル形式の未来」について掘り下げていきます。課題を解決してくれる画期的な未来が生まれるかもしれません。

それでは早速見ていきましょう!
代表的なデジタル音楽ファイルの現在を見ながら、未来に誕生するかもしれない新形式や技術をAIが未来予測
デジタル音楽ファイルの仕組みと代表的な形式
可逆圧縮と非可逆圧縮の違い
デジタル音楽ファイルには「可逆圧縮」と「非可逆圧縮」に分かれる”特性”があり、データ容量を大幅に削減できる非可逆圧縮形式は、見返りとして音質を若干犠牲にします。可逆圧縮は容量が大きいですが、原音を保持できます。

ちなみに現在「AppleMusic」で配信されている楽曲は、非可逆圧縮のAACファイル形式、そして16ビット/44.1kHz(CD 品質)から最高24ビット/192kHz(ハイレゾ)の解像度を持つ可逆圧縮のALACファイル形式です。

可逆圧縮は「ロスレス」、非可逆圧縮は「ロッシー」と呼ばれます。
代表的なファイル形式

高音質を求めるならWAV、FLAC、ALAC、ストレージを節約しながら高音質を維持したいならAACやOGG、互換性重視ならMP3のファイル形式が適しています。
再生デバイスやOSによってファイル形式の選択肢が変わるため、少々ややこしく感じられますが、MacとWindowsで両方活用できるWAVとFLACは、高音質で原音を損なわない可逆圧縮(ロスレス)ファイルの有力候補です。

膨大な音楽コレクションをスマホにインストールして聴く場合には、非可逆圧縮(ロッシー)のMP3やAACが重宝されることも多く、ユーザーが「音質重視」なのか「曲数重視」なのかで使い方も別れてくるでしょう。

最初に非可逆圧縮のファイル形式でCDやアナログを取り込んでしまうと、その後元の音質には決して戻らないので注意が必要です。私は自分の経験からも、先にロスレスファイルで保存してからロッシーへ変換することを推奨します。

ロスレスファイルはバックアップ保存しておくと安心です。
サンプリングレートについて

音声は本来アナログ信号(連続的な波)ですが、それをデジタルに変換する際に「瞬間的な音の高さ」を一定の間隔で”数値化”して記録します。この「記録する頻度」がサンプリングレートです。
私はアナログレコードをデジタル化する際、最初にWAV形式で出力し、その後音声編集ソフトでFLAC形式へ変換して、最終的には16ビット/44.1kHzのALACファイル形式で出力して保存するという手順を踏んでいます。

16ビット/44.1kHzはCD品質のサンプリングレートで、96kHz/24bit以上は一般的に「ハイレゾ」と呼ばれますが、私が好きな音楽ジャンルでは特に優位性を感じなかったため、CDと同じサンプリングレートにしています。

ただし「アナログレコードを限りなく本来の音質に近づけた状態でデジタル化したい」という場合には、ハイレゾ相当のサンプリングレートで記録するのが効果的でしょう。PC以外にクラウドにも保存しておくと安心です。

ハイレゾ相当だから全て最高、というわけでもないのが難しいところです。
ビットレートについて

「ビットレート」とは1秒間に処理・転送されるデータ量の多さを示す数値です。「kbps(キロビット毎秒)」が一般的な単位になります。
デジタル音声は、サンプリングされた音の情報(サンプリングレート)に加えて、「各サンプルに何ビット使うか」で精度が決まります。このデータの密度がビットレートで、高いほど情報量が多く、音質も良いとされます。

現在の形式で”高音質な音楽体験”を求めるのであれば、「44.1kHz以上のサンプリングレート」と「320kbps以上のビットレート」が最低ラインです。これ以下だと明らかに音質が劣化した印象を受けるので気をつけましょう。

例えばCDを取り込む場合、MP3のファイル形式を用いて128kbpsのビットレートで楽曲をデジタルファイル化すると、多くの人が「元の音源よりも劣った」と感じる仕上がりになります。特に高音部分の違いが顕著です。

ビットレートは高いに越したことはない、というのが私の持論です。
AIが考える「音楽ファイル形式の未来」を考察
ロスレスファイルの小型化

ロスレスファイルは現在FLACやALACが主流ですが、より高い圧縮率と音質を両立できる新たなコーデックが登場すれば、同じ音質でファイルサイズをダウンさせることもできるでしょう。
AIのこの発言の裏側には、現時点で噂されているAppleの「次世代ALAC構想」や、運営企業が経営破綻したものの音楽業界に一石を投じた「MQA(Master Quality Authenticated)」(外部リンク)ファイルの登場などがあります。

「音楽の折り紙」と呼ばれるMQAは、楽曲データを独自の理論でエンコード時に折り畳み、元データに影響しないエリアへ格納する方式で、デコード時には折り畳まれたデータを展開して再生する仕組みを持っていました。

私もMQA技術を用いたCDを保有していたことがありましたが、発表当時から熱心なオーディオファンの間で懐疑的な見方が強まり、ハイレゾ音源などで利用されていた既存のファイルを書き換えることができなかったのです。

MQAは「ファイル圧縮方式は改善できる」と世間に知らしめた点で意義がありました。
AIを用いた「次世代の圧縮技術」

AIを用いてデジタル楽曲の特徴を分析し、不要な部分は圧縮しながら”重要な部分のみ”を高音質で保持できる「次世代の圧縮技術」が開発される可能性があります。
AIによると、今後注目されるのはFLACやALACよりも高圧縮で、かつ音質を犠牲にしない可逆圧縮フォーマットです。その方法論の一つとしてAIは、AIを用いて圧縮技術を「次世代レベル」に引き上げる構想を語りました。

AIはこの発言の中で、従来のようにデジタルファイルに対して一律の圧縮をかけるのではなく、「異なる比率」で圧縮するスタイルを示しました。確かに”特徴分析”はAIの得意分野でもあり、それを活かせば可能性はあります。

課題としては、AIの機械学習時に利用されるデータの透明性、音源の本質を見極めるAIの高度な知性、リアルタイムで高品質な圧縮を行う際にAIが消費する計算コストなどが挙げられますが、面白い未来が訪れるかもしれません。

実現時期は先になりそうですが、希望が見えてきました。
まとめ
高音質と引き換えにファイルサイズが肥大化する音楽ファイル形式は、AIが進化した未来の技術によって「さらにサイズダウンする」可能性があります。課題は多いですが、AIとの対話を通じて”不可能ではない”ことが分かりました。

今はハイレゾ相当の楽曲もストリーミングできる時代に突入していますが、データを小型サイズにできる非可逆圧縮のファイルと比較すると通信量の負担が大きく、モバイルデータ通信での利用はあまり現実的ではありません。

これまで技術の進化は、数々の”小型化と利便性の両立”を実現してきました。ある時点で完全に止まっている可逆圧縮ファイルの進化を促進させるために「AIの力」を惜しみなく投入していくことには、大きな意義があるはずです。

スマホなどの身近なデバイスを通じて、高音質な音楽ファイルを「通信容量を気にせずストリーミングできる時代」が生まれた場合、音楽が持つ”本来の素晴らしさ”を多くの人々が体感できるのではないでしょうか。

最後までお読み頂き、ありがとうございました!
コメント