デジタルオーディオの基礎知識
ファイル形式を適切に選択していくために、まずはオーディオの基礎知識を理解しましょう。
今回ご紹介する、音楽制作で主に使用される MP3、WAVE 、AIFF などといった音楽ファイルは、全て PCM 方式という方式が採用されています。以下は PCM 方式で採用されている考え方です。
サンプルレート( Sample Rate )
サンプルレート( Sample Rate )とは、アナログ音声をデジタルに取り込む際に1秒間当たりにサンプリングが行われる回数のことです。1秒間の間に音を何度も記録し、その記録したものをデジタル音源として再生します。横軸を時間として、その分割の細かさを表すものと考えるとわかりやすいでしょう。
このサンプリング回数が多いほど、音をとらえる正確性が増します。イメージとして、以下の図をご覧ください。
サンプリング回数が多いと、より元の波形が滑らかに再現されますが、サンプリング回数が少ないと再現しきれない音が生じてしまっています。そのため、一般的にはサンプルレートが高いほど音質が良いとされています。一方で、サンプルレートが高いと、ファイルサイズがでかくなってしまうということがデメリットです。
以下は、サンプルレートの一般的な種類です。
- 44.1 kHz
- 48 kHz
- 88.2 kHz
- 96 kHz
- 176.4 kHz
- 192 kHz
基準となるサンプルレートは CD 規格の 44.1kHz です。44.1k Hz は、1秒間に 44100 回サンプリングが行われていることになります。また、映像の音楽で使用されるサンプルレートは 48kHz です。
ハイレゾと呼ばれる音源は、CD 規格よりも高解像度な音源のことで、96kHz 以上のサンプルレートのものになります。
ビット深度( Bit Depth )
ビット深度とは、波形の振幅値の正確さ、つまり音量の正確さを表す数値です。サンプルレートが表の横軸に対しての細かさだったのに対し、ビット深度は縦軸の細かさを表します。単位は bit となり、一般的には 16bit が主流です。ビット深度は2の n 乗で表現されるため、16bit は2の 16 乗を表しています。つまり 65,535 段階で数値を表すことができることを表します。
この数値が大きいと、小さな音から大きな音まで滑らかに表現することが可能です。
以下は、ビット深度の一般的な種類です。
- 8bit
- 16 bit
- 24 bit
- 32 bit (浮動小数点数)
16bit は CD の規格です。制作では、24bit や 32bit float が一般的に使用されています。
32bit (浮動小数点数)とは通称「フロート」とも呼ばれ、別のビット深度とは異なる仕組みとなっています。その仕組みによる最大のメリットは、0db を超えてもクリッピングしないという点です。
通常の 16bit や 24bit であると、音を出力した際に、0db を超えたところの波形は潰れてしまいますが、32bit float の場合は 0db を超えても波形が保たれます。
このダイナミックレンジの広さと調整のしやすさから、プロの現場ではスタンダードに使用されています。
★サンプルレートとビットデプスについて
サンプルレートとビットデプスは、プロジェクトの途中で変更するとオーディオファイルのピッチや再生速度が変化してしまうなど、音質が劣化してしまいます。
レコーディングや制作の時は、事前にクライアントにどの値で制作をすればいいかを確認し、後から変更がないようにしておきましょう。
ビットレート
ビットレートとは、サンプルレート×ビット深度で表します。つまり、1秒間あたりにどれほどの情報が入っているかを表したものです。単位は kbps です。
基本的に、圧縮するということは、このビットレートを下げることになります。ビットレートが下がると音質は下がりますが、その分容量が軽くなります。
ハイレゾ、ロスレスとは
ハイレゾ( High-Resolution Audio )とは、CD 規格( 44.1kHz/16bit )よりも高いサンプリング周波数やビット深度で録音・再生することです。
ハイレゾ音源は、通常よりもデータの情報量が多いため、より原音に近いものとなっています。具体的には、96kHz/24bit や 192kHz/24bit などです。
非圧縮
音楽ファイル形式における非圧縮形式は、音声信号をデジタルデータに変換する際に、全ての情報をデジタル化することで音質を担保した形式です。つまり、圧縮しないので音質も落ちないということです。
非圧縮では、他の方式と比較し他場合高音質ですが、その分容量が大きいです。
WAVE
Windows と IBM が開発したファイル形式で、音楽制作で最も使用されるファイル形式の一つです。
WAVE ファイルはサンプリング周波数やビット深度をそのまま保存するため、高品質な音声を保つことが可能です。そのため、音声データの品質を重視する場合に WAVE ファイルがよく使われます。
多くの音楽再生ソフトウェアやオーディオエディターが WAVE ファイルに対応しており、汎用性が高いのも特徴です。
WAVE ファイルのデメリットとしては、ファイルサイズが大きくなりがちであり、ストレージ容量を消費することが挙げられます。
AIFF
Apple が開発したファイル形式。
こちらも非圧縮なので音質が良いことが特徴です。
また、同じ非圧縮の WAVE と比較した場合、AIFF の方がアーティスト情報などのメタデータを記録しやすいなどの利点があります。
しかし、AIFF は MAC では標準対応していますが、Windows などのその他の機器などではWAVE より凡庸性がやや劣ります。
非可逆圧縮(ロッシー圧縮)
非可逆圧縮、別名ロッシー圧縮とは、人間が識別できない程度の領域を削除することでデータ容量を軽くするという圧縮方式です。
一定の音質は担保されますが、削除されている部分があるため非圧縮方式と比べると音質は劣ります。また、非可逆圧縮という名前の通り、データを復元しようとしても復元することができないのがデメリットです。
しかし、データ容量が少なくて済むので、高音質が求められない場合は、ファイルの転送やダウンロードなどにかかる時間を短縮できるため重宝されます。
MP3
音声ファイルとして広く使われており、様々なディバイスで使用できるため、汎用性の高いファイル形式です。
人間の可聴領域外の音量や周波数などのデータを削除することで、データサイズを1/10 程に圧縮します。
MP3はインターネットの普及が始まった頃に音楽ファイルの先駆者として登場し、現在もなお広く利用されています。しかし、現在はMP3 よりも優れたファイル形式も登場し始めています。
AAC
AACは、より高い圧縮率と音質を提供することを目的に、MP3の後継技術として開発されたファイル形式です。一般的に、同じ条件下において、MP3よりも音質が良いとされています。
AACは、Apple の iTunes Store や YouTube、Spotify などのオンライン音楽ストリーミングサービスでも採用されています。また、Apple 製品との相性が良いのも特徴です。その他のディバイスでも基本的に互換性はありますが、古いディバイスの場合はサポートされていない場合もあります。
Vorbis
特許使用料がかからず、フリーで誰でも使用できる音声ファイル形式です。
同じ非可逆圧縮のMP3と比較して、同じビットレート下において Vorbis の方が高い圧縮率、高音質とされています。特に低ビットレートに強いというのが特徴です。
ゲーム音楽において、MP3はメーカーに使用料が請求されますが、Vorbis は使用料がかかりません。そのため、圧縮率、音質共に MP3と引けを取らずフリーで使えるという理由から、Vorbis がゲーム音楽でよく使用されています。
WMA
Microsoft が開発した音声ファイル形式。
MP3と同様、人間の可聴領域外のデータを削除することで、聴覚上の音質は保ちつつ、データサイズを小さくしています。その圧縮率は、1/20程で、MP3よりも高い圧縮率で保存可能です。
また、WMA は、デジタル著作権管理( DRM )技術をサポートしているため、不正なコピーを防ぐなどといった音楽の著作権保護が可能という利点があります。
可逆圧縮(ロスレス音源)
可逆圧縮とは、圧縮前の元データを完全に復元できる圧縮方式です。
可逆圧縮のデータ圧縮率は非可逆圧縮に比べて低いですが、その分データの品質が損なわれないため、重要なデータの保存に使用されます。
FLAC
FLAC は、Free Lossless Audio Codec の略で、フリーの音楽ファイル形式です。
圧縮率は約1/2程度となっており、ファイルの軽さは非可逆圧縮の MP3などには劣りますが、その分音質を削除することなく圧縮してくれます。
また、FLAC の特徴として、曲名やアーティスト名などのメタデータを含めることができます。DRM(デジタル著作権管理)には対応していません。
ALAC
ALAC( Apple Lossless Audio Codec )は、Apple によって開発されたファイル形式です。
音声ファイルを約半分程度のファイルサイズで音質を維持することが可能です。
また、iTunes などの Apple 製品で広く使用されており、Mac OS X や iOS デバイスでサポートされています。
一方で、ALAC は非 Apple 製品でのサポートが限られているため、他の可逆圧縮形式である FLAC などと比べて普及度は低いです。
音楽ファイル一覧
前章の内容を一覧にまとめました。ご活用ください。
番外編
MIDIデータ
midi の打ち込み情報を記録するためのファイル形式です。
オーディオデータとは違い、演奏された音符、音量、音色、演奏速度などの情報が含まれます。そのため、MIDI ファイルを使用して、作曲者やアレンジャーが簡単に楽曲のアイデアを共有することもできます。
DDP
マスタリングを行う際に使用されるファイルです。
DDP ファイルの中には、音楽イメージ( DAT )、識別子( DDPID )、ストリーム記述子( DDPMS )、サブコード記述子 ( PQDESCR )が必ず含まれており、これらは CD のトラック、タイミング、音量、音声ファイルの配置など、CD 製造に必要な情報が含まれています。
このため、DDP ファイルを使用することで、CD の内容を正確に再現することができます。
適切なファイル形式の選び方
適切なファイル形式を選ぶ際には、
- 音質
- ファイルサイズ
- 使用する機器やソフトウェアの互換性
- 使用目的
これらの要素を考慮して選ぶ必要があります。
音質を重視する場合は、音が除去されない非圧縮のファイルを、音質は気にしない代わりにファイルサイズを軽くしたい場合は圧縮率の高いファイルを選択すると良いでしょう。
また、合わせて使用する機器や送り先が利用しやすいか、その他使用目的などの観点から、複合的に判断していくと良いです。
まとめ
以上、今回は音楽ファイル形式について解説しました。
音楽ファイルには様々な種類があり、混乱してしまいがちですよね。
あらかじめファイルの知識が頭に入っていれば、音楽配信サービスに曲を配信する際や、案件の取引の際にも混乱を避けることができます。
今回ご紹介したファイルの概念と選び方を理解していれば、ファイル選びもスムーズになるでしょう。
ファイルサイズを小さくしたいとお考えの方は、そもそも DAW で設定しているプロジェクトのサンプルレート、ビットレートを小さく設定しておくと良いです。
サンプルレートとビットレートが低いと音声データのファイルサイズは小さくなります。そのため、これらの数値は必ずしも高ければ良いというわけではなく、状況に応じて数値設定することが大切です。
それぞれの数値設定は、依頼主の希望の数値にする他、自分で設定する場合は CD や YouTube など、各媒体によって推奨の数値があるので、最終的にどの媒体に出力したいかによって設定すると良いでしょう。
東京出身の音楽クリエイター。 幼少期から音楽に触れ、高校時代ではボーカルを始める。その後弾き語りやバンドなど音楽活動を続けるうちに、自然の流れで楽曲制作をするように。 多様な音楽スタイルを聴くのが好きで、ジャンルレスな音楽感覚が強み。 現在は、ボーカル、DTM講師の傍ら音楽制作を行なっている。 今後、音楽制作やボーカルの依頼を増やし、さらに活動の幅を広げることを目指している。
Masato Tashiro
プロフェッショナルとして音楽業界に20年のキャリアを持ち、ライブハウスの店長経験を経て、 2004年にavexに転職。以降、マネージャーとして、アーティストに関わる様々なプロフェッショナルとの業務をこなし、 音楽/映像/ライブ/イベントなどの企画制作、マーケティング戦略など、 音楽業界における様々な制作プロセスに精通している。 現在はコンサルタントとして様々なプロジェクトのサポートを行っている。