音楽制作で取り扱うファイル形式を徹底解説！【一覧付き】

みなさんも聞き馴染みのある MP3、WAVE をはじめとし、様々な音楽ファイル形式が存在します。「色々な音楽ファイル形式があるけど、何が違うの？」「どう選べばいいの？」と疑問を抱いている方へ、今回は代表的な音楽ファイル形式を解説していきます！

#career #basic knowledge

Nami

2023-06-02・7min read

デジタルオーディオの基礎知識

ファイル形式を適切に選択していくために、まずはオーディオの基礎知識を理解しましょう。
今回ご紹介する、音楽制作で主に使用される音楽のファイルデータをより理解するための基礎知識として、音声をデジタル化する際に使用される「PCM 方式」の考え方をお伝えします。

サンプルレート（Sample Rate）

サンプルレート（Sample Rate）とは、アナログ音声をデジタルに取り込む際に１秒間当たりにサンプリングが行われる回数のことです。１秒間の間に音を何度も記録し、その記録したものをデジタル音源として再生します。
以下の図の横軸は時間で、その分割の細かさを表すものがサンプルレートと考えるとわかりやすいでしょう。

このサンプリング回数が多いほど、音をとらえる正確性が増します。イメージとして、以下の図をご覧ください。
サンプリング回数が多いと、より元の波形が滑らかに再現されますが、サンプリング回数が少ないと再現しきれない音が生じてしまっています。そのため、一般的にはサンプルレートが高いほど音質が良いとされています。一方で、サンプルレートが高いと、ファイルサイズがでかくなってしまうということがデメリットです。

以下は、サンプルレートの一般的な種類です。

44.1 kHz
48 kHz
88.2 kHz
96 kHz
176.4 kHz
192 kHz

基準となるサンプルレートは CD 規格の 44.1kHz です。44.1k Hz は、１秒間に 44100 回サンプリングが行われていることになります。また、映像の音楽で使用されるサンプルレートは 48kHz です。
ハイレゾと呼ばれる音源は、CD 規格よりも高解像度な音源のことで、96kHz 以上のサンプルレートのものになります。

ビット深度（Bit Depth）

ビット深度とは、波形の振幅値の正確さ、つまり音量の正確さを表す数値です。サンプルレートが表の横軸に対しての細かさだったのに対し、ビット深度は縦軸の細かさを表します。単位は bit となり、一般的には 16bit が主流です。ビット深度は２の n 乗で表現されるため、16bit は２の 16 乗を表しています。つまり 65,536段階で数値を表すことができることを表します。
この数値が大きいと、小さな音から大きな音まで滑らかに表現することが可能です。

以下は、ビット深度の一般的な種類です。

8bit
16 bit
24 bit
32 bit （浮動小数点数）

16bit は CD の規格です。制作では、24bit や 32bit float が一般的に使用されています。
32bit （浮動小数点数）とは通称「フロート」とも呼ばれ、別のビット深度とは異なる仕組みとなっています。その仕組みによる最大のメリットは、０db を超えてもクリッピングしないという点です。
通常の 16bit や 24bit であると、音を出力した際に、０db を超えたところの波形は潰れてしまいますが、32bit float の場合は０db を超えても波形が保たれます。
このダイナミックレンジの広さと調整のしやすさから、プロの現場ではスタンダードに使用されています。

★サンプルレートとビット深度について

サンプルレートとビット深度は、プロジェクトの途中で変更するとオーディオファイルのピッチや再生速度が変化してしまうなど、音質が劣化してしまいます。
レコーディングや制作の時は、事前にクライアントにどの値で制作をすればいいかを確認し、後から変更がないようにしておきましょう。

ビットレート

ビットレートとは、サンプルレート×ビット深度で表します。つまり、１秒間あたりにどれほどの情報が入っているかを表したものです。単位は bps です。

基本的に、圧縮するということは、このビットレートを下げることになります。ビットレートが下がると音質は下がりますが、その分容量が軽くなります。

ハイレゾとは

ハイレゾ（High-Resolution Audio）とは、CD 規格（44.1kHz/16bit）よりも高いサンプリング周波数やビット深度で録音・再生することです。

ハイレゾ音源は、通常よりもデータの情報量が多いため、より原音に近いものとなっています。具体的には、96kHz/24bit や 192kHz/24bit などです。

非圧縮

音楽ファイル形式における非圧縮形式は、音声信号をデジタルデータに変換する際に、全ての情報をデジタル化することで音質を担保した形式です。つまり、圧縮しないので音質も落ちないということです。

非圧縮では、他の方式と比較し他場合高音質ですが、その分容量が大きいです。

WAVE

Windows と IBM が開発したファイル形式で、音楽制作で最も使用されるファイル形式の一つです。
WAVE ファイルはサンプリング周波数やビット深度をそのまま保存するため、高品質な音声を保つことが可能です。そのため、音声データの品質を重視する場合に WAVE ファイルがよく使われます。
多くの音楽再生ソフトウェアやオーディオエディターが WAVE ファイルに対応しており、汎用性が高いのも特徴です。

WAVE ファイルのデメリットとしては、ファイルサイズが大きくなりがちであり、ストレージ容量を消費することが挙げられます。

AIFF

Apple が開発したファイル形式。
こちらも非圧縮なので音質が良いことが特徴です。
また、同じ非圧縮の WAVE と比較した場合、AIFF の方がアーティスト情報などのメタデータを記録しやすいなどの利点があります。
しかし、AIFF は MAC では標準対応していますが、Windows などのその他の機器などではWAVE より凡庸性がやや劣ります。

非可逆圧縮（ロッシー圧縮）

非可逆圧縮、別名ロッシー圧縮とは、人間が識別できない程度の領域を削除することでデータ容量を軽くするという圧縮方式です。
一定の音質は担保されますが、削除されている部分があるため非圧縮方式と比べると音質は劣ります。また、非可逆圧縮という名前の通り、データを復元しようとしても復元することができないのがデメリットです。
しかし、データ容量が少なくて済むので、高音質が求められない場合は、ファイルの転送やダウンロードなどにかかる時間を短縮できるため重宝されます。

MP3

音声ファイルとして広く使われており、様々なディバイスで使用できるため、汎用性の高いファイル形式です。
人間の可聴領域外の音量や周波数などのデータを削除することで、データサイズを１/10 程に圧縮します。

MP3はインターネットの普及が始まった頃に音楽ファイルの先駆者として登場し、現在もなお広く利用されています。しかし、現在はMP3よりも優れたファイル形式も登場し始めています。

AAC

AACは、より高い圧縮率と音質を提供することを目的に、MP３の後継技術として開発されたファイル形式です。一般的に、同じ条件下において、MP３よりも音質が良いとされています。
AACは、Apple の iTunes Store や YouTube、Spotify などのオンライン音楽ストリーミングサービスでも採用されています。また、Apple 製品との相性が良いのも特徴です。その他のディバイスでも基本的に互換性はありますが、古いディバイスの場合はサポートされていない場合もあります。

Vorbis

特許使用料がかからず、フリーで誰でも使用できる音声ファイル形式です。
同じ非可逆圧縮のMP3と比較して、同じビットレート下において Vorbis の方が高い圧縮率、高音質とされています。特に低ビットレートに強いというのが特徴です。

ゲーム音楽において、MP3はメーカーに使用料が請求されますが、Vorbis は使用料がかかりません。そのため、圧縮率、音質共に MP3と引けを取らずフリーで使えるという理由から、Vorbis がゲーム音楽でよく使用されています。

WMA

Microsoft が開発した音声ファイル形式。
MP3と同様、人間の可聴領域外のデータを削除することで、聴覚上の音質は保ちつつ、データサイズを小さくしています。その圧縮率は、１/20程で、MP3よりも高い圧縮率で保存可能です。

また、WMA は、デジタル著作権管理（ DRM ）技術をサポートしているため、不正なコピーを防ぐなどといった音楽の著作権保護が可能という利点があります。

可逆圧縮（ロスレス音源）

可逆圧縮とは、圧縮前の元データを完全に復元できる圧縮方式です。
可逆圧縮のデータ圧縮率は非可逆圧縮に比べて低いですが、その分データの品質が損なわれないため、重要なデータの保存に使用されます。

FLAC

FLAC は、Free Lossless Audio Codec の略で、フリーの音楽ファイル形式です。
圧縮率は約１/２程度となっており、ファイルの軽さは非可逆圧縮の MP3などには劣りますが、その分音質を削除することなく圧縮してくれます。

また、FLAC の特徴として、曲名やアーティスト名などのメタデータを含めることができます。DRM（デジタル著作権管理）には対応していません。

ALAC

ALAC（ Apple Lossless Audio Codec ）は、Apple によって開発されたファイル形式です。
音声ファイルを約半分程度のファイルサイズで音質を維持することが可能です。
また、iTunes などの Apple 製品で広く使用されており、Mac OS X や iOS デバイスでサポートされています。

一方で、ALAC は非 Apple 製品でのサポートが限られているため、他の可逆圧縮形式である FLAC などと比べて普及度は低いです。

音楽ファイル一覧

前章の内容を一覧にまとめました。ご活用ください。

ファイル形式	拡張子	圧縮方式
WAVE	.wav	非圧縮
AIFF	.aiff .aif .aifc	非圧縮
MP3	.mp3	非可逆圧縮
AAC	.3gp.3g2.aac	非可逆圧縮
Vorbis	.ogg .oga	非可逆圧縮
WMA	.wma .asf	非可逆圧縮
FLAC	.flac	可逆圧縮
ALAC	.mov .m4a .alac	可逆圧縮

番外編

MIDIデータ

MIDI の打ち込み情報を記録するためのファイル形式です。
オーディオデータとは違い、演奏された音符、音量、音色、演奏速度などの情報が含まれます。そのため、MIDI ファイルを使用して、作曲者やアレンジャーが簡単に楽曲のアイデアを共有することもできます。

DDP

マスタリングを行う際に使用されるファイルです。
DDP ファイルの中には、音楽イメージ（DAT）、識別子（DDPID）、ストリーム記述子（DDPMS）、サブコード記述子（PQDESCR）が必ず含まれており、これらは CD のトラック、タイミング、音量、音声ファイルの配置など、CD製造に必要な情報が含まれています。
このため、DDP ファイルを使用することで、CD の内容を正確に再現することができます。

適切なファイル形式の選び方

適切なファイル形式を選ぶ際には、

音質
ファイルサイズ
使用する機器やソフトウェアの互換性
使用目的

これらの要素を考慮して選ぶ必要があります。
音質を重視する場合は、音が除去されない非圧縮のファイルを、音質は気にしない代わりにファイルサイズを軽くしたい場合は圧縮率の高いファイルを選択すると良いでしょう。
また、合わせて使用する機器や送り先が利用しやすいか、その他使用目的などの観点から、複合的に判断していくと良いです。

まとめ

以上、今回は音楽ファイル形式について解説しました。
音楽ファイルには様々な種類があり、混乱してしまいがちですよね。

あらかじめファイルの知識が頭に入っていれば、音楽配信サービスに曲を配信する際や、案件の取引の際にもデータの話がスムーズに入ってくるでしょう。

Written by

Nami

東京出身の音楽クリエイター。幼少期から音楽に触れ、高校時代ではボーカルを始める。その後弾き語りやバンドなど音楽活動を続けるうちに、自然の流れで楽曲制作をするように。多様な音楽スタイルを聴くのが好きで、ジャンルレスな音楽感覚が強み。現在は、ボーカル、DTM講師の傍ら音楽制作を行なっている。今後、音楽制作やボーカルの依頼を増やし、さらに活動の幅を広げることを目指している。

監修

Masato Tashiro

プロフェッショナルとして音楽業界に20年のキャリアを持ち、ライブハウスの店長経験を経て、 2004年にavexに転職。以降、マネージャーとして、アーティストに関わる様々なプロフェッショナルとの業務をこなし、音楽／映像／ライブ／イベントなどの企画制作、マーケティング戦略など、音楽業界における様々な制作プロセスに精通している。現在はコンサルタントとして様々なプロジェクトのサポートを行っている。

音楽制作で取り扱うファイル形式を徹底解説！【一覧付き】

〜目次〜