
デジタル・オーディオの基礎知識
今回紹介する、音楽制作で使用される音楽ファイルを理解するための基礎知識として、アナログ波形をデジタル化する方式である ”PCM” について、解説していきます。
サンプル・レート(Sample Rate、サンプリング周波数)
音をデジタル化する際、サンプリングと量子化の2つのステップが行われます。まずはサンプリングについて紹介します。
サンプル・レート(Sample Rate)とは、アナログ音声をデジタル化する際、1秒間に何回音を切り取って(サンプリングして)記録するかという値のことです。
以下の図は、サンプル・レートのイメージ図です。横軸は時間となっており、縦軸に引かれた分割線が細かければ細かいほど、元の音を忠実に再現できる=サンプル・レートが高いということを表しています。

前述の通り、サンプリング回数が多いほど、元の音の正確性が増します。
イメージとして、以下の図をご覧ください。
サンプリング回数が多いと、より元の波形を滑らかに再現できますが、サンプリング回数が少ないと再現しきれない音が生じてしまっています。そのため、サンプル・レートが高いほど、元の音を忠実に再現できる=良い音質とされています。一方で、サンプル・レートが高いと、ファイル・サイズが大きくなる点がデメリットでしょう。

以下は、サンプル・レートの種類の例です。
- 44.1 kHz
- 48 kHz
- 88.2 kHz
- 96 kHz
- 176.4 kHz
- 192 kHz
44.1kHzは、音楽CD に使用され、人間が聴こえる音の範囲をカバーする標準的な音質です。1秒間に 44100 回サン・プリングが行われていることになります。
また、映像制作で使用されるサンプル・レートは 48kHz が基準です。ハイレゾ音源は、CD 規格よりも高音質な音源のことで、人間の耳では聴こえない領域まで記録したもののことです。
日本国内では、日本オーディオ協会(JAS)と電子情報技術産業協会(JEITA)が定義を定めており、96kHz 以上のサンプル・レート、後述するビット数24bit以上のものを指します(48kHz/24bit なども“CD超え”としてハイレゾに含まれる場合があります)。
ビット深度(Bit Depth)
ビット深度とは、波形の振幅値の正確さ、つまり音の強弱を何段階の数字で記録するか?という指標です。サンプル・レートが表の横軸に対しての細かさだったのに対し、ビット深度は縦軸の細かさを表します。単位は bit となり、一般的には 16bit がCD 音質です。ビット深度は2の n 乗で計算されるため、16bit は2の 16 乗となります。つまり 65,536段階で音の強弱を表現していることを表します。この数値が大きいと、小さな音から大きな音まで滑らかに表現することが可能なのです。

以下は、ビット深度の一般的な種類です。
- 8bit
- 16 bit(CD)
- 24 bit(ハイレゾ)
- 32 bit float(浮動小数点数)
16bit は CD の規格です。制作では、24bit や 32bit float で行われることが多いです。32bit float (浮動小数点数)とは、2の32乗とは異なる計算式を用いることで、0db を超えてもクリップがほぼ起きないという、ダイナミック・レンジの広さを持っています。16bit や 24bit の場合、0db を超えるとクリップしてしまいますが、32bit float の場合は 0db を超えても波形が保たれます。
★サンプル・レートとビット深度について
サンプル・レートとビット深度は、プロジェクトの途中で変更するとオーディオ・ファイルのピッチや再生速度が変化してしまうなど、音質が劣化してしまいます(※)。レコーディングや制作の時は、事前にクライアントにどの値で制作をすればいいかを確認し、後から変更がないようにしておきましょう。
(※)MIDIで入力されたソフト音源の場合は劣化しません
ビット・レート
ビット・レートとビット深度は、混同されがちですが役割は異なります。ビット・レートは、1秒間あたりのデータ量を表しており、サンプル・レート×ビット深度×チャンネル数で表し、単位は bps です。
MP3 などの圧縮音源では、このビット・レートの意味合いが少し異なり、人間には聴こえにくいデータを削ってビット・レートを無理やり落とすことで音質は下がりますが、その分ファイル・サイズが劇的に小さくなります。
ハイレゾとは
ハイレゾ(High-Resolution Audio)とは、CD 規格(44.1kHz/16bit)よりも高いサンプリング周波数やビット深度の音質のことです。具体的には、96kHz/24bit や 192kHz/24bit などです。
CDではカットされてしまう、超高域の倍音まで記録され、通常よりもデータの情報量が多いため、より原音に近い音質になるとされています。ハイレゾを聴くには、対応したDAC(変換機)やヘッドフォンなどの再生環境が必要になります。
音楽のファイル形式の種類
非圧縮
音楽ファイル形式における非圧縮形式は、音声信号をデジタル・データに変換する際に、すべての情報をデジタル化することで音質を担保した形式です。つまり、圧縮しないので録音時の音質を維持できます。
非圧縮では、他の方式と比較した場合高音質ですが、その分ファイル・サイズが大きくなるのが特徴です。
WAV
Microsoft と IBM が開発したファイル形式で、音楽制作で最も使用されるファイル形式です。WAV ファイルは、サンプリング周波数やビット深度をそのまま保存するため、高品質な音声を保つことが可能。そのため、音声データの品質を重視する場合に WAV ファイルがよく使われます。古い機材や特殊な再生ソフトでも対応しており、汎用性が高いのも特徴です。
WAV ファイルのデメリットとしては、ファイル・サイズが大きくなりがちであり、ストレージ容量を消費することが挙げられます。
AIFF
Apple が開発したファイル形式です。WAVファイルと同様に非圧縮なので、録音時の音質を維持できることが特徴となっています。また、WAV と比較した場合、AIFF はアーティスト情報などのメタデータをファイル内に埋め込む規格がある点が利点です。
その他、ループの情報を保持することもでき、サンプラーなどを使う場合にメリットになる場合があります。AIFF は Mac では標準対応していますが、Windows などのその他の機器などでは WAV より凡庸性がやや劣ります。しかし、現在ではどちらの OS でも再生可能です。
非可逆圧縮(ロッシー圧縮)
非可逆圧縮、別名ロッシー圧縮とは、人間が識別できない程度の領域を削除することでデータ容量を軽くするという圧縮方式です。一定の音質は担保されますが、削除されている部分があるため非圧縮方式と比べると音質は劣ります。
また、非可逆圧縮という名前の通り、データを復元しようとしても復元することができないのがデメリットです。しかし、データ容量が少なくて済むので、高音質が求められない場合は、ファイルの転送やダウンロードなどにかかる時間を短縮できるため重宝されます。
MP3(.mp3)
音声ファイルとして広く使われており、様々なデバイスで使用できるため、汎用性の高いファイル形式です。人間の可聴領域外の音量や周波数などのデータを削除することで、データサイズを1/10 程に圧縮します。
MP3はインターネットの普及が始まった頃に音楽ファイルの先駆者として登場し、現在もなお広く利用されています。しかし、次に紹介する AAC など、同じデータ量ならMP3よりも音質面で優れたファイル形式も登場し始めています。
AAC(.m4a / .aac)
AAC は、より高い圧縮率と音質を提供することを目的に、MP3の後継技術として開発されたファイル形式です。一般的に、同じ条件下において、MPよりも音質が良いとされています。
AAC は、Apple の iTunes Store や Apple Music の標準であり、その他 YouTube、Spotify などのストリーミング・サービスでも採用されています。また、Apple 製品との相性が良いのも特徴です。その他のデバイスでも基本的に互換性はありますが、古いデバイスの場合はサポートされていない場合もあります。
Ogg Vorbis(.ogg)
MP3や AAC を使用して企業がサービスを行う場合、特許使用料を払う必要がありますが、こちらはかからず、フリーで誰でも使用できます。また、同じ非可逆圧縮のMP3と比較して、同じビットレート下において Vorbis の方が高い圧縮率、高音質とされています。特に低ビットレートに強いというのが特徴です。
そのため、ゲーム音楽業界や Spotify において、この特許使用料のコストカットは非常に重要で、フリーで使えるという理由から、Vorbis が使用されることが多いです。
WMA(.wma)
Microsoft が開発した音声ファイル形式。MP3に対抗するために開発され、人間の可聴領域外のデータを削除することで、聴覚上の音質は保ちつつ、データ・サイズを小さくしています。
その圧縮率は、1/20程で、MP3よりも高い圧縮率で保存可能です。Windowsユーザーには、非常になじみ深い形式でした。
また、WMA は、デジタル著作権管理( DRM )技術をサポートしているため、不正なコピーを防ぐなどといった音楽の著作権保護が可能という利点があり、多くの定額制サービスで採用されました。
Opus(.opus)
Opusは、Ogg Vorbis や MP3、AAC などの“いいとこ取り”をして開発された、現在もっとも合理的で高性能な音声フォーマットです。
DiscordやLINEでの通話、オンライン・ゲームのボイスチャットなどでの遅延が少なく、リアルタイム性に強い特徴があります。また、高い圧縮効率で、低ビット・レートでも、十分音楽として楽しめる音質を維持できるのです。
可逆圧縮(ロスレス音源)
可逆圧縮とは、圧縮前の元データを完全に復元できる圧縮方式です。可逆圧縮のデータ圧縮率は非可逆圧縮に比べて低いですが、その分データの品質が損なわれないため、重要なデータの保存に使用されます。
FLAC(.flac)
FLAC は、Free Lossless Audio Codec の略で、オープンソースの音楽ファイル形式です。圧縮率は約1/2程度となっており、ファイルの軽さは非可逆圧縮の MP3などには劣りますが、その分音質を削除することなく圧縮してくれます。
また、FLAC の特徴として、曲名やアーティスト名などのメタ・データを含めることができます。DRM(デジタル著作権管理)には対応していません。
ALAC(.m4a)
ALAC( Apple Lossless Audio Codec )は、Apple によって開発されたファイル形式です。音声ファイルを約半分程度のファイルサイズで音質を維持することが可能です。また、iTunes などの Apple 製品で広く使用されており、Mac OS X や iOS デバイスでサポートされています。
一方で、ALAC は非 Apple 製品でのサポートが限られているため、他の可逆圧縮形式である FLAC などと比べて普及度は低いです。
音楽ファイル一覧
前章の内容を一覧にまとめました。ご活用ください。
まとめ
以上、今回は音楽制作で扱われる代表的な音楽ファイル形式について解説しました。
音楽ファイルには、非圧縮・非可逆圧縮・可逆圧縮などの種類があり、それぞれ音質やファイルサイズ、用途が異なります。
音楽制作の現場では、制作・納品では WAV、試聴用やデータ共有では MP3 など、用途に応じてファイル形式を使い分けることが一般的です。
それぞれの特徴を理解しておくことで、クライアントとのデータのやり取りや楽曲の管理もスムーズになるでしょう。
ONLIVE Studio では、音楽のプロフェッショナルに依頼ができます。
音楽制作でお困りの方は、是非ご活用ください。

東京出身の音楽クリエイター。 幼少期から音楽に触れ、高校時代ではボーカルを始める。その後弾き語りやバンドなど音楽活動を続けるうちに、自然の流れで楽曲制作をするように。 多様な音楽スタイルを聴くのが好きで、ジャンルレスな音楽感覚が強み。 現在は、ボーカル、DTM講師の傍ら音楽制作を行なっている。 今後、音楽制作やボーカルの依頼を増やし、さらに活動の幅を広げることを目指している。

Masato Tashiro
プロフェッショナルとして音楽業界に20年のキャリアを持ち、ライブハウスの店長経験を経て、 2004年にavexに転職。以降、マネージャーとして、アーティストに関わる様々なプロフェッショナルとの業務をこなし、 音楽/映像/ライブ/イベントなどの企画制作、マーケティング戦略など、 音楽業界における様々な制作プロセスに精通している。 現在はコンサルタントとして様々なプロジェクトのサポートを行っている。







