オーディオビット深度

アナログ信号 (赤) を 4 ビット PCM デジタルサンプル (青) にエンコードしたもの。ビット深度は 4 なので、各サンプルの振幅は 16 通りの値 (16 = 2 ⁴ ) のいずれかになります。

パルス符号変調（PCM）を用いたデジタルオーディオにおいて、ビット深度とは各サンプルに含まれる情報のビット数であり、各サンプルの解像度に直接対応します。ビット深度の例としては、1サンプルあたり16ビットを使用するコンパクトディスクデジタルオーディオや、 1サンプルあたり最大24ビットをサポートできるDVDオーディオやブルーレイディスクなどがあります。

基本的な実装では、ビット深度の変化は主に量子化誤差によるノイズレベル、つまり信号対雑音比（SNR）とダイナミックレンジに影響します。しかし、ディザリング、ノイズシェーピング、オーバーサンプリングなどの技術を用いることで、ビット深度を変えずにこれらの影響を軽減することができます。ビット深度はビットレートとファイルサイズにも影響します。

ビット深度はPCMデジタル信号を記述するのに役立ちます。非可逆圧縮を使用する非PCM形式には、関連するビット深度はありません。^{[ a ]}

バイナリ表現

PCM信号は、元のアナログ信号を再構成するために必要な情報を含むデジタルオーディオサンプルのシーケンスです。各サンプルは特定の時点における信号の振幅を表し、サンプルは時間的に均一な間隔で配置されています。振幅はサンプルに明示的に格納される唯一の情報であり、通常は整数または浮動小数点数として格納され、サンプルのビット深度（ワード長またはワードサイズとも呼ばれる）と呼ばれる固定桁数の2進数としてエンコードされます。

分解能とは、アナログ値の範囲で表現できる離散値の数のことです。2進整数の分解能は、ワード長が増加するにつれて指数関数的に増加します。1ビットを追加すると分解能は2倍になり、2ビットを追加すると4倍になります。整数ビット深度が表現できる値の数は、2 ⁿ （ nはビット深度）で計算できます。^{[ 1 ]}したがって、16ビットシステムの分解能は65,536（2 ¹⁶）通りです。

整数PCMオーディオデータは通常、2の補数形式の符号付き数値として保存されます。^[²^]

現在、ほとんどのオーディオファイル形式とデジタルオーディオワークステーション(DAW) は、サンプルを浮動小数点数で表す PCM 形式をサポートしています。^{[ 3 ]}^{[ 4 ]}^{[ 5 ]}^{[ 6 ]} WAVファイル形式とAIFFファイル形式はどちらも浮動小数点表現をサポートしています。 ^{[ 7 ]}^{[ 8 ]}ビットパターンが単一のビット列である整数とは異なり、浮動小数点数は、数学的な関係によって数値が形成される個別のフィールドで構成されています。最も一般的な標準はIEEE 754で、数値が正か負かを表す符号ビット、仮数、および仮数をスケーリングするための 2 の累乗係数を決定する指数の 3 つのフィールドで構成されています。仮数は、IEEE の 2 を基数とする浮動小数点形式では2 進小数として表されます。 ^{[ 9 ]}

量子化

ビット深度は、再構成信号の信号対雑音比（SNR）を量子化誤差によって決まる最大レベルに制限します。ビット深度は周波数応答には影響を与えず、周波数応答はサンプルレートによって制限されます。

アナログ-デジタル変換（ADC）中に生じる量子化誤差は、量子化ノイズとしてモデル化できます。これは、ADCへのアナログ入力電圧とデジタル出力値との間の丸め誤差です。このノイズは非線形であり、信号に依存します。

理想的なADCでは、量子化誤差が最下位ビット（LSB）間で均一に分布し、信号がすべての量子化レベルにわたって均一に分布している場合、信号対量子化雑音比（SQNR）は次のように計算できます。 $\scriptstyle {\pm {\frac {1}{2}}}$

{\text{SQNR}}=20\log _{10}({\sqrt {1.5}}\cdot 2^{b})\approx (1.76+6.02\,b)\ {\text{dB}},

ここでbは量子化ビット数であり、結果はデシベル（dB）で測定される。^{[ 10 ]}^{[ 11 ]}

したがって、 CDに収録されている 16 ビットデジタルオーディオの理論上の最大 SNR は 98 dB で、プロ仕様の 24 ビットデジタルオーディオでは 146 dB にまで達します。2011 年現在、デジタルオーディオコンバーター技術の SNR は、集積回路設計における現実的な制限により、約 123 dB ^{[ 12 ]}^{[ 13 ]}^{[ 14 ]} (実質的に21 ビット) に制限されています。^[^b^]それでも、これは人間の聴覚システムの性能とほぼ一致しています。^[¹⁷^]^[¹⁸^]複数のコンバーターを使用して同じ信号の異なる範囲をカバーすることができ、長期的にはより広いダイナミックレンジを録音するために組み合わせることができますが、短期的には単一のコンバーターのダイナミックレンジによって制限されます。これをダイナミックレンジ拡張と呼びます。^[¹⁹^]^[²⁰^]

信号対雑音比とビット深度の解像度（非重み付け）
# ビット	SNR （オーディオ）	SNR （ビデオ）	最小dBステップ差（量子化丸め誤差）	可能な値の数（サンプルあたり）	符号付き表現の範囲（サンプルごと）
4	25.84デシベル	34.31デシベル	1.723 dB	16	−8から+7
8	49.93デシベル	58.92デシベル	0.1958 dB	256	−128から+127
11	67.99デシベル	77.01デシベル	0.03321 dB	2,048	−1,024から+1,023
12	74.01デシベル	83.04デシベル	0.01807 dB	4,096	−2,048から+2,047
16	98.09デシベル	107.12デシベル	0.001497 dB	65,536	−32,768から+32,767
18	110.13デシベル		0.0004201 dB	262,144	−131,072から+131,071
20	122.17デシベル		0.0001165 dB	1,048,576	−524,288 から +524,287
24	146.26デシベル		0.000008717 dB	16,777,216	−8,388,608 から +8,388,607
32	194.42 dB		4.52669593 × 10 ⁻⁸ dB	4,294,967,296	−2,147,483,648 から+2,147,483,647
48	290.75デシベル		1.03295047 × 10 ⁻¹² dB	281,474,976,710,656	−140,737,488,355,328 から+140,737,488,355,327
64	387.08 dB		2.09836113 × 10 ⁻¹⁷ dB	18,446,744,073,709,551,616	−9,223,372,036,854,775,808 から+9,223,372,036,854,775,807

浮動小数点

浮動小数点サンプルの解像度は、浮動小数点値が均等間隔ではないため、整数サンプルよりも複雑です。浮動小数点表現では、隣接する2つの値間の間隔は、その値に比例します。

浮動小数点形式と整数形式のトレードオフは、大きな浮動小数点値間の間隔が、同じビット深度の大きな整数値間の間隔よりも大きいことです。大きな浮動小数点数を丸めると、小さな浮動小数点数を丸めるよりも誤差が大きくなりますが、整数を丸めると常に同じレベルの誤差になります。言い換えると、整数は均一な丸めが行われ、常にLSBが0または1に丸められ、浮動小数点形式は均一なSNRを持ち、量子化ノイズレベルは常に信号レベルに一定の比率を持ちます。^{[ 21 ]}浮動小数点ノイズフロアは信号が上昇すると上昇し、信号が下降すると下降するため、ビット深度が十分に低い場合は可聴な変動が生じます。^{[ 22 ]}

オーディオ処理

デジタルオーディオ処理のほとんどの処理では、サンプルの再量子化が行われるため、アナログ-デジタル変換時に発生する元の量子化誤差と同様の丸め誤差が発生します。ADC処理時の暗黙的な誤差よりも大きな丸め誤差を防ぐために、処理中の計算は入力サンプルよりも高い精度で実行する必要があります。^{[ 23 ]}

デジタル信号処理（DSP）演算は、固定小数点精度または浮動小数点精度のいずれかで実行できます。いずれの場合も、各演算の精度は、入力データの解像度ではなく、処理の各ステップを実行するために使用されるハードウェア演算の精度によって決まります。例えば、 x86プロセッサでは、浮動小数点演算は単精度または倍精度で実行され、固定小数点演算は16ビット、32ビット、または64ビットの解像度で実行されます。したがって、Intelベースのハードウェアで実行されるすべての処理は、ソース形式に関係なく、これらの制約の下で実行されます。^{[ c ]}

固定小数点デジタル信号プロセッサは、多くの場合、特定の信号解像度をサポートするために特定のワード長をサポートします。たとえば、モトローラ 56000 DSP チップは、24 ビットの乗算器と 56 ビットの累算器を使用して、 2 つの 24 ビットサンプルに対して、オーバーフローや切り捨てなしで乗算累算演算を実行します。 ^{[ 24 ]}大きな累算器をサポートしていないデバイスでは、固定小数点の結果が切り捨てられ、精度が低下します。エラーは、実行される操作に依存する速度で DSP の複数のステージで増加します。DC オフセットのないオーディオデータに対する相関のない処理ステップでは、エラーは平均が 0 のランダムであると想定されます。この仮定に基づくと、分布の標準偏差がエラー信号を表し、量子化エラーは操作数の平方根に比例します。^{[ 25 ]}畳み込みなどの繰り返し処理を伴うアルゴリズムには、高いレベルの精度が必要です。^{[ 23 ]}無限インパルス応答（IIR）フィルタなどの再帰アルゴリズムでも高い精度が必要です。^{[ 26 ]}特にIIRフィルタの場合、丸め誤差によって周波数応答が劣化し、不安定性が生じる可能性があります。^{[ 23 ]}

ディザ

量子化誤差によって生じるノイズ（音声処理中に生じる丸め誤差や精度の低下など）は、量子化前に信号に「ディザ」と呼ばれる少量のランダムノイズを加えることで軽減できます。ディザリングにより非線形量子化誤差の挙動が排除され、歪みが非常に少なくなりますが、ノイズフロアがわずかに上昇します。ITU -R 468 ノイズ加重法を使用して測定された 16 ビットデジタルオーディオの推奨ディザは、アライメントレベルより約 66 dB 低い、またはデジタルフルスケールより 84 dB低い値です。これは、マイクロフォンや室内のノイズレベルに匹敵するため、16 ビットオーディオではほとんど影響がありません。

24ビットおよび32ビットオーディオでは、デジタルコンバータのノイズレベルが適用される可能性のあるディザの必要レベルよりも常に大きいため、ディザリングは必要ありません。24ビットオーディオは理論的には144dBのダイナミックレンジをエンコードでき、32ビットオーディオは192dBを達成できますが、最高のセンサーとマイクでさえ130dBを超えることはほとんどないため、現実世界でこれを達成することはほぼ不可能です。^{[ 27 ]}

ディザは実効ダイナミックレンジを拡大するためにも使用できます。16ビットオーディオの知覚ダイナミックレンジは、人間の耳の周波数応答を利用したノイズシェーピングディザによって120dB以上になります。 ^{[ 28 ]}^{[ 29 ]}

ダイナミックレンジとヘッドルーム

ダイナミックレンジとは、システムが記録または再生できる最大信号と最小信号の差です。ディザリングがない場合、ダイナミックレンジは量子化ノイズフロアと相関します。例えば、16ビット整数解像度では約96dBのダイナミックレンジが実現されます。ディザリングを適切に適用することで、デジタルシステムは通常の解像度よりも低いレベルの信号を再生することができ、解像度によって課せられる限界を超えて実効ダイナミックレンジを拡大することができます。^{[ 30 ]}オーバーサンプリングやノイズシェーピングなどの技術を用いることで、量子化誤差を対象周波数帯域外に移動させることで、サンプリングされたオーディオのダイナミックレンジをさらに拡大することができます。

信号の最大レベルがビット深度で許容されるレベルよりも低い場合、録音にはヘッドルームが確保されます。スタジオ録音では、より高いビット深度を使用することで、同じダイナミックレンジを維持しながらヘッドルームを確保できます。これにより、低音量時に量子化誤差を増やすことなく、クリッピングのリスクを軽減できます。

オーバーサンプリング

オーバーサンプリングは、サンプルあたりのビット数を変えずにPCMオーディオのダイナミックレンジを拡大する代替手法です。^{[ 31 ]}オーバーサンプリングでは、オーディオサンプルは所望のサンプルレートの倍数で取得されます。量子化誤差は周波数に対して均一に分布すると仮定されるため、量子化誤差の多くは超音波周波数にシフトし、再生時にデジタル-アナログコンバータによって除去できます。

解像度をnビット増加させるには、信号をオーバーサンプリングする必要がある。

\mathrm {サンプル数} =(2^{n})^{2}=2^{2n}.

例えば、14ビットADCは、16倍オーバーサンプリング（768kHz）で動作させると、16ビット/48kHzのオーディオを生成できます。したがって、オーバーサンプリングPCMでは、同じ解像度を得るために、サンプルあたりのビット数を少なくしてサンプル数を増やします。

ダイナミックレンジは、ソースでオーバーサンプリングを行わず、信号再構成時にオーバーサンプリングを行うことで拡張することもできます。再構成時に16倍のオーバーサンプリングを行うとします。再構成時の各サンプルは、元のサンプルポイントごとに16個のポイントが挿入される点で固有であり、これらはすべてデジタル再構成フィルタによって計算されます。実効ビット深度が増加するメカニズムは前述の通りです。つまり、量子化ノイズの電力は低減されませんが、ノイズスペクトルはオーディオ帯域幅の16倍に分散されます。

歴史的背景：コンパクトディスク規格は、ソニーとフィリップスの共同開発によって誕生しました。ソニーの最初の民生用製品には16ビットDACが搭載され、フィリップスの最初の製品にはデュアル14ビットDACが搭載されていました。14ビットPCMではSNRが84dBと、16ビットPCMよりも12dB低いため、市場だけでなくプロの間でも混乱を招きました。フィリップスは、一次ノイズシェーピングを用いた4倍オーバーサンプリングを実装し、理論上はCDフォーマットの96dBのダイナミックレンジを実現していました。^{[ 32 ]}フィリップスCD100は、20Hz～20kHzのオーディオ帯域でSNRが90dBと評価され、これはソニーのCDP-101と同じでした。^{[ 33 ]}^{[ 34 ]}

ノイズシェーピング

信号をオーバーサンプリングすると、すべての周波数で帯域幅の単位あたり量子化ノイズが等しくなり、ダイナミックレンジはオーバーサンプリング比の平方根のみで改善されます。ノイズシェーピングは、高周波数で追加のノイズを追加して、低周波数でのエラーをキャンセルする手法であり、オーバーサンプリング時にダイナミックレンジが大幅に増加します。n次ノイズシェーピングの場合、オーバーサンプリングされた信号のダイナミックレンジは、ノイズシェーピングなしのオーバーサンプリングに比べて 6 n dB 向上します。^{[ 35 ]}たとえば、2 次ノイズシェーピングを使用して 4 倍オーバーサンプリングでサンプリングされた 20 kHz アナログオーディオの場合、ダイナミックレンジは 30 dB 増加します。したがって、176 kHz でサンプリングされた 16 ビットの信号は、ノイズシェーピングなしで 44.1 kHz でサンプリングされた 21 ビットの信号と等しいビット深度になります。

ノイズシェーピングは、一般的にデルタシグマ変調で実装されます。デルタシグマ変調を使用することで、Direct Stream Digitalは、1ビットオーディオと64倍オーバーサンプリングで、オーディオ周波数において理論上120 dBのSNRを実現します。

アプリケーション

ビット深度はデジタルオーディオ実装の基本的な特性です。アプリケーションの要件や機器の性能に応じて、異なるビット深度がアプリケーションごとに使用されます。

サンプルアプリケーションとサポートされるオーディオビット深度
応用	説明	オーディオ形式
CD-DA（レッドブック）^{[ 36 ]}	デジタルメディア	16ビットLPCM
DVDオーディオ^{[ 37 ]}	デジタルメディア	16ビット、20ビット、24ビットLPCM ^{[ A ]}
スーパーオーディオCD ^{[ 38 ]}	デジタルメディア	1ビットダイレクトストリームデジタル（PDM）
ブルーレイディスクオーディオ^{[ 39 ]}	デジタルメディア	16ビット、20ビット、24ビットLPCMなど^{[ B ]}
DVオーディオ^{[ 40 ]}	デジタルメディア	12ビットおよび16ビットの非圧縮PCM
ITU-T勧告G.711 ^{[ 41 ]}	電話の圧縮規格	8ビットPCM（圧縮伸長機能付き） ^{[ C ]}
NICAM -1、NICAM-2、NICAM-3 ^{[ 42 ]}	放送用圧縮規格	それぞれ10ビット、11ビット、10ビットのPCM（圧縮伸長あり） ^{[ D ]}
熱意	Paul DavisとArdourコミュニティによるDAW	32ビット浮動小数点^{[ 43 ]}
プロツールズ11	Avid TechnologyのDAW	16ビットおよび24ビットまたは32ビット浮動小数点セッションと64ビット浮動小数点ミキシング^{[ 44 ]}
ロジックプロX	Apple Inc.による DAW	16ビットおよび24ビットプロジェクトと32ビットまたは64ビット浮動小数点ミキシング^{[ 45 ]}
キューベース	スタインバーグのDAW	オーディオ処理精度を32ビット浮動小数点または64ビット浮動小数点に設定可能^{[ 46 ]}
エイブルトンライブ^{[ 6 ]}	AbletonのDAW	32ビット浮動小数点ビット深度と64ビット加算
理由7	Propellerhead SoftwareのDAW	16ビット、20ビット、24ビットのI/O、32ビットの浮動小数点演算、64ビットの合計演算^{[ 47 ]}
リーパー5	Cockos Inc. の DAW	8 ビット PCM、16 ビット PCM、24 ビット PCM、32 ビット PCM、32 ビット FP、64 ビット FP、4 ビット IMA ADPCM および 2 ビット cADPCMレンダリング。 8 ビット整数、16 ビット整数、24 ビット整数、32 ビット整数、32 ビット浮動小数点数、および 64 ビット浮動小数点数の混合
GarageBand '11（バージョン6）	Apple Inc. による DAW	16ビットデフォルト、24ビット実楽器録音^{[ 48 ]}
大胆さ	オープンソースのオーディオエディター	16ビットおよび24ビットLPCMと32ビット浮動小数点^{[ 49 ]}
FLスタジオ	Image-LineのDAW	16ビットおよび24ビット整数と32ビット浮動小数点数（OSによって制御）^{[ 50 ]}

^ DVD-Audio は、ロスレス圧縮方式であるオプションの Meridian Lossless Packingもサポートしています。
^ Blu-ray はさまざまな非 LPCM 形式をサポートしていますが、すべてサンプルあたり 16 ビット、20 ビット、または 24 ビットの組み合わせに準拠しています。
^ ITU-T は、それぞれ 13 ビットと 14 ビットから圧縮するA-lawおよびμ-law の圧縮アルゴリズムを規定しています。
^ NICAM システム 1、2、3 はそれぞれ 13、14、14 ビットから圧縮します。

ビットレートとファイルサイズ

ビット深度はビットレートとファイルサイズに影響します。ビットは、コンピューティングやデジタル通信で使用されるデータの基本単位です。ビットレートとは、1秒あたりに送信または受信されるデータ量、具体的にはビット数を指します。MP3などの非可逆圧縮オーディオ形式では、ビットレートはオーディオ信号をエンコードするために使用される情報量を表します。通常はkb/sで測定されます。^{[ 51 ]}

参照

オーディオシステムの測定
色深度、デジタル画像に対応する概念
有効ビット数

注記

^たとえば、 MP3では、ビット深度に関連する時間領域のサンプルではなく、信号の周波数領域表現に対して量子化が実行されます
^ 32ビットコンバータも存在しますが、これは純粋にマーケティング目的であり、24ビットコンバータに比べて実用的な利点はありません。余分なビットはゼロか、ノイズのみをエンコードします。^{[ 15 ]}^{[ 16 ]}
^ Intel および AMD x86 ハードウェアは、64 ビットよりも高い精度、または任意の大きさの浮動小数点数や整数も処理できますが、処理にはネイティブ型よりもはるかに時間がかかります。

参考文献

^ダン・トンプソン (2005)。オーディオを理解する。バークリープレス。 ISBN 978-0-634-00959-4。
^ Smith, Julius (2007). 「パルス符号変調 (PCM)」 .離散フーリエ変換 (DFT) の数学とオーディオアプリケーション、第2版、オンラインブック. 2012年10月22日閲覧。
^キャンベル、ロバート (2013). Pro Tools 10 高度な音楽制作テクニック, 247ページ. Cengage Learning. ISBN 978-1133728016. 2013年8月12日閲覧。
^ Wherry, Mark (2012年3月). 「Avid Pro Tools 10」 . Sound On Sound . 2013年8月10日閲覧。
^プライス、サイモン（2005年10月）「Reason Mixing Masterclass」 Sound On Sound誌。 2013年8月10日閲覧。
^ ^a ^b「Abletonリファレンスマニュアルバージョン10、32. オーディオファクトシート」 Ableton、2019年。 2019年9月3日閲覧。
^ Kabal, Peter (2011年1月3日). 「オーディオファイルフォーマット仕様、WAVE仕様」 . マギル大学. 2013年8月10日閲覧。
^ Kabal, Peter (2011年1月3日). 「オーディオファイルフォーマット仕様、AIFF / AIFF-C仕様」 . マギル大学. 2013年8月10日閲覧。
^ Smith, Steven (1997–98). 「科学者とエンジニアのためのデジタル信号処理ガイド、第4章 DSPソフトウェア/浮動小数点（実数）」 . www.dspguide.com . 2013年8月10日閲覧。
^信号対雑音比§固定小数点を参照。
^ Kester, Walt (2007). 「SNR = 6.02N + 1.76dBという悪名高い公式の謎を解き明かす、そしてなぜ気にする必要があるのか」(PDF) . Analog Devices . 2011年7月26日閲覧。
^ Nwavguy (2011年9月6日). 「NwAvGuy: ノイズとダイナミックレンジ」 . NwAvGuy . 2016年12月2日閲覧. 24ビットDACは、多くの場合約16ビットの性能しか発揮できず、最高でも21ビット（ENOB）の性能しか発揮できない。
^ "PCM4222" . 2011年4月21日閲覧。ダイナミックレンジ（−60 dB入力、A特性）：124 dB（標準）ダイナミックレンジ（−60 dB入力、20 kHz帯域幅）：122 dB（標準）
^ 「WM8741：高性能ステレオDAC」 Cirrus Logic . 2016年12月2日閲覧。128dB SNR（'A'加重モノラル@48kHz）、123dB SNR（非加重ステレオ@48kHz）
^ 「オーディオの神話：32ビットDACが必要ない理由」 Android Authority、2016年1月19日。 2016年12月2日閲覧。つまり、32ビットDACは最大21ビットの有効なデータしか出力できず、残りのビットは回路ノイズによってマスクされてしまうのです。
^ 「32ビット対応DAC」。hydrogenaud.io 。2016年12月2日閲覧。現在存在する「32ビット対応」DACチップの実際の解像度はすべて24ビット未満です。
^ DR Campbell. 「人間の聴覚の側面」(PDF)。2011年8月21日時点のオリジナル(PDF)からアーカイブ。 2011年4月21日閲覧。人間の聴覚のダイナミックレンジは[約]120dBである。
^ 「人間の耳の感度」。2011年6月4日時点のオリジナルよりアーカイブ。 2011年4月21日閲覧。実用的なダイナミックレンジは、聴力閾値から痛みの閾値[130dB]までと言える。
^ US6317065B1、「ダイナミックレンジを拡張する複数のA/Dコンバータ」、1999年7月1日発行
^ Christodoulou, Lakis; Lane, John; Kasparis, Takis (2010年3月1日). 「複数のA/Dコンバータを用いたダイナミックレンジの拡張」. 2010年第4回国際通信・制御・信号処理シンポジウム (ISCCSP) . pp. 1– 4. doi : 10.1109/ISCCSP.2010.5463427 . ISBN 978-1-4244-6285-8. S2CID 16501096 .
^ Smith, Steven (1997–1998). 「科学者とエンジニアのためのデジタル信号処理ガイド、第28章 – デジタル信号プロセッサ / 固定小数点と浮動小数点」 . www.dspguide.com . 2013年8月10日閲覧。
^ Moorer, James (1999年9月). 「プロフェッショナルオーディオアプリケーションにおいて、48ビット整数処理は32ビット浮動小数点処理を上回る」(PDF) . www.jamminpower.com . 2019年2月14日時点のオリジナル(PDF)からアーカイブ。 2013年8月12日閲覧。
^ ^a ^b ^c Tomarakos, John. 「デジタルオーディオ処理アプリケーションにおけるデータワードサイズとダイナミックレンジおよび信号品質の関係」 www.analog.com . Analog Devices . 2013年8月16日閲覧。
^ "DSP56001A" (PDF) . Freescale . 2013年8月15日閲覧。
^スミス、スティーブン (1997–1998). 「科学者とエンジニアのためのデジタル信号処理ガイド、第4章 DSPソフトウェア/数値精度」 . 2013年8月19日閲覧。
^ Carletta, Joan (2003). 「固定小数点IIRフィルタにおける信号の適切な精度の決定」.第40回設計自動化会議議事録. pp. 656– 661. CiteSeerX 10.1.1.92.1266 . doi : 10.1145/775832.775998 . ISBN 1581136889. S2CID 15615715 .
^高性能オーディオADCの選択、2011年9月14日、 2019年5月7日閲覧。
^ Montgomery, Chris (2012年3月25日). 「24/192 Music Downloads ...and why they make no sense」 . xiph.org .オリジナルから2013年7月7日アーカイブ。 2013年5月26日閲覧。量子化ノイズのエネルギーを聞き取りにくい周波数に移動させるシェーピングディザを使用することで、16ビットオーディオの実効ダイナミックレンジは実際には120dBに達し、96dBという主張の15倍以上になります。120dBは、同じ部屋のどこかにいる蚊と30センチほど離れた削岩機の音の差よりも大きく、あるいは、人気のない「防音」室と数秒で聴覚障害を引き起こすほどの音量の差よりも大きいです。16ビットは、私たちが聞き取れるすべての音を保存するのに十分であり、永遠に十分な容量です。
^ Stuart, J. Robert (1997). 「高品質デジタルオーディオのコーディング」(PDF) . Meridian Audio Ltd. 2016年4月7日時点のオリジナル(PDF)からアーカイブ。2016年2月25日閲覧。PCMにおける偉大な発見の一つは、小さなランダムノイズ（ディザと呼ぶ）を加えることで切り捨て効果を消すことができるという点だった。さらに重要なのは、加えるべきランダムノイズの種類が適切であり、適切なディザを用いることでデジタルシステムの解像度が無限大になるという認識だった。
^ 「アナログからデジタルへの変換におけるディザリング」（PDF） . e2v Semiconductors. 2007年.オリジナル（PDF）から2011年10月4日時点のアーカイブ。 2011年7月26日閲覧。
^ Kester, Walt. 「オーバーサンプリング補間DAC」（PDF） . Analog Devices. 2012年5月19日時点のオリジナル（PDF）からアーカイブ。 2013年8月19日閲覧。
^ 「CDの歴史」philips.com . 2020年10月7日閲覧。
^ 「Philips CD100」 . hifiengine.
^ 「Sony CDP-101」 . hifiengine.
^ 「B.1 一次および二次ノイズシェーピングループ」。 2013年8月19日閲覧。
^ 「Sweetwater Knowledge Base、Masterlink：「Red Book」CDとは何ですか？」 www.sweetwater.com Sweetwater . 2007年4月27日. 2013年8月25日閲覧。
^ 「DVD-Audioを理解する」(PDF) . Sonic Solutions. 2012年3月4日時点のオリジナル(PDF)からアーカイブ。 2013年8月25日閲覧。
^ Shapiro, L. (2001年7月2日). 「サラウンドサウンド、10ページ」 . ExtremeTech . 2013年8月26日閲覧。
^ 「ホワイトペーパー Blu-ray Disc Format, 2.B Audio Visual Application Format Specifications for BD-ROM Version 2.4」(PDF) 。Blu-ray Disc Association。2010年4月。 2011年7月8日時点のオリジナル(PDF)からアーカイブ。 2013年8月25日閲覧。
^ Puhovski, Nenad (2000年4月). 「DV – A SUCCESS STORY」 . www.stanford.edu . 2004年10月27日時点のオリジナルよりアーカイブ。 2013年8月26日閲覧。
^ 「G.711：音声周波数のパルス符号変調（PCM）」（PDF）国際電気通信連合。 2013年8月25日閲覧。
^ 「デジタルサウンド信号：高品質サウンド信号のための5つのコンパンディングシステムの性能比較テスト」（PDF）。BBC調査部。1978年8月。 2012年11月8日時点のオリジナルよりアーカイブ（PDF）。 2013年8月26日閲覧。
^ 「Ardourの主な機能」。Ardourコミュニティ。2014年。2014年4月8日時点のオリジナルよりアーカイブ。 2014年4月8日閲覧。
^ 「Pro Toolsドキュメント、Pro Toolsリファレンスガイド」（ZIP/PDF） . Avid. 2013年. 2013年8月26日閲覧。
^ 「Logic Pro X: ユーザーガイド」(PDF) . Apple. 2010年1月. 2013年8月26日閲覧。
^ 「Cubase Pro 10.5 マニュアル」(PDF) . Steinberg. 2020年. 2020年9月2日閲覧。
^ 「Reason 7 操作マニュアル」(PDF) . Propellerhead Software. 2013年.オリジナル(PDF)から2013年5月24日時点のアーカイブ。 2013年8月26日閲覧。
^ 「GarageBand '11: オーディオ解像度を設定する」 Apple、2012年3月13日。 2013年8月26日閲覧。
^ 「Audacity: 機能」 . wiki.audacityteam.com . Audacity開発チーム. 2014年9月13日閲覧。
^ 「オーディオ設定」 . www.image-line.com . 2019年2月12日閲覧。
^ "Sample Rate, Bit-Depth & Bitrate | Exclusivemusicplus" . Exclusivemusicplus . 2018年10月26日. 2018年11月30日閲覧。

ケン・C・ポールマン（2000年2月15日）。デジタルオーディオの原則(第 4 版)。マグロウヒルプロフェッショナル。ISBN 978-0-07-134819-5。

[41] DVD-Audio は、ロスレス圧縮方式であるオプションの Meridian Lossless Packingもサポートしています。

[44] Blu-ray はさまざまな非 LPCM 形式をサポートしていますが、すべてサンプルあたり 16 ビット、20 ビット、または 24 ビットの組み合わせに準拠しています。

[47] ITU-T は、それぞれ 13 ビットと 14 ビットから圧縮するA-lawおよびμ-law の圧縮アルゴリズムを規定しています。

[49] NICAM システム 1、2、3 はそれぞれ 13、14、14 ビットから圧縮します。

[1] たとえば、 MP3では、ビット深度に関連する時間領域のサンプルではなく、信号の周波数領域表現に対して量子化が実行されます

[18] 32ビットコンバータも存在しますが、これは純粋にマーケティング目的であり、24ビットコンバータに比べて実用的な利点はありません。余分なビットはゼロか、ノイズのみをエンコードします。^{[ 15 ]}^{[ 16 ]}

[26] Intel および AMD x86 ハードウェアは、64 ビットよりも高い精度、または任意の大きさの浮動小数点数や整数も処理できますが、処理にはネイティブ型よりもはるかに時間がかかります。

[Understanding_Audio-2] ダン・トンプソン (2005)。オーディオを理解する。バークリープレス。 ISBN 978-0-634-00959-4。

[Julius_PCM-3] Smith, Julius (2007). 「パルス符号変調 (PCM)」 .離散フーリエ変換 (DFT) の数学とオーディオアプリケーション、第2版、オンラインブック. 2012年10月22日閲覧。

[ptnativefloat-4] キャンベル、ロバート (2013). Pro Tools 10 高度な音楽制作テクニック, 247ページ. Cengage Learning. ISBN 978-1133728016. 2013年8月12日閲覧。

[protools10float-5] Wherry, Mark (2012年3月). 「Avid Pro Tools 10」 . Sound On Sound . 2013年8月10日閲覧。

[reasonfloat-6] プライス、サイモン（2005年10月）「Reason Mixing Masterclass」 Sound On Sound誌。 2013年8月10日閲覧。

[live10manual-7] 「Abletonリファレンスマニュアルバージョン10、32. オーディオファクトシート」 Ableton、2019年。 2019年9月3日閲覧。

[waveref-8] Kabal, Peter (2011年1月3日). 「オーディオファイルフォーマット仕様、WAVE仕様」 . マギル大学. 2013年8月10日閲覧。

[aiffref-9] Kabal, Peter (2011年1月3日). 「オーディオファイルフォーマット仕様、AIFF / AIFF-C仕様」 . マギル大学. 2013年8月10日閲覧。

[dspguide4-10] Smith, Steven (1997–98). 「科学者とエンジニアのためのデジタル信号処理ガイド、第4章 DSPソフトウェア/浮動小数点（実数）」 . www.dspguide.com . 2013年8月10日閲覧。

[11] 信号対雑音比§固定小数点を参照。

[12] Kester, Walt (2007). 「SNR = 6.02N + 1.76dBという悪名高い公式の謎を解き明かす、そしてなぜ気にする必要があるのか」(PDF) . Analog Devices . 2011年7月26日閲覧。

[13] Nwavguy (2011年9月6日). 「NwAvGuy: ノイズとダイナミックレンジ」 . NwAvGuy . 2016年12月2日閲覧. 24ビットDACは、多くの場合約16ビットの性能しか発揮できず、最高でも21ビット（ENOB）の性能しか発揮できない。

[14] "PCM4222" . 2011年4月21日閲覧。ダイナミックレンジ（−60 dB入力、A特性）：124 dB（標準）ダイナミックレンジ（−60 dB入力、20 kHz帯域幅）：122 dB（標準）

[15] 「WM8741：高性能ステレオDAC」 Cirrus Logic . 2016年12月2日閲覧。128dB SNR（'A'加重モノラル@48kHz）、123dB SNR（非加重ステレオ@48kHz）

[16] 「オーディオの神話：32ビットDACが必要ない理由」 Android Authority、2016年1月19日。 2016年12月2日閲覧。つまり、32ビットDACは最大21ビットの有効なデータしか出力できず、残りのビットは回路ノイズによってマスクされてしまうのです。

[17] 「32ビット対応DAC」。hydrogenaud.io 。2016年12月2日閲覧。現在存在する「32ビット対応」DACチップの実際の解像度はすべて24ビット未満です。

[19] DR Campbell. 「人間の聴覚の側面」(PDF)。2011年8月21日時点のオリジナル(PDF)からアーカイブ。 2011年4月21日閲覧。人間の聴覚のダイナミックレンジは[約]120dBである。

[20] 「人間の耳の感度」。2011年6月4日時点のオリジナルよりアーカイブ。 2011年4月21日閲覧。実用的なダイナミックレンジは、聴力閾値から痛みの閾値[130dB]までと言える。

[21] US6317065B1、「ダイナミックレンジを拡張する複数のA/Dコンバータ」、1999年7月1日発行

[22] Christodoulou, Lakis; Lane, John; Kasparis, Takis (2010年3月1日). 「複数のA/Dコンバータを用いたダイナミックレンジの拡張」. 2010年第4回国際通信・制御・信号処理シンポジウム (ISCCSP) . pp. 1– 4. doi : 10.1109/ISCCSP.2010.5463427 . ISBN 978-1-4244-6285-8. S2CID 16501096 .

[dspguide28-23] Smith, Steven (1997–1998). 「科学者とエンジニアのためのデジタル信号処理ガイド、第28章 – デジタル信号プロセッサ / 固定小数点と浮動小数点」 . www.dspguide.com . 2013年8月10日閲覧。

[48forproaudio-24] Moorer, James (1999年9月). 「プロフェッショナルオーディオアプリケーションにおいて、48ビット整数処理は32ビット浮動小数点処理を上回る」(PDF) . www.jamminpower.com . 2019年2月14日時点のオリジナル(PDF)からアーカイブ。 2013年8月12日閲覧。

[wordrelation-25] Tomarakos, John. 「デジタルオーディオ処理アプリケーションにおけるデータワードサイズとダイナミックレンジおよび信号品質の関係」 www.analog.com . Analog Devices . 2013年8月16日閲覧。

[27] "DSP56001A" (PDF) . Freescale . 2013年8月15日閲覧。

[28] スミス、スティーブン (1997–1998). 「科学者とエンジニアのためのデジタル信号処理ガイド、第4章 DSPソフトウェア/数値精度」 . 2013年8月19日閲覧。

[29] Carletta, Joan (2003). 「固定小数点IIRフィルタにおける信号の適切な精度の決定」.第40回設計自動化会議議事録. pp. 656– 661. CiteSeerX 10.1.1.92.1266 . doi : 10.1145/775832.775998 . ISBN 1581136889. S2CID 15615715 .

[30] 高性能オーディオADCの選択、2011年9月14日、 2019年5月7日閲覧。

[31] Montgomery, Chris (2012年3月25日). 「24/192 Music Downloads ...and why they make no sense」 . xiph.org .オリジナルから2013年7月7日アーカイブ。 2013年5月26日閲覧。量子化ノイズのエネルギーを聞き取りにくい周波数に移動させるシェーピングディザを使用することで、16ビットオーディオの実効ダイナミックレンジは実際には120dBに達し、96dBという主張の15倍以上になります。120dBは、同じ部屋のどこかにいる蚊と30センチほど離れた削岩機の音の差よりも大きく、あるいは、人気のない「防音」室と数秒で聴覚障害を引き起こすほどの音量の差よりも大きいです。16ビットは、私たちが聞き取れるすべての音を保存するのに十分であり、永遠に十分な容量です。

[32] Stuart, J. Robert (1997). 「高品質デジタルオーディオのコーディング」(PDF) . Meridian Audio Ltd. 2016年4月7日時点のオリジナル(PDF)からアーカイブ。2016年2月25日閲覧。PCMにおける偉大な発見の一つは、小さなランダムノイズ（ディザと呼ぶ）を加えることで切り捨て効果を消すことができるという点だった。さらに重要なのは、加えるべきランダムノイズの種類が適切であり、適切なディザを用いることでデジタルシステムの解像度が無限大になるという認識だった。

[33] 「アナログからデジタルへの変換におけるディザリング」（PDF） . e2v Semiconductors. 2007年.オリジナル（PDF）から2011年10月4日時点のアーカイブ。 2011年7月26日閲覧。

[34] Kester, Walt. 「オーバーサンプリング補間DAC」（PDF） . Analog Devices. 2012年5月19日時点のオリジナル（PDF）からアーカイブ。 2013年8月19日閲覧。

[35] 「CDの歴史」philips.com . 2020年10月7日閲覧。

[36] 「Philips CD100」 . hifiengine.

[37] 「Sony CDP-101」 . hifiengine.

[38] 「B.1 一次および二次ノイズシェーピングループ」。 2013年8月19日閲覧。

[cdda-39] 「Sweetwater Knowledge Base、Masterlink：「Red Book」CDとは何ですか？」 www.sweetwater.com Sweetwater . 2007年4月27日. 2013年8月25日閲覧。

[dvdaudio-40] 「DVD-Audioを理解する」(PDF) . Sonic Solutions. 2012年3月4日時点のオリジナル(PDF)からアーカイブ。 2013年8月25日閲覧。

[surround-42] Shapiro, L. (2001年7月2日). 「サラウンドサウンド、10ページ」 . ExtremeTech . 2013年8月26日閲覧。

[bluray-43] 「ホワイトペーパー Blu-ray Disc Format, 2.B Audio Visual Application Format Specifications for BD-ROM Version 2.4」(PDF) 。Blu-ray Disc Association。2010年4月。 2011年7月8日時点のオリジナル(PDF)からアーカイブ。 2013年8月25日閲覧。

[dvaudio-45] Puhovski, Nenad (2000年4月). 「DV – A SUCCESS STORY」 . www.stanford.edu . 2004年10月27日時点のオリジナルよりアーカイブ。 2013年8月26日閲覧。

[g711-46] 「G.711：音声周波数のパルス符号変調（PCM）」（PDF）国際電気通信連合。 2013年8月25日閲覧。

[nicam-48] 「デジタルサウンド信号：高品質サウンド信号のための5つのコンパンディングシステムの性能比較テスト」（PDF）。BBC調査部。1978年8月。 2012年11月8日時点のオリジナルよりアーカイブ（PDF）。 2013年8月26日閲覧。

[ardourfeatures-50] 「Ardourの主な機能」。Ardourコミュニティ。2014年。2014年4月8日時点のオリジナルよりアーカイブ。 2014年4月8日閲覧。

[ptdocs-51] 「Pro Toolsドキュメント、Pro Toolsリファレンスガイド」（ZIP/PDF） . Avid. 2013年. 2013年8月26日閲覧。

[logicxguide-52] 「Logic Pro X: ユーザーガイド」(PDF) . Apple. 2010年1月. 2013年8月26日閲覧。

[cubasemanual-53] 「Cubase Pro 10.5 マニュアル」(PDF) . Steinberg. 2020年. 2020年9月2日閲覧。

[reasonmanual-54] 「Reason 7 操作マニュアル」(PDF) . Propellerhead Software. 2013年.オリジナル(PDF)から2013年5月24日時点のアーカイブ。 2013年8月26日閲覧。

[garageband-55] 「GarageBand '11: オーディオ解像度を設定する」 Apple、2012年3月13日。 2013年8月26日閲覧。

[audacity-56] 「Audacity: 機能」 . wiki.audacityteam.com . Audacity開発チーム. 2014年9月13日閲覧。

[57] 「オーディオ設定」 . www.image-line.com . 2019年2月12日閲覧。

[58] "Sample Rate, Bit-Depth & Bitrate | Exclusivemusicplus" . Exclusivemusicplus . 2018年10月26日. 2018年11月30日閲覧。

[ a ]

[ 1 ]

[

[ 3 ]

[ 4 ]

[ 5 ]

[ 6 ]

[ 7 ]

[ 8 ]

[ 9 ]

[ 10 ]

[ 11 ]

[ 12 ]

[ 13 ]

[ 14 ]

[

[

[

[

[

[ 21 ]

[ 22 ]

[ 23 ]

[ c ]

[ 24 ]

[ 25 ]

[ 26 ]

[ 27 ]

[ 28 ]

[ 29 ]

[ 30 ]

[ 31 ]

[ 32 ]

[ 33 ]

[ 34 ]

[ 35 ]

[ 36 ]

[ 37 ]

[ A ]

[ 38 ]

[ 39 ]

[ B ]

[ 40 ]

[ 41 ]

[ C ]

[ 42 ]

[ D ]

[ 43 ]

[ 44 ]

[ 45 ]

[ 46 ]

[ 47 ]

[ 48 ]

[ 49 ]

[ 50 ]

[ 51 ]

[ 15 ]

[ 16 ]