高度なオーディオコーディング

高度なオーディオコーディング
ファイル名拡張子.3gp、、、、、、、、、、.aac.adif.adts.m4a.m4b.m4p.m4r.mp4
インターネットメディアの種類
オーディオ/aacオーディオ/aacpオーディオ/3gppオーディオ/3gpp2オーディオ/mp4オーディオ/mp4a-latmオーディオ/mpeg4-generic
開発者AT&T Labsドルビーラボラトリーズフラウンホーファー協会ソニー株式会社
初回リリース1997年12月[ 1 ] (1997年12月
最新リリース
ISO/IEC 14496-3:2019 2019年12月 (2019年12月
フォーマットの種類ロスレスオーディオ
含まれるものMPEG-4 Part 14、3GPおよび3G2ISOベースのメディアファイル形式およびオーディオデータ交換形式(ADIF)
標準ISO/IEC 13818-7ISO/IEC 14496-3
オープンフォーマット?はい
フリーフォーマット?いいえ[ 2 ]

AACAdvanced Audio Coding)は、非可逆デジタル音声圧縮のための音声符号化規格です。ドルビーAT&Tフラウンホーファーソニーによって開発されました。[ 3 ] [ 4 ] [ 5 ]当初はMPEG-2規格の一部として開発されましたが、後にMPEG-4として改良されました。[ 6 ] [ 7 ] AACはMP3フォーマット(MPEG-2 Audio Layer III)の後継として設計され、一般的に同じビットレートでMP3よりも高い音質を実現します。[ 8 ] AACでエンコードされた音声ファイルは、通常、ファイル名拡張子.mp4を使用してMP4コンテナにパッケージ化されます。[ 9 ] [ 10 ].m4a

AAC(MPEG-4とMPEG-2の両方)の基本プロファイルはAAC-LCLow Complexity)と呼ばれています。これは業界で広くサポートされており、AppleiTunes Store任天堂Wii[ 11 ] DSi3DSSonyPlayStation 3などの製品のデフォルトまたは標準オーディオ形式として採用されています。[ 12 ]また、iPhoneiPodPlayStation PortableVitaPlayStation 5Androidと古い携帯電話、[ 13 ] Sony WalkmanSanDisk Clipなどのデジタルオーディオプレーヤー、VLCWinampWindows Media Playerなどのメディアプレーヤー、さまざまなインダッシュカーオーディオシステムなど、さまざまな他のデバイスやソフトウェアでもサポートされています。[ 14 ]また、 Spotify[ a ] Google NestAmazon Alexaで使用されています。[ 15 ] Apple MusicYouTube 、 YouTube Musicストリーミングサービスでも使用されています。 [ 16 ] AACはさらにHE-AAC高効率、またはAAC+)に拡張され、AAC-LCよりも効率が向上しました。 [ 17 ]もう一つの変種はAAC-LD低遅延)です。[ 18 ]

AACは、1つのストリームに48の全帯域幅(最大96 kHz)のオーディオチャンネルに加え、16の低周波効果(LFE、120 Hzまでに制限)チャンネル、最大16の「カップリング」またはダイアログチャンネル、および最大16のデータストリームを含めることができます。ステレオの品質は、ジョイントステレオモードで96 kbit/sで適度な要件を満たしますが、Hi-Fiトランスペアレンシーには少なくとも128 kbit/s(VBR )のデータレートが必要です。MPEG-4オーディオのテストでは、AACはステレオで128 kbit/s、 5.1chオーディオで384 kbit/sで、ITUの「トランスペアレント」と呼ばれる要件を満たしていることが示されています。[ 19 ] AACは修正離散コサイン変換(MDCT)アルゴリズムのみを使用するため、MDCTとFFTを組み合わせたハイブリッド符号化アルゴリズムを使用するMP3よりも高い圧縮効率が得られます。[ 8 ]

歴史

背景

離散コサイン変換(DCT) は非可逆圧縮用の変換符号化の一種で、1972 年にNasir Ahmed 氏によって提案され、1973 年に Ahmed 氏と T. Natarajan 氏、KR Rao 氏によって開発され、1974 年にその結果が発表されました。[ 20 ] [ 21 ] [ 22 ]これにより、1986 年のPrincen 氏と Bradley 氏による初期の研究に続いて、1987 年に JP Princen 氏、AW Johnson 氏、AB Bradley 氏によって提案された修正離散コサイン変換(MDCT) の開発が進みました。 [ 23 ] 1992 年に導入されたMP3オーディオ符号化規格では、 MDCT とFFTを組み合わせたハイブリッド符号化アルゴリズム使用されました。[ 25 ] AACでは純粋な MDCT アルゴリズムが使用されており、MP3 よりも圧縮効率が高くなっています[ 8 ]ラース・リリェリドが歌やスピーチのデジタル化された形式を保存するために必要な情報量を大幅に削減する方法を導入したことで、開発はさらに進みました。 [ 26 ]

AACは、 AT&T研究所ドルビーフラウンホーファーIIS(MP3を開発した)、ソニー株式会社の協力により開発された。[ 3 ] AACは1997年4月にMoving Picture Experts Groupにより正式に国際標準規格と宣言された。MPEG -2規格のパート7、およびMPEG-4規格のパート3のサブパート4として規定されている。[ 27 ]その後、ベル研究所LGエレクトロニクスNECノキアパナソニックETRIJVCケンウッドフィリップスマイクロソフトNTTなどの企業が開発に貢献した。[ 28 ] [ 29 ]

標準化

1997年、AACはMPEG-2パート7(正式名称:ISO / IEC 13818-7:1997 )として初めて導入されました。MPEG-2には既にMPEG-2パート3(正式名称:ISO/IEC 13818-3:MPEG-2 BC(後方互換性あり))が含まれていたため、このパートは新しいパートでした。 [ 30 ] [ 31 ]そのため、MPEG-2パート7はMPEG-1オーディオフォーマット(MP1MP2MP3)と互換性がないため、MPEG-2 NBC (後方互換性なし)とも呼ばれています。[ 30 ] [ 32 ] [ 33 ] [ 34 ]

MPEG-2 Part 7 では、低複雑度プロファイル (AAC-LC / LC-AAC)、メインプロファイル (AAC Main)、スケーラブル サンプリング レートプロファイル (AAC-SSR) の 3 つのプロファイルが定義されています。AAC-LC プロファイルは、AT&T の知覚オーディオ符号化 (PAC) 符号化形式によく似た基本形式で構成され、[ 35 ] [ 36 ] [ 37 ]これに時間的ノイズ シェーピング(TNS)、[ 38 ]カイザーウィンドウ(後述)、非均一量子化器、および 1 つのビット ストリームで最大 16 のステレオ チャンネル、16 のモノラル チャンネル、16 の低周波効果 (LFE) チャンネル、および 16 の解説チャンネルを処理できるようにビット ストリーム形式が作り直されています。メイン プロファイルでは、フィルタバンクの各タップで計算される再帰予測子のセットが追加されています。 SSR、スケーラブルなサンプリング レートを可能にするために、 4 バンドPQMFフィルタ バンクとそれに続く 4 つの短いフィルタ バンクを使用します。

1999 年に、 MPEG-2 Part 7 が更新され、 MPEG-4 ファミリーの標準に含まれ、MPEG-4 Part 3MPEG-4 AudioまたはISO/IEC 14496-3:1999として知られるようになりました。 この更新には、いくつかの改善が含まれていました。 これらの改善の 1 つは、TwinVQCELPHVXC音声合成MPEG-4 Structured Audioなどのさまざまな他のオーディオ形式との相互運用性を可能にするために使用されるオーディオ オブジェクト タイプの追加です。 このバージョンの AAC 標準で注目すべきもう 1 つの追加は、知覚ノイズ置換(PNS) です。 その点で、 AAC プロファイル (AAC-LC、AAC Main、および AAC-SSR プロファイル) は、知覚ノイズ置換と組み合わされ、 MPEG-4 オーディオ標準でオーディオ オブジェクト タイプとして定義されています。[ 39 ] MPEG-4オーディオオブジェクトタイプは、メイン(ほとんどのMPEG-4オーディオオブジェクトタイプを含む)、スケーラブル(AAC LC、AAC LTP、CELP、HVXC、TwinVQ、ウェーブテーブル合成、TTSI)、音声(CELP、HVXC、TTSI)、低レート合成(ウェーブテーブル合成、TTSI)の4つのMPEG-4オーディオプロファイルに統合されています。[ 39 ] [ 40 ]

MPEG-4パート3の参照ソフトウェアはMPEG-4パート5で規定されており、適合ビットストリームはMPEG-4パート4で規定されている。MPEG-4オーディオはMPEG-2パート7と下位互換性を維持している。 [ 41 ]

MPEG-4オーディオバージョン2(ISO/IEC 14496-3:1999/Amd 1:2000)では、新しいオーディオオブジェクトタイプが定義されました。低遅延AAC(AAC-LD)オブジェクトタイプ、ビットスライス算術符号化(BSAC)オブジェクトタイプ、ハーモニックと個別ラインを使用したパラメトリックオーディオ符号化、ノイズとエラー耐性(ER)バージョンのオブジェクトタイプです。[ 42 ] [ 43 ] [ 44 ]また、高品質オーディオプロファイル、低遅延オーディオプロファイル、ナチュラルオーディオプロファイル、モバイルオーディオインターネットワーキングプロファイルの4つの新しいオーディオプロファイルも定義されました。[ 45 ]

HE -AACプロファイル(AAC LC with SBR)とAACプロファイル(AAC LC)は、ISO/IEC 14496-3:2001/Amd 1:2003で初めて標準化されました。[ 46 ] HE-AAC v2プロファイル(AAC LC with SBR and Parametric Stereo)は、ISO/IEC 14496-3:2005/Amd 2:2006で初めて指定されました。[ 47 ] [ 48 ] [ 49 ] HE-AAC v2で使用されるパラメトリックステレオオーディオオブジェクトタイプは、ISO/IEC 14496-3:2001/Amd 2:2004で初めて定義されました。[ 50 ] [ 51 ] [ 52 ]

AAC規格の現在のバージョンはISO/IEC 14496-3:2009で定義されています。[ 53 ]

AAC+ v2は、ETSI欧州電気通信標準化機構)によってTS 102005として標準化されています。[ 50 ]

MPEG -4 Part 3規格には、音声を圧縮する他の方法も含まれています。これには、ロスレス圧縮形式、合成音声、そして一般的に音声に使用される低ビットレート圧縮形式が含まれます。

AACのMP3に対する改善点

Advanced Audio Coding は、 ISO / IECによって11172-3 ( MPEG-1 Audio) および 13818-3 (MPEG-2 Audio )で指定された、MP3 形式として知られるMPEG-1 Audio Layer 3の後継として設計されています。

改善点は次のとおりです:

  • MP3 (16 ~ 48 kHz) よりも多くのサンプル レート(8 ~ 96 kHz )
  • 最大 48 チャンネル (MP3 は MPEG-1 モードで最大 2 チャンネル、MPEG-2 モードで最大5.1チャンネルをサポートします)。
  • 任意のビットレートと可変フレーム長。ビットリザーバを備えた標準化された固定ビットレート。
  • より効率的でよりシンプルなフィルタバンク。AAC は MP3 のハイブリッド コーディング (一部は MDCT、一部はFFT )ではなく、純粋なMDCT (修正離散コサイン変換) を使用します。
  • 定常信号に対するより高いコーディング効率(AAC は 1024 または 960 サンプルのブロックサイズを使用するため、MP3 の 576 サンプル ブロックよりも効率的なコーディングが可能になります)。
  • 過渡信号のコーディング精度の向上(AAC は 128 または 120 サンプルのブロック サイズを使用するため、MP3 の 192 サンプル ブロックよりも正確なコーディングが可能になります)。
  • メインローブを広げる代わりにスペクトル漏れを排除するためにカイザーベッセル導出ウィンドウ関数を使用する可能性。
  • 16 kHz を超えるオーディオ周波数の処理が大幅に改善されました。
  • より柔軟なジョイントステレオ(異なる周波数範囲で異なる方法を使用できます)
  • 圧縮効率を高めるために追加されたモジュール(ツール):TNS、後方予測、知覚ノイズ置換(PNS)など。これらのモジュールを組み合わせて、さまざまなエンコード プロファイルを構成できます。

全体として、AACフォーマットはMP3よりも開発者にコーデック設計の柔軟性を提供し、オリジナルのMPEG-1オーディオ仕様で行われた設計上の選択の多くを修正しています。この柔軟性の向上は、多くの場合、より多くの同時エンコード戦略を可能にし、結果としてより効率的な圧縮を実現します。これは特に、優れたステレオコーディング、純粋なMDCT、そしてより優れた変換ウィンドウサイズによってMP3が太刀打ちできない、非常に低いビットレートにおいて顕著です。

採択

MP3形式は、インターネットを介した音楽ファイルの共有・配信が普及し始めた最初の数年間、主にMP3が主流だったため、ハードウェアとソフトウェアの両面でほぼ普遍的なサポートを得ている。一方、 AACは業界からの揺るぎない支持を受け、依然として有力な候補であり続けた。 [ 54 ] MP3の優位性により、AACの普及は当初は遅かった。最初の商用化は1997年、AT&T Labs(AAC特許の共同所有者)がMPEG-2 AACでエンコードされた楽曲を扱うデジタルミュージックストアを立ち上げた時だった。[ 55 ] Windows版HomeBoyは、最も初期のAACエンコーダーとデコーダーの一つであった。[ 56 ]

ドルビーラボラトリーズは2000年にAACのライセンス管理を担当するようになった。[ 55 ] 2002年にドルビーは新しいライセンスモデルを導入し、ノキアはこのフォーマットの5番目の共同ライセンサーとなった。[ 57 ]ドルビー自身も独自のコーディングフォーマットであるドルビーAC-3を販売した。

ノキアは2001年初頭からAAC再生のサポートを開始していたが[ 58 ]、Apple ComputerがiTunes StoreでAACを独占的に採用したことで、AACへの注目が一気に高まった。その後まもなく、ソニーもPlayStation Portable(ソニーは引き続き独自のATRACを推進していた)でAACをサポートし、ソニー・エリクソンもSony Ericsson W800に始まる音楽指向の携帯電話でAACをサポートした。[ 59 ]マイクロソフトのWindows Media Audio(WMA)は、AACの最大の競合と考えられていた。[ 60 ]

2017年までに、AACは非可逆オーディオの事実上の業界標準になったと考えられました。[ 61 ]

機能性

AAC は、2 つの主要なコーディング戦略を活用して、高品質のデジタル オーディオを表現するために必要なデータ量を大幅に削減する、 広帯域オーディオコーディング アルゴリズムです。

  • 知覚的に無関係な信号成分は破棄されます。
  • 符号化されたオーディオ信号内の冗長性が排除されます。

実際のエンコード プロセスは次の手順で構成されます。

MPEG -4オーディオ規格では、高効率の圧縮方式を 1 つまたは少数セット定義するのではなく、低ビット レートの音声コーディングから高品質のオーディオ コーディングや音楽合成まで、幅広い操作を実行するための複雑なツールボックスを定義します。

  • MPEG -4オーディオ コーディング アルゴリズム ファミリは、低ビット レートの音声エンコーディング (最低 2 kbit/s) から高品質のオーディオ コーディング (チャネルあたり 64 kbit/s 以上) までの範囲にわたります。
  • AAC は、8 kHz ~ 96 kHz のサンプリング周波数と、1 ~ 48 の任意の数のチャネルを提供します。
  • MP3 のハイブリッド フィルタ バンクとは対照的に、AAC は、1024 ポイントまたは 960 ポイントに増加したウィンドウ長とともに、修正離散コサイン変換 ( MDCT ) を使用します。

AAC エンコーダーは、長さ 1024 ポイントの単一の MDCT ブロック間、または 128 ポイントの 8 つのブロック間 (またはそれぞれ 960 ポイントと 120 ポイント間) を動的に切り替えることができます。

  • 信号の変化や過渡現象が発生した場合、時間分解能を向上させるために、それぞれ 128/120 ポイントの 8 つの短いウィンドウが選択されます。
  • デフォルトでは、より長い 1024 ポイント/960 ポイントのウィンドウが使用されます。これは、周波数解像度の向上により、より洗練された心理音響モデルが可能になり、コーディング効率が向上するためです。

モジュラーエンコーディング

AACはモジュール型のアプローチでエンコードを行います。エンコードするビットストリームの複雑さ、求められるパフォーマンス、そして許容可能な出力に応じて、実装者はプロファイルを作成し、特定のアプリケーションで使用するツールセットを定義することができます。

MPEG-2 Part 7規格(Advanced Audio Coding)は1997年に初めて公開され、3つのデフォルトプロファイルを提供しています。[ 1 ] [ 63 ]

  • 低複雑性(LC)  – 最もシンプルで、最も広く使用され、サポートされている
  • メインプロファイル(メイン)  - LCプロファイルと同様ですが、後方予測が追加されています。
  • スケーラブル サンプル レート (SSR)またはサンプル レート スケーラブル (SRS)

MPEG-4 Part 3規格(MPEG-4 Audio)では、様々な新しい圧縮ツール(別名Audio Object Types)と、それらの新しいプロファイルでの使用法が定義されています。AACは一部のMPEG-4 Audioプロファイルでは使用されていません。MPEG-2 Part 7のAAC LCプロファイル、AAC Mainプロファイル、AAC SSRプロファイルは、知覚ノイズ置換と統合され、MPEG-4 Audio規格ではAudio Object Types(AAC LC、AAC Main、AAC SSRという名称)として定義されています。これらは、MPEG-4 Audioプロファイル内の他のオブジェクトタイプと統合されています。[ 39 ] MPEG-4規格で定義されているオーディオプロファイルの一覧を以下に示します。[ 47 ] [ 64 ]

  • メインオーディオプロファイル – 1999年に定義され、MPEG-4オーディオオブジェクトタイプのほとんどを使用します(AACメイン、AAC-LC、AAC-SSR、AAC-LTP、AACスケーラブル、TwinVQ、CELP、HVXC、TTSI、メイン合成)
  • スケーラブルオーディオプロファイル - 1999年に定義され、AAC-LC、AAC-LTP、AACスケーラブル、TwinVQ、CELP、HVXC、TTSIを使用
  • 音声オーディオプロファイル – 1999年に定義され、CELP、HVXC、TTSIを使用
  • 合成オーディオプロファイル – 1999年に定義、TTSI、メイン合成
  • 高品質オーディオプロファイル – 2000年に定義され、AAC-LC、AAC-LTP、AACスケーラブル、CELP、ER-AAC-LC、ER-AAC-LTP、ER-AACスケーラブル、ER-CELPを使用
  • 低遅延オーディオ プロファイル – 2000 年に定義され、CELP、HVXC、TTSI、ER-AAC-LD、ER-CELP、ER-HVXC を使用
  • 低遅延AAC v2  – 2012年に定義され、AAC-LD、AAC-ELD、AAC-ELDv2を使用[ 65 ]
  • モバイル オーディオ インターネットワーキング プロファイル– 2000 年に定義され、ER-AAC-LC、ER-AAC-Scalable、ER-TwinVQ、ER-BSAC、ER-AAC-LD を使用
  • AACプロファイル – 2003年に定義され、AAC-LCを使用
  • 高効率AACプロファイル - 2003年に定義され、AAC-LC、SBRを使用
  • 高効率AAC v2プロファイル – 2006年に定義され、AAC-LC、SBR、PSを使用
  • 拡張高効率AAC xHE-AAC  – 2012年に定義され、USACを使用

MPEG-4オーディオの多くの改良点の1つに長期予測(LTP)と呼ばれるオブジェクトタイプがあります。これは、計算の複雑さが少ない前方予測器を使用したメインプロファイルの改良版です。[ 41 ]

AACエラー保護ツールキット

エラー保護を適用することで、ある程度のエラー訂正が可能になります。エラー訂正コードは通常、ペイロード全体に均等に適用されます。しかし、AACペイロードの各部分は伝送エラーに対する感度が異なるため、これはあまり効率的なアプローチとは言えません。

AAC ペイロードは、エラー感度が異なる部分に分割できます。

  • MPEG-4 オーディオ標準で定義されているエラー保護 (EP) ツールを使用して、これらのいずれの部分にも独立したエラー訂正コードを適用できます。
  • このツールキットは、追加のオーバーヘッドを低く抑えるために、ペイロードの最も機密性の高い部分にエラー訂正機能を提供します。
  • このツールキットは、よりシンプルで既存のAACデコーダーとの下位互換性を備えています。ツールキットのエラー訂正機能の多くは、オーディオ信号に関する情報をデータストリーム内でより均等に分散させることに重点を置いています。

エラー耐性(ER)AAC

エラー耐性 (ER) 技術を使用すると、コーディング スキーム自体をエラーに対してより堅牢にすることができます。

AACについては、MPEG-4オーディオで3つのカスタマイズされた方法が開発され、定義されました。

  • スペクトルデータ内のエラー伝播を回避するためのハフマンコードワード並べ替え(HCR)
  • スペクトルデータ内の重大なエラーを検出するための仮想コードブック(VCB11)
  • スケールファクターデータ内のエラー伝播を低減する可逆可変長コード(RVLC)

AAC 低遅延

ISO/IEC 14496-3:2009およびISO/IEC 14496-3:2009/Amd 3で定義されている音声符号化規格MPEG-4 Low DelayAAC-LD)、Enhanced Low Delay(AAC-ELD)、およびEnhanced Low Delay v2(AAC-ELDv2)は、知覚的音声符号化の利点と双方向通信に必要な低遅延を組み合わせるように設計されています。これらは、MPEG-2 Advanced Audio Coding(AAC)形式から密接に派生しています。[ 66 ] [ 67 ] [ 68 ] AAC-ELDは、 GSMAによって、高解像度ビデオ会議(HDVC)サービスのためのIMSプロファイルにおいて、超広帯域音声コーデックとして推奨されています。 [ 69 ]

ライセンスと特許

ユーザーがAAC形式でオーディオをストリーミングまたは配信するには、ライセンスや支払いは必要ありません。[ 70 ]この理由だけでも、AACは、ユースケースによっては特にストリーミングオーディオ(インターネットラジオなど)の場合、前身のMP3よりもオーディオを配信するためのより魅力的な形式になった可能性があります。

しかし、AAC「エンドユーザー」コーデックのすべての製造業者または開発者には特許ライセンスが必要である。[ 71 ] SECに開示された条件では、ユニット単位の価格設定が採用されている。ソフトウェアの場合、ソフトウェアを実行する各コンピュータは個別の「ユニット」とみなされる。[ 72 ]

FFmpegFAACなどのフリー・オープンソース・ソフトウェア実装は、AACコーデックを「別途提供」しないよう、ソースコード形式でのみ配布されるのが一般的でした。しかし、FFmpegはその後、特許問題に関してより寛容になりました。公式サイトで推奨されている「gyan.dev」ビルドには現在、AACコーデックが含まれており、FFmpegの法的ページには、特許法への準拠はユーザーの責任であると明記されています。[ 73 ](AACをサポートする製品、ソフトウェアについては後述)。Red Hatが支援するコミュニティであるFedoraプロジェクトは、2018年9月25日に「Android向けFraunhofer FDK AACコーデックライブラリのサードパーティ製修正版」をリポジトリにインポートし、[ 74 ] 、 2023年1月31日にffmpeg-freeパッケージでFFmpegのネイティブAACエンコーダとデコーダを有効にしました。[ 75 ]

AACの特許保有者には、ベル研究所ドルビーETRIフラウンホーファーJVCケンウッドLGエレクトロニクスマイクロソフトNECNTT(およびその子会社NTTドコモ)、パナソニックフィリップスソニー株式会社などがある。[ 28 ] [ 29 ] SECの条項による特許リストに基づくと、最後のベースラインAAC特許は2028年に失効し、前述のすべてのAAC拡張機能の最後の特許は2031年に失効する。[ 76 ]

拡張と改善

最初の AAC 標準 (1997 年に MPEG-2 Part 7 で定義) には、いくつかの拡張機能が追加されました。

  • 知覚ノイズ置換 (PNS) は、1999 年にMPEG-4に追加されました。これにより、ノイズを疑似ランダムデータとしてコーディングできます。
  • 長期予測器(LTP)は1999年にMPEG-4に追加されました。これは計算の複雑さが少ない前向き予測器です。[ 41 ]
  • エラー耐性(ER)は、2000年にMPEG-4オーディオバージョン2で追加され、エラーが発生しやすいチャネルでの転送に使用されます[ 77 ]
  • AAC-LD(低遅延)は2000年に定義され、リアルタイム会話アプリケーションに使用されます。
  • 高効率AAC(HE-AAC)は、aacPlus v1またはAAC+とも呼ばれ、 SBR(スペクトル帯域複製)とAAC LCを組み合わせたものです。低ビットレートで使用されます。2003年に定義されました。
  • HE-AAC v2 (別名aacPlus v2、eAAC+、またはEnhanced aacPlus)は、パラメトリックステレオ(PS)とHE-AACを組み合わせた規格で、さらに低いビットレートで使用されます。2004年と2006年に定義されました。
  • xHE-AACはコーデックの動作範囲を12kbit/sから300kbit/sに拡張します。 [ 78 ] [ 79 ]
  • MPEG-4 Scalable to Lossless (SLS)、まだ公開されていないが、 [ 80 ]はAACストリームを補完して、Fraunhofer IISの「HD-AAC」製品のようにロスレスデコードオプションを提供することができる。

コンテナ形式

ファイル保存用のISO ベースのメディアファイル形式に基づくMP43GPおよびその他のコンテナ形式に加えて、 AAC オーディオデータは、最初、オーディオデータ交換フォーマット (ADIF) を使用して MPEG-2 標準のファイルにパッケージ化され、[ 81 ]単一のヘッダーとそれに続く生の AAC オーディオデータブロックで構成されます。[ 82 ]ただし、データを MPEG-2 トランスポートストリーム内でストリーミングする場合は、オーディオデータトランスポートストリーム( ADTS ) と呼ばれる自己同期形式が使用されます。これは、一連のフレームで構成され、各フレームにはヘッダーがあり、その後に AAC オーディオデータが続きます。[ 81 ]このファイルとストリーミングベースの形式はMPEG-2 パート 7で定義されていますが、 MPEG-4 では参考情報としてのみ考えられているため、 MPEG-4 デコーダーはどちらの形式もサポートする必要はありません。[ 81 ]これらのコンテナと生の AAC ストリームには、 .aac ファイル拡張子が付くことがあります。MPEG-4 Part 3では、AACだけでなく、 TwinVQALSなどのあらゆるMPEG-4オーディオ圧縮方式をカプセル化する、低オーバーヘッドオーディオストリーム(LOAS)と呼ばれる独自の自己同期フォーマットも定義されています。このフォーマットは、エンコーダがSBRまたはパラメトリックステレオAAC拡張を使用する際に、DVBトランスポートストリームで使用するために定義されました。ただし、これは単一の非多重化AACストリームのみに制限されています。このフォーマットは、低オーバーヘッドオーディオトランスポートマルチプレックス(LATM)とも呼ばれ、LOASのインターリーブされたマルチストリームバージョンです。[ 81 ]

エンコーダとデコーダ

ツール

アップルAAC

Appleの AAC エンコーダは、当初はQuickTimeメディア フレームワークの一部でしたが、現在は Audio Toolbox の一部になっています。

FAAC と FAAD2

FAACとFAAD2はそれぞれFreeware Advanced Audio CoderとDecoder 2の略です。FAACはLC、Main、LTPのオーディオオブジェクトタイプをサポートしています。[ 83 ] FAAD2はLC、Main、LTP、SBR、PSのオーディオオブジェクトタイプをサポートしています。[ 84 ] FAAD2はフリーソフトウェアですが、FAACはフリーソフトウェアではありません。

フラウンホーファーFDK AAC

Androidに搭載されているFraunhoferが開発したオープンソースのエンコーダ/デコーダが、他のプラットフォームに移植されました。FFmpegのネイティブAACエンコーダはHE-AACとHE-AACv2をサポートしていませんが、ffmpegのGPL 2.0+はFDK AACと互換性がないため、libfdk-aacを含むffmpegは再配布できません。AppleのCore Media Audioを使用するQAACエンコーダは、FDKよりも高品質です。

FFmpegとLibav

FFmpeglibavcodecで作成され、LibavからフォークされたネイティブAACエンコーダは、実験的で貧弱だとみなされていました。FFmpeg 3.0リリース(2016年2月)では、そのバージョンを他のAACエンコーダと競合できるレベルにするために、かなりの作業が行われました。[ 85 ] Libavはこの作業を統合しておらず、古いバージョンのAACエンコーダを使い続けています。これらのエンコーダはLGPLライセンスのオープンソースであり、FFmpegまたはLibavフレームワークがビルド可能なあらゆるプラットフォームでビルドできます。

FFmpegとLibavはどちらもlibfdk-aac経由でFraunhofer FDK AACライブラリを使用できます。FFmpegのネイティブエンコーダは安定しており、一般的な使用には十分ですが、FDKは依然としてFFmpegで使用できる最高品質のエンコーダと考えられています。[ 86 ] Libavも、利用可能な場合はFDK AACを使用することを推奨しています。[ 87 ] FFmpeg 4.4以降では、Apple audiotoolboxエンコーダも使用できます。[ 86 ]

ネイティブ AAC エンコーダーは AAC-LC のみを生成しますが、ffmpeg のネイティブ デコーダーは幅広い入力形式を処理できます。

Nero デジタルオーディオ

2006年5月、Nero AGはAACエンコードツール「Nero Digital Audio」(AACコーデック部分はNero AAC Codecに変更)を無償でリリースしました[ 88 ]。これはLC-AAC、HE-AAC、HE-AAC v2ストリームのエンコードが可能です。このツールはコマンドラインインターフェースのみです。PCM WAVへのデコード用ユーティリティも別途含まれています。

foob​​ar2000オーディオ プレーヤーやMediaCoderなどのさまざまなツールがこのエンコーダ用のGUIを提供できます。

メディアプレーヤー

現在のほぼすべてのコンピュータメディアプレーヤーにはAAC用のデコーダーが組み込まれているか、ライブラリを利用してデコードすることができます。Microsoft Windowsでは、DirectShowを対応するフィルターと組み合わせて使用​​することで、DirectShowベースのプレーヤーでAACを再生できます。Mac OS XはQuickTimeライブラリを介してAACをサポートしています。Adobe Flash Playerはバージョン9アップデート3以降でAACストリームを再生できます。[ 89 ] [ 90 ] Flash Playerはブラウザプラグインでもあるため、ブラウザ経由でAACファイルを再生することもできます。

Rockboxオープン ソースファームウェア(複数のポータブル プレーヤーで利用可能) も プレーヤーのモデルと AAC プロファイルに応じて、さまざまなレベルで AAC をサポートします。

Xbox 360のオプションのiPodサポート(保護されていないAACファイルの再生)は、Xbox Liveから無料でダウンロードできます。[ 91 ]

以下は、その他のソフトウェア プレーヤー アプリケーションの包括的なリストではありません。

これらのプレーヤーの中には(例:foobar2000、Winamp、VLC)、SHOUTcastプロトコルを使用したADTS(Audio Data Transport Stream)のデコードもサポートしているものがあります。Winampとfoobar2000用のプラグインを使えば、このようなストリームを作成できます。

HDTV放送での使用

日本のISDB-T

日本は2003年12月、MPEG-2ビデオとMPEG-2 AACオーディオを実装した地上デジタルテレビISDB-T規格の放送を開始しました。2006年4月には、ISDB-Tモバイルサブプログラム「ワンセグ」の放送を開始しました。これは、地上HDTV放送サービスにおいて、世界で初めてH.264/AVCビデオとHE-AACオーディオを実装した番組でした。

国際ISDB-Tb

2007 年 12 月、ブラジルは、メイン プログラム (単一または複数) でビデオ コーディング H.264/AVC とオーディオ AAC-LC を実装し、ワンセグ モバイル サブ プログラムでビデオ H.264/AVC とオーディオ HE-AACv2 を実装する、国際ISDB -Tb と呼ばれる地上 DTV 規格の放送を開始しました。

DVB

DVBスイートの標準化団体であるETSIは、少なくとも2004年以来、DVBアプリケーションでAAC、HE-AAC、HE-AAC v2オーディオコーディングをサポートしています。[ 92 ]ビデオにH.264圧縮を使用するDVB放送は、通常、オーディオにHE-AACを使用します。

ハードウェア

iTunesとiPod

2003年4月、AppleはiTunesiPod製品がMPEG-4 AAC形式の楽曲をサポートすると発表し(旧型iPodのファームウェアアップデート経由)、AACへの注目を世間に広めました。ユーザーはiTunes Storeから、クローズドソースのデジタル著作権管理(DRM)制限付き128kbit/s AAC(FairPlay参照)形式の音楽をダウンロードしたり、iTunesを使って自分のCDからDRMなしのファイルを作成したりできました。その後、AppleはAACを音声エンコードに使用したミュージックビデオや映画の提供も開始しました。

2007年5月29日、Appleは参加レコードレーベルの楽曲とミュージックビデオを、高ビットレート(256 kbit/s cVBR)かつDRMフリーの「iTunes Plus」フォーマットで販売開始しました。これらのファイルは主にAAC規格に準拠しており、多くのApple製品以外でも再生可能ですが、アルバムアートワークや購入レシートなどのiTunes独自の情報が含まれており、ファイルがピアツーピアネットワークに流出した場合に顧客を特定できるようにしています。ただし、これらのカスタムタグを削除することで、AAC規格に厳密に準拠するプレーヤーとの相互運用性を回復することは可能です。2009年1月6日時点で、米国リージョンのiTunes Storeのほぼすべての音楽がDRMフリーとなり、残りの音楽も2009年3月末までにDRMフリーになりました。[ 93 ]

iTunesはAACトラックを制約可変ビットレート方式(ABRエンコードのより緩い変種)でエンコードする「可変ビットレート」エンコードオプションを提供しています。ただし、基盤となるQuickTime APIは真のVBRエンコードプロファイルを提供しています。[ 94 ]

2009 年 9 月現在、Apple はファイル再生ではなくラジオ ストリームに対してのみHE-AAC (完全に MP4 標準の一部) のサポートを追加しており、iTunes では依然として真の VBR エンコーディングがサポートされていません。

その他のポータブルプレーヤー

携帯電話

長年にわたり、ノキアモトローラサムスンソニー・エリクソンベンキュー・シーメンスフィリップスなどのメーカーの多くの携帯電話がAAC再生に対応してきました。最初のAAC再生対応機種は2002年に発売されたNokia 5510で、MP3も再生可能でした。しかし、この機種は商業的には失敗に終わり、音楽プレーヤー内蔵の携帯電話が主流となるのは2005年になってからで、その後AACとMP3の両方をサポートするというトレンドが続きました。しかし、最近のスマートフォンや音楽関連の携帯電話のほとんどは、これらのフォーマットの再生に対応しています。

その他のデバイス

  • AppleiPad:iTunes Storeのデフォルトのエンコード形式として使用されるAACおよびFairPlayで保護されたAACファイルをサポートします。
  • Palm OS PDA:多くのPalm OSベ​​ースのPDAとスマートフォンは、サードパーティ製ソフトウェア「Pocket Tunes」を使用することでAACおよびHE-AACを再生できます。2006年12月にリリースされたバージョン4.0では、ネイティブAACおよびHE-AACファイルのサポートが追加されました。人気のビデオプレーヤーであるTCPMPのAACコーデックは、特許問題によりバージョン0.66以降で廃止されましたが、corecodec.org以外のサイトからダウンロードすることは可能です。TCPMPの後継製品であるCorePlayerはAACをサポートしています。AACをサポートするPalm OSプログラムには、他にKinoma PlayerやAeroPlayerなどがあります。
  • Windows Mobile : ネイティブのWindows Media Playerまたはサードパーティ製品 (TCPMP、CorePlayer) によって
  • エプソン: P-2000およびP-4000マルチメディア/フォトストレージビューアーでAAC再生をサポート
  • Sony Reader:AACを含むM4Aファイルを再生し、iTunesで作成されたメタデータを表示します。AシリーズおよびEシリーズのネットワークウォークマンを含む他のSony製品は、ファームウェアアップデート(2006年5月リリース)でAACに対応しており、Sシリーズは標準でAACをサポートしています。
  • Sonosデジタルメディアプレーヤー:AACファイルの再生をサポート
  • Barnes & Noble Nook Color : AACエンコードされたファイルの再生をサポート
  • Roku SoundBridge : ネットワークオーディオプレーヤー。AACエンコードされたファイルの再生をサポート
  • Squeezebox : AACファイルの再生をサポートするネットワークオーディオプレーヤー(Logitech傘下のSlim Devices
  • PlayStation 3 : AACファイルのエンコードとデコードをサポート
  • Xbox 360 : Zune ソフトウェアを介した AAC のストリーミングと、USB ポートを介して接続された対応 iPod のストリーミングをサポートします。
  • Wii :2007年12月11日現在、フォトチャンネルのバージョン1.1でAACファイルをサポートしています。.m4aファイル拡張子であれば、すべてのAACプロファイルとビットレートがサポートされます。バージョン1.1アップデートでMP3への対応は削除されましたが、任天堂によると、このバージョンをインストールしたユーザーは、希望に応じて旧バージョンに自由にダウングレードできます。 [ 98 ]
  • Livescribe PulseおよびEchoスマートペン:音声をAAC形式で録音・保存します。音声ファイルは、ペンの内蔵スピーカー、接続されたヘッドフォン、またはLivescribeデスクトップソフトウェアを使用してコンピューターで再生できます。AACファイルはWindows OSの「マイドキュメント」フォルダに保存され、Livescribe製の専用ハードウェアやソフトウェアなしで配布・再生できます。
  • Google Chromecast : LC-AACおよびHE-AACオーディオの再生をサポート[ 99 ]

参照

注記

  1. ^ウェブプレーヤーでのみ使用されます

参考文献

  1. ^ a b ISO (1997). 「ISO/IEC 13818-7:1997, 情報技術 - 動画及び関連音声情報の汎用符号化 - パート7:高度音声符号化(AAC)」 . 2012年9月25日時点のオリジナルよりアーカイブ。 2010年7月18日閲覧
  2. ^ Advanced Audio Coding (MPEG-4)(完全草案). デジタルフォーマットの持続可能性. ワシントンD.C.: 米国議会図書館. 2010年6月22日. 2021年12月1日閲覧
  3. ^ a b「AAC in the Chips」 Stereophile.com 2002年6月9日. 2025年4月11日閲覧
  4. ^ 「ドルビーラボラトリーズがAACサポートプログラムを発表」(PDF) 2000年。2000年8月23日時点のオリジナル(PDF)からアーカイブ
  5. ^ 「MP3の競合が勢揃い」ストリーミングメディアマガジン、2001年4月17日。 2025年4月11日閲覧
  6. ^ ISO (2006) ISO/IEC 13818-7:2006 – 情報技術 – 動画及び関連音声情報の汎用符号化 – パート7:高度音声符号化(AAC) 2016年3月3日アーカイブ、 Wayback Machineにて2009年8月6日取得
  7. ^ ISO (2006) ISO/IEC 14496-3:2005 – 情報技術 – オーディオビジュアルオブジェクトのコーディング – パート3:オーディオArchived 2016-04-13 at the Wayback Machine , Retrieved on 2009-08-06
  8. ^ a b c Brandenburg, Karlheinz (1999). 「MP3とAACの説明」(PDF) . 2017年2月13日時点のオリジナル(PDF)からのアーカイブ
  9. ^ 「Apple、iTunesをWindowsに移植するプログラマーを募集」2024年9月8日時点のオリジナルよりアーカイブ2025年4月11日閲覧。
  10. ^ James (2021年10月17日) 曰く、「MP3 vs. AAC (.m4a) with Allan Tépper – PES 120 – Podcast Engineering School」 。 2025年4月11日閲覧
  11. ^ Caron, Frank (2007年11月14日). 「Wiiフォトチャンネルのアップデートでカスタマイズ機能が追加され、MP3再生機能が削除される」 Ars Technica . 2025年4月11日閲覧
  12. ^ 「PS3™ | オーディオCDを本体ストレージにインポートする」 . manuals.playstation.net . 2025年4月11日閲覧。
  13. ^ 「ソニーがAACをサポートへ ― 凍結はしないだろう」 Engadget 2006年5月10日2025年4月11日閲覧
  14. ^ 「パイオニア、創業80周年を記念したカーオーディオパッケージを海外市場向けに期間限定で発売|ニュースリリース|ニュースとイベント|企業情報|パイオニア」パイオニア株式会社。 2025年4月11日閲覧
  15. ^ 「Audio quality – Spotify」 . Spotify . 2025年7月13日時点のオリジナルよりアーカイブ。 2025年8月20日閲覧
  16. ^ Svetlik, Joe; Scarrott, Becky (2022年7月25日). 「MP3、AAC、WAV、FLAC:すべてのオーディオファイル形式を解説」 . whathifi . 2025年4月11日閲覧
  17. ^ 「ドルビーが高効率AACをMPEG 4特許プールに追加」 2004年。
  18. ^ Rose, Matthias (2012年6月28日). 「mp3からxHE-AACまでのMPEGオーディオコーデックを理解する」 . Electronic Design . 2025年4月11日閲覧。
  19. ^ 「放送およびケーブルテレビ向けAACオーディオコーディングファミリー」(PDF) 2013年6ページ。2023年9月28日時点のオリジナル(PDF)からアーカイブ。 2024年1月29日閲覧
  20. ^ Ahmed, Nasir (1991年1月). 「離散コサイン変換の考案経緯」 .デジタル信号処理. 1 (1): 4– 5. Bibcode : 1991DSP.....1....4A . doi : 10.1016/1051-2004(91)90086-Z .
  21. ^ Ahmed, Nasir ; Natarajan, T.; Rao, KR (1974年1月)、「離散コサイン変換」、IEEE Transactions on ComputersC-23 (1): 90– 93、Bibcode : 1974ITCmp.100...90Adoi : 10.1109/TC.1974.223784S2CID 149806273 
  22. ^ Rao, KR ; Yip, P. (1990)、「離散コサイン変換:アルゴリズム、利点、アプリケーション」、ボストン:アカデミックプレス、ISBN 978-0-12-580203-1
  23. ^ JP Princen、AW Johnson、AB Bradley:「時間領域エイリアシング除去に基づくフィルタバンク設計を用いたサブバンド/変換符号化」、IEEE Proc. Intl. Conference on Acoustics, Speech, and Signal Processing (ICASSP)、2161–2164、1987
  24. ^ John P. Princen, Alan B. Bradley:時間領域エイリアシング除去に基づく分析/合成フィルタバンク設計、IEEE Trans. Acoust. Speech Signal Processing、 ASSP-34 (5)、1153–1161、1986
  25. ^ Guckert, John (2012年春). 「MP3オーディオ圧縮におけるFFTとMDCTの利用」(PDF) .ユタ大学. 2019年7月14日閲覧.
  26. ^ Borland, John (2004年3月18日). 「科学の音」 . CNET . 2023年4月21日閲覧
  27. ^ ISO/IEC 14496-3:2009 – 情報技術 – オーディオビジュアルオブジェクトの符号化 – パート3:オーディオ(PDF) (技術レポート). ISO / IEC . 2009年9月1日. 2011年6月14日時点のオリジナルよりアーカイブ(PDF) . 2009年10月7日閲覧
  28. ^ a b「AACライセンサー」 Via Corp. 2020年1月15日閲覧
  29. ^ a b「Via Licensing、AAC共同特許ライセンスの更新を発表」 Business Wire、2009年1月5日。 2019年6月18日閲覧
  30. ^ a b "AAC" . MPEG.ORG . 2009年10月3日時点のオリジナルよりアーカイブ。 2009年10月28日閲覧
  31. ^ 「ISO/IEC 13818-7、第4版、パート7 – 高度オーディオ符号化(AAC)」(PDF)。ISO 。2006年1月15日 2009年3月6日時点のオリジナルよりアーカイブ(PDF) 。 2009年10月28日閲覧
  32. ^ Bouvigne, Gabriel (2003). 「MPEG-2/MPEG-4 – AAC」 . MP3'Tech. 2010年1月5日時点のオリジナルよりアーカイブ。 2009年10月28日閲覧
  33. ^ 「MPEG Audio FAQ Version 9 – MPEG-1 and MPEG-2 BC」 . ISO . 1998年10月. 2010年2月18日時点のオリジナルよりアーカイブ2009年10月28日閲覧。
  34. ^ 「Florence Press Release」ISO、 1996年3月。 2010年4月8日時点のオリジナルよりアーカイブ。 2009年10月28日閲覧
  35. ^ Johnston, JD および Ferreira, AJ、「Sum-Difference stereo transform coding」、ICASSP '92、1992 年 3 月、pp. II-569-572。
  36. ^ Sinha, D. および Johnston, JD、「信号適応スイッチフィルタバンクを使用した低ビットレートでのオーディオ圧縮」、IEEE ASSP、1996 年、1053-1057 ページ。
  37. ^ Johnston, JD、Sinha, D.、Dorward, S.、Quackenbush, S.、「AT&T 知覚オーディオ コーダ (PAC)」、『デジタル オーディオ ビット レート削減に関する論文集』、Gilchrist, N. および Grewin, C. (編)、オーディオ エンジニアリング協会、1996 年。
  38. ^ Herre, J. および Johnston, JD, 「時間的ノイズシェーピングを用いた知覚的オーディオ符号化器の性能向上」、AES 101st Convention、プレプリント 4384、1996
  39. ^ a b c Brandenburg, Karlheinz; Kunz, Oliver; Sugiyama, Akihiko. 「MPEG-4 Natural Audio Coding – Audio profiles and levels」 . chiariglione.org . 2010年7月17日時点のオリジナルよりアーカイブ。 2009年10月6日閲覧
  40. ^ 「ISO/IEC FCD 14496-3 サブパート1 – 草案 – N2203」(PDF) ISO / IEC JTC 1/SC 29/WG 11. 1998年5月15日.オリジナル(PDF)から2004年9月22日時点のアーカイブ。 2009年10月7日閲覧
  41. ^ a b c Brandenburg, Karlheinz; Kunz, Oliver; Sugiyama, Akihiko (1999). 「MPEG-4 Natural Audio Coding – General Audio Coding (AAC based)」 . chiariglione.org . 2010年2月19日時点のオリジナルよりアーカイブ。 2009年10月6日閲覧
  42. ^ 「ISO/IEC 14496-3:1999/Amd 1:2000 – オーディオ拡張」 ISO 2000. 2011年6月6日時点のオリジナルよりアーカイブ。 2009年10月7日閲覧
  43. ^ 「ISO/IEC 14496-3:/Amd.1 – 最終委員会草案 – MPEG-4 オーディオバージョン2」(PDF) . ISO / IEC JTC 1/SC 29/WG 11FTP). 1999年7月. 2009年10月7日閲覧(ドキュメントを表示するには、ヘルプ:FTPを参照してください)
  44. ^ Purnhagen, Heiko (2000年2月19日). 「MPEG-4 Version 2 Audio Workshop:HILN – Parametric Audio Coding」(PDF) . パリ. AES 108th Convention: MPEG-4 Version 2 Audio What is it about? . 2009年10月7日閲覧.
  45. ^ Pereira, Fernando (2001年10月). 「オーディオプロファイルのレベル」 . MPEG Industry Forum. 2010年1月8日時点のオリジナルよりアーカイブ。 2009年10月15日閲覧
  46. ^ 「ISO/IEC 14496-3:2001/Amd 1:2003 – 帯域幅拡張」ISO 2003年。2011年6月6日時点のオリジナルよりアーカイブ。 2009年10月7日閲覧
  47. ^ a b「ISO/IEC 14496-3:2001/FPDAM 4、オーディオロスレス符号化(ALS)、新しいオーディオプロファイル、およびBSAC拡張のテキスト」。ISO / IEC JTC1/SC29/WG11/N7016。2005年1月11日。2014年5月12日時点のオリジナル(DOC)からアーカイブ。 2009年10月9日閲覧
  48. ^ 「Audio Lossless Coding (ALS), new audio profiles and BSAC extensions, ISO/IEC 14496-3:2005/Amd 2:2006」 . ISO . 2006. 2012年1月4日時点のオリジナルよりアーカイブ。 2009年10月13日閲覧
  49. ^ Mody, Mihir (2005年6月6日). 「オーディオ圧縮はより良く、より複雑に」 . Embedded.com . 2016年2月8日時点のオリジナルよりアーカイブ2009年10月13日閲覧。
  50. ^ a b「MPEG-4 aacPlus – 今日のデジタルメディアの世界のためのオーディオコーディング」(PDF) 。 2006年10月26日時点のオリジナル(PDF)からアーカイブ。 2007年1月29日閲覧
  51. ^ 「高品質オーディオのためのパラメトリック符号化、ISO/IEC 14496-3:2001/Amd 2:2004」。ISO 。2004年。2012年1月4日時点のオリジナルよりアーカイブ2009年10月13日閲覧
  52. ^ 「3GPP TS 26.401 V6.0.0 (2004-09)、一般オーディオコーデックのオーディオ処理機能、拡張aacPlus一般オーディオコーデック、概要(リリース6)」(DOC)。3GPP。2004年9月30日。 2006年8月19日時点のオリジナルからアーカイブ。 2009年10月13日閲覧
  53. ^ 「ISO/IEC 14496-3:2009 – 情報技術 – オーディオビジュアルオブジェクトの符号化 – パート3:オーディオ」ISO 2009年。2011年6月6日時点のオリジナルよりアーカイブ。 2009年10月7日閲覧
  54. ^ "AAC" . Hydrogenaudio. 2014年7月6日時点のオリジナルよりアーカイブ。 2011年1月24日閲覧
  55. ^ a b「ニュース:デジタル音楽のより高い基準」 ZDNet 2001年8月8日。2001年8月8日時点のオリジナルよりアーカイブ。 2025年4月11日閲覧
  56. ^ 「ReallyRareWares – HomeBoy AACエンコーダ」 . www.rarewares.org . 2025年4月11日閲覧
  57. ^ RadioWorld (2002年3月26日). 「ドルビーラボラトリーズ、MPEG-4 AACライセンスプログラムを発表」 . Radio World . 2025年4月11日閲覧。
  58. ^ 「Nokiaの携帯電話で音楽を奏でる」 Forbes . 2025年4月11日閲覧
  59. ^ WIREDスタッフ。「A Music File by Any Other Name」。Wired。ISSN 1059-10282025年4月11閲覧 
  60. ^バスカーク、エリオット・ヴァン. 「EMIとiTunesの取引で最大の敗者はマイクロソフトか」 . Wired . ISSN 1059-1028 . 2025年4月11日閲覧 
  61. ^ What Hi-Fi Admin (2017年5月15日). 「ホーム」 . whathifi . 2025年4月11日閲覧
  62. ^米国特許出願20070297624デジタルオーディオエンコーディング
  63. ^ 「ISO/IEC 13818-7、第3版、パート7 – 高度オーディオ符号化(AAC)」(PDF)。ISO 2004年10月15日。p. 32。2011年7月13日時点のオリジナル(PDF)からアーカイブ。 2009年10月19日閲覧
  64. ^ Grill, Bernhard; Geyersberger, Stefan; Hilpert, Johannes; Teichmann, Bodo (2004年7月).様々なプラットフォームにおけるMPEG-4オーディオコンポーネントの実装(PDF) . 109th AES Convention 2000 September 22–25 Los Angeles. Fraunhofer Gesellschaft.オリジナル(PDF)から2007年6月10日アーカイブ. 2009年10月9日閲覧
  65. ^ 「ISO/IEC 14496-3:2009/Amd 3:2012 – 統合音声符号化方式(USAC)の転送」ISO2016年3月8日時点のオリジナルよりアーカイブ2016年8月3日閲覧
  66. ^ 「ISO/IEC 14496-3:2009 – 情報技術 – オーディオビジュアルオブジェクトの符号化 – パート3:オーディオ」。ISO 2016年5月20日時点のオリジナルよりアーカイブ2016年8月2日閲覧
  67. ^ 「ISO/IEC 14496-3:2009/Amd 3:2012 – 統合音声符号化方式(USAC)の転送」ISO . 2016年8月19日時点のオリジナルよりアーカイブ2016年8月2日閲覧
  68. ^ 「高品質通信サービス向けAAC-ELDファミリー | MPEG」 mpeg.chiariglione.org . 2016年8月20日時点のオリジナルよりアーカイブ。 2016年8月2日閲覧
  69. ^ IMSプロファイル for High Definition Video Conference (HDVC) Service (PDF) GSMA 2016年5月24日 p. 10. 2016年8月18日時点のオリジナルよりアーカイブ(PDF) 。
  70. ^ 「AACライセンスFAQ Q5」。Via Licensing 2020年1月15日閲覧。
  71. ^ 「AAC FAQs – ViaLa」 . ViaLa . 2025年6月4日時点のオリジナルよりアーカイブ2025年8月20日閲覧。
  72. ^ Via Licensing Corporation (2018年6月5日). 「AAC特許ライセンス契約」 . www.sec.gov . 2023年4月21日閲覧
  73. ^ 「FFmpeg ライセンスと法的考慮事項」 . ffmpeg.org .
  74. ^ 「コミット – rpms/fdk-aac-free – b27d53fbad872ea0ec103653fddaec83238132d9 – src.fedoraproject.org 。src.fedoraproject.org
  75. ^ 「コミット – rpms/ffmpeg – 45f894ec0e43a37775393c159021a4ac60170a55 – src.fedoraproject.org 。src.fedoraproject.org
  76. ^ 「AAC関連特許一覧」 . hydrogenaud.io .
  77. ^ Thom, D.; Purnhagen, H. (1998年10月). 「MPEG Audio FAQ Version 9 – MPEG-4」 . chiariglione.org . MPEG Audio Subgroup. 2010年2月14日時点のオリジナルよりアーカイブ。 2009年10月6日閲覧
  78. ^ 「xHE-AAC商標プログラム」フラウンホーファー集積回路研究所IIS . 2021年2月11日閲覧
  79. ^ 「FraunhoferのxHE-AACオーディオコーデックソフトウェアがAndroid PのネイティブAACサポートを拡張し、低ビットレートでも高品質を実現」フラウンホーファー集積回路研究所IIS 2020年7月11日閲覧
  80. ^ 「ISO/IEC 14496-3:2019」 . ISO . 2022年2月19日閲覧
  81. ^ a b c d Wolters, Martin; Kjorling, Kristofer; Homm, Daniel; Purnhagen, Heiko. A closer look into MPEG-4 High Efficiency AAC (PDF) . p. 3. 2003年12月19日時点のオリジナル(PDF)からのアーカイブ。 2008年7月31日閲覧2003 年 10 月 10 日から 13 日に開催されたオーディオ エンジニアリング協会の第 115 回大会で発表されました。
  82. ^ 「Advanced Audio Coding (MPEG-2), Audio Data Interchange Format」。米国議会図書館/国立デジタル情報基盤保存プログラム。2007年3月7日。 2008年7月30日時点のオリジナルよりアーカイブ。 2008年7月31日閲覧
  83. ^ "FAAC" . AudioCoding.com . 2009年12月11日時点のオリジナルよりアーカイブ。 2009年11月3日閲覧
  84. ^ "FAAD2" . AudioCoding.com . 2009年12月11日時点のオリジナルよりアーカイブ2009年11月3日閲覧。
  85. ^ 「2015年12月5日、ネイティブFFmpeg AACエンコーダが安定しました!」 ffmpeg.org 2016年7月16日時点のオリジナルよりアーカイブ2016年6月26日閲覧。
  86. ^ a b「FFmpeg AACエンコーディングガイド」2016年4月17日時点のオリジナルよりアーカイブ2016年4月11日閲覧。どのエンコーダが最も高品質ですか?…おそらく答えはlibfdk_aacでしょう。
  87. ^ 「Libav Wiki – AACエンコード」2016年4月20日時点のオリジナルよりアーカイブ2016年4月11日閲覧。
  88. ^ 「Nero Platinum 2018 Suite – 受賞歴のあるオールラウンダー」 Nero AG . 2012年12月14日時点のオリジナルよりアーカイブ2018年5月8日閲覧。
  89. ^ 「Statistics – Adob​​e Flash runtimes」 www.adobe.com 2011年10月2日時点のオリジナルよりアーカイブ2018年5月8日閲覧。
  90. ^ 「Adobe、H.264ビデオ対応のFlash Player 9を発表」 Adobeプレスリリース2007年12月4日。2014年8月21日時点のオリジナルよりアーカイブ。 2014年8月20日閲覧
  91. ^ 「Xbox.com | システムの使用 – Xbox 360でApple iPodを使用する」 。2007年4月8日時点のオリジナルよりアーカイブ
  92. ^ ETSI TS 101 154 v1.5.1: MPEGトランスポートストリームに基づく放送アプリケーションにおけるビデオおよびオーディオ符号化の使用に関する仕様
  93. ^ Cohen, Peter (2010年5月27日). 「iTunes StoreがDRMフリーに」 . Macworld . Mac Publishing. 2009年2月18日時点のオリジナルよりアーカイブ2009年2月10日閲覧。
  94. ^ “Apple AAC” . Hydrogenaudio . 2021年11月23日時点のオリジナルよりアーカイブ。 2021年11月22日閲覧
  95. ^ “Gingerbread – Android Developers” . Android Developers . 2017年12月29日時点のオリジナルよりアーカイブ。 2018年5月8日閲覧
  96. ^ 「サポートされているメディア形式 - Android Developers」 . Android Developers . 2012年3月11日時点のオリジナルよりアーカイブ2018年5月8日閲覧。
  97. ^ 「Palm Pre Phone / 特徴、詳細」Palm USA . 2011年5月24日時点のオリジナルよりアーカイブ
  98. ^ “Nintendo – Customer Service – Wii – Photo Channel” . nintendo.com . 2017年5月5日時点のオリジナルよりアーカイブ2018年5月8日閲覧。
  99. ^ 「Google Castでサポートされているメディア」2015年9月23日時点のオリジナルよりアーカイブ2015年9月22日閲覧。| Google Cast でサポートされているメディア