MPEG-4は、デジタル音声・映像データの圧縮、マルチメディアシステム、ファイル保存形式に関する国際標準規格群です。1998年後半にISO/IEC動画専門家グループ(MPEG)(ISO/IEC JTC 1 /SC29/WG11)が正式規格ISO/IEC 14496「音声・映像オブジェクトの符号化」に基づき合意した音声・映像符号化形式および関連技術のグループとして導入されました。MPEG-4の用途には、インターネットビデオやCD配信、音声(電話、テレビ電話)、テレビ放送アプリケーション向けの音声・映像データの圧縮が含まれます。MPEG-4規格は、Touradj Ebrahimi(後のJPEG会長)とFernando Pereiraが率いるグループによって開発されました。[ 1 ]
MPEG-4は、MPEG-1、MPEG-2、その他の関連規格の多くの機能を吸収し、3Dレンダリングのための(拡張) VRMLサポート、オブジェクト指向複合ファイル(オーディオ、ビデオ、VRMLオブジェクトを含む)、外部指定のデジタル著作権管理のサポート、様々なインタラクティブ機能などの新機能を追加しています。AAC (Advanced Audio Coding)は、 MPEG-4が発行される前に、MPEG-2の補助機能として(パート1として)標準化されました。
MPEG-4は現在も発展途上の規格であり、いくつかのパートに分かれています。MPEG-4の互換性を謳う企業は、必ずしもどの「パート」レベルの互換性を指しているかを明確に示していません。特に注目すべきパートは、MPEG-4 Part 2 ( DivX、Xvid、Nero Digital、RealMedia、3ivx、H.263などのコーデックやQuickTime 6で使用されるAdvanced Simple Profileを含む)とMPEG-4 Part 10 ( x264エンコーダ、Nero Digital AVC、QuickTime 7、Flash Video、Blu-ray Discなどの高解像度ビデオメディアで使用されるMPEG-4 AVC/ H.264またはAdvanced Video Coding )です。
MPEG-4に含まれる機能のほとんどは、実装するかどうかの判断が個々の開発者に委ねられています。つまり、MPEG-4規格全体を完全に実装したものは存在しない可能性が高いということです。この問題に対処するため、この規格には「プロファイル」と「レベル」という概念が含まれており、特定の機能セットをアプリケーションのサブセットに適した方法で定義することが可能です。
当初、MPEG-4は主に低ビットレートのビデオ通信を対象としていましたが、後にマルチメディア符号化規格としてその範囲が拡大されました。MPEG-4は、数キロビット/秒から数十メガビット/秒までの様々なビットレートで効率よく動作します。MPEG-4は以下の機能を提供します。
MPEG-4 は、開発者、さまざまなサービスプロバイダー、エンドユーザー向けに一連のテクノロジを提供します。
MPEG-4 形式ではさまざまな機能を実行できますが、その中には次のような機能があります。
MPEG-4は、エンコードのための大規模かつ豊富なツールセットを提供しています。MPEG-4ツールセットのサブセットは、特定のアプリケーションで使用するために提供されています。これらのサブセットは「プロファイル」と呼ばれ、デコーダーが実装する必要があるツールセットのサイズを制限します。[ 3 ]計算の複雑さを制限するために、各プロファイルには1つ以上の「レベル」が設定されています。[ 3 ]プロファイルとレベルの組み合わせにより、以下のことが可能になります。[ 3 ]
MPEG-4 は、「パート」と呼ばれるいくつかの標準で構成されており、次のものが含まれます (各パートは仕様全体の特定の側面をカバーします)。
| 一部 | 番号 | 初版発売日(初版) | 最新の公開日(最終版) | 最新の改正 | タイトル | 説明 |
|---|---|---|---|---|---|---|
| パート1 | ISO/IEC 14496-1 [ 6 ] | 1999 | 2010年[ 7 ] | 2014年[ 8 ] | システム | ビデオとオーディオの同期と多重化を記述する。例えば、MPEG-4ファイルフォーマットバージョン1(MPEG-4 Part 14で定義されたバージョン2に廃止)など。ISO/IEC 14496に準拠したコンテンツの送信および/または保存のためのトランスポートプロトコルスタックの機能は14496-1の範囲外であり、この層へのインターフェース(DMIF)のみが考慮される。MPEG-4コンテンツのトランスポートに関する情報は、例えばMPEG-2トランスポートストリーム、RTPオーディオビデオプロファイルなどで定義されている。[ 9 ] [ 10 ] [ 11 ] [ 12 ] [ 13 ] |
| パート2 | ISO/IEC 14496-2 [ 14 ] | 1999 | 2004年[ 15 ] | 2009 | ビジュアル | 映像データ(動画、静止画テクスチャ、合成画像など)の圧縮形式。Advanced Simple Profile(ASP)やSimple Profile(SP)など、多くのプロファイルが含まれています。 |
| パート3 | ISO/IEC 14496-3 [ 16 ] | 1999 | 2009年[ 17 ] | 2017年[ 18 ] | オーディオ | オーディオ信号の知覚符号化のための圧縮形式のセット。これには、 Advanced Audio Coding (AAC) のいくつかのバリエーション、およびその他のオーディオ/音声符号化形式とツール ( Audio Lossless Coding (ALS)、Scalable Lossless Coding (SLS)、Structured Audio、Text-To-Speech Interface (TTSI)、HVXC、CELPなど) が含まれます。 |
| パート4 | ISO/IEC 14496-4 [ 19 ] | 2000 | 2004年[ 20 ] | 2016 | 適合性テスト | 標準の他の部分への適合性をテストする手順について説明します。 |
| パート5 | ISO/IEC 14496-5 [ 21 ] | 2000 | 2001年[ 22 ] | 2017 | リファレンスソフトウェア | 標準の他の部分を説明および明確にするための 参照ソフトウェアを提供します。 |
| パート6 | ISO/IEC 14496-6 [ 23 ] | 1999 | 2000年[ 24 ] | 配信マルチメディア統合フレームワーク(DMIF) | ||
| パート7 | ISO/IEC TR 14496-7 [ 25 ] | 2002 | 2004年[ 26 ] | オーディオビジュアルオブジェクトのコーディングに最適化されたリファレンスソフトウェア | 改善された実装を行う方法の例を示します (例: パート 5 に関連して)。 | |
| パート8 | ISO/IEC 14496-8 [ 27 ] | 2004 | 2004年[ 28 ] | IPネットワークを介したISO/IEC 14496コンテンツの伝送 | IPネットワーク上でMPEG-4コンテンツを伝送する方法を規定します。また、RTPペイロード形式の設計ガイドライン、 ISO/IEC 14496-1関連情報を伝送するためのSDPの使用規則、 MIMEタイプ定義、RTPセキュリティおよびマルチキャストに関する分析も含まれています。 | |
| パート9 | ISO/IEC TR 14496-9 [ 29 ] | 2004 | 2009年[ 30 ] | 参照ハードウェアの説明 | 標準の他の部分を実装する方法を示すためのハードウェア設計を提供します。 | |
| パート10 | ISO/IEC 14496-10 [ 31 ] | 2003 | 2025 | 高度なビデオコーディング(AVC) | 技術的にはITU-T H.264標準と同一のビデオ信号の圧縮形式。 | |
| パート11 | ISO/IEC 14496-11 [ 32 ] | 2005 | 2015年[ 33 ] | シーン記述とアプリケーションエンジン | 2D版や3D版を含む複数のプロファイルを備えたリッチでインタラクティブなコンテンツに使用できます。MPEG-4 Part 11は、MPEG-4 Part 1 – ISO/IEC 14496-1:2001を改訂したもので、MPEG-4 Part 1に対する2つの修正が含まれています。アプリケーションエンジンのシステムレベルの記述(ダウンロード可能なJavaバイトコードアプリケーションの配信、ライフサイクル、フォーマット、動作)と、シーン用バイナリフォーマット(BIFS)および拡張可能MPEG-4テキスト(XMT)フォーマット( XMLなど を使用したMPEG-4マルチメディアコンテンツのテキスト表現)について説明しています。 [ 33 ](BIFS、XMT、MPEG-Jとも呼ばれます。[ 34 ] MPEG-JはMPEG-4 Part 21で定義されました) | |
| パート12 | ISO/IEC 14496-12 [ 35 ] | 2004 | 2015年[ 36 ] | 2017年[ 37 ] | ISOベースのメディアファイル形式 | 時間ベースのメディアコンテンツを格納するためのファイル形式。これは、他の多くのより具体的なファイル形式(例:3GP、Motion JPEG 2000、MPEG-4 Part 14 )の基盤となる汎用形式です。技術的にはISO/IEC 15444-12( JPEG 2000画像符号化方式 Part 12) と同一です。 |
| パート13 | ISO/IEC 14496-13 [ 38 ] | 2004 | 2004年[ 39 ] | 知的財産管理および保護(IPMP)拡張機能 | MPEG-4 Part 13は、MPEG-4 Part 1(ISO/IEC 14496-1:2001/Amd 3:2004)の改訂版です。共通の知的財産管理および保護(IPMP)処理、ビットストリームにおけるIPMPツールの伝送に関する構文とセマンティクス、IPMP情報の伝送、IPMPツールの相互認証、改訂仕様のサポートに必要な登録機関(CISACなど)のリストなどを規定しています。これは、音楽やビデオなどの著作権で保護されたデジタルコンテンツの保護と配信における異なる保護メカニズム(異なるDRMシステム)の相互運用性の欠如を理由に定義されました。[ 40 ] [ 41 ] [ 42 ] [ 43 ] [ 44 ] [ 45 ] [ 46 ] [ 47 ] [ 48 ] | |
| パート14 | ISO/IEC 14496-14 [ 49 ] | 2003 | 2003年[ 50 ] | 2010年[ 51 ] | MP4ファイル形式 | これは「MPEG-4ファイルフォーマット バージョン2」とも呼ばれます。MPEG-4コンテンツ用のコンテナファイルフォーマットとして指定され、パート12に基づいています。これは、MPEG-4ファイルフォーマットが以前規定されていたISO/IEC 14496-1(MPEG-4 パート1:システム)の条項13を改訂し、完全に置き換えたものです。 |
| パート15 | ISO/IEC 14496-15 [ 52 ] | 2004 | 2022年[ 53 ] | 2023年[ 54 ] | パート15: ISOベースメディアファイル形式でのネットワーク抽象化層(NAL)ユニット構造化ビデオの伝送 | Part 10ビデオの保存用。ファイル形式はPart 12に準拠していますが、他のファイル形式での保存も可能です。 |
| パート16 | ISO/IEC 14496-16 [ 55 ] | 2004 | 2011年[ 56 ] | 2016年[ 57 ] | アニメーション フレームワーク拡張 (AFX) | 3Dグラフィックスコンテンツを表現するMPEG-4 Animation Framework eXtension (AFX)モデルを規定しています。MPEG-4は、ジオメトリ、テクスチャ、アニメーション、および専用の圧縮アルゴリズムを指定するための高レベルの合成オブジェクトによって拡張されています。 |
| パート17 | ISO/IEC 14496-17 [ 58 ] | 2006 | 2006年[ 59 ] | ストリーミングテキスト形式 | タイムドテキスト字幕形式 | |
| パート18 | ISO/IEC 14496-18 [ 60 ] | 2004 | 2004年[ 61 ] | 2014 | フォント圧縮とストリーミング | パート 22 で定義されているオープン フォント形式の場合。 |
| パート19 | ISO/IEC 14496-19 [ 62 ] | 2004 | 2004年[ 63 ] | 合成テクスチャストリーム | 合成テクスチャ ストリームは、非常に低いビットレートの合成ビデオ クリップの作成に使用されます。 | |
| パート20 | ISO/IEC 14496-20 [ 64 ] | 2006 | 2008年[ 65 ] | 2010 | 軽量アプリケーションシーン表現(LASeR)とシンプル集約形式(SAF) | LASeRの要件(圧縮効率、コードとメモリのフットプリント)は、ワールドワイドウェブコンソーシアムによって定義された既存のスケーラブルベクターグラフィックス(SVG)形式を基盤として構築することで満たされます。 [ 66 ] |
| パート21 | ISO/IEC 14496-21 [ 67 ] | 2006 | 2006年[ 68 ] | MPEG-J グラフィックス フレームワーク拡張 (GFX) | 高度なインタラクティブマルチメディアアプリケーションのための軽量なプログラム環境について説明します。これは、MPEG標準Javaアプリケーション環境(MPEG-J)のサブセットとJava APIを組み合わせたフレームワークです。[ 34 ] [ 68 ] [ 69 ] [ 70 ](2005年7月の「FCD」段階、2006年1月のFDIS、2006年11月22日にISO標準として公開)。 | |
| パート22 | ISO/IEC 14496-22 [ 71 ] | 2007 | 2015年[ 72 ] | 2017 | オープンフォントフォーマット | OFFSはOpenTypeバージョン1.4フォントフォーマット仕様に基づいており、技術的にはその仕様と同等である。[ 73 ] [ 74 ] 2005年7月に「CD」段階に達し、2007年にISO標準として発行された。 |
| パート23 | ISO/IEC 14496-23 [ 75 ] | 2008 | 2008年[ 76 ] | 象徴的音楽表現(SMR) | 2006年10月に「FCD」段階に到達し、2008年1月28日にISO規格として発行されました。 | |
| パート24 | ISO/IEC TR 14496-24 [ 77 ] | 2008 | 2025 | オーディオとシステムの相互作用 | MPEG-4 ファイル形式と MPEG-4 オーディオの望ましい共同動作について説明します。 | |
| パート25 | ISO/IEC 14496-25 [ 78 ] | 2009 | 2011年[ 79 ] | 3Dグラフィックス圧縮モデル | MPEG-4 標準で定義された 3D グラフィックス圧縮ツールを他の標準または仕様で定義されたグラフィックス プリミティブに接続するためのモデルを定義します。 | |
| パート26 | ISO/IEC 14496-26 [ 80 ] | 2010 | 2024 | オーディオ適合性 | ||
| パート27 | ISO/IEC 14496-27 [ 81 ] | 2009 | 2009年[ 82 ] | 2015年[ 83 ] | 3Dグラフィックス準拠 | 3Dグラフィックス適合性は、要件を要約し、特性との相互参照を示し、それらへの適合性をテストする方法を定義します。デコーダーの適合性を検証するためのテスト構築に関するガイドラインも示されています。 |
| パート28 | ISO/IEC 14496-28 [ 84 ] | 2012 | 2012年[ 85 ] | 合成フォント表現 | ||
| パート29 | ISO/IEC 14496-29 [ 86 ] | 2014 | 2015 | ウェブビデオコーディング | パート29のテキストは、パート10 - ISO/IEC 14496-10から派生しています。ウェブビデオコーディングは、ISO/IEC 14496-10の制約付きベースラインプロファイルと互換性のある技術です(制約付きベースラインの附属書Aで規定されているサブセットは規範的な仕様であり、残りの部分はすべて参考情報です)。 | |
| パート30 | ISO/IEC 14496-30 [ 87 ] | 2014 | 2018 | 2022 | ISO ベースのメディア ファイル形式でのタイムド テキストおよびその他のビジュアル オーバーレイ | 本仕様は、ISO/IEC 14496-12 - W3C Timed Text Markup Language 1.0、W3C WebVTT (Web Video Text Tracks) に基づくファイルにおける、タイムドテキストおよび字幕ストリームのいくつかの形式の伝送について規定しています。これらの形式の文書化は、タイムドテキストまたは字幕の伝送に関する他の定義を妨げるものではありません。例えば、3GPP Timed Text (3GPP TS 26.245) を参照してください。 |
| パート31 | ISO/IEC 14496-31 [ 88 ] | 開発中(2018年5月) | ブラウザ向けビデオコーディング | ブラウザ向けビデオコーディング(VCB) - ワールドワイドウェブブラウザ内での使用を目的としたビデオ圧縮技術 | ||
| パート32 | ISO/IEC CD 14496-32 [ 89 ] | 2025 | 適合および参照ソフトウェア | |||
| パート33 | ISO/IEC FDIS 14496-33 [ 90 ] | 2019 | インターネットビデオコーディング | |||
| パート34 | ISO/IEC FDIS 14496-34 [ 91 ] | 2025 | 構文記述言語 |
プロファイルは個々の「パーツ」内でも定義されるため、パーツの実装は通常、パーツ全体の実装にはなりません。
MPEG-1、MPEG-2、MPEG-7、MPEG-21は、MPEG 標準の他のスイートです。
MPEG-4には特許技術が含まれており、その使用にはソフトウェアアルゴリズム特許を認めている国でのライセンス取得が必要です。20社以上の企業がMPEG-4の特許を保有していると主張しています。MPEG LA [ 92 ]は、MPEG-4 Part 2 Visualに必要な特許を幅広い企業からライセンス供与を受けており(音声は別途ライセンス供与されています)、そのすべてのライセンサーとライセンシーをサイトに掲載しています。MPEG-4システム特許の新しいライセンスは現在開発中であり[ 93 ]、新しいライセンスは提供されていませんが、古いMPEG-4システムライセンスの所有者は、記載されている特許について、そのライセンスの条件に引き続き適用されます。[ 94 ]
MPEG-4 Visual 形式に使用される特許の大部分は、三菱電機(255 件)、日立(206 件)、パナソニック(200 件) の 3 つの日本企業が保有しています。