アダプティブマルチレート音声コーデック

音声符号化に最適化された音声圧縮形式
アダプティブ・マルチレート(AMR)
ファイル名拡張子
.amr、.3ga
インターネットメディアタイプ
audio/amr、audio/3gpp、audio/3gpp2
初回リリース1999年6月23日[1] [2] ( 1999-06-23 )
最新リリース
14.0.0
2017年3月17日; 8年前 ( 2017-03-17 )
フォーマットの種類非可逆 オーディオ
オープンフォーマットはい
フリーフォーマットいいえ

アダプティブマルチレートAMRAMR-NB、またはGSM-AMRオーディオコーデックは、音声符号化に最適化されたオーディオ圧縮フォーマットです。AMRは、狭帯域(200~3400 Hz)信号を4.75~12.2 kbit/sの可変ビットレートで符号化するマルチレート狭帯域音声コーデックであり、 7.4 kbit/sから通話品質[3]の音声を実現します。 [4]

AMRは1999年10月に3GPPによって標準音声コーデックとして採用され、現在ではGSM [5]およびUMTSで広く使用されています。リンクアダプテーションを使用して、リンク状態に基づいて8つの異なるビットレートから1つを選択します

AMRは、AMRコーデックを使用して音声を保存するためのファイル形式です。多くの最新の携帯電話端末は、短い音声録音をAMR形式で保存できます。AMRは音声形式であるため、他の音声には理想的な結果が得られない可能性がありますが、この形式と他の形式を変換するための無料プログラムとプロプライエタリプログラムの両方が存在します(ソフトウェアサポートを参照)。一般的なファイル名拡張子は.aaです.amr。また、ランダムアクセスやビデオとの同期など、より高度なストレージ形式を要求するアプリケーションに適した、AMRの別のストレージ形式も存在します。この形式は、ISOベースのメディアファイル形式に基づく3GPP仕様の3GP コンテナ形式です。 [6]

使用法

フレームには160個のサンプルが含まれ、長さは20ミリ秒です。[1] AMRは、 ACELPDTXVADCNGなどのさまざまな技術を使用します。AMRを使用するには、ローカル無線チャネルと容量要件を満たす最適なコーデックモードを選択する最適化されたリンク適応が必要です。無線状態が悪い場合は、ソースコーディングが削減され、チャネルコーディングが増加します。これにより、音声の明瞭度は多少犠牲になりますが、ネットワーク接続の品質と堅牢性が向上します。AMRの場合、この改善は使用可能な通信の場合、S/N比が4~6dB程度です。新しいインテリジェントシステムにより、ネットワーク事業者は基地局ごとに容量または品質を優先できます。

AMRコーデックには合計14のモードがあり、8つはフルレートチャネル(FR)で、6つはハーフレートチャネル(HR)で使用できます。

モード ビットレート(kbit/s) チャネル 互換性
AMR_12.20 12.20 FR ETSI GSM拡張フルレート
AMR_10.20 10.20 FR
AMR_7.95 7.95 FR/HR
AMR_7.40 7.40 FR/HR TIA/EIA IS-641 TDMA拡張フルレート
AMR_6.70 6.70 FR/HR ARIB 6.7 kbit/s拡張フルレート
AMR_5.90 5.90 FR/HR
AMR_5.15 5.15 FR/HR
AMR_4.75 4.75 FR/HR
AMR_SID 1.80 FR/HR

機能

  • サンプリング周波数8 kHz/13ビット(20 msフレームで160サンプル)、200~3400 Hzにフィルタリング
  • AMRコーデックは、ビットレートが12.2、10.2、7.95、7.40、6.70、5.90、5.15、4.75 kbit/sの8つのソースコーデックを使用します。
  • AMR FRビットレートが4.75、5.15、5.90、6.70、7.40、7.95、10.2、12.2 kbit/sの場合、それぞれ95、103、118、134、148、159、204、244ビットのフレーム長を生成します。AMR HRフレーム長は異なります。
  • AMRは、音声区間検出(VAD)とコンフォートノイズ生成(CNG)を備えた不連続送信(DTX)を利用して、無音期間中の帯域幅使用量を削減します
  • アルゴリズムの遅延はフレームあたり20ミリ秒です。ビットレート12.2の場合、「アルゴリズム」の先読み遅延はありません。その他のレートの場合、先読み遅延は5ミリ秒です。他のレートとのフレーム単位のシームレスなモード切り替えを可能にするために、5ミリ秒の「ダミー」先読み遅延があることに注意してください。
  • AMRはハイブリッド音声符号化器であり、音声パラメータと波形信号の両方を送信します。
  • アルゴリズムの複雑さは、 G.711を1、G.729aを15とする相対尺度で5と評価されます
  • 理想的な条件下でのPSQMテストでは、AMR(12.2 kbit/s)の平均オピニオンスコアは4.14であるのに対し、 G.711(μ-law)は4.45でした[要出典]
  • ネットワークストレス下でのPSQMテストでは、AMR(12.2 kbit/s)の平均オピニオンスコアは3.79であるのに対し、G.711(μ-law)は4.13でした

ライセンスと特許の問題

AMRコーデックには、NokiaEricssonNTT、VoiceAgeの複数の特許が組み込まれています[7] [8] 。VoiceAgeはAMR特許プールのライセンス管理者です。VoiceAgeは、これらの規格への必須性を判断するための特許の提出も受け付けています[9] [10]

プロフェッショナルコンテンツ作成ツールと「リアルタイムチャンネル」製品の初期費用は6,500米ドルです。[いつ? ]最低年間ロイヤリティは10,000米ドルで、初年度は初期費用は含まれません。チャンネルごとのライセンス料は、販売量に応じて0.99ドルから0.50ドルに下がり、年間最大200万ドルとなります。[7] [8]

メディアプレーヤーなどのパーソナルコンピュータ製品のカテゴリでは、AMRデコーダーは無料でライセンスされます。販売されたエンコーダーのライセンス料は、販売量に応じて0.40ドルから0.30ドルに下がり、年間最大30万ドルとなります。パーソナルコンピュータ製品のカテゴリに該当し、無料のデコーダーのみを使用するライセンス製品には、最低年間ロイヤリティは適用されません。[7] [8]

詳細情報:

  • VoiceAgeのライセンス情報(AMRコーデックのライセンス価格を含む)
  • 3GPPの法的問題
  • 3G特許プラットフォームとそのライセンスポリシー
  • AMRコーデックを共有ライブラリとしてアーカイブ(Wayback Machineに2021年4月11日にアーカイブ)—リファレンス実装に基づくamrnbおよびamrwbライブラリの使用に関する法的通知

ソフトウェアサポート

  • 3GPP TS 26.073 – AMR音声コーデック(Cソースコード)–リファレンス実装[11]
  • Audacity(ベータ版1.3)(FFmpeg統合ライブラリ[12]経由 、入力形式と出力形式の両方)
  • OpenCORE AMRライブラリを使用したFFmpeg [13]
  • Android [14]音声レコーダーに使用
  • AMRコーデックを共有ライブラリとしてアーカイブ( Wayback Machine  、amrnbおよびamrwbライブラリ開発サイト)2021年4月11日。これらのライブラリはリファレンス実装に基づいており、特許取得済みの可能性のあるソースコードが多くのオープンソースプロジェクトに埋め込まれるのを防ぐために作成されました。
  • .amr形式を変換するオープンソースソフトウェア:RetroCode、Amr2Wav。どちらも開発初期段階です
  • AMR PlayerはAMRオーディオファイルを再生できるフリーウェアで、AMRとMP3/WAVオーディオ形式間の変換が可能です。
  • Nokia Multimedia Converter 2.0はサンプルの変換(作成)が可能で、Nokiaの変換ツールを使用して.amrファイルと.awbファイルの両方を作成できます。セットアップをXP互換モードで実行すれば、Windows 7でも動作します。
  • MPlayerSMPlayerKMPlayer [15]
  • Parole Media Player 0.8.1(Ubuntu 16.04)
  • QuickTime Playerおよびマルチメディアフレームワーク
  • RealPlayerバージョン11以降
  • VLCメディアプレーヤーバージョン1.1.0以降(入力形式のみ、出力形式は不可)
  • ffdshow
  • Apple iPhone(AMRファイルを再生可能)
  • iOSおよびmacOS(iMessage)
  • BlackBerryスマートフォン(ボイスレコーダーのファイル形式に使用されますが、BlackBerry 10はAMR形式を再生できません)
  • K-Liteコーデックパック
  • Media Player Classic Home Cinema、1.7.1頃
  • foobar2000 (コンポーネントfoo_input_amr搭載)

参照

参考文献

  1. ^ ab "3GPP TS 26.090 - 必須音声コーデック音声処理機能;アダプティブ・マルチレート(AMR)音声コーデック;トランスコーディング機能". 3GPP . 2010年7月21日閲覧
  2. ^ 「3GPP TS 26.071 - 必須音声コーデック音声処理機能;AMR音声コーデック;概要」3GPP 2010年7月21日閲覧。
  3. ^ 「トールクオリティ音声とは?」ITworld。2000年12月13日。 2019年7月26日閲覧
  4. ^ RFC 4867 - アダプティブマルチレート(AMR)およびアダプティブマルチレートワイドバンド(AMR-WB)オーディオコーデックのRTPペイロードフォーマットおよびファイルストレージフォーマット 35ページ
  5. ^ 「GSMコーデックの整理:チュートリアル」2003年7月11日
  6. ^ RFC 4867 - アダプティブマルチレート(AMR)およびアダプティブマルチレートワイドバンド(AMR-WB)オーディオコーデックのRTPペイロードフォーマットおよびファイルストレージフォーマット 35ページ
  7. ^ abc VoiceAge Corporation (2007-10-14). 「AMRライセンス規約」. VoiceAge Corporation. 2007-10-14時点のオリジナルよりアーカイブ。2009-09-12閲覧
  8. ^ abc VoiceAge Corporation (2007年6月). 「AMRライセンス規約」. VoiceAge Corporation. 2007-10-14時点のオリジナルよりアーカイブ。2009-09-12閲覧
  9. ^ VoiceAge Corporation. ライセンス - 特許コール」. VoiceAge Corporation. 2007-10-14時点のオリジナルよりアーカイブ。2009-09-12閲覧
  10. ^ VoiceAge Corporation (2007-10-14). 「ライセンス - 特許コール」。2007-10-14にオリジナルからアーカイブ。2009-09-12閲覧
  11. ^ 3GPP (2008-12-11) 3GPP TS 26.073 - AMR音声コーデック、2009-09-08に閲覧
  12. ^ 2010-02-28閲覧
  13. ^ FFmpeg 一般ドキュメント - AMR外部ライブラリ、2009-07-08に閲覧
  14. ^ Android AMRコーデック、2009-07-08に閲覧。2009年2月18日に Wayback Machineにアーカイブ
  15. ^ KMPlayer 内部オーディオデコーダー設定 2014年10月22日Wayback Machineにアーカイブ、2014年10月22日取得
  • 3GPP TS 26.090 – 必須音声コーデックの音声処理機能;適応型マルチレート(AMR)音声コーデック;トランスコーディング機能
  • 3GPP TS 26.071 – 必須音声コーデックの音声処理機能;AMR音声コーデック;概要
  • 3GPPコーデック仕様; 3G以降 / GSM、26シリーズ
  • RFC 4867 – 適応型マルチレート(AMR)および適応型マルチレート広帯域(AMR-WB)オーディオコーデックのRTPペイロード形式およびファイル保存形式
  • RFC 4281 – 「バケット」メディアタイプのコーデックパラメータ
「https://en.wikipedia.org/w/index.php?title=Adaptive_Multi-Rate_audio_codec&oldid=1306124989」より取得