音声品質の知覚評価

ITU-T規格

音声品質の知覚的評価PESQ )は、電話システムのユーザーが体感する音声品質を自動評価するための試験方法論を構成する一連の規格群です。2001年にITU-T勧告P.862 [1]として標準化されました。PESQは、電話機メーカー、ネットワーク機器ベンダー、通信事業者による客観的な音声品質試験に用いられています。使用にはライセンスが必要です。PESQの後継規格であるPOLQA(ITU-T勧告P.863 [2] )の初版は2011年に発効しました。

測定範囲

PESQは、電気通信分野で一般的に用いられる主観テスト(例えば、 ITU-T勧告P.800)をモデル化し、人間が知覚する音声品質を評価するために開発されました。そのため、PESQでは実際の音声サンプルをテスト信号として用います。ユーザーが知覚する聴取品質を特徴付けるためには、現代の電気通信機器に音声に似た信号を負荷することが極めて重要です。多くのシステムは音声に最適化されており、音声以外の信号(例えば、トーンやノイズ)に対しては予測できない反応を示す可能性があります。音声テストサンプルの適切な適用に関するガイドラインは、ITU-T勧告P.862.3に含まれるPESQアプリケーションガイドに定義されています。[3]

ITU-Tの完全参照客観音声品質測定法ファミリーは、1997年に勧告ITU-T P.861(PSQM)から始まり、2001年にITU-T P.862(PESQ) [1]に置き換えられました。P.862はその後、勧告ITU-T P.862.1 [4](PESQスコアのMOSスケールへのマッピング)、ITU-T P.862.2 [5](広帯域測定)、ITU-T P.862.3 [3] (アプリケーションガイド)によって補完されました。ITU-T P.863( POLQA[2]の初版は2011年に発効しました。勧告ITU-T P.863のアプリケーションガイドは2019年に承認され、ITU-T P.863.1 [6]として発行されました。

ITU-Tの客観的音声品質測定規格のリストには、上記の完全な参照方法に加えて、ITU-T P.563 [7](参照なしアルゴリズム)も含まれています。

テストの類型

アルゴリズムに提供される情報に応じて、音声品質テスト アルゴリズムは主に次の 2 つのカテゴリに分けられます。

  • 「フルリファレンス」(FR)アルゴリズムは、元のリファレンス信号にアクセスし、比較(すなわち、差分分析)に使用します。リファレンス信号(送話側)の各サンプルを、劣化信号(受話側)の各対応するサンプルと比較することができます。FR測定は最高の精度と再現性を実現しますが、実ネットワークにおける専用テスト(モバイルネットワークベンチマーク用のドライブテストツールなど)にのみ適用できます。
  • 「ノーリファレンス」(NR)アルゴリズムは、品質推定に劣化信号のみを使用し、元の参照信号の情報は持ちません。NRアルゴリズム(例えば、ITU-T勧告P.563 [7])は、参照元の音声特性(男性話者か女性話者か、背景雑音、非音声など)が全く不明であるため、精度の低い推定値しか得られません。NRアルゴリズムの一般的な変種は、デコードされた音声信号を分析せず、IPパケットレベルのデジタルビットストリームを分析するものです。そのため、測定はトランスポートストリームの分析に限定されます。

PESQはフルリファレンスアルゴリズムであり、リファレンス信号とテスト信号の対応する抜粋を時間的にアラインメントした後、音声信号をサンプルごとに分析します。PESQは、ネットワークのエンドツーエンド(E2E)品質評価や、個々のネットワークコンポーネントの特性評価に適用できます。

PESQの結果は、主に1(悪い)から5(優れている)までの尺度で評価される平均意見評点(MOS)をモデル化します。MOS-LQOへのマッピング関数は、ITU-T勧告P.862.1に概説されています。[4]

参照

参考文献

  1. ^ ab 「P.862:音声品質の知覚的評価(PESQ):狭帯域電話ネットワークおよび音声コーデックのエンドツーエンド音声品質評価のための客観的手法」www.itu.int . 2021年4月20日閲覧
  2. ^ ab 「P.863:知覚的客観的聴取品質予測」www.itu.int . 2021年4月11日閲覧
  3. ^ ab 「P.862.3:勧告P.862、P.862.1、およびP.862.2に基づく客観的品質測定のアプリケーションガイド」www.itu.int . 2021年4月20日閲覧
  4. ^ ab 「P.862.1:P.862の生の結果スコアをMOS-LQOに変換するためのマッピング関数」www.itu.int . 2021年4月11日閲覧
  5. ^ 「P.862.2:広帯域電話網および音声コーデックの評価のための勧告P.862の広帯域拡張」www.itu.int . 2021年4月11日閲覧
  6. ^ 「P.863.1 : ITU-T勧告P.863の適用ガイド」www.itu.int . 2021年4月11日閲覧
  7. ^ ab 「P.563:狭帯域電話アプリケーションにおける客観的な音声品質評価のためのシングルエンド法」www.itu.int . 2021年4月11日閲覧
  • Rix, Antony W.; Hollier, Michael P.; Hekstra, Andries P.; Beerends, John G. (2002-10-15). 「音声品質の知覚的評価 (PESQ) エンドツーエンド音声品質評価のための新しいITU規格 パートI - 時間遅延補正」Journal of the Audio Engineering Society 50 (10): 755–764.
  • Beerends, John G.; Hekstra, Andries P.; Rix, Antony W.; Hollier, Michael P. (2002-10-15). 「音声品質の知覚的評価(PESQ)エンドツーエンド音声品質評価のための新しいITU規格 パートII:心理音響モデル」Journal of the Audio Engineering Society 50 ( 10): 765–778.
  • アプリケーションノート 1GA49: R&S UPVオーディオアナライザを用いた心理音響オーディオ品質測定
  • アプリケーションノート 1MA119: R&SCMUgo による GSM の PESQ 測定
  • アプリケーションノート 1MA136: R&SCMUgo による CDMA2000 の PESQ 測定
  • アプリケーションノート 1MA137: R&SCMUgo による WCDMA の PESQ 測定
  • アプリケーションノート 1MA149: WiMAX向けVoIP測定 Archived 2016-12-20 at the Wayback Machine
「https://en.wikipedia.org/w/index.php?title=Perceptual_Evaluation_of_Speech_Quality&oldid=1320904206」より取得