フルレート

フル レート( FR ) は、 GSM-FRまたはGSM 06.10 (単にGSMと呼ばれることもある)とも呼ばれ、 GSMデジタル携帯電話システムで使用された最初のデジタル音声符号化規格でした。線形予測符号化(LPC)を使用します。コーデックのビット レートは 13 kbit/s、つまり 1 オーディオ サンプルあたり 1.625 ビットです (多くの場合、33 バイト/20 ms または 13.2 kbit/s にパディングされます)。符号化された音声の品質は現代の基準からするとかなり低いですが、開発当時 (1990 年代初頭) は計算の複雑さと品質のバランスが取れており、1 秒あたり約 100 万回の加算と乗算しか必要としませんでした。このコーデックは今でも世界中のネットワークで広く使用されています。徐々に FR は、より低いビット レートではるかに高い音声品質を提供する拡張フル レート(EFR) およびアダプティブ マルチレート(AMR) 規格に置き換えられるでしょう。

テクノロジー

GSM-FRはETSI 06.10 (ETS 300 961)で規定されており、RPE-LTP ( Regular Pulse Excitation - Long Term Prediction )音声符号化パラダイムに基づいています。他の多くの線形予測符号化(LPC)音声コーデックと同様に、合成フィルタでは線形予測が使用されます。ただし、ほとんどの最新の音声コーデックとは異なり、線形予測の次数は8です。最新の狭帯域音声コーデックでは通常10、広帯域音声コーデックでは通常16です。

音声エンコーダは、8kHzのサンプルレートで13ビットの線形PCMを受け入れます。これは、電話機やコンピュータのA /Dコンバータから直接入力することも、 PSTNからのG.711 8ビット非線形A-lawまたはμ-law PCMをルックアップテーブルを用いて変換することもできます。GSMでは、エンコードされた音声はGSM 05.03で規定されているチャネルエンコーダに渡されます。受信方向では、逆の処理が行われます。

このコーデックは20ミリ秒間隔の160サンプルフレームで動作するため、これはCPUが極めて高速でネットワーク遅延がゼロであっても可能なトランスコーダ遅延の最小値です。動作要件は、トランスコーダ遅延が30ミリ秒未満であることです。トランスコーダ遅延は、160サンプルの音声フレームがエンコーダ入力で受信された瞬間から、対応する160個の再構成音声サンプルが音声デコーダによって8kHzのサンプルレートで出力される瞬間までの時間間隔として定義されます。[ 1 ]

実装

フリーのlibgsmコーデックは、GSMフルレートオーディオのエンコードとデコードが可能です。[ 2 ] [ 3 ]「libgsm」は、1992年から1994年にかけて、当時ベルリン工科大学のユッタ・デゲナーとカーステン・ボルマンによって開発されました。[ 4 ] GSMの音声フレームは32.5バイトであるため、この実装では33バイトのニブルパディングによるGSMフレーム表現も定義されていました(これは、フレームレートが50/sの場合、GSMのビットレートが13.2 kbit/sであるという誤った主張の根拠となっています)。このコーデックはWineにコンパイルしてGSMオーディオをサポートすることもできます。

libgsmをベースにしたraw GSM 06.10用のWinampプラグインもあります。 [ 5 ] [ 6 ]

GSM 06.10 は、EkigaQuteComLinphoneAsterisk (PBX)Ventriloなど のVoIPソフトウェアでも使用されます。

参照

参考文献