混合励起線形予測(MELP)は、米国国防総省の音声符号化規格であり、主に軍事用途、衛星通信、セキュア音声、セキュア無線機器に使用されています。その標準化とその後の開発は、NSAとNATOが主導し、支援しました。現在の「拡張」版はMELPeと呼ばれています。
最初の MELP は、ジョージア工科大学の信号画像処理センター (CSIP) の大学院生だったアラン・マクリーが 1995 年頃に発明しましたが[ 1 ] 、元の MELP 関連の特許は現在までに期限切れになっています。最初の音声符号化器は 1997 年に標準化され、MIL-STD-3005 として知られていました。 [ 2 ]このボコーダは、米国国防総省の競争において、(a)周波数選択高調波符号化器(FSHC)、(b)高度マルチバンド励振(AMBE)、(c)拡張マルチバンド励振(EMBE)、(d)正弦波変換符号化器(STC)、(e)サブバンド LPC 符号化器(SBC) など、他の候補ボコーダを凌駕しました。[ 3 ]波形補間 (WI) 符号化器よりも複雑度が低いため、MELP ボコーダは国防総省の競争で勝利し、 MIL-STD -3005に選ばれました。[ 4 ]
1998年から2001年にかけて、半分のレート(すなわち1200ビット/秒)で新しいMELPベースのボコーダが作成され、SignalCom(後にMicrosoftが買収)、Compandent、およびAT&T CorporationによりMIL-STD-3005に大幅な機能強化が加えられました。これには、(a)半分のレート(すなわち1200ビット/秒)での新しいボコーダの追加、(b)大幅に改善されたエンコード(分析)、(c)大幅に改善されたデコード(合成)、(d)バックグラウンドノイズを除去するノイズ前処理、(e)2400ビット/秒と1200ビット/秒のビットストリーム間のトランスコーディング、および(f)新しいポストフィルタが含まれます。このかなり重要な開発は、半分のレートで新しいコーダを作成し、古いMELP標準と相互運用できるようにすることを目的としていました。この拡張MELP(MELPeとも呼ばれる)は、2001年に元のMIL-STD-3005の付録および補足として新しいMIL-STD-3005として採用され、従来の2400ビット/秒MELPと同等の品質を半分の速度で実現しました。新しい2400ビット/秒MELPeの最大の利点の一つは、MELPと同じビットフォーマットを共有しているため、従来のMELPシステムと相互運用でき、通信の両端でより優れた品質を実現できることです。MELPeは、特に戦場や車両、航空機などのノイズの多い環境において、従来のすべての軍事規格よりもはるかに優れた品質を提供します。
2002年、広範な競争と試験を経て、2400ビット/秒および1200ビット/秒の米国国防総省MELPeがNATO標準規格として採用され、STANAG -4591として知られるようになりました。[ 5 ] NATOの試験性能測定には、音声明瞭度、音声品質、話者認識、言語依存性、話者依存性、10種類の音響雑音環境、1% BER以下の伝送チャネル、16 kbit/秒CVSDボコーダーを用いたタンデム、ささやき声、リアルタイム実装が含まれていました。試験データには、様々な条件と言語による36,000以上のファイル、つまり500時間以上の音声が含まれていました。新しいNATO標準のためのNATOテストの一環として、MELPeはフランスのHSX(Harmonic Stochastic eXcitation)やトルコのSB-LPC(Split-Band Linear Predictive Coding)などの他の候補、およびFS1015 LPC-10e(2.4 kbit/s)、FS1016 CELP (4.8 kbit/s ) 、 CVSD (16 kbit/s)などの古いセキュア音声標準と比較してテストされました。その後、MELPeはNATOコンペティションでも優勝し、他のすべての候補の品質とすべての古いセキュア音声標準(CVSD、CELP、およびLPC-10e)の品質を上回りました。NATOコンペティションでは、MELPeにより、スループット要件が低減しながら、パフォーマンス(音声品質、明瞭度、ノイズ耐性の点で)が大幅に向上したと結論付けられました。 NATOのテストには相互運用性テストも含まれ、200時間を超える音声データが使用され、世界3か所のテスト機関で実施されました。Compandent Incは、 NSAとNATO向けに実施されたMELPeベースのプロジェクトの一環として、NSAとNATOにMELCODERデバイスと呼ばれる特別なテストベッドプラットフォームを提供しました。このデバイスは、MELPeのリアルタイム実装のゴールデンリファレンスとなりました。Compandent社製の低価格なFLEXI-232データ端末装置(DTE)は、 MELCODERゴールデンリファレンスに基づいており、非常に人気があり、リアルタイム、さまざまなチャネルとネットワーク、および現場条件でのMELPeの評価とテストに広く使用されています。
2005年に、タレスグループ(フランス)による新しい600ビット/秒の速度のMELPeバリエーションが(2400/1200ビット/秒のMELPeで行われたような大規模な競争やテストなしに)NATO標準STANAG-4591に追加されました。[ 6 ]
2010年には、MITリンカーン研究所、コンパンデント、BBN、ジェネラルダイナミクスもDARPA向けに300ビット/秒のMELPデバイスを開発した。[ 7 ]その品質は600ビット/秒のMELPeよりも優れていたが、アルゴリズムの遅延は長かった。
MELPeは、セキュア無線デバイス、衛星通信、VoIP、携帯電話アプリケーションなど、多くのアプリケーションに実装されています。これらのアプリケーションでは、チャネルエラー、パケットロス、同期ロスに対処するための専門知識が求められます。こうした専門知識には、MELPeのビットのエラーに対する感度を理解する必要があります。2400ビット/秒および1200ビット/秒のMELPeには、シリアル通信に役立つ同期ビットが含まれています。
MELPeは音声圧縮を目的としています。8kHzでサンプリングされた音声入力を与えられた場合、MELPeコーデックはプロトコルオーバーヘッドの影響を除いた64kbit/sのμ-Law G.711データストリームで以下の圧縮率を実現します。
| ビットレート | G.711を超える圧縮率 | ペイロードサイズ | ペイロード間隔 |
|---|---|---|---|
| 2400ビット/秒 | 26.7 X | 54ビット | 22.5ミリ秒 |
| 1200ビット/秒 | 53.3 X | 81ビット | 67.5ミリ秒 |
| 600ビット/秒 | 106.7 X | 54ビット | 90ミリ秒 |
一般的に、音声符号化には、ビットレート、音声品質、遅延(フレームサイズと先読み)、計算量、異なる話者や言語への堅牢性、異なる背景雑音への堅牢性、チャネルエラーへの堅牢性、そしてパケット損失時のコーデック状態回復など、様々な側面とのトレードオフが伴います。MELPeの低レート(600および1200ビット/秒)は2400ビット/秒のレートのスーパーセットであるため、アルゴリズムの複雑さ(例えばMIPS単位)はすべてのレートでほぼ同じです。低レートでは、フレームと先読み、そしてコードブックサイズが増加するため、より多くのメモリが必要になります。
MELPe (および/またはその派生製品) は、Texas Instruments (2400 ビット/秒 MELP アルゴリズム/ソース コード)、Microsoft (1200 ビット/秒 トランスコーダ)、Thales Group (600 ビット/秒 レート)、 Compandent 、およびAT&T (ノイズ プリプロセッサ NPP) などの企業からのIPR ライセンスの対象となります。