帯域幅拡張

信号帯域幅拡張とは、信号に含まれる有意かつ有用な成分、あるいはその効果が現れる周波数範囲(帯域幅)を意図的に拡大するプロセスと定義されます。近年のこの技術の著しい進歩により、小型スピーカーの心理音響的低音増強や、符号化された音声・オーディオの高音増強など、いくつかの分野で商業的に採用されるようになりました。

帯域幅拡張は、音声圧縮アプリケーションとオーディオ圧縮アプリケーションの両方で利用されてきました。G.729.1で使用されるアルゴリズムスペクトル帯域複製(SBR)は、現在使用されている多くの帯域幅拡張アルゴリズムの例のうちの2つです。これらの方法では、スペクトルの低帯域は既存のコーデックを使用してエンコードされ、高帯域はより少ないパラメータを使用して粗くパラメータ化されます。これらの帯域幅拡張アルゴリズムの多くは、抽出された低帯域の特徴からより広い帯域の信号を予測するために、低帯域と高帯域の相関関係を利用します。また、非常に少ないビット数で高帯域をエンコードするアルゴリズムもあります。人間の耳は低帯域に比べて高帯域の歪みに鈍感であるため、多くの場合これで十分です。

小型スピーカーの低音増強

小型スピーカーは、多くの場合、物理的に低周波音を再生することができません。[1]ミッシング・ファンダメンタル(欠落基音)のような心理音響現象を利用することで、低周波の知覚を大幅に高めることができます。低周波の倍音を生成し、低周波そのものを除去することで、これらの周波数が信号内にまだ残っているように聴こえます。この処理は通常、外部機器を介して適用されるか、デジタル信号プロセッサを用いてスピーカーシステムに組み込むことで適用されます。

高域応答は、倍音生成によっても向上させることができます。スピーカーの再生可能領域内の周波数をマッピングするのではなく、スピーカー自体を利用して通常の再生可能領域外の周波数を生成します。高域をブーストし、スピーカーまたはアンプをわずかにオーバードライブすることで、より高次の倍音を生成することができます。

電話システムにおける音声の帯域幅拡張

電話の音声信号は通常、品質が著しく劣化します。この劣化の一部は、電話システムで使用される帯域幅の限界に起因します。ほとんどのシステムでは、250Hz未満の周波数はカットされ、帯域幅は4kHzまたは8kHzまでしか拡張されません。フィルタリングと波形整形を用いることで、低周波数および高周波数の応答を拡張することができます。

最低オクターブのローパスフィルタリングと半波整流により、元の周波数の半分の基本周波数を持つ波形が生成されます。波形には不連続性があるため、すべての倍音を除去するにはローパスフィルタリングが必要です。このようなサブハーモニックシンセサイザーを使用することで、125~250Hzの重要な周波数帯域が再現され、信号に重みが加わります。

高周波帯域幅を拡張するには、ハイパスフィルタリングを用いて最高オクターブを分離し、その高調波を生成することができます。高調波の生成は、計算コストが低く、振幅に依存しない単純な全波整流によって行うことができます。代替として、単側波帯変調を用いることで、高調波の数と振幅を正確に制御できます。理論的には、包絡線推定を用いて元の高周波包絡線を抽出し、ノイズ源を用いて高周波を再生することが可能です。狭い帯域幅で得られる情報はまばらであるため、適切な包絡線を抽出するにはおそらく限界が大きすぎるでしょう。

オーディオの帯域幅拡張

スペクトル帯域複製(SBR)は、MP3やAdvanced Audio Coding (AAC)などの一般的な知覚オーディオコーデックへの「アドオン」として人気を集めている新しい技術です。SBRと従来のオーディオコーダを組み合わせた新しいオーディオコーダ、すなわちMP3ProAAC+が開発されました。これらのアルゴリズムでは、低域スペクトルはMP3またはAACを使用してエンコードされ、高域はSBRを使用してエンコードされます。SBRアルゴリズムの鍵となるのは、信号の高域部分を記述するために使用される情報です。このアルゴリズムの主な設計目標は、エイリアシングアーティファクトを導入することなく高域スペクトルを再構築し、優れたスペクトル分解能と時間分解能を提供することです。分析部では、64バンドの複素値多相フィルタバンクが使用されます。エンコーダでは、このフィルタバンクを使用して、元の入力信号の高域のエネルギーサンプルを取得します。これらのエネルギーサンプルは、デコーダで使用されるエンベロープ調整スキームの参照値として使用されます。

注記

  1. ^ “オーディオ帯域幅拡張 by Erik Larsen & Ronald M. Aarts”.

参考文献

  • RM Aarts、Erik Larsen、O. Ouweltjes (2003)、「低周波および高周波帯域幅拡張への統一アプローチ」、オーディオエンジニアリング協会第115回大会2003年10月10~13日、米国ニューヨークにて発表された大会論文5921
  • V. BerishaとA. Spanias「心理音響基準を用いた広帯域音声回復」EURASIP Journal on Audio, Speech, and Music Processing、2007年
  • V. BerishaとA. Spanias「スケーラブルな帯域幅拡張アルゴリズム」、IEEE国際音響・音声・信号処理会議論文集、2007年第4巻、601~604ページ、2007年4月
  • A. McCree、T. Unno、A. Anandakumar、A. Bernard、および E. Paksoy、「埋め込み型適応型マルチレート広帯域音声符号化器」、Proc. IEEE Int. Conf. Acoust.、Speech Signal Processing、vol. 2、2001 年 5 月、pp. 761–764。
  • P. Jax および P. Vary、「帯域制限音声信号の強化」、アーヘン信号理論シンポジウム議事録、2001 年 9 月、331 ~ 336 ページ。
  • M. Nilsson、W. Kleijn、「電話音声の帯域幅拡張における過剰推定の回避」、Proc. IEEE Int. Conf. Acoust.、Speech Signal Processing、vol. 2、2001 年 5 月、pp. 869–872。
「https://en.wikipedia.org/w/index.php?title=Bandwidth_extension&oldid=1163534860」から取得