スペクトルモデリング合成

スペクトルモデリング合成( Roads 1996、p. 153に基づく)

スペクトルモデリング合成SMS)は、音声やその他の信号のための音響モデリング手法です。SMSでは、音を倍音成分とノイズ成分の組み合わせとして扱います。倍音成分は、信号の周波数スペクトルのピークに基づいて識別され、通常は短時間フーリエ変換によって求められます。スペクトル成分を除去した後に残る信号(残差と呼ばれることもあります)は、時間可変フィルタを通過したホワイトノイズとしてモデル化されます。このモデルの出力は、検出された倍音成分の周波数とレベル、および時間可変フィルタの 係数です。

直感的に言えば、このモデルは多くの種類の音声信号に適用できます。例えば、音声信号には、声帯の振動によって生じるゆっくりと変化する倍音と、唇や口によって生じる広帯域のノイズのような音が含まれます。楽器もまた、音符を打ったり変化させたりする際に、倍音成分と打楽器のようなノイズのような音の両方を含む音を生成します。

参照

参考文献