ゼロ交差率

信号が変化する速度

ゼロ交差率(ZCR)は、信号が正からゼロ、負、または負からゼロ、正へと変化する速度です。 [1]その値は音声認識音楽情報検索の両方で広く使用されており、打楽器音を分類するための重要な特徴量です。[2]

ZCRは正式には次のように定義される。

z c r 1 T 1 t 1 T 1 | s グラム n [ s t ] s グラム n [ s t 1 ] | {\displaystyle zcr={\frac {1}{T-1}}\sum _{t=1}^{T-1}\left|\mathrm {sgn} [s(t)]-\mathrm {sgn} [s(t-1)]\right|}

ここで、 は長さの信号でありは次のように定義される符号関数です。 s {\displaystyle s} T {\displaystyle T} s グラム n × {\displaystyle \mathrm {sgn} (x)}

s グラム n × { 1 × 0 0 × < 0 {\displaystyle \mathrm {sgn} (x)={\begin{cases}1,\quad x\geq 0\\0,\quad x<0\end{cases}}}

場合によっては、隣接する正のゼロ交差のペアの間には負のゼロ交差が 1 つ存在する必要があるため、すべての交差ではなく、「正方向」または「負方向」の交差のみがカウントされます。

モノラルの音色信号の場合、ゼロ交差率は基本的なピッチ検出アルゴリズムとして使用できます。ゼロ交差率は、音声区間に人間の発話が含まれているかどうかを判断する音声区間検出(VAD)にも使用されます。

参照

参考文献

  1. ^ * チェン、CH、「信号処理ハンドブック」、デッカー、ニューヨーク、1988
  2. ^ Gouyon F., Pachet F., Delerue O. (2000), 「打楽器音の分類におけるゼロクロッシングレートの利用について」, COST G-6 デジタルオーディオ効果会議 (DAFX-00 - DAFX-06) 議事録, イタリア、ヴェローナ, 2000年12月7日~9日. 2011年4月26日にアクセス.


「https://en.wikipedia.org/w/index.php?title=Zero-crossing_rate&oldid=1324405925」より取得