3D音響再構成は、再構成技術を3D音源定位技術に応用したものです。これらの3次元音響再構成手法は、自然環境に適合した音を再現し、音源の空間的な手がかりを提供するために使用されます。また、音場上に3D視覚化を作成し、音波の方向、圧力、強度といった物理的側面を含めるという応用も考えられます。この技術は、エンターテイメント分野では、コンピュータースピーカーを通してライブパフォーマンスを再現するために使用されています。また、軍事分野では、音源の位置を特定するためにも使用されています。音場再構成は、超音波の点を測定するための医療画像診断にも応用できます。[1]
テクニック
3次元音声録音から、力強く自然な響きの音声を再現するために、音像定位と残響再構成技術が用いられます。これらの技術は、音を処理して空間的な手がかりを再現します。
- 音源の位置は、複数のマイクアレイ、両耳聴法、HRTF(頭部伝達関数)を使用した3次元の音源定位によって決定されます。
- 方向を特定した後、他の信号処理技術を用いて時間経過に伴うインパルス応答を測定し、異なる方向における音の強度成分を決定します。両方のデータと音の強度と方向を組み合わせることで、三次元音場が決定され、結果として生じる強度変化を生み出す物理的特性が再構築されます。
この二段階のプロセスの結果、再構成された三次元音場には、音源の定位に関する情報だけでなく、元の信号源の周囲の物理的な側面に関する情報も含まれるようになります。これが、音源定位プロセスの結果との違いです。
音が再構成され、空間的な手がかりが利用可能になったら、それを顧客に届ける必要があります。このセクションでは、そのための様々な方法について説明します。
リスニングルーム

リスニングルーム方式では、リスナーはヘッドホンまたはスピーカーを通して音を聞きます。ヘッドホンは、リスナーが指向性のある3Dサウンドを体験するのに十分な音源を提供します。スピーカーの場合、配置と台数によって再生の奥行きが変わります。スピーカーの位置を選択する方法は様々です。シンプルなモデルは、ITU-R推奨の配置(中央、左30°、左110°、右30°、右110°)で5つのスピーカーを配置したもので構成されます。この配置は、いくつかの3次元音響システムや再生技術で用いられています。[2]また、別の方法として、頭部伝達関数を用いて音源信号の畳み込みを各スピーカーの方向と位置に応じてパンニングすることもできます。これにより、リスニングルーム内の複数の制御点での音響評価を通じて、各スピーカーの信号エネルギーを計算できます。[3]
残響再構成

残響再構成では、4点マイクを用いて音を測定し、異なる場所における実際の伝播遅延を測定します。各マイクは、様々な音源を用いて、様々な時間枠で時間伸張されたパルス信号からのインパルス応答を測定します。得られたデータは、リスニングルーム法と同様に、5スピーカー3次元音響システムに適用されます。システムはまた、マイクで録音された信号からのインパルス応答と頭部伝達関数を畳み込み、音響信号の元の時間枠ごとにエネルギーを調整し、インパルス応答の時間枠に合わせて音に遅延を加えます。畳み込みと遅延は、取得したすべての音源データに適用され、合計されて最終的な信号となります。
この手法は、再構成された音の方向性、自然さ、明瞭さを元の音と比較して向上させます。この手法の欠点は、単一の音源を仮定すること(実際の残響には様々な音が重なり合って存在するにもかかわらず)と、様々な値を加算することで、リスナーの部屋の大きさの知覚、つまり距離感が改善されないことです。[3]
レーザー投影
音波は空気密度の変化を引き起こし、結果として音圧の変化を引き起こします。これらの変化は測定され、トモグラフィー信号処理によって音場が再構成されます。これらの測定は投影法によって行われるため、複数のマイクを用いて個別のインパルス応答を求める必要はありません。これらの投影法は、レーザードップラー振動計を用いてレーザー光路上の媒質の屈折率を測定します。[1]これらの測定値はトモグラフィー再構成法によって処理され、三次元音場が再現されます。その後、畳み込み逆投影法によって可視化されます。
近接場音響ホログラフィー
近接場音響ホログラフィーでは、媒質内の二次元領域(この二次元音場は三次元音場の断面)における光の屈折を測定し、ホログラムを作成します。次に、水温の解析から媒質の波数を推定します。複数の二次元音場を計算し、三次元音場を再構成することもできます。
この方法は主に超音波や低音圧の音に適用され、水中や医療画像診断によく用いられます。この方法は、媒質の波数が一定であるという仮定に基づいています。媒質全体で波数が変化する場合は、この方法では三次元音場を正確に再現できません。[4]
参照
参考文献
- ^ 及川、後藤、池田、滝沢、山崎 (2005). 「レーザー投影からの再構成に基づく音場測定」. Proceedings. (ICASSP '05). IEEE International Conference on Acoustics, Speech, and Signal Processing, 2005. Vol. 4. pp. iv/661–iv/664. doi :10.1109/ICASSP.2005.1416095. ISBN 978-0-7803-8874-1. S2CID 15044296。
- ^ Kim, Jee, Park, Yoon, Choi (2004). 「DSPを用いた3Dサウンドシステムのリアルタイム実装」IEEE 60th Vehicular Technology Conference, 2004. VTC2004-Fall. 2004 . 第7巻. pp. 4798– 480. doi :10.1109/VETECF.2004.1405005. ISBN 978-0-7803-8521-4. S2CID 9906064。
- ^ ab Tanno; Saiji; Huang (2013). 「残響再構成法を用いた新しい5スピーカー3Dサウンドシステム」2013 International Joint Conference on Awareness Science and Technology & Ubi-Media Computing (ICAST 2013 & UMEDIA 2013) . pp. 174– 179. doi :10.1109/ICAwST.2013.6765429. ISBN 978-1-4799-2364-9. S2CID 11582154。
- ^ 大渕; 水谷; 若月; 西宮; 増山 (2009). 「光コンピュータ断層撮影法と近接場音響ホログラフィーを用いた2次元音場からの3次元音場再構成」.応用物理学会誌. 48 (7): 07. Bibcode :2009JaJAP..48gGC03O. doi :10.1143/JJAP.48.07GC03. S2CID 119815337.