音声科学

音声の生成、伝達、知覚の研究

音声科学とは、音声の生成、伝達、知覚に関する研究を指します。音声科学には、解剖学、特に口腔顔面領域の解剖学、神経解剖学、生理学、音響学が含まれます。

音声生成

発声は、約100の口腔顔面筋、喉頭筋、咽頭筋、呼吸筋を伴う非常に複雑な運動タスクです。^[2]^[3]これらの筋肉の正確で迅速なタイミングは、周波数帯域間の遷移がわずか10ミリ秒^[4]で、平均発声速度が1秒あたり約15音という特徴を持つ、時間的に複雑な発声音の生成に不可欠です。発声には、肺からの空気の流れ（呼吸）が喉頭の声帯を通して発声され（発声）、顎、軟口蓋、唇、舌、その他の調音器官によって形成される声帯で共鳴する必要があります（調音）。

呼吸

呼吸は生物とその環境との間のガス交換の物理的プロセスであり、4 つのステップ (換気、分布、灌流、拡散) と 2 つのプロセス (吸気と呼気) が含まれます。呼吸は、容器の容積が増加すると気圧が低下するというボイルの法則の原理に基づいて、肺に出入りする空気の流れの機械的プロセスとして説明できます。この相対的に負圧の高い圧力により、圧力が均等になるまで空気が容器内に入ります。空気を吸い込む間、横隔膜が収縮し、表面張力と負圧によって胸膜に引き寄せられて肺が膨張します。肺が膨張すると、空気圧が大気圧に比べて負圧になり、圧力の高い領域から空気が流れて肺を満たします。発声のための強制吸気では、補助筋を使用して胸郭を挙上し、胸腔を垂直方向と水平方向に拡大します。発声のために強制的に呼気を行う際、体幹と腹部の筋肉が腹部を圧迫したり、胸郭を引き下げて肺から空気を押し出すことで、胸腔のサイズを縮小します。

発声

発声は、声帯を振動させることによって周期的な音波を生成することです。肺からの気流と喉頭筋の収縮によって声帯が動きます。声帯の張力と弾性により、声帯は伸ばされたり、束になったり、閉じたり、離れたりします。発声前段階では、声帯は外転位から内転位へと動きます。声門下圧が高まり、気流が声帯を下方から上方へと押し広げます。気流の量が一定であれば、気流の速度は狭窄部で増加し、分配されると下方の圧力が低下します。この負圧により、最初は声帯が開いていたものが再び閉じます。このサイクルは、発声を抑制するため、または呼吸をするために声帯が外転するまで繰り返されます。

アーティキュレーション

発声の生成における3番目のプロセスである調音では、声帯の振動音が通過する際に、顔面の可動構造と固定構造（調音器官）が口、咽頭、鼻腔（声道）の形状を調整し、さまざまな共鳴周波数を生み出します。

中枢神経制御

脳病変の分析と病変部位と行動障害の相関関係は、長年にわたり、言語生成の基盤となる脳のメカニズムに関する最も重要な知識源であった。^[5]^[6]ポール・ブローカの画期的な病変研究は、言語生成が左下前頭回の機能的完全性に依存していることを示した。^[7]

最近では、機能的磁気共鳴画像法（fMRI）などの非侵襲性神経画像技術の結果から、人間の複雑な能力は主に高度に特殊化した脳領域（例えばブローカ野）に存在しているのではなく、両脳半球の複数の異なる領域を繋ぐネットワークとして構成されているという証拠が増えています。機能的神経画像法は、補足運動野、帯状運動野、一次運動野、基底核、小脳などの皮質および皮質下領域を含む、発話生成の基盤となる複雑な神経ネットワークを特定しました。^[8]^[9]

音声知覚

音声知覚とは、音声の理解を指します。音声理解のプロセスの始まりは、まず話されたメッセージを聞くことです。聴覚系は、外耳から始まる音信号を受信します。音は耳介に入り、外耳道（外耳道）を通り、鼓膜へと続きます。槌骨、砧骨、アブミ骨からなる中耳に入ると、音は機械的エネルギーに変換されます。機械的エネルギーに変換された後、メッセージは内耳の始まりである卵円窓に到達します。内耳に入ると、メッセージは液体で満たされた蝸牛を通過してコルチ器官に送られ、水力エネルギーに変換されます。この器官は再び、音が聴覚伝導路を刺激して脳に到達する神経インパルスに変換されるのを助けます。音は次にヘシュル回で処理され、ウェルニッケ野で意味と関連付けられます。音声知覚の理論には、運動理論と聴覚理論があります。運動理論は、音声は音響信号に暗号化されているのではなく、符号化されているという前提に基づいています。聴覚理論は、聞き手の感覚とフィルタリングのメカニズムを重視し、音声知識は知覚が困難な状況でのみ用いられる、より小さな役割であると示唆しています。

音声の伝達

音声は音波を介して伝達されますが、これは音響学の基本原理に従っています。すべての音の源は振動です。音が存在するためには、音源（振動するもの）と媒体（振動を伝えるもの）が必要です。

音波は振動する物体によって生成されるため、振動する物体は一方向に移動し、正面の空気を圧縮します。振動する物体が反対方向に移動すると、空気の圧力が減少し、空気分子の膨張、つまり希薄化が起こります。1 つの圧縮と 1 つの希薄化が 1 つの縦波を構成します。振動する空気分子は波の進行方向と平行に前後に移動し、発生源に近い隣接分子からエネルギーを受け取り、発生源から遠い隣接分子にエネルギーを渡します。音波には、一般的な 2 つの特性があります。擾乱は、エネルギーが場所から場所へと伝達される何らかの識別可能な媒体にありますが、媒体は 2 か所の間では移動しません。

波の重要な基本特性は、波長、振幅、周期、周波数です。波長は、繰り返される波形の長さです。振幅は媒体の粒子の最大変位であり、波のエネルギーによって決まります。周期（秒単位で測定）は、1つの波が特定の点を通過する時間です。波の周波数は、単位時間あたりに特定の点を通過する波の数です。周波数はヘルツ（hz）（1秒あたりのHzサイクル）で測定され、音の高さとして知覚されます。音波の完全な振動は1サイクルと呼ばれます。音の他の2つの物理的特性は、強度と持続時間です。強度はデシベル（dB）で測定され、音の大きさとして知覚されます。

音には、純音と複音の2種類があります。音叉によって発せられる音は、単一の周波数で鳴る単一の音で構成されているため、純音と呼ばれます。楽器が特定の音色、つまり音色を持つのは、異なる周波数で鳴る多くの異なる音の組み合わせから成り立っているからです。例えば、ピアノで弾く1つの音は、実際にはわずかに異なる周波数で鳴る複数の音の組み合わせから成り立っています。

参照

参考文献

^ abc グレイの人体解剖学、第20版。1918年。
^ Simonyan K, Horwitz B (2011年4月). 「ヒトにおける喉頭運動皮質と発話制御」. Neuroscientist . 17 (2): 197– 208. doi :10.1177/1073858410386727. PMC 3077440. PMID 21362688 .
^ Levelt, Willem JM (1989). 『Speaking : from intent to articulation』ケンブリッジ, マサチューセッツ州: MIT Press. ISBN 978-0-262-12137-8. OCLC 18136175。
^ Fitch RH, Miller S, Tallal P (1997). 「音声知覚の神経生物学」. Annu. Rev. Neurosci . 20 : 331–53 . doi :10.1146/annurev.neuro.20.1.331. PMID 9056717.
^ フーバー P、グートブロード K、オズドバ C、ニルッコ A、レヴブラッド KO、シュロス G (2000 年 1 月)。「【失語症の研究と脳内音声定位】」。Schweiz Med Wochenschr (ドイツ語)。130 (3) : 49–59。PMID 10683880 。
^ Rorden C, Karnath HO (2004年10月). 「ヒト脳損傷を用いた機能推定：fMRI時代における過去の遺物か？」Nat. Rev. Neurosci . 5 (10): 813–9 . doi :10.1038/nrn1521. PMID 15378041.
^ ポール・ブローカ (1861)。「REMARQUES SUR LE SIÉGE DE LA FACULTÉ DU LANGAGE ARTICULÉ、SUIVIES D'UNE OBSERVATION D'APHÉMIE (PERTE DE LA PAROLE)」。解剖学協会紀要。６．ヨーク大学、トロント、オンタリオ州: 330–357 。2013 年12 月 20 日に取得。
^ Riecker A, Mathiak K, Wildgruber D, et al. (2005年2月). 「fMRIは、発話運動制御を支える2つの異なる脳ネットワークを明らかにする」. Neurology . 64 (4): 700–6 . doi :10.1212/01.WNL.0000152156.90779.89. PMID 15728295.
^ Sörös P, Sokoloff LG, Bose A, McIntosh AR, Graham SJ, Stuss DT (2006年8月). 「顕在的発話生成のクラスター化機能MRI」. NeuroImage . 32 (1): 376–87 . doi :10.1016/j.neuroimage.2006.02.046. PMID 16631384.

さらに読む

ベアマン、アリソン (2013). 『音声科学』カリフォルニア州サンディエゴ: プルーラル出版. ISBN 978-1-59756-481-6. OCLC 836744549。
Hickok G, Houde J, Rong F (2011年2月). 「音声処理における感覚運動統合：計算基盤と神経組織」. Neuron . 69 (3): 407–22 . doi :10.1016/j.neuron.2011.01.019. PMC 3057382. PMID 21315253 .

[GA-1] グレイの人体解剖学、第20版。1918年。

[Simonyan_2011-2] Simonyan K, Horwitz B (2011年4月). 「ヒトにおける喉頭運動皮質と発話制御」. Neuroscientist . 17 (2): 197– 208. doi :10.1177/1073858410386727. PMC 3077440. PMID 21362688 .

[Levelt_1989-3] Levelt, Willem JM (1989). 『Speaking : from intent to articulation』ケンブリッジ, マサチューセッツ州: MIT Press. ISBN 978-0-262-12137-8. OCLC 18136175。

[Fitch_1997-4] Fitch RH, Miller S, Tallal P (1997). 「音声知覚の神経生物学」. Annu. Rev. Neurosci . 20 : 331–53 . doi :10.1146/annurev.neuro.20.1.331. PMID 9056717.

[Huber_2000-5] フーバー P、グートブロード K、オズドバ C、ニルッコ A、レヴブラッド KO、シュロス G (2000 年 1 月)。「【失語症の研究と脳内音声定位】」。Schweiz Med Wochenschr (ドイツ語)。130 (3) : 49–59。PMID 10683880 。

[Rorden_2004-6] Rorden C, Karnath HO (2004年10月). 「ヒト脳損傷を用いた機能推定：fMRI時代における過去の遺物か？」Nat. Rev. Neurosci . 5 (10): 813–9 . doi :10.1038/nrn1521. PMID 15378041.

[BROCA-7] ポール・ブローカ (1861)。「REMARQUES SUR LE SIÉGE DE LA FACULTÉ DU LANGAGE ARTICULÉ、SUIVIES D'UNE OBSERVATION D'APHÉMIE (PERTE DE LA PAROLE)」。解剖学協会紀要。６．ヨーク大学、トロント、オンタリオ州: 330–357 。2013 年12 月 20 日に取得。

[Riecker_2005-8] Riecker A, Mathiak K, Wildgruber D, et al. (2005年2月). 「fMRIは、発話運動制御を支える2つの異なる脳ネットワークを明らかにする」. Neurology . 64 (4): 700–6 . doi :10.1212/01.WNL.0000152156.90779.89. PMID 15728295.

[Sörös_2006-9] Sörös P, Sokoloff LG, Bose A, McIntosh AR, Graham SJ, Stuss DT (2006年8月). 「顕在的発話生成のクラスター化機能MRI」. NeuroImage . 32 (1): 376–87 . doi :10.1016/j.neuroimage.2006.02.046. PMID 16631384.