神経符号化(または神経表現)とは、刺激とそれに対応するニューロン応答との関係、およびニューロン集団内のネットワーク間のシグナル伝達関係を指す。[ 1 ] [ 2 ]生物学的神経ネットワークにおいて主要な情報伝達媒体として機能する活動電位は、刺激の種類やニューロンの種類に関わらず、一般的に均一である。無差別加算過程を要素とする情報符号化の方法論としての活動電位の単純さは、シナプス前終末でニューロンが示す指定能力、ならびに脳全体にわたる統合が知性、意識、複雑な社会的相互作用、推論、動機付けなどの複雑な派生にとって基礎となる、複雑なニューロン処理と領域特化の幅広い能力とは無関係であると見なされている。したがって、観察されたパターンとの関係において活動電位シーケンスの符号化メカニズムを記述する理論的枠組みは、神経科学的理解の基礎となると見なされている。[ 3 ]
ニューロンは、身体の細胞には珍しく、活動電位と呼ばれる特徴的な電気パルス(軸索を伝わる電圧スパイク)を発生させることで、信号を長距離に高速で伝播させる能力を持っている。感覚ニューロンは、光、音、味、嗅覚、触覚などの外部感覚刺激があると、様々な時間パターンで活動電位のシーケンスを発火させることで活動を変化させる。刺激に関する情報は、この活動電位のパターンにエンコードされ、脳内および脳周囲に伝達される。さらに、網膜のニューロンなどの特殊なニューロンは、段階的電位を通じてより多くの情報を伝達することができる。段階的電位は、刺激の強さに関する情報がニューロンの出力の強さと直接相関している点で、活動電位と異なる。段階的電位では信号がはるかに速く減衰するため、ニューロン間の距離が短く、ニューロン密度が高いことが必要となる。段階的電位の利点は、スパイクニューロンよりも情報レートが高く、より多くの状態(つまり、より高い忠実度)をエンコードできることである。[ 4 ]
活動電位は、持続時間、振幅および形状が多少変化し得るが、神経符号化の研究では、通常、同一の定型的な事象として扱われる。活動電位の短い持続時間(約 1 ミリ秒)を無視すれば、活動電位シーケンスまたはスパイク列は、時間における一連の全またはゼロの点事象として単純に特徴付けることができる。[ 5 ]スパイク列における 2 つの連続するスパイク間のスパイク間隔 ( ISI )の長さは、しばしば変化し、一見ランダムである。 [ 6 ]神経符号化の研究では、光や音の強度などの刺激属性、または腕の動きの方向などの運動動作が、ニューロンの活動電位またはスパイクによってどのように表されるかを測定し、特徴付けることが含まれる。ニューロンの発火を記述および分析するために、統計的手法および確率論と確率点過程の方法が広く適用されてきた。
大規模な神経記録および解読技術の開発により、研究者は神経コードの解読を開始し、記憶形成の中心として知られる脳領域である海馬で記憶が形成され想起される際のリアルタイムの神経コードを初めて垣間見せています。[ 7 ] [ 8 ] [ 9 ]神経科学者はいくつかの大規模な脳解読プロジェクトを開始しています。[ 10 ] [ 11 ]
刺激と反応のつながりは、2つの相反する観点から研究することができます。神経エンコーディングとは、刺激から反応へのマップを指します。主な焦点は、ニューロンが様々な刺激にどのように反応するかを理解し、他の刺激への反応を予測するモデルを構築することです。神経デコーディングとは、反応から刺激への逆のマップを指し、刺激が引き起こすスパイクシーケンスから、刺激、あるいはその刺激の特定の側面を再構築することが課題となります。[ 12 ]
スパイクのシーケンス、つまり「列」には、異なる符号化方式に基づく情報が含まれる場合があります。一部のニューロンでは、シナプス後結合細胞の応答強度は、「発火率」(単位時間あたりの平均スパイク数、いわゆる「レートコード」)のみに依存する場合があります。一方、複雑な「時間コード」は、個々のスパイクの正確なタイミングに基づいています。これらのコードは、視覚[ 13 ] や聴覚系などの外部刺激に同期している場合もあれば、神経回路によって内在的に生成される場合もあります。[ 14 ]
ニューロンが速度符号化を使用するか時間符号化を使用するかは、これらの用語の意味を明確に定義していないにもかかわらず、神経科学コミュニティ内で激しい議論の的となっている。[ 15 ]
ニューロン発火コミュニケーションのレートコーディングモデルは、刺激の強度が増加すると、活動電位(スパイク発火) の頻度またはレートが増加すると述べている。レートコーディングは周波数コーディングと呼ばれることもある。
レートコーディングは、刺激に関する情報のほとんど、あるいはすべてがニューロンの発火率に含まれていると仮定する、伝統的なコーディング方式である。与えられた刺激によって生成される活動電位のシーケンスは試行ごとに変化するため、ニューロンの応答は通常、統計的または確率的に扱われる。それらは特定のスパイクシーケンスとしてではなく、発火率によって特徴付けられる。ほとんどの感覚システムでは、発火率は刺激強度の増加に伴って、一般的に非線形に増加する。[ 16 ]レートコーディングの仮定の下では、スパイク列の時間構造に符号化されている可能性のある情報はすべて無視される。したがって、レートコーディングは非効率的であるが、ISI「ノイズ」に対しては非常に堅牢である。[ 6 ]
レートコーディングにおいては、発火率を正確に計算することが非常に重要です。実際、「発火率」という用語にはいくつかの異なる定義があり、それぞれ異なる平均化手法を指します。例えば、時間経過による平均(単一ニューロンのスパイクカウントとしての発火率)や、実験を複数回繰り返した平均(PSTHの発火率)などが挙げられます。
レートコーディングでは、学習は活動に依存したシナプス重みの変更に基づいています。
レートコーディングは、1926年にエドガー・エイドリアンとイングヴェ・ゾッターマンによって初めて示されました[ 17 ]。この単純な実験では、筋肉に異なる重りが吊るされました。刺激の重さが増加すると、筋肉を支配する感覚神経から記録されるスパイクの数も増加しました。これらの最初の実験から、エイドリアンとゾッターマンは、活動電位は単位事象であり、個々の事象の大きさではなく、事象の頻度がほとんどのニューロン間コミュニケーションの基礎であると結論付けました。
その後数十年にわたり、発火率の測定は、実験的に発火率を測定することが比較的容易であったこともあり、あらゆる種類の感覚ニューロンや皮質ニューロンの特性を記述するための標準的なツールとなりました。しかしながら、このアプローチでは、スパイクの正確なタイミングに含まれる可能性のあるすべての情報が無視されています。近年、時間平均に基づく単純な発火率の概念は、脳活動を記述するにはあまりにも単純すぎる可能性があることを示唆する実験的証拠が増えています。[ 6 ]
スパイクカウント率は、時間平均とも呼ばれ、試行中に出現するスパイクの数を数え、試行時間で割ることで得られます。[ 15 ]時間ウィンドウの長さTは実験者によって設定され、刺激から記録されるニューロンの種類と刺激へのニューロンの種類によって異なります。実際には、適切な平均値を得るには、時間ウィンドウ内に複数のスパイクが発生する必要があります。典型的な値はT = 100 msまたはT = 500 msですが、持続時間はこれより長くても短くても構いません(教科書『スパイキングニューロンモデル』第1.5章[ 15 ])。
スパイクカウント率は1回の試行で測定できますが、その代償として、試行中の神経反応の変化に関する時間分解能は完全に失われます。時間平均化は、刺激が一定または緩やかに変化し、生物の素早い反応を必要としない場合に有効です。これは実験プロトコルでよく見られる状況です。しかし、現実世界の入力は静止しているわけではなく、多くの場合、速い時間スケールで変化しています。例えば、人間は静止画像を見ているときでも、サッカードと呼ばれる視線の急速な変化を行います。そのため、網膜光受容体に投影される画像は数百ミリ秒ごとに変化します([ 15 ]の第1.5章)。
欠点はあるものの、スパイクカウントレートコードの概念は、実験だけでなくニューラルネットワークのモデルでも広く用いられています。この概念は、ニューロンが単一の入力変数(刺激強度)に関する情報を単一の連続的な出力変数(発火率)に変換するという考えにつながりました。
少なくともプルキンエ細胞では、情報は発火だけでなく、発火していない静止期間のタイミングと継続時間にも符号化されているという証拠が増えています。 [ 18 ] [ 19 ]また、網膜細胞からは、情報は発火率だけでなくスパイクのタイミングでも符号化されているという証拠もあります。[ 20 ]より一般的には、生物の迅速な反応が求められるときはいつでも、数百ミリ秒にわたるスパイクカウントとして定義される発火率は単に遅すぎます。[ 15 ]
時間依存発火率は、時刻 t と t+Δt の間の短い間隔に現れるスパイクの平均数(試行全体の平均)を間隔の長さで割ったものとして定義されます。[ 15 ]これは、定常刺激にも時間依存刺激にも機能します。時間依存発火率を実験的に測定するには、実験者は何らかの入力シーケンスで刺激を与えながらニューロンから記録します。同じ刺激シーケンスを数回繰り返し、ニューロンの応答が刺激周辺時間ヒストグラム(PSTH) で報告されます。時間 t は、刺激シーケンスの開始を基準にして測定されます。Δt は、間隔内に十分な数のスパイクがあり、信頼性の高い平均値の推定値を取得できるように十分に大きくなければなりません (通常、1 ミリ秒または数ミリ秒の範囲)。実験の全繰り返しにおけるスパイク発生回数n K (t;t+Δt)の合計を繰り返し回数Kで割ったものが、時刻tとt+Δtの間のニューロンの典型的な活動の尺度となる。さらに間隔Δtで割ると、ニューロンの時間依存発火率r(t)が得られ、これはPSTHのスパイク密度に相当する([ 15 ]の第1.5章)。
Δtが十分に小さい場合、r(t)Δtは、複数回の試行における時刻tとt+Δtの間に発生するスパイクの平均数です。Δtが小さい場合、どの試行においても、tとt+Δtの間の区間内にスパイクが1つしか発生しません。つまり、r(t)Δtは、これらの時刻の間にスパイクが発生した試行の割合でもあります。同様に、r(t)Δtは、この時間区間にスパイクが発生する 確率です。
実験手順として、時間依存発火率測定は、特に時間依存的な刺激の場合に、ニューロン活動を評価する有用な方法である。このアプローチの明らかな問題は、脳内のニューロンが用いる符号化方式とは異なる可能性があることである。ニューロンは、刺激が全く同じ方法で繰り返し提示されるまで、反応を生成することができない。[ 15 ]
しかしながら、同じ刺激を受ける独立したニューロンの大きな集団が存在する場合、実験的な時間依存発火率測定は意味をなすことがあります。N個のニューロン集団を1回の実行で記録するよりも、1個のニューロンから記録し、N回の繰り返し実行で平均化する方が実験的には容易です。したがって、時間依存発火率コーディングは、ニューロン集団が常に存在するという暗黙の仮定に基づいています。
正確なスパイクタイミングや高頻度の発火率変動が情報を伝達していることが判明した場合、神経コードは時間コードとして識別されることが多い。[ 15 ] [ 21 ]多くの研究で、神経コードの時間分解能はミリ秒単位であることがわかっており、正確なスパイクタイミングが神経コーディングにおいて重要な要素であることがわかる。[ 3 ] [ 22 ] [ 20 ]このようなスパイク間の時間を介して通信するコードは、インターパルス間隔コードとも呼ばれ、最近の研究によって裏付けられている。[ 23 ]
ニューロンは発火率の高頻度変動を示し、これはノイズとなる場合もあれば、情報を伝達する場合もある。発火率符号化モデルはこれらの不規則性がノイズであると示唆する一方、時間符号化モデルはこれらが情報を符号化していると示唆する。もし神経系が情報伝達に発火率符号化のみを使用していたとしたら、より一貫性のある規則的な発火率の方が進化的に有利であり、ニューロンは他の堅牢性の低い選択肢よりもこの符号化を利用したであろう。[ 24 ]時間符号化は「ノイズ」の別の説明を提供し、それが実際には情報を符号化し、神経処理に影響を与えることを示唆している。この考えをモデル化するために、スパイクを2進数記号でマークすることができる。スパイクは1、スパイクなしは0である。時間符号化により、平均発火率はどちらのシーケンスでも同じで、10msあたり6スパイクであるにもかかわらず、シーケンス000111000111は001100110011とは異なる意味を持つことができる。[ 25 ]
最近まで、科学者たちはシナプス後電位パターンの説明として、レートエンコーディングに最も重点を置いてきました。しかし、脳の機能は、レートエンコーディングのみでは説明できないほど時間的に正確です。[ 20 ]言い換えれば、レートコードがスパイク列の利用可能なすべての情報を捉えることができないため、重要な情報が失われる可能性があります。さらに、類似した(しかし同一ではない)刺激間でも反応は大きく異なるため、異なるスパイクパターンには、レートコードに収められるよりも多くの情報が含まれていると考えられます。[ 26 ]
時間コード(スパイクコードとも呼ばれる[ 15 ])は、発火率では説明できないスパイク活動の特徴を使用します。たとえば、刺激開始後の最初のスパイクまでの時間、背景振動に関する発火位相、 ISI確率分布の2次および高次の統計モーメントに基づく特性、スパイクのランダム性、または正確にタイミングが合ったスパイクのグループ(時間パターン)は、時間コードの候補です。[ 27 ]神経系には絶対的な時間基準が存在しないため、情報は、ニューロン集団内のスパイクの相対的なタイミング(時間パターン)または進行中の脳の振動(発火位相)のいずれかで伝達されます。[ 3 ] [ 6 ]神経振動がある場合に時間コードをデコードする1つの方法は、振動サイクルの特定の位相で発生するスパイクがシナプス後ニューロンの脱分極により効果的であるというものです。[ 28 ]
刺激によって引き起こされるスパイク列や発火率の時間的構造は、刺激のダイナミクスと神経符号化プロセスの性質の両方によって決まります。急速に変化する刺激は、どのような神経符号化戦略が用いられているかにかかわらず、正確にタイミングを合わせたスパイク[ 29 ](およびPSTHにおける急速に変化する発火率)を生成する傾向があります。狭義の時間的符号化とは、刺激のダイナミクスのみから生じるのではなく、刺激の特性と関連する応答の時間的精度を指します。刺激と符号化ダイナミクスの相互作用により、時間的コードの識別は困難です。
時間的コーディングでは、学習は活動依存的なシナプス遅延の修正によって説明できる。[ 30 ]この修正自体はスパイクレート(レートコーディング)だけでなく、スパイクタイミングパターン(時間的コーディング)にも依存する。つまり、スパイクタイミング依存可塑性の特殊なケースである可能性がある。[ 31 ]
時間的符号化の問題は、独立スパイク符号化の問題とは別個かつ独立しています。各スパイクが列内の他のすべてのスパイクから独立している場合、神経コードの時間的特徴は、時間依存の発火率r(t)の挙動によって決定されます。r(t)が時間とともにゆっくりと変化するコードは、通常、レートコードと呼ばれ、急速に変化するコードは時間的コードと呼ばれます。
非常に短い刺激の場合、ニューロンの最大発火率は、1回以上のスパイクを生成するには十分ではない可能性があります。この1回のスパイクに含まれる短縮された刺激に関する情報の密度を考えると、スパイクのタイミング自体が、一定時間内の活動電位の平均頻度以上の情報を伝える必要があると考えられます。このモデルは、脳内でミリ秒オーダーで発生する音源定位において特に重要です。脳は、比較的短い神経応答に基づいて大量の情報を取得する必要があります。さらに、1秒あたり10スパイク程度の低い発火率と、異なる刺激に対する任意に近い発火率のコーディングを区別する必要がある場合、これら2つの刺激を区別しようとするニューロンは、十分な情報を蓄積するために1秒以上待つ必要があるかもしれません。これは、ミリ秒オーダーの時間枠で刺激を区別できる多くの生物とは一致せず、レートコードが唯一のモデルではないことを示唆しています。[ 25 ]
視覚刺激の高速符号化を説明するため、網膜ニューロンは刺激開始から最初の活動電位までの潜時(最初のスパイクまでの潜時または最初のスパイクまでの時間とも呼ばれる)に視覚情報を符号化することが示唆されている。[ 32 ]この種の時間符号化は、聴覚系および体性感覚系でも示されている。このような符号化方式の主な欠点は、内因性のニューロン変動に敏感なことである。[ 33 ]マカクザルの一次視覚野では、刺激開始に対する最初のスパイクのタイミングが、スパイク間の間隔よりも多くの情報を提供することがわかった。しかし、スパイク間隔は追加情報を符号化するために使用でき、これは特に高コントラストの状況のようにスパイク率が限界に達したときに重要になる。このため、時間符号化は、緩やかな遷移ではなく、明確なエッジの符号化において役割を果たす可能性がある。[ 34 ]
哺乳類の味覚系は、刺激がかなり明瞭で、生物の反応が容易に識別できるため、時間的符号化の研究に有用である。[ 35 ]時間的に符号化された情報は、スパイク数で非常に類似した反応を引き起こす同じカテゴリー(甘味、苦味、酸味、塩味、うま味)の異なる味物質を生物が区別するのに役立つ可能性がある。各味物質によって誘発されるパターンの時間的要素は、その味物質の同一性を決定するために使用できる(例えば、キニーネとデナトニウムのような2つの苦味物質の違い)。このように、味覚系では速度符号化と時間符号化の両方が使用される可能性がある。速度は基本的な味物質の種類を、時間はより具体的な区別に使用できる。[ 36 ]
哺乳類の味覚系の研究では、ニューロン集団全体にわたる時間的パターンに豊富な情報が存在することが示されているが、この情報はレートコーディングスキームによって決定される情報とは異なる。ニューロン群は刺激に反応して同期することがある。霊長類の脳の前頭皮質に関する研究では、わずか数ミリ秒という短い時間スケールの正確なパターンが、特定の情報処理行動と相関するニューロンの小さな集団全体にわたって発見された。しかし、これらのパターンから得られる情報はほとんどなく、脳内で行われている高次処理を表しているという説が有力である。[ 26 ]
視覚系と同様に、マウスの嗅球にある僧帽細胞/房状細胞では、嗅ぎ行動の開始に対する最初のスパイク潜時が、匂いに関する情報の多くを符号化しているようである。スパイク潜時を利用するこの戦略により、匂い物質の迅速な識別と反応が可能になる。さらに、僧帽細胞/房状細胞の中には、特定の匂い物質に対して特異的な発火パターンを示すものがある。この種の追加情報は特定の匂いを認識するのに役立つ可能性があるが、必ずしも必要というわけではない。なぜなら、動物が嗅ぎ行動を行っている間の平均スパイク数も、匂い物質を識別する上で優れた指標となるからである。[ 37 ]同様に、ウサギの嗅覚系を用いた実験では、異なる匂い物質のサブセットと相関する明確なパターンが示され、イナゴの嗅覚系を用いた実験でも同様の結果が得られた。[ 25 ]
時間的コーディングの特異性を理解するには、有益で信頼性の高い実験データを測定する高度に洗練された技術が必要です。オプトジェネティクスの進歩により、神経科医は個々のニューロンにおけるスパイクを制御できるようになり、電気的および空間的な単一細胞分解能を実現しました。例えば、青色光は光依存性イオンチャネルであるチャネルロドプシンを開かせ、細胞を脱分極させてスパイクを発生させます。細胞が青色光を感知しなくなると、チャネルは閉じ、ニューロンはスパイクを停止します。スパイクのパターンは青色光刺激のパターンと一致します。チャネルロドプシン遺伝子配列をマウスのDNAに挿入することで、研究者はスパイクを制御し、マウスの特定の行動(例えば、マウスを左に曲がらせるなど)を制御することができます。[ 38 ]研究者はオプトジェネティクスを通じて、平均発火率を維持しながらニューロンに異なる時間的コーディングを与えるツールを手に入れ、特定の神経回路で時間的コーディングが発生するかどうかを検証することができます。[ 39 ]
光遺伝学技術は、いくつかの神経学的および心理学的疾患の根本原因であるスパイク異常の修正を可能にする可能性も秘めている。[ 39 ]ニューロンが個々のスパイクタイミングパターンに情報をエンコードしている場合、平均発火率のみに注目してコードを解読しようとすると、重要な信号を見逃す可能性がある。[ 25 ]神経コードの時間的にエンコードされた側面を理解し、これらのシーケンスをニューロンで複製することで、 うつ病、統合失調症、パーキンソン病などの神経疾患の制御と治療を向上させることができる。単一細胞のスパイク間隔を制御することで、静脈内に薬物を投与するよりも正確に脳活動を制御できる。[ 38 ]
発火位相コードは、スパイクカウントコードと振動に基づく時間基準を組み合わせた神経符号化方式である。このタイプのコードは、低周波数[ 40 ]または高周波数[ 41 ]における局所的な進行中の振動の位相に基づく時間基準に従って、各スパイクの時間ラベルを考慮する。
一部の皮質感覚領域のニューロンは、スパイク数だけでなく、進行中のネットワーク振動変動の位相に対するスパイク時刻という観点から、豊かな自然刺激を符号化することが示されている。[ 40 ] [ 42 ]局所場電位信号は集団(ネットワーク)振動を反映する。発火位相コードは、スパイクに用いられる時間ラベル(すなわちネットワーク振動位相)が低解像度(粗粒度)の時間基準であるにもかかわらず、しばしば時間コードに分類される。その結果、この種のコードに含まれる低周波の振動位相に関するすべての情報量を表すには、位相の離散値4つだけで十分であることが多い。発火位相コードは、海馬の場所細胞で観察される位相歳差運動現象に大まかに基づいている。このコードのもう一つの特徴は、ニューロンが感覚ニューロン群間の好ましいスパイク順序に従い、その結果として発火順序が決まることである。[ 43 ]
視覚皮質における位相コードは、高周波振動も伴うことが示されている[ 43 ]。ガンマ振動の周期内において、各ニューロンはそれぞれ好ましい相対発火時間を持つ。その結果、ニューロン集団全体は最大約15ミリ秒の持続時間を持つ発火系列を生成する。[ 43 ]
ポピュレーションコーディングは、多数のニューロンの共同活動を用いて刺激を表現する手法である。ポピュレーションコーディングでは、各ニューロンは入力の集合に対する応答分布を持ち、多数のニューロンの応答を組み合わせることで、入力に関する何らかの値を決定することができる。理論的な観点から見ると、ポピュレーションコーディングは神経科学において数学的に明確に定式化された数少ない問題の一つである。これは神経コーディングの本質的な特徴を捉えながらも、理論的分析には十分に単純である。[ 44 ]実験的研究により、このコーディングパラダイムは脳の感覚野と運動野で広く用いられていることが明らかになっている。
例えば、内側側頭葉(MT)視覚野では、ニューロンは物体の動きの方向に同調しています。[ 45 ]物体が特定の方向に移動すると、MT領域の多くのニューロンが、ノイズに汚染されたベル型の活動パターンで集団全体に発火します。物体の移動方向は、ニューロン集団の活動から取得されるため、単一のニューロンの信号に存在する変動の影響を受けません。サルにジョイスティックを点灯した標的に向かって動かすように訓練すると、単一のニューロンが複数の標的方向に対して発火します。しかし、ある方向に対しては最も速く発火し、標的がニューロンの「好みの」方向にどれだけ近かったかに応じて、発火速度は遅くなります。[ 46 ] [ 47 ]各ニューロンがそれぞれの好みの方向への動きを表し、すべてのニューロンのベクトル和を計算すると(各ニューロンには発火率と好みの方向があります)、その和は動きの方向を指します。このように、ニューロン集団は動きの信号を符号化します。この特定の集団コードは、集団ベクトル符号化と呼ばれます。
平均局所同期応答(ALSR)コードと呼ばれる場所-時間集団コードは、聴覚音響刺激の神経表現のために導出されました。これは、聴神経内の場所またはチューニングと、各聴神経線維内の位相ロックの両方を利用します。最初のALSR表現は定常母音用でした。[ 48 ]複雑な非定常刺激のピッチとフォルマント周波数のALSR表現は、後に有声音高に対して実証され、[ 49 ]子音母音節のフォルマント表現も実証されました。[ 50 ] このような表現の利点は、ピッチやフォルマントの遷移プロファイルなどのグローバル特徴を、速度と場所の両方のコーディングを介して同時に神経全体のグローバル特徴として表現できることです。
集団符号化には、ニューロンの変動による不確実性の低減や、複数の異なる刺激属性を同時に表現できるなど、他にも多くの利点があります。また、集団符号化はレート符号化よりもはるかに高速であり、刺激条件の変化をほぼ瞬時に反映することができます。[ 51 ]このような集団内の個々のニューロンは通常、異なるが重複する選択性を持っているため、必ずしもすべてのニューロンが特定の刺激に反応するとは限りませんが、多くのニューロンが反応します。
典型的には、符号化関数はピーク値を持ち、知覚値がピーク値に近い場合にニューロンの活動が最大となり、ピーク値から遠い値ではそれに応じて活動が減少する。したがって、ニューロン群全体の活動パターンから実際の知覚値を再構成することができる。ベクトル符号化は単純平均化の一例である。このような再構成を実行するためのより洗練された数学的手法は、ニューロン応答の多変量分布に基づく最大尤度法である。これらのモデルは、独立性、二次相関、[ 52 ]、あるいは高次最大エントロピーモデル[ 53 ]やコピュラ[ 54 ] などのより詳細な依存関係を仮定することができる。
ニューロン発火の相関符号化モデルは、スパイク列内の活動電位(「スパイク」)間の相関が、スパイクの単純なタイミングを超えた追加情報を伝達する可能性があると主張している。初期の研究では、スパイク列間の相関は、刺激特徴に関する2つのスパイク列に存在する相互情報量の総量を減少させることはあっても、増加させることは決してないと示唆されていた。 [ 55 ]しかし、これは後に誤りであることが証明された。相関構造は、ノイズと信号の相関が逆符号である場合、情報量を増加させる可能性がある。[ 56 ]相関は、2対のニューロンの平均発火率には存在しない情報も伝達する可能性がある。その好例は、ペントバルビタール麻酔下のマーモセット聴覚皮質であり、純音は2対のニューロンの相関スパイク数を増加させるが、平均発火率は増加させない。[ 57 ]
神経発火の独立スパイク符号化モデルは、個々の活動電位、つまり「スパイク」はスパイク列内の他のスパイクとは独立していると主張している。[ 21 ] [ 58 ]

典型的な集団コードは、刺激強度に対して平均値が直線的に変化するガウス分布の同調曲線を持つニューロンから構成されます。つまり、ニューロンは平均値に近い刺激に対して(1秒あたりのスパイク数で)最も強く反応します。実際の刺激強度は、最も強い反応を示すニューロンの平均値に対応する刺激レベルとして復元できます。しかし、神経応答に内在するノイズのため、最尤推定関数の方がより正確です。

このタイプのコードは、関節の位置、目の位置、色、音の周波数などの連続変数を符号化するために使用されます。個々のニューロンはノイズが多すぎて、レートコーディングを使用して変数を忠実に符号化することはできませんが、集団全体で符号化することで、より高い忠実度と精度が保証されます。単峰性のチューニング曲線、つまりピークが1つだけの集団の場合、精度は通常、ニューロン数に比例して増加します。したがって、精度が半分であれば、必要なニューロンの数は半分になります。対照的に、空間を表すグリッドセルのように、チューニング曲線に複数のピークがある場合、集団の精度はニューロン数に比例して増加します。これにより、同じ精度に必要なニューロン数が大幅に削減されます。[ 59 ]
次元削減と位相データ解析により、集団コードは低次元多様体[ 60 ](アトラクターとも呼ばれる)に制限されていることが明らかになった。神経多様体上の位置は、リング構造を形成する前背側視床核の頭方向ニューロン[ 61 ] 、トーラスの表面に沿った嗅内皮質の空間位置をコードするグリッド細胞[ 62 ]、手の動き[ 63 ] や準備活動 [ 64 ]をコードする運動皮質ニューロンなど、特定の行動条件と相関している。低次元多様体は、視覚皮質の眼球閉鎖[ 65 ]、腹側呼吸柱の呼吸行動など、状態依存的に変化することが知られている。[ 66 ]
スパース符号化とは、各項目が比較的少数のニューロンの強い活性化によって符号化される符号化方式です。符号化される各項目は、利用可能なニューロンの異なるサブセットです。センサースパース符号化とは対照的に、センサーデンス符号化では、考えられるセンサーの位置からのすべての情報が既知であることを意味します。
結果として、スパース性は時間的スパース性(「比較的少数の時間期間がアクティブである」)に焦点を当てることも、活性化されたニューロン集団におけるスパース性に焦点を当てることもできる。後者の場合、これはある時間期間における、集団内のニューロン総数に対する活性化ニューロン数の比率として定義することができる。これは、従来のコンピュータと比較して、情報がニューロン全体に大規模に分散されているため、ニューラルコンピューティングの特徴であると思われる。自然画像のスパース符号化は、視覚皮質の単純細胞の受容野に似たウェーブレットのような方向性フィルタを生成する。 [ 67 ]スパース符号の容量は、イナゴの嗅覚系に見られるように、時間的符号化を同時に使用することで増加する可能性がある。[ 68 ]
潜在的に大規模な入力パターン集合が与えられた場合、スパース符号化アルゴリズム(例:スパースオートエンコーダ)は、適切な割合で組み合わせることで元の入力パターンを再現する少数の代表的なパターンを自動的に見つけようとします。入力に対するスパース符号化は、これらの代表的なパターンで構成されます。例えば、膨大な数の英語の文は、特定の順序で組み合わせられた少数の記号(文字、数字、句読点、スペースなど)によって符号化できるため、英語のスパース符号化はこれらの記号になります。
スパース符号化のほとんどのモデルは線形生成モデルに基づいています。[ 69 ]このモデルでは、シンボルは線形に結合され、入力を近似します。
より正式には、k次元の実数入力ベクトルの集合が与えられたとき、スパース符号化の目的は、ニューロン受容野に対応するn個のk次元基底ベクトルと、各入力ベクトルの重みまたは係数のスパースn次元ベクトルを決定し、係数によって与えられた割合で基底ベクトルを線形結合すると、入力ベクトルに近い近似値が得られるようにすることである。[ 70 ]
線形生成モデルを実装するアルゴリズムによって生成される符号化は、ソフトスパース性を持つ符号化とハードスパース性を持つ符号化に分類できる。[ 69 ]これらは、典型的な入力に対する基底ベクトル係数の分布を指す。ソフトスパース性を持つ符号化は滑らかな ガウス分布に似ているが、ガウス分布よりも尖っており、ゼロ値が多く、絶対値が小さいものがいくつかあり、絶対値が大きいものがより少なく、絶対値が非常に大きいものがほとんどない。したがって、基底ベクトルの多くはアクティブである。一方、ハードスパース性は、ゼロ値が多く、絶対値が小さいものが全くないかほとんどなく、絶対値が大きいものがより少なく、絶対値が非常にほとんどないことを示しており、したがって、アクティブな基底ベクトルは少ない。これは代謝の観点から魅力的である。ニューロンの発火数が少ないほど、エネルギー消費量が少なくなるからである。[ 69 ]
符号化のもう一つの尺度は、それが臨界完全か過剰完全かである。基底ベクトルの数nが入力セットの次元kに等しい場合、符号化は臨界完全であると言われる。この場合、入力ベクトルの滑らかな変化が係数の急激な変化をもたらし、符号化は入力の小さなスケーリング、小さな移動、またはノイズを適切に処理することができない。しかし、基底ベクトルの数が入力セットの次元より大きい場合、符号化は過剰完全である。過剰完全な符号化は入力ベクトル間を滑らかに補間し、入力ノイズに対して堅牢である。[ 71 ]人間の一次視覚野は500倍過剰完全であると推定されており、例えば14×14の入力パッチ(196次元空間)は約10万個のニューロンによって符号化される。[ 69 ]
他のモデルは、多次元データの「最も一致する」投影を見つけるスパース近似アルゴリズムであるマッチング追求と、入力データのスパース行列表現を基本要素の線形結合の形で、またそれらの基本要素自体を見つけることを目的とした表現学習法である辞書学習に基づいています。 [ 72 ] [ 73 ] [ 74 ]
スパースコーディングは、記憶容量を増強するための神経システムの一般的な戦略であると考えられる。環境に適応するために、動物はどの刺激が報酬または罰と関連しているかを学習し、これらの強化刺激を類似しているが無関係な刺激と区別する必要がある。このような課題には、刺激特異的な連想記憶の実装が必要となる。この連想記憶では、集団内の少数のニューロンのみが特定の刺激に反応し、各ニューロンはあらゆる刺激のうち少数の刺激にのみ反応する。
疎分散記憶に関する理論的研究では、スパース符号化は表現間の重複を減らすことで連想記憶の容量を増やすことが示唆されている。[ 75 ]実験的には、感覚情報のスパース表現は、視覚、[ 76 ]聴覚、[ 77 ]触覚、[ 78 ]嗅覚[ 79 ]など多くのシステムで観察されている。しかし、スパース符号化の広範な証拠が蓄積され、その重要性に関する理論的議論があるにもかかわらず、スパース符号化が連想記憶の刺激特異性を改善するという実証を得ることは困難であった。
ショウジョウバエの嗅覚系では、キノコ体のケニオン細胞によるスパースな匂いコーディングが、匂い特異的な記憶を保存するための、正確にアドレス指定可能な多数の場所を生成すると考えられている。[ 80 ]スパース性は、ケニオン細胞とGABA作動性前側方対側(APL)ニューロン間の負のフィードバック回路によって制御されている。このフィードバック回路の各脚を系統的に活性化および遮断すると、ケニオン細胞がAPLニューロンを活性化し、APLニューロンがケニオン細胞を抑制することが示された。ケニオン細胞-APLフィードバックループを破壊すると、ケニオン細胞の匂い応答のスパース性が低下し、匂い間の相関が高まり、ハエが類似の匂いを識別できるように学習するのを阻害するが、異なる匂いは識別できないように学習するのを阻害することはない。これらの結果は、フィードバック阻害がケニオン細胞の活動を抑制し、スパースで相関のない匂いコーディングを維持し、ひいては記憶の匂い特異性を維持することを示唆している。[ 81 ]
{{cite web}}: CS1 maint: 複数の名前: 著者リスト (リンク)