古典的条件付け(レスポンデント条件付け、パブロフ条件付けとも呼ばれる)は、生物学的に強力な刺激(例:食物、目に吹きかける空気)と中立的な刺激(例:ミュージカルトライアングルの音)を組み合わせる行動手順である。古典的条件付けという用語は、特定の刺激と組み合わせられた自動的な条件反応のプロセスを指す。[ 1 ]これは本質的に信号に相当する。
ロシアの生理学者イワン・パブロフは、犬を用いた詳細な実験で古典的条件付けを研究し、1897年にその実験結果を発表しました。消化の研究において、パブロフは実験犬に赤身の肉を与えると唾液が分泌されることを観察しました。[ 2 ]パブロフの条件付けは、強化または罰によって自発行動の強度を修正するオペラント条件付け(道具的条件付け)とは異なります。しかし、古典的条件付けはオペラント条件付けに影響を及ぼす可能性があり、古典的条件付けされた刺激はオペラント反応を強化する可能性があります。
古典的条件付けは基本的な行動メカニズムであり、その神経基盤は今や解明され始めている。古典的条件付けを他の形態の連合学習(例えば、道具的学習や人間の連想記憶)と区別することは時に難しいが、多くの観察結果、特に学習が起こる随伴性によって両者は区別されている。[ 3 ]
オペラント条件付けと共に、古典的条件付けは行動主義心理学の基礎となりました。行動主義は20世紀半ばに支配的な心理学の一派であり、現在でも心理療法の実践や動物行動学に重要な影響を与えています。古典的条件付けは他の分野にも応用されています。例えば、向精神薬に対する身体の反応、空腹感の調節、学習と記憶の神経基盤の研究、そして偽りの合意効果などの特定の社会現象にも影響を及ぼす可能性があります。[ 4 ]
古典的条件付けは、条件刺激(CS)と無条件刺激(US)が対になったときに生じる。通常、条件刺激は中立刺激(例:音叉の音)、無条件刺激は生物学的に強力な刺激(例:食物の味)であり、無条件刺激に対する無条件反応(UR)は生得的な反射反応(例:唾液分泌)である。この対合が繰り返されると、条件刺激が単独で提示された際に、生物は条件刺激に対して条件反応(CR)を示すようになる(条件反応は1回のみの対合後に生じる場合もある)。したがって、URとは異なり、CRは経験を通じて獲得され、URよりも永続的ではない。[ 5 ]
通常、条件反応は無条件反応と類似していますが、時には全く異なることもあります。こうした理由から、多くの学習理論家は、条件刺激が無条件刺激をシグナルまたは予測するようになり、そのシグナルの結果を分析するようになると主張しています。[ 6 ]ロバート・A・レスコラは、1988年の論文「パブロフの条件付け:それはあなたが考えているものではない」の中で、この考え方の変化とその意味を明確に要約しています。[ 7 ]レスコラの理論は広く受け入れられていますが、欠点もあります。[ 8 ]
偶然による古典的条件付け(無条件刺激が条件刺激の有無にかかわらず発生する確率が同じ場合)に伴う偽陽性は、反応の条件付けを成功させる上で起こりにくいことが証明されている。偶発性の要素はさらに検証され、「条件付けの分析においていかなる有用性も失った」と言われている。[ 9 ]
古典的条件付けはオペラント条件付けや道具的条件付けとは異なります。古典的条件付けでは、前述のように刺激の関連付けによって行動が修正されるのに対し、オペラント条件付けでは、行動はそれが生み出す効果(報酬や罰など)によって修正されます。[ 10 ]
評価的条件付けは古典的条件付けの一種で、条件刺激を無条件刺激と組み合わせることで、条件刺激に対する反応が変化するという点で共通しています。古典的条件付けはあらゆる種類の反応の変化を指すのに対し、評価的条件付けは条件刺激に対する評価反応の変化、つまり条件刺激の好ましさの変化のみに関係します。[ 11 ]:391 評価的条件付けは、ある刺激と別の正または負の刺激との組み合わせによって生じる刺激の関連性の変化と定義されます。最初の刺激は条件刺激、2 番目の刺激は無条件刺激と呼ばれることがよくあります。条件刺激は、正の無条件刺激と組み合わせるとより正になり、負の無条件刺激と組み合わせるとより負になります。[ 11 ] : 391 評価的条件付けとは、ある物体が他の物体と単に共起することによる、その物体に対する態度の形成または変化を指す。[ 12 ] : 205
条件付けによる態度形成の典型的な例は、1958 年に Staats と Staats によって行われた実験である。[ 13 ]被験者は最初に視覚的に提示された単語のリストを覚えるように求められ、リストの学習能力がテストされた。次に、口頭で提示された単語のリストで同じことを行った。これらはすべて、被験者の視覚と聴覚の両方のチャネルで同時に学習する能力の評価として表現された実験の重要な段階の準備であった。この段階では、被験者は視覚的に一連の国籍名、具体的にはオランダ語とスウェーデン語にさらされた。国籍がスクリーンに表示されてから約 1 秒後に、実験者は単語を声に出して読み上げた。これらの後者の単語のほとんどは中立的な単語 (例: chair、with、twelve) で、繰り返されることはなかった。ただし、いくつかの肯定的な単語 (例: gift、sacred、happy) といくつかの否定的な単語 (例: bitter、ugly、failure) も含まれていた。これらの単語は、2つの条件刺激である国籍と体系的に対になって提示され、一方は常に肯定的な単語と、もう一方は否定的な単語と対になって提示された。こうして、条件付け試験は、視覚的に提示された国籍名と口頭で提示された単語の流れの中に埋め込まれた。条件付け段階が完了すると、被験者はまず視覚的に提示された単語を想起し、次にそれらの単語に対する感情が学習に影響を与えた可能性があると判断し、それらの単語を評価するよう求められた。条件付けは成功した。より肯定的な無条件刺激と対になった国籍は、否定的な無条件刺激と対になった国籍よりも、より快適であると評価された。[ 12 ] : 205–206

古典的条件付けに関する最も有名かつ徹底的な初期の研究はイワン・パブロフによるものですが、エドウィン・トゥイットマイヤーはそれより1年前にいくつかの関連研究結果を発表していました。[ 14 ]パブロフは犬の消化生理学に関する研究の中で、動物の消化プロセスを長期間にわたって研究できる手法を開発しました。彼は動物の消化液を体外に排出し、そこで測定できるようにしました。
パブロフは、自分の犬が単に餌があるだけで唾液を分泌するのではなく、普段餌を与えている技術者の存在によって唾液を分泌し始めることに気づきました。パブロフは、犬の予期的唾液分泌を「精神的分泌」と呼びました。これらの非公式な観察結果を実験的に検証するため、パブロフは刺激(例えばメトロノームの音)を与えてから犬に餌を与えました。数回繰り返すと、犬は刺激に反応して唾液を分泌し始めました。パブロフは、犬に餌を与えた際に犬の周囲に特定の刺激が存在する場合、その刺激が餌と関連付けられ、それ自体で唾液分泌を引き起こす可能性があると結論付けました。
パブロフの実験では、無条件刺激(US)は食物でした。その効果は過去の経験に依存しなかったからです。メトロノームの音は、犬の唾液分泌を誘発しないため、もともと中立刺激(NS)でした。条件付け後、メトロノームの音は条件刺激(CS)または条件付き刺激になります。なぜなら、その効果は食物との関連性に依存するからです。[ 15 ]同様に、犬の反応も同様に条件刺激と無条件刺激の配置に従います。条件反応(CR)は条件刺激に対する反応であり、無条件反応(UR)は無条件刺激に対応します。
パブロフは条件付けに関する多くの基本的な事実を報告した。例えば、彼はCSとUSの出現の間隔が比較的短いときに学習が最も速く起こることを発見した。[ 16 ]
前述のように、条件反応は無条件反応の複製であるとよく考えられていますが、パブロフはCSによって生成される唾液の組成がUSによって生成される唾液とは異なることに注目しました。実際、CRとは、CSとUSの条件関係を持つ経験に明確に結び付けられる、以前は中立であったCSに対する新しい反応のことです。[ 7 ] [ 10 ]また、条件付けが出現するには繰り返しの組み合わせが必要であると考えられていましたが、多くのCRは、特に恐怖条件付けと味覚嫌悪学習において、1回の試行で学習できます。

学習は順方向条件付けにおいて最も速い。順方向条件付けでは、CSの開始がUSの開始に先行し、USがそれに続くことを知らせる。[ 17 ] [ 18 ] : 69 順方向条件付けの一般的な形態は、遅延条件付けとトレース条件付けである。

同時条件付けでは、CSとUSが同時に提示され、同時に終了します。例えば、ベルの音を聞くと同時に目に空気を吹き込まれた人が、このような組み合わせを繰り返した結果、空気の吹き込みがないにもかかわらずベルの音を聞くと瞬きするようになった場合、同時条件付けが行われたことが示されます。
二次的あるいは高次の条件付けは、2段階の手順を踏む。まず、中立刺激(「CS1」)が順方向条件付けを通してUS(認知的反応)を刺激する。次に、2つ目の中立刺激(「CS2」)が最初の刺激(CS1)と対になり、それ自身の条件付け反応を引き起こす。[ 18 ] : 66 例えば、ベルが唾液分泌を誘発するまで、ベルと食べ物を対にして刺激を与えるとしよう。次に、光をベルと対にすると、光も唾液分泌を誘発するようになる。ベルがCS1で、食べ物がUSである。光はCS1と対になるとCS2になる。
後方条件付けは、CSがUSの直後に現れる場合に起こる。[ 17 ] CSがUSに先行する通常の条件付け手順とは異なり、CSに対する条件付け反応は抑制的になる傾向がある。これはおそらく、CSがUSがこれから現れるという合図ではなく、USが終了したという合図として機能するためであると考えられる。[ 18 ]例えば、人の目に空気を吹き付けた後にブザーが鳴ることがある。
時間的条件付けでは、USは一定の間隔、例えば10分ごとに提示されます。CRが各USの直前に発生する傾向がある場合、条件付けが行われたとされています。これは、動物がCSとして機能できる生物時計を持っていることを示唆しています。この方法は、動物のタイミング能力の研究にも用いられています(動物の認知を参照)。
以下の例は時間的条件付けを示しています。空腹のマウスに餌を与えるというUS(米国における実験)は、例えば30秒ごとなど、一定の時間間隔で行われます。十分な曝露を受けたマウスは、餌が与えられる直前に唾液を分泌し始めます。これは、マウスが時間の経過に条件付けされているように見えるため、時間的条件付けとなります。 ![]()
この手順では、CSはUSと対になるが、USは他のタイミングでも発生する。この場合、CSがない場合でもUSが発生する可能性が高いと予測される。言い換えれば、CSはUSを「予測」しない。この場合、条件付けは失敗し、CSはCRを誘発しない。[ 19 ] CSとUSの対ではなく予測こそが条件付けの鍵であるというこの発見は、その後の条件付け研究と理論に大きな影響を与えた。
消去手順では、CSはUSが存在しない状態で繰り返し提示されます。これは、CSが上記のいずれかの方法で条件付けされた後に行われます。これが行われると、CR頻度は最終的に訓練前のレベルに戻ります。しかし、消去によって以前の条件付けの影響が除去されるわけではありません。これは、自発的な回復(消去後にCRが突然出現する)やその他の関連現象によって示されます(下記の「消去からの回復」を参照)。これらの現象は、弱い刺激が提示された際に抑制が蓄積されるという仮説によって説明できます。
獲得過程においては、CSとUSは上述のように対になる。条件付けの程度はテスト試行によって追跡することができる。これらのテスト試行では、CSが単独で提示され、CRが測定される。CS-USの1回のペアリングでテストでCRが得られる場合もあるが、通常は複数回のペアリングが必要であり、CSに対する条件付け反応は徐々に増加する。この試行回数の繰り返しにより、CRの強度および/または頻度が徐々に増加する。条件付けの速度は、CSとUSの性質と強度、過去の経験、動物の動機づけ状態など、いくつかの要因に依存する。[ 6 ] [ 10 ]このプロセスは完了に近づくにつれて遅くなる。[ 20 ]
CSがUSなしで提示され、このプロセスが十分に繰り返されると、CSは最終的にCRを引き起こさなくなります。この時点でCRは「消滅した」と言われます。[ 6 ] [ 21 ]
強い刺激や未知の刺激がCSの直前、あるいは同時に提示された場合、 外的抑制が観察されることがあります。これにより、CSに対する条件反応が減少します。
いくつかの手順によって、最初に条件付けされ、その後消滅させられたCRを回復させることができます。これは、消滅手順では条件付けの効果を除去できないことを示しています。[ 10 ]これらの手順は以下のとおりです。
刺激の般化とは、特定のCSがCRを誘発するようになった後に、類似のテスト刺激が同じCRを誘発することが判明した場合、起こると言われています。通常、テスト刺激がCSに類似しているほど、CRはテスト刺激に対して強くなります。[ 6 ]逆に、テスト刺激がCSと異なるほど、CRは弱くなり、以前に観察されたものとの差が大きくなります。
刺激弁別は、ある刺激(「CS1」)が1つのCRを誘発し、別の刺激(「CS2」)が別のCRを誘発するか、全くCRを誘発しないという場合に観察される。これは、例えば、CS1に効果的なUSを呈示し、CS2にUSを呈示しないことで実現できる。[ 6 ]
潜在的抑制とは、刺激が効果的なUSと対になっている場合、新しい刺激がCSになるよりも、馴染みのある刺激がCSになるのに時間がかかるという観察を指します。[ 6 ]
これは、古典的条件付けにおける学習の強さを測定する最も一般的な方法の一つです。この手順の典型的な例は以下のとおりです。まず、ラットはオペラント条件付けによってレバーを押すことを学習します。次に、一連の試行において、ラットはCS(光または音)に曝露され、続いてUS(弱い電気ショック)に曝露されます。CSとUSの間には関連が形成され、ラットはCSが点灯するとレバーを押す速度を遅くしたり、止めたりします。CS中のレバーを押す速度は、古典的条件付けの強さを測る指標です。つまり、ラットがレバーを押す速度が遅いほど、CSとUSの関連が強くなります。(ゆっくりとレバーを押すことは「恐怖」という条件反応を示し、これは条件付けされた情動反応の一例です。以下のセクションを参照してください。)
通常、3 つの段階のコンディショニングが使用されます。
漸近的なCR レベルに達する まで、CS (CS+) は US とペアになります。
CS+/US試行は継続されますが、CS+を別のCS(CS-)とペアリングし、USとはペアリングしない試行(すなわちCS+/CS-試行)が交互に行われます。通常、生物はCS+/US試行ではCRを示しますが、CS+/CS-試行では反応を停止します。
この形式の古典的条件付けには 2 つの段階が含まれます。
CS (CS1) は US とペアになっています。
複合 CS (CS1 + CS2) は US とペアになります。
各CS(CS1とCS2)について個別のテストを実施しました。CS2に対する条件反射の欠如において阻害効果が観察され、これは訓練の第1段階が2番目のCSの獲得を阻害したことを示唆しています。 ![]()
条件付けにおける理論的問題に関する実験は、主に脊椎動物、特にラットとハトを用いて行われてきました。しかし、無脊椎動物においても条件付けは研究されており、条件付けの神経基盤に関する非常に重要なデータは、ウミウシの一種であるアメフラシを用いた実験から得られています。[ 6 ]関連する実験のほとんどは古典的条件付け手法を用いていますが、道具的(オペラント)条件付け実験も用いられており、古典的条件付けの強度は、条件付け抑制(上記の「現象」セクションを参照)やオートシェイピングなどのオペラント効果によって測定されることがよくあります。
パブロフによれば、条件付けは新しい行動の獲得には関係なく、むしろ新しい刺激に対して古い方法で反応する傾向を伴う。したがって、彼は、CS は反射反応を喚起する際に US を単に代替するだけだと理論づけた。この説明は条件付けの刺激代替理論と呼ばれている。[ 18 ] : 84 刺激代替理論の重要な問題は、CR と UR が常に同じではないということである。パブロフ自身、CR として生成されたイヌの唾液は、UR として生成された唾液とは組成が異なることを観察した。[ 14 ] CR は UR の反対であることもある。たとえば、電気ショックに対する無条件反応は心拍数の増加であるが、電気ショックと対になった CS は心拍数の減少を引き起こす。(ただし、UR が中枢神経系に関与しない場合にのみ、CR と UR が反対であるという提案もある。)
レスコーラ・ワグナー(R-W)モデル[ 10 ] [ 22 ]は、比較的単純でありながら強力な条件付けモデルである。このモデルは多くの重要な現象を予測する一方で、重要な点では誤りも生じており、そのため多くの修正や代替モデルが生み出されている。しかしながら、過去40年間の条件付けに関する理論的研究の多くは、このモデル、あるいはそれに対する反応によって引き起こされてきた。[ 23 ] [ 18 ] : 85
レスコーラ・ワグナーモデルは、2つの刺激の組み合わせで起こり得る条件付けの量には限界があると主張している。この限界を決定する要因の1つは、USの性質である。例えば、ベルをジューシーなステーキと組み合わせると、ベルを乾いたパンと組み合わせるよりも唾液分泌が促進される可能性が高く、乾いたパンは段ボールよりも効果的である可能性が高い。R-Wモデルの鍵となる考え方は、CSがUSの合図または予測を行うというものである。条件付け前は、被験者はUSに驚いていると言える。しかし、条件付け後は、CSがUSの到来を予測するため、被験者はもはや驚かない。(このモデルは数学的に記述でき、予測する、驚かせる、期待するなどの言葉は、モデルを説明するためにのみ使用されている。)ここでは、獲得、消去、ブロックという簡単な説明とともに、モデルの仕組みを説明する。このモデルは、他の多くの現象も予測する。モデルに関するメイン記事を参照のこと。
これはレスコラ・ワグナー方程式です。これは、条件付け刺激(CS)と無条件刺激(US)を1回組み合わせた際に生じる学習量を指定します。上記の方程式を繰り返し解くことで、このような多数の試行における学習過程を予測することができます。
このモデルでは、学習の度合いはCSがUSをどれだけ正確に予測できるかによって測定され、これはCSの「連合強度」によって表されます。式において、VはCSの現在の連合強度を表し、∆Vは特定の試行におけるこの強度の変化を表します。ΣVは、状況に存在するすべての刺激の強度の合計です。λは、特定のUSがサポートする最大の連合強度です。その値は通常、USが存在する試行では1に、USが存在しない場合は0に設定されます。αとβは、CSの顕著性と特定のUSの学習速度に関連する定数です。この式が様々な実験結果をどのように予測するかについては、以下のセクションで説明します。詳細については、このモデルに関するメイン記事を参照してください。[ 18 ] : 85–89
R-Wモデルは、CSとその他の局所刺激に「連合強度」を割り当てることで条件付けを測定する。CSが条件付けされる前の連合強度はゼロである。CSとUSをペアにすると、CSの連合強度が徐々に増加する。この増加はUSの性質(例えば、その強度)によって決まる。[ 18 ]:85–89 CS-USの1回のペアリング中に行われる学習量は、状況に存在するCSとその他の刺激の合計連合強度(式中のΣV)と、USによって設定される最大値(式中のλ)との差に依存する。CSとUSの最初のペアリングではこの差は大きく、CSの連合強度は大きく上昇する。CS-USのペアリングが蓄積されるにつれて、USはより予測可能になり、各試行における連合強度の増加はますます小さくなる。最終的に、CSの連合強度(および他の刺激によって生じる可能性のある強度)と最大強度との差はゼロになります。つまり、USは完全に予測され、CSの連合強度の成長は停止し、条件付けは完了します。

R-Wモデルによって記述される連合プロセスは、消去も考慮に入れています(上記の「手順」を参照)。消去プロセスは、CSの連合強度が正であることから始まり、これはCSがUSの発生を予測することを意味します。消去試行において、CSの後にUSは発生しません。この「予想外の」結果の結果として、CSの連合強度は低下します。CSの強度がゼロに達すると消去は完了し、USは予測されず、USも発生しません。しかし、同じCSがUSなしで提示され、確立された条件付け抑制因子(CI)、つまりUSの不在を予測する刺激(RWの用語で言えば、負の連合強度を持つ刺激)が伴う場合、RWはCSが消去されない(Vは減少しない)と予測します。
R-Wモデルの最も重要かつ斬新な貢献は、CSの条件付けがそのCSのみ、そしてそのCSとUSとの関係だけでなく、条件付け状況に存在する他のすべての刺激にも依存するという仮定である。特に、このモデルは、USは条件付け状況に存在するすべての刺激の連合強度の合計によって予測されると述べている。学習は、この連合強度の合計とUSによって支えられる強度の差によって制御される。この強度の合計がUSによって設定された最大値に達すると、条件付けは前述のように終了する。[ 18 ]:85–89
ブロッキング現象のR-Wモデルによる説明は、先ほど述べた仮定の一つの帰結を示しています。ブロッキング(上記の「現象」を参照)では、CS1はUSと対になって条件付けが完了するまで続きます。その後、追加の条件付け試行において、CS1と共に2つ目の刺激(CS2)が現れ、その両方に続いてUSが現れます。最終的にCS2がテストされ、CS2に関する学習がCS1に関する最初の学習によって「ブロック」されたため、CS2は反応を示さないことが示されます。R-Wモデルは、最初の条件付け後、CS1はUSを完全に予測する、と説明することでこれを説明しています。予測と実際の結果に違いがないため、CS1+CS2による追加試行では新たな学習は起こらず、したがってCS2は後に反応を示さないのです。
R-Wモデルの重要性の主な理由の一つは、それが比較的単純で明確な予測を立てられることです。これらの予測の検証は、多くの重要な新発見と条件付けに関する理解の大幅な深化をもたらしました。この理論を支持する新たな情報もいくつかありましたが、多くの情報はそうではなく、この理論はせいぜい単純すぎるという点が一般的に認められています。しかしながら、実験で生じたすべての現象を説明できる単一のモデルは存在しないようです。[ 10 ] [ 24 ]以下は、関連する理論的論点の簡単な要約です。[ 23 ]
R-Wモデルは、条件付けをCSとUSの連想に還元し、CSの連想強度という単一の数値で測定します。多くの実験結果は、これよりも多くのことが学習されていることを示しています。その中には、この記事の前半で説明した2つの現象があります。
潜在的抑制は、被験者が頻繁に見られるCSがUSと対になる前にそのCSへの注意を止めてしまうために起こるのかもしれない。実際、CSへの注意の変化は、R-Wモデルに困難をもたらす実験結果に対処しようとする2つの著名な理論の中核を成している。ニコラス・マッキントッシュによって提唱されたこれらの理論の一つでは[ 25 ]、条件付けの速度はCSに費やされる注意の量に依存し、この注意の量はCSがUSをどれだけ正確に予測できるかに依存する。ピアースとホールは、異なる注意原理に基づく関連モデルを提唱した[ 26 ]。どちらのモデルも広範囲にテストされてきたが、どちらもすべての実験結果を説明できるわけではない。その結果、様々な著者が2つの注意プロセスを組み合わせたハイブリッドモデルを試みてきた。ピアースとホールは2010年に彼らの注意に関するアイデアを統合し、レスコーラ・ワグナー方程式を統合モデルに組み込む可能性さえ示唆した[ 10 ] 。
前述のように、条件付けにおける重要な考え方は、CSがUSをシグナルまたは予測するというものです(上記の「ゼロ随伴性手順」を参照)。しかし、例えば、条件付けが行われる部屋も、USが発生する可能性を「予測」します。それでも、部屋が予測する確実性は、実験的なCS自体よりもはるかに低くなります。なぜなら、部屋は実験試行の合間にUSが発生していない時にも存在するからです。このような文脈の役割は、パブロフの実験で犬が実験装置に近づくと、CSを見たり聞いたりする前に唾液を分泌し始めることがあったという事実によって示されています。[ 20 ]このようないわゆる「文脈」刺激は常に存在し、その影響は、そうでなければ不可解な実験結果のいくつかを説明するのに役立ちます。文脈刺激の連合強度は、レスコラ・ワグナー方程式に代入することができ、以下に概説する比較理論と計算理論において重要な役割を果たします。[ 10 ]
学習内容を知るためには、テスト状況における行動(「パフォーマンス」)を何らかの方法で測定する必要があります。しかし、学生がよく知っているように、テスト状況におけるパフォーマンスは必ずしも学習内容の良い指標とは限りません。条件付けに関しては、ブロッキング実験の被験者は「ブロックされた」CSについて何かを学習しますが、通常のテスト方法のために、その学習を示さないという証拠があります。
条件付けの「コンパレータ」理論は「パフォーマンスに基づく」、つまり、テスト時に何が起こっているかを重視します。特に、テスト中に存在するすべての刺激と、これらの刺激によって獲得された連想がどのように相互作用するかに注目します。[ 27 ] [ 28 ]やや単純化しすぎると、コンパレータ理論は、条件付け中に被験者がCS-USと文脈-USの連想の両方を獲得すると仮定します。テスト時にこれらの連想が比較され、CS-USの連想が文脈-USの連想よりも強い場合にのみ、CSへの反応が生じます。CSとUSが単純な獲得において繰り返し対にされると、CS-USの連想は強くなり、文脈-USの連想は比較的弱くなります。これは、CSが強いCRを引き起こすことを意味します。「ゼロ随伴性」(上記参照)では、文脈-USの連想がCS-USの連想とほぼ同じ強さであるため、条件付け反応は弱くなるか、または全くなくなります。ブロッキングやその他のより微妙な現象もコンパレータ理論によって説明できますが、やはりすべてを説明することはできません。[ 10 ] [ 23 ]
生物が将来の出来事を予測する必要性は、現代の条件付け理論の中心である。ほとんどの理論は、刺激間の関連性を利用してこれらの予測を処理する。例えば、R-W モデルでは、CS の関連性の強さは、その CS が US をどの程度強く予測するかを示す。予測に対する異なるアプローチは、Gallistel と Gibbon (2000、2002) によって提案されたモデルなどによって示唆されている。[ 29 ] [ 30 ]ここでは、応答は関連性の強さによって決定されない。その代わりに、生物は CS と US の開始と終了の時間を記録し、これらを使用して US が CS に続く確率を計算する。多くの実験により、人間と動物は出来事の時間を計ることを学習できることが示されており ( 「動物の認知」を参照)、Gallistel と Gibbon のモデルはさまざまな実験データに非常によく定量的に適合する。[ 6 ] [ 23 ]しかし、最近の研究では、期間ベースのモデルは連想モデルほど実証的な知見を説明できないことが示唆されている。[ 31 ]
Rescorla-Wagner モデルは、刺激を単一のエンティティとして扱い、刺激と 1 つの数値との連想の強さを表しますが、その数値にどのように到達したかについての記録はありません。上で述べたように、このため、モデルで多くの実験結果を説明することが困難になります。刺激が内部的に要素の集合で表現され、各要素が 1 つの連想状態から別の連想状態へと変化する可能性があると仮定することで、より柔軟な対応が可能になります。たとえば、ある刺激と別の刺激の類似性は、2 つの刺激が共通の要素を共有していると言うことで表すことができます。これらの共有要素は、刺激の一般化や、一般化に依存する可能性のあるその他の現象を説明するのに役立ちます。また、同じセット内の異なる要素は異なる連想を持つ場合があり、それらの活性化と連想は異なる時間と異なる速度で変化する可能性があります。これにより、要素ベースのモデルでは、他の方法では説明できない結果を処理できます。
要素アプローチの顕著な例として、ワグナーの「SOP」モデルが挙げられます。[ 32 ]このモデルは導入以来、様々な方法で精緻化され、現在では極めて多様な実験結果を原理的に説明することができます。[ 10 ]このモデルは、任意の刺激を多数の要素の集合で表現します。様々な刺激の提示時間、刺激を構成する要素の状態、そして要素間の相互作用は、連合過程の過程と条件付け実験中に観察される行動を決定します。
単純条件付けのSOP説明は、SOPモデルの本質的な部分を例示しています。まず、このモデルでは、CSとUSがそれぞれ多数の要素によって表現されると仮定しています。これらの刺激要素はそれぞれ、以下の3つの状態のいずれかを取ります。
特定の瞬間に単一の刺激を表す要素のうち、一部は状態 A1 にあり、一部は状態 A2 にあり、一部は状態 I にある場合があります。
刺激が最初に現れたとき、その要素の一部は不活性状態 I から主要活性状態 A1 にジャンプします。A1 状態から要素は徐々に A2 に減衰し、最終的に I に戻ります。要素の活性はこのようにしか変化できません。特に、A2 の要素は直接 A1 に戻ることはできません。CS と US の両方の要素が同時に A1 状態にある場合、2 つの刺激の間に関連付けが学習されます。つまり、後ほど CS が US より先に提示され、一部の CS 要素が A1 に入ると、これらの要素は一部の US 要素を活性化します。ただし、このように間接的に活性化された US 要素は A2 状態にしかブーストされません。(これは CS が US の記憶を呼び起こすものと考えられますが、実際の US ほど強力ではありません。) CS-US 試行を繰り返すと、ますます多くの要素が関連付けられ、CS が現れたときにますます多くの US 要素が A2 に移動します。これにより、US 自体が現れたときに A1 に入ることができる US 要素は徐々に少なくなります。その結果、学習速度は低下し、限界に近づきます。USは「完全に予測可能」あるいは「驚くべきことではない」と言えるかもしれません。なぜなら、CSが出現した時点では、USの要素のほぼすべてがA2に入ることができず、新たな連想を形成できる要素がほとんど残っていないからです。
このモデルは、レスコラ・ワグナーモデルによって説明される知見に加え、多くの追加的知見も説明できる。例えば、他の多くのモデルとは異なり、SOPは時間を考慮している。要素活性化の上昇と下降をモデルに用いることで、CSがUSの直前に来る場合に条件付けが最も強くなるという事実や、CSがUSの後に来る場合(「後方条件付け」)には抑制的なCSが生じることが多いという事実など、時間依存的な効果を説明できる。他にも多くのより微妙な現象が説明できる。[ 10 ]
近年、要素表現を取り入れた強力なモデルが数多く登場しています。これらのモデルでは、連想は刺激や反応を表す「ノード」間の接続ネットワーク、そして場合によっては1つ以上の「隠れた」中間層間の接続ネットワークによって構成されるという仮定がしばしば採用されています。こうしたモデルは、ニューラルネットワーク、人工知能、機械学習に関する近年の爆発的な研究と関連しています。
パブロフは、条件付けには条件刺激と無条件刺激に対する脳中枢間の接続が関与していると提唱した。彼の条件付けの生理学的説明は放棄されたが、古典的条件付けは学習と記憶の基礎となる神経構造と機能の研究に今も用いられている。この目的で用いられる古典的条件付けの形態には、とりわけ恐怖条件付け、瞬目条件付け、およびウミウシの一種Hermissenda crassicornisの足収縮条件付けなどがある。恐怖条件付けと瞬目条件付けはどちらも中性刺激(多くの場合音)が無条件刺激と対になる。瞬目条件付けの場合、US は空気の噴出であるが、恐怖条件付けの場合、US は足への電撃など、脅迫的または嫌悪的なものである。
アメリカの神経科学者デビッド・A・マコーミックは、「小脳とそれに関連する脳幹の特定の領域には、条件付け中に活動を変化させるニューロンが含まれており、これらの領域は、この単純な学習課題の習得と遂行に非常に重要である。海馬、扁桃体、前頭前皮質など、脳の他の領域も、特に課題の要求がより複雑になったときに、条件付けプロセスに寄与しているようだ」という実験を行った。[ 33 ]
恐怖と瞬きの条件付けは一般に重複しない神経回路を伴うが、分子メカニズムは共通している。恐怖の条件付けは基底外側部扁桃体で起こり、そこでは視床求心性神経から直接グルタミン作動性入力を受け取り、また前頭前野投射からは間接的に入力を受ける。遅延条件付けには直接投射で十分だが、外部刺激がないにもかかわらず CS を内部的に表象する必要がある痕跡条件付けの場合には間接的な経路が必要となる。前帯状皮質は中間痕跡条件付けの候補の 1 つだが、海馬も主要な役割を果たす可能性がある。条件付け関連の可塑性には、タンパク質キナーゼ Aのシナプス前活性化とNMDA 受容体およびそのシグナル伝達経路のシナプス後活性化が必要である。CREBも条件付け関連の可塑性に必要であり、これが起こるために必要なタンパク質の下流合成を誘導する可能性がある。[ 34 ] NMDA受容体はシナプス前カルシウム濃度の上昇( Mg2+ブロックの解除)によってのみ活性化されるため、スパイクタイミング依存性可塑性を媒介する可能性のある同時発生検出器である可能性がある。STDPはLTPをCSがUSを予測する状況に制限し、LTDをその逆の状況に制限する。[ 35 ]
古典的条件付けに関連する療法としては、嫌悪療法、系統的脱感作療法、フラッディング療法などがあります。
嫌悪療法は行動療法の一種で、望ましくない習慣を強い不快な無条件刺激と関連づけることで、患者にその習慣をやめさせることを目的とする。[ 36 ] : 336 例えば、アルコールの味と胃の不調を関連づけるために薬が使用される場合がある。 系統的脱感作法は恐怖症の治療法であり、患者は徐々に不安を誘発する刺激(怒りの言葉など)にさらされながらリラックスするように訓練される。これはカウンターコンディショニングの一例であり、恐れられている刺激を不安と両立しない反応(リラクゼーション)と関連づけることを目的とする。[ 36 ] : 136 フラッディングは脱感作法の一種で、不安反応の強化の欠如によって反応が消失するまで、非常に苦痛な刺激に繰り返しさらすことによって恐怖症や不安を取り除こうとする。[ 36 ] : 133 「洪水」は通常、刺激への実際の曝露を伴いますが、「内破」という用語は想像上の曝露を指しますが、この2つの用語は同義語として使用されることもあります。
条件付け療法は通常、人間性療法よりも時間がかかりません。[ 37 ]
薬物を投与または摂取したときに存在する刺激が、最終的に薬物の効果を模倣する条件付けされた生理学的反応を引き起こす可能性があります。これはカフェインの場合に時々当てはまります。習慣的にコーヒーを飲む人は、コーヒーの香りが自分に覚醒感を与えることに気付くでしょう。他の場合には、条件付け反応は薬物の効果を打ち消す傾向がある代償反応です。たとえば、薬物が体の痛みに対する感受性を低下させる場合、代償条件付け反応は、使用者の痛みに対する感受性を高めるものになる可能性があります。この代償反応は薬物耐性に寄与する場合があります。そうであれば、薬物使用者は効果を感じるために薬物の消費量を増やし、最終的に非常に大量の薬物を摂取する可能性があります。この場合、CSがたまたま存在せず、条件付けされた代償効果が起こらないと、危険な過剰摂取反応が発生する可能性があります。たとえば、薬物が常に同じ部屋で投与されている場合、その部屋によって提供される刺激が条件付けされた代償効果を生み出す可能性があります。条件刺激が存在しない別の場所に薬物を投与すると、過剰摂取反応が起こる可能性がある。[ 38 ]
食物摂取に先立って一貫して現れる信号は、身体が食物と消化に備える一連の身体的反応の条件刺激となる可能性がある。これらの反射反応には、胃への消化液の分泌や血流への特定のホルモンの分泌が含まれ、空腹状態を誘発する。条件付けされた空腹の一例として、「前菜効果」が挙げられる。夕食の時間を示す時計など、食事に先立って一貫して現れる信号は、信号を受ける前よりも空腹感を強く感じさせる可能性がある。側頭視床下部(LH)は摂食開始に関与している。黒質、側頭視床下部、基底核を含む黒質線条体経路は、空腹動機に関与することが示されている。
古典的条件付けの影響は、恐怖、嫌悪、吐き気、怒り、性的興奮といった感情反応に見られます。よくある例としては、条件付けされた吐き気があります。この場合、CSは過去に無条件に胃の不調を引き起こした特定の食品の光景や匂いです。同様に、CSが犬の光景で、USが噛まれた痛みである場合、犬に対する条件付けされた恐怖が生じる可能性があります。条件付けされた感情反応の例としては、条件付けされた抑圧があります。
適応メカニズムとしての感情的条件付けは、個体を危害から守ったり、性行為などの重要な生物学的イベントに備えさせたりするのに役立ちます。つまり、性行為の前に生じた刺激が性的興奮を引き起こし、個体を性的な接触に備えさせるのです。例えば、ヒト被験者において、ペニー硬貨の入った瓶の写真のような刺激とエロティックな映画のクリップを組み合わせさせることで、性的興奮を条件付けることができます。ブルーグーラミと家畜のウズラを対象とした同様の実験では、このような条件付けによって子孫の数を増やすことができることが示されています。これらの結果は、条件付け技術が不妊個体や絶滅危惧種の出生率を向上させるのに役立つ可能性を示唆しています。[ 39 ]
古典的条件付けは、特定の製品やロゴを心地よい音楽、魅力的な画像、人気のある著名人などの肯定的な刺激と関連付け、消費者から肯定的な反応を引き出すことを意図して、広告やメディアで広く使用されています。[ 40 ] [ 41 ]時間の経過とともに、古典的条件付けにより、製品だけで消費者から望ましい反応を引き出せるようになることがよくあります。[ 42 ]
このセクションは拡張が必要です。不足している情報を追加していただければ幸いです。 (2017年5月) |
パブロフ的道具的転移とは、古典的条件付けによって報酬刺激または嫌悪刺激と関連付けられた条件刺激(CS、「キュー」とも呼ばれる)が、動機づけの顕著性とオペラント行動を変化させるときに発生する現象である。[ 43 ] [ 44 ] [ 45 ] [ 46 ]典型的な実験では、ラットに音と餌の組み合わせが提示される(古典的条件付け)。それとは別に、ラットはレバーを押して餌を得ることを学習する(オペラント条件付け)。テストセッションでは、音がレバーを押すことと関連付けられたことはなかったが、ラットは音が聞こえる場合の方が静かな場合よりも速くレバーを押すことが示された。
パブロフの道具的転移は、刺激と特定の結果を組み合わせることでオペラント識別を強化する手順である 差別的結果効果において役割を果たすことが示唆されています。
最近の研究では、潜在抑制が条件付けの速度にどのように影響するかを調べることで、パブロフの初期の研究を拡張しています。潜在抑制は、強化なしに中性刺激に繰り返しさらされると、後にその刺激を無条件刺激と関連付けることが困難になるときに発生します[ 47 ]。この現象は、学習が純粋に自動的なものではなく、生物が環境中の刺激を予測し、その関連性を割り当てる能力に依存していることを示しています。この効果は注意メカニズムと関連付けられており、動物とヒトの両方で研究されており、統合失調症患者は潜在抑制の低下を示すことが多く、認知フィルタリングプロセスの変化を示唆しています[ 48 ] 。
動機付けと道具的行動の選択を変化させる。…予測的な手がかりは、私たちの生活において、常に私たちの行動に影響を与え、導く重要な要素である。クラクションの音を聞くと、私たちは道路を渡ろうとする前に立ち止まります。ファストフードの広告を見ると、空腹になり、特定の種類の食べ物や供給源を探し求めるかもしれません。一般的に、手がかりは私たちを特定の行動に駆り立てることもあれば、行動を阻止することもあります。手がかりは適応的なもの(道路を渡る際に命綱となる)もあれば、不適応的なもの(空腹ではないのに食べてしまうなど、最適ではない選択につながる)もあります(Colagiuri and Lovibond, 2015)。極端な場合には、薬物依存症などの病態にも関与し、薬物関連の手がかりが渇望を引き起こし、再発を誘発することがあります(Belin et al., 2009)。
2つの別々の入力要因を統合する:(1) 現在の生理学的神経生物学的状態; (2) 報酬キュー、またはパブロフの CS について以前に学習した関連付け ...
UCS に対するキューによって誘発される「欲求」
短時間の CS 遭遇 (または短時間の UCS 遭遇) は、多くの場合、より多くの報酬 UCS を獲得して消費するための高いモチベーションの脈動を引き起こします。これは、インセンティブ サリエンスの特徴的な特徴です。日常生活では、食べ物の匂いを嗅ぐと、1 分前には感じていなかったのに突然空腹を感じることがあります。動物神経科学の実験では、報酬のための CS は、パブロフの道具的転移 (PIT) 実験などのインセンティブ サリエンスの測定を精製する状況で、関連する UCS 報酬を獲得するためのより熱狂的な道具的努力の増加の脈動を引き起こす可能性があります...同様に、CS を含めると、CS がない場合の同じ UCS の消費と比較して、ラットまたは人々による報酬 UCS の消費が増加することがよくあります...このように、パブロフのキューは、UCS 報酬を消費するための高いモチベーションの脈動を引き起こし、食欲をそそり、強化することができます。しかし、動機づけの力は、決して単純にきっかけそのものやその関連性にあるのではありません。なぜなら、きっかけによって引き起こされる動機づけは、以下で説明するように、薬物、空腹感、満腹感などによって簡単に調整され、逆転する可能性があるからです。
{{cite book}}: CS1 メンテナンス: 追記 (リンク){{cite book}}:ISBN / 日付の非互換性(ヘルプ)