
行動心理学において、強化とは、通常、特定の先行刺激が存在する場合に、生物の将来の行動の可能性を高める結果を指します。[ 1 ]例えば、ネズミは、ライトが点灯するたびにレバーを押して餌をもらうように訓練できます。この例では、ライトが先行刺激、レバーを押すことがオペラント行動、餌が強化子です。同様に、教師の質問に答えて注目と賞賛を受けた生徒は、授業中に将来の質問に答える可能性が高くなります。教師の質問が先行刺激、生徒の反応が行動、賞賛と注目が強化子です。罰は強化の逆であり、反応が起こる可能性を低下させるあらゆる行動を指します。オペラント条件付けの用語では、罰は痛み、恐怖、または身体的行為を伴う必要はなく、不承認の短い口頭表現でさえも罰の一種です。[ 2 ]
主観的な「欲しい」や「好き」 (欲求と快感)といった欲求行動につながる結果は、報酬または正の強化として機能する。[ 3 ]また、望ましくない刺激を取り除くことを伴う負の強化もある。負の強化の例としては、頭痛を和らげるためにアスピリンを服用することがあげられる。
強化はオペラント条件付けと行動変容の重要な要素です。この概念は、子育て、コーチング、セラピー、自助、教育、経営など、様々な実践分野に応用されてきました。
| 依存症と依存に関する用語集[ 4 ] [ 5 ] [ 6 ] | |
|---|---|
| |
行動科学において、「ポジティブ」と「ネガティブ」という用語は、厳密な専門用語で使用される場合、条件付け者が行う行動の性質を指し、反応するオペラントによるその行動とその結果の評価を指すものではありません。「ポジティブ」な行動とは、快不快を問わず、環境への要因の追加であり、「ネガティブ」な行動とは、環境からいずれかのタイプの要因を削除または差し控える行動です。一方、「強化」の厳密な意味は報酬に基づく条件付けのみを指します。不快要因の導入と快要因の削除または差し控えは「罰」と呼ばれ、厳密な意味で使用される場合、「強化」とは対照的ですしたがって、「正の強化」は快い要素の追加を指し、「正の罰」は不快な要素の追加を指し、「負の強化」は不快な要素の除去または保留を指し、「負の罰」は快い要素の除去または保留を指します。
この用法は、4つの用語の組み合わせの非専門用語における用法、特に「負の強化」という用語の場合と矛盾します。この用語は、専門用語では「正の罰」と呼ばれるものを指すためにしばしば用いられます。非専門用語では、「強化」は報酬と罰の両方を包含し、「負」は、導入される要因に対する反応するオペラントの評価を指すと解釈されます。対照的に、専門用語では「負の強化」という用語が用いられ、不快な要因が存在する、または存在するであろうが、その行動に従事することでその要因から逃れるか、その発生を防ぐかのいずれかの結果が得られるようなシナリオを作り出すことで、特定の行動を奨励することを指します。これは、マーティン・セリグマンが犬に電気ショックの回避を学習させる実験に見られるようにです。
BFスキナーは、強化と行動主義の理論的構成の多くを明確に表現した、著名で影響力のある研究者でした。スキナーは、強化子を、何が誰かにとって楽しいか、何が価値があるかといったより主観的な基準ではなく、反応の強さ(反応率)の変化に基づいて定義しました。したがって、楽しい、または楽しいと見なされる活動、食べ物、またはアイテムは、必ずしも強化的であるとは限りません(それらの前に起こる反応を増加させないため)。刺激、状況、および活動は、潜在的な強化子の直前の行動が将来の同様の状況で増加する場合にのみ、強化子の定義に適合します。例えば、クッキーを要求するとクッキーをもらえる子供などです。「クッキー要求行動」の頻度が増加する場合、クッキーは「クッキー要求行動」を強化していると見なすことができます。しかし、「クッキー要求行動」が増加しない場合、クッキーは強化的とは見なされません
刺激が強化刺激であるかどうかを判断する唯一の基準は、その潜在的な強化刺激の投与後に行動の確率がどのように変化するかです。他の理論では、例えば、ある行動が特定の結果をもたらすと人が予想していたかどうかといった追加的な要因に焦点を当てる場合もありますが、行動理論では、強化は反応の確率の増加によって定義されます。
強化に関する研究は、膨大な再現性のある実験結果を生み出してきました。強化は、特殊教育、応用行動分析、そして行動の実験分析における中心的な概念および手順であり、特に嗜癖、依存、強迫といった医学および精神薬理学モデルにおける中核概念です。
強化に関する実験室研究は、通常、パズルボックスから逃げ出す猫の実験で知られるエドワード・ソーンダイクの研究に遡ります。 [ 7 ]この研究は他の多くの人々によって継続されましたが、特にBFスキナーは1938年にこのテーマに関する独創的な研究を『生物の行動』で発表し、その後の多くの出版物でこの研究を詳しく説明しました。[ 8 ]特にスキナーは、行動の形成には罰よりも正の強化の方が優れていると主張しました。[ 9 ]罰は強化の正反対のように思われるかもしれませんが、スキナーは、正の強化は永続的な行動修正(長期的)をもたらすのに対し、罰は行動を一時的(短期的)にしか変えず、多くの有害な副作用があると述べています。
その後、多くの研究者が強化に関する理解を深め、スキナーの結論の一部に異議を唱えました。例えば、アズリンとホルツは罰を「行動の将来の確率を低下させる行動の結果」と定義しました[ 10 ] 。 また、いくつかの研究では、正の強化と罰は行動修正において同等に効果的であることが示されています。正の強化、負の強化、罰の効果に関する研究は今日も続けられています。これらの概念は学習理論の基礎であり、その理論の多くの実践的な応用に当てはまるからです。
| オペラント条件付け | 消去 | ||||||||||||||||||||||||||||||
| 強化:行動の増加 | 罰:行動の減少 | ||||||||||||||||||||||||||||||
| 正の強化正しい行動の後に食欲刺激を加える | 負の強化 | 正の罰:行動後に有害な刺激を加える | 負の罰行動後の欲求刺激を除去する | ||||||||||||||||||||||||||||
| 逃避正しい行動に従って有害な刺激を除去する | 能動的回避行動は有害な刺激を避ける | ||||||||||||||||||||||||||||||
オペラント条件付けという用語は、スキナーによって導入され、彼の実験パラダイムにおいては、生物が環境に対して自由に作用することを示すものでした。このパラダイムでは、実験者は望ましい反応を引き起こすことはできません。実験者は反応が起こる(生物から発せられる)のを待ち、その後に潜在的な強化子が提示されます。古典的条件付けパラダイムでは、実験者は反射誘発刺激である無条件刺激(UCS)を提示することで望ましい反応を誘発(引き出す)し、無条件刺激と中立刺激である条件刺激(CS )を対にして提示(先行)します。
強化はオペラント条件付けにおける基本的な用語です。オペラント条件付けにおける罰の側面については、「罰(心理学)」を参照してください。
正の強化は、行動の結果として望ましい出来事や刺激が提示され、同様の環境でこの行動が現れる可能性が高まるときに起こります。 [ 11 ]:253 例えば、本を読むことが楽しい場合、その楽しさを経験することで、楽しい本を読むという行動が正に強化されます。正の強化を受けた人(つまり、本を読んで楽しい人)は、より多くの楽しみを得るために、より多くの本を読むでしょう
高確率指導(HPI)治療は、正の強化の考えに基づいた 行動主義治療です。
負の強化は、嫌悪的な状況や刺激を回避または逃避する行動の割合を高めます。[ 11 ]:252–253 つまり、何か不快なことがすでに起こっており、その行動は人が不快さを回避または逃避するのに役立ちます。快い刺激を加える正の強化とは対照的に、負の強化では、不快な状況や刺激の除去に焦点が当てられています。例えば、誰かが不幸を感じている場合、嫌悪的な状況(例えば、不幸な感情)から逃れるために行動(例えば、本を読む)を行うかもしれません。[ 11 ]:253 不快な状況や刺激を除去するという回避行動または逃避行動の成功は、その行動を強化します
ある行動が再び起こらないようにするため、または起こらないようにするために、人々に不快なことをすることは罰であり、負の強化ではない。[ 11 ]:252 主な違いは、強化は常に行動の可能性を高める(例えば、退屈なときにチャンネルサーフィンをすると、一時的に退屈が緩和されるので、退屈なときにチャンネルサーフィンが増える)のに対し、罰は行動の可能性を低下させる(例えば、二日酔いは不快な刺激であるため、人々はその不快な刺激につながった行動を避けることを学ぶ)という点である。
消去は、特定の行動が無視されたとき(つまり、何の結果も伴わないとき)に起こります。行動は、継続的に強化を受けない場合、時間の経過とともに消滅します。意図的な消去の間、対象となる行動は最初に急増し(以前に強化された期待効果を生み出そうとして)、その後、時間の経過とともに減少します。被験者の行動に影響を与えるために、強化も消去も意図的である必要はありません。例えば、子供が楽しいから本を読む場合、親が読書を無視するという決定は、子供が本を読むことから得る正の強化(つまり、楽しさ)を取り除くものではありません。しかし、子供が親の注意を引くために行動をとる場合、親がその行動を無視するという決定は、その行動を消滅させ、子供は親の注意を引くために別の行動を見つけるでしょう
強化子は行動を増加させる働きがあり、罰子は行動を減少させる働きがあります。したがって、正の強化子は被験者が達成しようと努力する刺激であり、負の強化子は被験者が取り除くか終わらせるために努力する刺激です。[ 12 ]以下の表は、強化と罰に関連して、刺激(快刺激または嫌悪刺激)の追加と削減を示しています
| 報酬刺激(快刺激) | 嫌悪刺激(不快刺激) | |
|---|---|---|
| ポジティブ(刺激を加える) | 正の強化
| 正の罰
|
| ネガティブ(刺激を取り除く) | 負の罰
| 負の強化
|
一次強化子は無条件強化子とも呼ばれ、強化子として機能するために異なる刺激との組み合わせを必要とせず、進化と種の存続における役割を通じてこの機能を獲得した可能性が高い刺激です。 [ 14 ]一次強化子の例には、食物、水、性別が含まれます。特定の薬物など、一部の一次強化子は、他の一次強化子の効果を模倣する場合があります。これらの一次強化子は生涯を通じて、また個体間でかなり安定していますが、異なる一次強化子の強化値は複数の要因(例:遺伝、経験)により異なります。したがって、ある人は特定の種類の食品を好み、別の人はそれを避ける場合があります。または、ある人はたくさん食べるが、別の人はほとんど食べない場合があります。そのため、食物がどちらの個人にとっても一次強化子であっても、強化子としての食物の価値は両者間で異なります。
二次強化子(条件付け強化子とも呼ばれる)とは、強化子として機能する刺激と対になった後に、強化子としての機能を獲得した刺激または状況のことである。この刺激は一次強化子の場合もあれば、別の条件付け強化子(例えば金銭)の場合もある。
人間の例で一次強化子と二次強化子を区別しようとする場合、「原始人テスト」を用います。刺激が原始人が自然に好ましいと感じるもの(例えばキャンディー)であれば、それは一次強化子です。一方、原始人が反応しないもの(例えばドル紙幣)であれば、それは二次強化子です。一次強化子と同様に、生物は二次強化子によって満足感と喪失感を経験することができます。
チャールズ・ファースターは1967 年の論文「恣意的強化と自然強化」で、強化を、オペラント行動の頻度をその行動自体の自然な結果として増加させるイベントと、被験者がセラピストから特定の行動に対して報酬を受けるトークンエコノミーなどのように人間の仲介を必要とすることによって頻度に影響を与えるイベントに分類することを提案しました。
1970年、ベーアとウルフは「行動の罠」という概念を提唱しました[ 18 ] 。行動の罠は、単純な反応で罠に陥るだけで済みますが、一度罠に陥ると、抵抗できず、行動全般に変化が生じます。行動の罠を用いることで、ある行動が自然に強化されるという状況に晒され、その人の行動レパートリーが拡大します。行動の罠には4つの特徴があります。
このように、人工的な強化は、一般化可能なスキルを構築または発達させるために用いられ、最終的には行動を維持または向上させるための自然発生的な強化へと移行します。別の例としては、特定の行動が特定の基準を満たすと、その行動から一般的に生じる社会的状況が挙げられます。
行動は発せられるたびに必ず強化されるわけではなく、強化パターンはオペラント反応の学習速度、特定の時点での反応速度、そして強化が停止したときに反応がどれだけ長く続くかに強く影響します。強化を制御する最も単純な規則は、すべての反応が強化される連続強化と、どの反応も強化されない消去強化です。これらの両極端の間にある、より複雑な強化スケジュールは、反応にいつどのように強化子が続くかを決定する規則を規定します
特定の強化スケジュールは確実に特定の反応パターンを引き起こし、これらの規則は多くの異なる種に当てはまります。強化の一貫性と予測可能性の差異は、異なるスケジュールの作用に重要な影響を与えます。BFスキナーはハトを用いて、多くの単純および複雑なスケジュールを詳細に研究しました。

シンプルなスケジュールには、特定の応答に対して 1 種類の強化子がいつ配信されるかを決定する単一のルールがあります。
単純なスケジュールは多くの差別的強化法[ 20 ]で利用されている。
複合スケジュールとは、同じ行動に対して同じ強化子を用いて、2つ以上の異なる単純スケジュールを何らかの方法で組み合わせたものです。多くの可能性がありますが、最もよく使用されるものは次のとおりです

心理学用語の「重ね合わせ強化スケジュール」とは、2つ以上の単純な強化スケジュールが同時に作用する報酬構造を指します。強化子は、正、負、またはその両方です。例えば、長い一日の仕事を終えて帰宅する人がいます。玄関のドアを開けるという行動は、配偶者からの唇への大きなキスと、飼い犬が元気よく飛び跳ねてズボンを破るという報酬で与えられます。重ね合わせ強化スケジュールのもう一つの例は、実験用のケージに入れられたハトがボタンをつつくことです。ハトは20つつくごとに穀物の入ったホッパーを、200つつくごとに水を与えられるようになります。
重畳強化スケジュールは、 BFスキナーとその同僚による単純強化スケジュールに関する初期の研究(Skinner and Ferster, 1957)から発展した複合スケジュールの一種です。彼らは、強化子をスケジュールに従って与えることが可能であり、さらに、生物はスケジュールによって異なる行動をとることを実証しました。餌や水などの強化子は、ある行動の結果として毎回与えられるのではなく、行動が複数回行われた後に与えられることもあります。例えば、ハトは餌が現れるまでボタンスイッチを10回つつく必要があるかもしれません。これは「比率スケジュール」です。また、強化子は目標行動の後に一定の時間を置いてから与えることもできます。例えば、ラットにレバーを最後に押してから2分後に最初の反応が起こり、その直後に餌のペレットを与えるという ものです。これは「間隔スケジュール」と呼ばれます。
さらに、比率スケジュールは、個体による一定数または可変数の行動の後に強化を与えることができます。同様に、間隔スケジュールは、個体による単一の反応の後に、一定または可変の時間間隔の後に強化を与えることができます。個々の行動は、強化スケジュールの作成方法に応じて異なる反応率を生み出す傾向があります。その後、多くの研究室で、スケジュール強化子が行動に与える影響について多くの研究が行われました。
生物が2つ以上の単純な強化スケジュールを同時に選択する機会を与えられる場合、その強化構造は「並行強化スケジュール」と呼ばれます。Brechner (1974, 1977) は、人間による漁業の乱獲や熱帯雨林の伐採といった社会的罠の実験的アナロジーを作成するために、重ね合わせ強化スケジュールの概念を導入しました。Brechner は、単純な強化スケジュールが互いに重ね合わされた状況を作り出しました。言い換えれば、生物による単一の反応または一連の反応が複数の結果をもたらすということです。並行強化スケジュールは「または」スケジュール、重ね合わせ強化スケジュールは「および」スケジュールと考えることができます。Brechner と Linder (1981)、および Brechner (1987) はこの概念を拡張し、重ね合わせスケジュールと社会的罠のアナロジーを用いて、システムにおけるエネルギーの流れを分析する方法を説明しました。
重ね合わせた強化スケジュールは、社会的罠を生み出すこと以外にも、現実世界で多くの応用があります。単純な強化スケジュールを重ね合わせることで、さまざまな個人的および社会的状況を作り出すことができます。たとえば、ある人間が同時にタバコとアルコール中毒になる可能性があります。さらに複雑な状況は、2 つ以上の同時スケジュールを重ね合わせることで作り出したりシミュレートしたりできます。たとえば、高校 3 年生は、スタンフォード大学か UCLA のどちらに行くかを選択し、同時に陸軍か空軍に入るかを選択し、さらに同時にインターネット企業に就職するかソフトウェア企業に就職するかを選択することもできます。これは、3 つの同時強化スケジュールを重ね合わせた強化構造です。
重ね合わせ強化スケジュールは、クルト・ルーヴィン(1935)が記述した3つの典型的な葛藤状況(接近-接近葛藤、接近-回避葛藤、回避-回避葛藤)を作り出すことができ、また、彼の力場分析によって分析された他のルーヴィン状況を操作化することができる。重ね合わせ強化スケジュールを分析ツールとして用いる他の例としては、家賃統制の偶発事象(Brechner, 2003)や、ロサンゼルス郡の雨水排水システムにおける有害廃棄物投棄問題(Brechner, 2010)への応用が挙げられる。
オペラント条件付けにおいて、同時強化スケジュールとは、動物の被験者または人間の参加者が同時に利用できる強化スケジュールであり、被験者または参加者はどちらのスケジュールでも反応することができます。例えば、二者択一強制選択課題において、スキナー箱の中のハトは2つのつつきキーに直面します。どちらでもつつき反応を行うことができ、どちらをつついた後にも餌の強化が行われる可能性があります。2つのキーをつついた場合の強化スケジュールは異なる場合があります。それらは独立している場合もあれば、一方のキーでの行動がもう一方のキーでの強化の可能性に影響を与えるようにリンクされている場合もあります
2つのスケジュールへの反応は、物理的に区別される必要はありません。1958年にFindleyによって導入された、同時スケジュールを設定する別の方法では、両方のスケジュールを1つのキーまたはその他の反応装置に配置し、被験者は2つ目のキーに反応することでスケジュールを切り替えることができます。このような「Findley同時」手順では、刺激(例えば、メインキーの色)によって、どちらのスケジュールが有効であるかが示されます。
同時スケジュールは、しばしばキー間の急速な切り替えを引き起こします。これを防ぐため、「切り替え遅延」が一般的に導入されます。これは、被験者がスケジュールを切り替えた後、各スケジュールが短時間非アクティブになるというものです。
同時発生しているスケジュールが両方とも可変間隔である場合、 2つのスケジュールにおける相対的な反応率とそれらがもたらす相対的な強化率の間には、マッチング法則として知られる定量的な関係が見られます。これは1961年にRJ Herrnsteinによって初めて観察されました。マッチング法則とは、道具的行動における法則であり、特定の反応選択肢に対する相対的な反応率は、その反応に対する相対的な強化率と等しい(行動率 = 強化率)とされています。動物と人間は、スケジュールにおいて選択性を好む傾向があります。[ 24 ]
シェーピングとは、望ましい道具的反応への連続的な近似値の強化です。例えば、ラットにレバーを押すように訓練する場合、最初はレバーに向かって向きを変えることだけが強化されます。次に、向きを変えてレバーに向かって歩くことだけが強化されます。最終的に、ラットはレバーを押すことが強化されます。1つの行動の達成に成功すると、次の行動のシェーピングプロセスが始まります。訓練が進むにつれて、反応は徐々に望ましい行動に近づき、後続の行動はそれぞれ最終的な行動に近づくようになります。[ 25 ]
シェーピング介入は多くの訓練場面で用いられており、自閉症やその他の発達障害のある人にも用いられています。シェーピングを機能的コミュニケーション訓練(FCT)[ 26 ]などのエビデンスに基づく他の実践と組み合わせることで、人間の行動に肯定的な結果をもたらす可能性があります。シェーピングでは通常、連続強化が用いられますが、その後、間欠強化スケジュールに移行することも可能です。
シェイピングは食物拒否にも用いられます。[ 27 ]食物拒否とは、個人が食物に対して部分的または完全な嫌悪感を抱くことです。これは、好き嫌いが激しい程度の軽度なものから、個人の健康に影響を与えるほど重度なものまで様々です。シェイピングは食物受容において高い成功率を示すために用いられてきました。[ 28 ]
チェーニングとは、個別の行動を連続的に結びつけることです。各行動の結果は、前の行動の強化と次の行動の先行刺激の両方となります。チェーニングを教える方法は、順方向チェーニング(チェーニングの最初の行動から始める)、逆方向チェーニング(最後の行動から始める)、トータルタスクチェーニング(チェーニングの各行動を同時に教える)など、数多くあります。人々の朝の日課は典型的な連鎖であり、一連の行動(例:シャワーを浴びる、体を拭く、服を着る)が、よく学習された習慣として順番に行われます
自閉症やその他の関連障害を持つ人に見られる困難な行動は、連鎖強化スケジュールを用いた研究でうまく管理・維持できることが示されている。[ 29 ]機能的コミュニケーショントレーニングは、適切かつ望ましい機能的コミュニケーション反応を効果的に促進するために、連鎖強化スケジュールを使用する介入である。[ 30 ]
このセクションは拡張が必要です。不足している情報を追加してご協力ください。 (2024年2月) |
強化の数学的モデルの構築に関する研究が行われています。このモデルはMPR(強化の数学的原理)として知られています。ピーター・キリーンはハトに関する研究でこの分野における重要な発見を成し遂げました。[ 31 ]
強化と罰は人間の社会的相互作用において遍在しており、オペラント原理の多くの応用が提案され、実践されてきました。以下にいくつかの例を示します
正の強化と負の強化は、依存症と薬物依存の発生と維持において中心的な役割を果たします。依存性薬物は本質的に報酬性があり、つまり薬物使用の主要な正の強化子として機能します。脳の報酬系は、薬物にインセンティブの顕著性(つまり、「欲しい」または「望まれている」)を割り当てます。[ 32 ] [ 33 ] [ 34 ]そのため、依存症が発症すると、薬物の欠乏は渇望につながります。さらに、薬物使用に関連する刺激(例えば、注射器の光景や使用場所)は、薬物によって誘発される強い強化と関連付けられるようになります。[ 32 ] [ 33 ] [ 34 ]これらの以前は中立であった刺激は、いくつかの特性を獲得します。その外観は渇望を誘発し、継続的な使用の条件付けされた正の強化子になる可能性があります[ 32 ] [ 33 ] [ 34 ]そのため、中毒者がこれらの薬物への渇望のきっかけの一つに遭遇すると、関連する薬物への渇望が再び現れる可能性があります。例えば、麻薬撲滅機関はかつて、薬物使用の危険性を示すために、麻薬関連器具の画像を掲載したポスターを使用していました。しかし、ポスターに描かれた刺激を見ると 再発を引き起こすというインセンティブサリエンシーの影響により、このようなポスターはもはや使用されていません。
薬物依存者の場合、薬物離脱中に生じる身体的依存(震えや発汗など)や心理的依存(無快感症、落ち着きのなさ、イライラ、不安など)の症状を軽減または「逃れる」ために薬物を自己投与すると、負の強化が起こる。[ 32 ]
動物訓練士やペットの飼い主は、オペラント条件付けの概念が命名され研究されるずっと前から、この原則と実践を適用していました。そして、動物訓練は今でもオペラント制御の最も明確で説得力のある例の一つを提供しています。この記事で説明されている概念と手順の中で、最も顕著なものをいくつか挙げると、即時強化の利用可能性(例:常にある犬用のおやつ袋)、随伴性(強化が望ましい行動に続くものであり、他の何かに続くものではないことを保証する)、二次強化の使用(望ましい反応の直後にクリッカーを鳴らすなど)、シェーピング(犬を徐々に高くジャンプさせるなど)、間欠強化(おやつを与える頻度を減らして、飽きることなく持続的な行動を誘発する)、連鎖(複雑な行動が徐々に組み立てられる)です。[ 35 ]
子どもの適切な行動に対する肯定的な強化を与えることは、保護者マネジメント研修の主要な焦点です。一般的に、保護者は適切な行動に対して、社会的な報酬(褒め言葉、笑顔、ハグなど)だけでなく、具体的な報酬(子どもと協力して作り上げたインセンティブシステムの一環として、ステッカーやポイントなど、より大きな報酬につながるもの)を与えることを学びます。[ 36 ]さらに、保護者は最初の焦点として単純な行動を選び、子どもがより大きな目標達成に向けて達成する小さな一歩ごとに報酬を与えることを学びます(この概念は「漸進的近似」と呼ばれます)。[ 36 ] [ 37 ]また、進捗チャートなどの間接的な報酬を用いることもあります。教室で肯定的な強化を与えることは、生徒の成功に有益です。生徒に肯定的な強化を与える際には、個々の生徒のニーズに合わせて個別に行うことが重要です。こうすることで、生徒はなぜ褒められているのかを理解し、それを受け入れ、最終的には肯定的な強化によって得られた行動を継続することを学びます。たとえば、ご褒美や追加の休憩時間の使用は、一部の生徒にはより効果的かもしれませんが、他の生徒は賞賛を示すステッカーやチェックマークをもらうことで強制を受け入れるかもしれません。
心理学者と経済学者はともに、オペラント理論の概念と知見を市場における人間の行動に適用することに興味を抱いています。一例として、商品の購入量によって指標化された消費者需要の分析が挙げられます。経済学では、価格が消費に影響を与える度合いを「需要の価格弾力性」と呼びます。特定の商品は他の商品よりも弾力性が高い場合があります。例えば、特定の食品の価格変動は購入量に大きな影響を与える可能性がありますが、ガソリンなどの生活必需品は価格変動の影響が少ない場合があります。オペラント分析の観点から見ると、このような効果は消費者の動機と、強化子としての商品の相対的な価値という観点から解釈することができます。[ 38 ]
この記事の冒頭で述べたように、可変比率スケジュールは、予測不可能な数の反応を発した後に強化効果をもたらします。このスケジュールは通常、迅速かつ持続的な反応を生み出します。スロットマシンは可変比率スケジュールに基づいて配当を支払い、まさにこのような持続的なレバー引き行動をギャンブラーに引き起こします。スロットマシンは獲得する金額よりも少ない金額を支払うようにプログラムされているため、スロットマシンを粘り強く使用する人は長期的には必ず負けることになります。スロットマシン、そしてひいては可変比率強化は、ギャンブル依存症の根底にある要因としてしばしば非難されてきました。[ 39 ]
人間における行動強化の手段としての賞賛の概念は、BFスキナーのオペラント条件付けモデルに根ざしています。この観点から、賞賛は正の強化の手段と見なされており、観察された行動は、その行動を条件付きで賞賛することによって、より起こりやすくなるとされています。[ 40 ] 何百もの研究が、肯定的な行動を促進する上での賞賛の有効性を実証しており、特に、教師と親が子供を賞賛することで行動と学業成績の向上を促進する研究[ 41 ] [ 42 ]だけでなく、仕事のパフォーマンスの研究でも実証されています。[ 43 ]賞賛はまた、代理強化を通じて、賞賛を受けていない隣接する個人(賞賛を受ける人のクラスメートなど)の肯定的な行動を強化することが実証されています。[ 44 ]賞賛は、その形式、内容、伝え方によって、行動を変える上で多かれ少なかれ効果的である可能性があります賞賛が肯定的な行動の変化をもたらすためには、賞賛は肯定的な行動を条件とするもの(すなわち、目標とする行動が行われた後にのみ与えられる)であり、強化されるべき行動の詳細を特定し、誠実かつ信頼できる形で伝えられなければならない。[ 45 ]
賞賛が肯定的な強化戦略として効果があることを認識し、多くの行動および認知行動介入において、賞賛の使用がプロトコルに取り入れられています。[ 46 ] [ 47 ]賞賛の戦略的な使用は、学級経営[ 46 ]と子育て訓練介入[ 42 ]の両方において証拠に基づく実践として認識されていますが、介入研究では、賞賛は戦略的注意や行動報酬などの戦略を含む、より大きなカテゴリーの肯定的な強化にまとめられることがよくあります。
トラウマティック・ボンディングは、継続的な虐待のサイクルの結果として発生し、報酬と罰の断続的な強化によって、変化に抵抗する強力な感情的な絆が形成されます。[ 48 ] [ 49 ]
他の情報源によると、 [ 50 ] 「トラウマ的な絆を形成するための必要条件は、一方が他方を支配し、虐待のレベルが慢性的に急上昇し、その後下降することです。この関係は、支配的な人物からの寛容で、同情的で、愛情深い行動の期間と、断続的な激しい虐待のエピソードによって特徴付けられます。加害者は、優位性を維持するために、被害者の行動を操作し、被害者の選択肢を制限して、力の不均衡を永続させます。支配と服従のバランスに対するいかなる脅威も、煮えくり返る脅迫から激しい暴力の爆発に至るまで、エスカレートする懲罰のサイクルで対処される可能性があります。」加害者は被害者を他の支援源から孤立させ、発見や介入の可能性を低下させ、被害者が相反する自己言及的なフィードバックを受け取る能力を損ない、一方的な依存感を強めます。…こうした虐待的な関係によるトラウマ的な影響には、被害者の正確な自己評価能力の低下が含まれ、自己不十分感や支配的な人物への従属的な依存感につながります。被害者は、たとえ自身が攻撃の受け手であったとしても、攻撃行為を行った人物との感情的および行動的なつながりによって、様々な不快な社会的・法的結果に直面する可能性があります。
ほとんどのビデオゲームは、ある種の強迫ループに基づいて設計されており、変動レートスケジュールを通じて一種の正の強化を加えることで、プレイヤーがゲームをプレイし続けられるようにしていますが、これはビデオゲーム依存症につながる可能性もあります。[ 51 ]
2010年代のビデオゲーム収益化のトレンドの一環として、一部のゲームでは「ルートボックス」と呼ばれる報酬が提供されました。ルートボックスは、ゲーム内アイテムをランダムに選択し、レア度に応じて配布されます。この仕組みは、スロットマシンなどのギャンブル機器が報酬を配布する方法と同じく、変動レートで報酬を配布する仕組みです。ルートボックスはギャンブルの一種であるという一般的な認識がありますが、ギャンブルとして分類されているのはごく一部の国に限られ、それ以外は合法です。しかし、これらのアイテムをオンラインギャンブルの仮想通貨として使用したり、現実世界の通貨と交換したりする手段によって、スキンギャンブル市場が形成され、法的評価が行われています。[ 52 ]
行動強化の標準的な定義は、反応の強さは強化によって増加すると主張しているように見えるため、循環論法であると批判されてきました。強化とは、反応の強さを増大させるもの(つまり、反応の強さは、反応の強さを増大させるものによって増大する)と定義されています。しかし、強化の正しい用法[ 53 ]は、行動に影響を与えるから強化子であるということであり、その逆ではありません。特定の刺激が強化子であるから行動を強化すると述べ、なぜ刺激が行動にそのような効果を生み出しているのかを説明していない場合、循環論法になります。FDシェフィールドの「反応に依存する完了的行動」など、他の定義も提案されていますが、これらは心理学では広く使用されていません。[ 54 ]
強化子の役割に関する理解は、「強化」効果から「シグナリング」効果へと移行しつつある。[ 55 ]つまり、強化子は強化につながる可能性のある行動をシグナルするため、反応を増加させるという考え方である。ほとんどの実用的応用においては、強化子がシグナルを発しているか強化しているかに関わらず、その効果はどの強化子でも同じであるが、このアプローチは、断続的な強化スケジュール(固定間隔スカロップ)における反応パターンや差異的結果効果など、多くの行動現象を説明するのに役立つ。[ 56 ]
行動分析学の観点から見ると、罰とは、ある反応の後に、同様の状況において同様の反応が起こる確率を低下させるような事象(すなわち刺激の変化)が続く状況を指します。…この定義には、痛み、恐怖、不快感などは含まれていません。例えば、ある人が2台分のスペースを占領して駐車し、通行人が「それは思いやりがない」と言ったとします。駐車中に2台分のスペースを占領する確率がその後低下した場合、罰が行われたと合理的に推定できます。
戻ってくるものはすべて正の強化子であり、したがって報酬である。良い定義を与えるが、正の強化は複数の報酬機能の一つに過ぎない。…報酬は魅力的である。報酬は動機付けとなり、努力を促す。…報酬は接近行動(欲求行動または準備行動とも呼ばれる)と完了行動を引き起こす。 …したがって、私たちがそれに近づき、消費する可能性のあるあらゆる刺激、物体、出来事、活動、または状況は、定義上、報酬です。…内発的報酬とは、それ自体が喜びをもたらし、外発的報酬を得るための手段ではなく、それ自体のために行われる活動です。…内発的報酬は、ピアノを完璧に演奏し、楽しむことのように、学習、接近、そして喜びを誘発するため、それ自体が真の報酬です。内発的報酬は高次の報酬を条件付ける役割を果たしますが、条件付けされた高次の報酬ではありません。なぜなら、その報酬特性を得るためには、無条件の報酬との組み合わせが必要ないからです。
乱用薬物への繰り返しの曝露が、脆弱な脳に変化を引き起こし、薬物の強迫的な探求と摂取、そして薬物使用に対する制御の喪失を引き起こし、依存症の状態を定義する能力です... 多くの文献で、D1 型 [側坐核] ニューロンでのこのような ΔFosB 誘導により、動物の薬物および自然報酬に対する感受性が高まり、おそらくは正の強化のプロセスを通じて薬物の自己投与が促進されることが実証されています... ΔFosB のもう 1 つのターゲットは cFos です。薬物への反復曝露により ΔFosB が蓄積すると、c-Fos が抑制され、慢性薬物投与状態で ΔFosB が選択的に誘導される分子スイッチに寄与します。41
...
さらに、人口全体にわたって依存症の遺伝的リスクに幅があるにもかかわらず、長期間にわたって十分に高用量の薬物に曝露されると、遺伝的負荷が比較的低い人でも依存症になる可能性があるという証拠が増えています。
アルコールやその他の薬物の反復使用によって、健康問題、障害、職場、学校、家庭における主要な責任の遂行不能など、臨床的および機能的に重大な障害が生じる状態を指す。重症度に応じて、軽度、中等度、重度に分類される。
依存症:物質使用障害の最も重篤な慢性段階を指す用語。薬物の使用をやめたいと願っているにもかかわらず、強迫的に薬物を摂取するなど、自制心が著しく失われている状態を指す。DSM-5では、「依存症」という用語は重度の物質使用障害の分類と同義である。
当初、その正の強化特性に応じて定期的に摂取されます。重要なのは、報酬物質への反復曝露が二次強化イベントの連鎖を引き起こし、薬物使用に関連する手がかりや状況自体が強化要因となり、選択した物質の継続的な使用や乱用につながる可能性があることです。…依存症プロセス(特に再発)に非常に関連する強化の重要な側面は、二次強化です(Stewart, 1992)。二次強化子(多くの場合、条件付け強化子とも考えられます)は、人間の強化プロセスの大部分を駆動すると考えられます。薬物[依存症]という具体的なケースでは、薬物使用と密接に繰り返し結びつく手がかりや文脈は、しばしばそれ自体が強化因子となる。…ロビンソンとベリッジによる依存症の誘因感作理論の基本的な部分は、一次強化因子自体に加えて、このような二次強化プロセスの誘因価値や魅力が、薬物依存症の発達と連動して、時間の経過とともに持続し、感作さえされる可能性があると仮定している(Robinson and Berridge, 1993)。…負の強化とは、何らかの進行中の(おそらく嫌悪的な)刺激を終結させる行動反応の強化に関連する特殊な状態である。この場合、負の強化因子とは、そのような「逃避」反応を強化する動機づけ刺激と定義することができる。歴史的に、薬物依存症に関して、この現象はヒトにおいて一貫して観察されており、離脱状態における動機づけ欲求を鎮めるために乱用薬物が自己投与される(Wikler, 1952)。
れるだけでなく、多くの場合、その手がかり自体が非常に魅力的になり、時には非合理的なレベルにまで達する。この手がかりの魅力は、インセンティブサリエンシーのもう一つの特徴である。 CSは、見ずにはいられなくなる(Wiers & Stacy, 2006; Hickey et al., 2010a; Piech et al., 2010; Anderson et al., 2011)。CSは、UCSと同様のインセンティブ特性さえも持つ。魅力的なCSはしばしば行動的動機づけを誘発し、時にはCSをUCSのように「消費」しようとすることさえある(例えば、食べる、飲む、喫煙する、性交する、薬物として摂取する)。CSを「欲する」ことは、以前は中立的だった刺激を道具的条件付け強化子へと変化させ、個人は手がかりを得るために努力するようになる(ただし、条件付け強化には別の心理メカニズムも存在する)。
特定の対象に狭く集中するのかを理解することです。依存症は、強い「欲求」を生み出す、感作された、あるいは過剰反応したドーパミン系によって生じる過剰なインセンティブの顕在化に一部起因すると示唆されています (Robinson and Berridge, 1993)。しかし、なぜある対象が他の対象よりも強く「欲求」されるのかは、完全には解明されていません。中毒患者やアゴニスト刺激を受けている患者では、ドーパミン刺激によるインセンティブ顕在化の繰り返しが、依存性薬物の摂取や特定の強迫行為といった特定の個別的な追求に帰属するようになる。パブロフの報酬状況では、報酬の手がかりの中には、強力な動機づけの磁石として他の手がかりよりも「求められる」ものがあり、その様子は個人によって異なる(Robinson et al., 2014b; Saunders and Robinson, 2013)。…しかしながら、快楽効果は時間の経過とともに変化する可能性がある。薬物を繰り返し摂取すると、感受性の高い人では中脳辺縁系ドーパミンの感作が起こり、「欲求」が増幅される可能性がある(Leyton and Vezina, 2013; Lodge and Grace, 2011; Wolf and Ferrario, 2010)。これは、たとえ継続的な薬物刺激によってオピオイド快楽機構がダウンレギュレーションを起こし、「好み」耐性が生じた場合であっても同様である。インセンティブ感作は、手がかりによって引き起こされる薬物の再摂取への「欲求」を選択的に増幅させることで依存症を生じさせ、薬物の快感が薄れたとしても、強力な動機づけを引き起こす(Robinson and Berridge, 1993)。
{{cite book}}:ISBN / 日付の非互換性(ヘルプ){{cite book}}:ISBN / 日付の非互換性(ヘルプ){{cite book}}:ISBN / 日付の非互換性(ヘルプ)