強化・弱化とは
オペラント条件づけ・道具的条件づけにおいて、報酬などの刺激によって行動が増えることを強化、罰などの刺激によって行動が減ることを弱化(罰)と呼ぶ。
強化・弱化はあくまで結果であり、いくら報酬を与えても行動が増えなければ強化ではないし、いくら罰を与えても行動が減らなければ弱化ではない。
強化子(好子・報酬刺激)
目標となる行動を増やす(強化する)ための報酬などの刺激のこと。
動物に対する餌、子供に対するお菓子や褒めることなどが一般的な強化子として用いられるが、結果的に行動が増えることが強化子の定義であり、行動が増えなければそれは強化子ではない。
例えば、満腹時の餌やお菓子は強化子にならないし、褒められることが嫌悪刺激となって逆に行動が弱化されることもある。(褒められるのも嫌。)
弱化子・罰子(嫌子・嫌悪刺激)
目標となる行動を減らす(弱化する)ための罰などの刺激のこと。
動物や子供を叱ることなどが一般的な弱化子として用いられるが、結果的に行動が減ることが弱化子の定義であり、行動が減らなければそれは弱化子ではない。
例えば、叱られることが報酬刺激となって逆に行動が強化されることもある。(叱られても嬉しい。)
弱化子は、行動を減らす(弱化)だけでなく、刺激から逃げたり(逃避学習)、回避したり(回避学習)する行動を増やす(強化)ことにもつながることから、その用法には十分注意する必要がある。
また、弱化子の強度が十分強くないと、慣れが生じるため効果が薄れることがある。
正の強化・負の強化・正の弱化・負の弱化
正は刺激を受け取ること(提示)、負は刺激を取り除くこと(消去)を意味する。
以下は、それぞれ正の強化・負の強化・正の弱化・負の弱化の例。
- 正の強化は、販売実績に応じたインセンティブ報酬による販売活動の促進
- 負の強化は、生産実績に応じた休暇制度による生産効率の向上
- 正の弱化は、事務処理ミスに応じた罰則制度によるミスの削減(隠蔽など別の問題が起こる)
- 負の弱化は、不良品数に応じた報奨金による生産不良の削減
以下の表は、正の強化・負の強化・正の弱化・負の弱化を刺激の観点でまとめたもの。
報酬的な刺激(強化子) | 嫌悪的な刺激(弱化子) | |
刺激を受け取る(提示) | 行動が増える (正の強化) | 行動が減る (正の弱化) 別の行動が増える (回避学習・逃避学習) |
刺激を取り除く(消去) | 行動が減る (負の弱化) | 行動が増える (負の強化) |
以下の表は、刺激と反応の観点でまとめたもの。
褒めればいい、叱ったらダメなどの単純な話ではなく、目的となる行動が増えるように強化することが大切。
分類 | 刺激 | 反応 | 説明 |
---|---|---|---|
正の強化 | 刺激(強化子)を受け取る | 行動が増える(維持される) | ・褒めても行動が増えなければ強化ではない ・褒めたら逆に行動が減る(弱化される)こともある |
正の弱化 | 刺激(弱化子)を受け取る | 行動が減る | ・叱っても行動が減らなければ弱化ではない ・叱ったら逆に行動が増える(強化される)こともある(俗にいうマゾ) ・回避や逃避などの別の行動も強化(負の強化)される ・回避も逃避もできないと学習性無力感に陥る恐れがある |
負の強化 | 刺激(弱化子)を取り除く | 行動が増える(維持される) | ・刺激(弱化子)を消去して行動を増やす手続き ・正の弱化では、刺激(弱化子)を回避や逃避によって消去しようとする行動が起きる(回避学習・逃避学習) ・例えば、お漏らしを隠して叱られるのを避けるのが回避学習、お漏らしを叱られたら逃げるのが逃避学習 |
負の弱化 | 刺激(強化子)を取り除く | 行動が減る | ・刺激(強化子)を消去して行動を減らす手続き ・タイムアウト法、レスポンスコスト法(トークン・エコノミー法の逆)などが行われる |
不安障害(不安症):負の強化と回避学習・逃避学習
レスポンデント条件づけ・古典的条件づけ(恐怖条件づけ)によって発生して(発生要因)、オペラント 条件づけ・道具的条件づけの負の強化(回避学習・逃避学習)で維持される(維持要因)ものに、不安障害(不安症)がある。
不安を避けようとする回避行動・安全行動が強化されることで、逆に不安を消去(抑制)する機会を失い、不安症状が維持されることになる。
不安障害(不安症)には、暴露療法(エクスポージャー法)が用いられることが多い。
回避行動・安全行動は、暴露(エクスポージャー)における安全行動(安全確保行動)である。
即時強化
強化子は、行動が行われた直後に与えることで学習効果が高まることがわかっている。
時間が経つほど強化の効果は弱まり、時間が経ってから強化すると別の行動が誤って強化される恐れも出てくる。
トークン・エコノミー法
強化子は、数をためると報酬と交換できるトークン(引換券)でも強化が成立することがわかっている。(トークン・エコノミー法による二次的強化)
トークン(引換券)を用いることで、即時強化が容易になる。
シェーピング法(シェイピング法)
強化子を用いてスモールステップに分けて行動を形成していくことをシェーピング法(シェイピング法)と呼ぶ。
強化子には、数をためると報酬と交換できるトークン(引換券)を与えるトークン・エコノミー法と組み合わせて用いられることもある。
部分強化効果(間欠強化効果)
毎回強化子(報酬などの刺激)を与える連続強化よりも、ときどき強化子を与える部分強化(間欠強化)の方が学習の消去(抑制)が起こりにくい(消去抵抗が大きい)。
ギャンブル依存やゲーム依存などが典型例で、恋愛や教育などでは「アメと無視」、「じらし」や「おあずけ」などとして利用されるものである。
強化スケジュール
強化子(報酬などの刺激)をどのような間隔や時間で与えるかの配分方法を強化スケジュールと呼ぶ。
スキナー箱では実験の記録などを自動化することで、強化スケジュールの実験が進められた。
効果の法則
エドワード・ソーンダイクが試行錯誤説の中で用いた効果の法則は、のちのオペラント条件づけ・道具的条件づけにおける強化とほぼ同じことを説明しようとしている。
参考
関連する心理学用語
行動療法
行動分析学
応用行動分析(ABA)
恐怖条件づけ
不安障害(不安症)
コメント