強化スケジュールとは
オペラント条件づけ・道具的条件づけにおいて、強化子(報酬などの刺激)をどのような間隔や時間で与えるかの配分方法。
スキナー箱では実験の記録などを自動化することで、強化スケジュールの実験が進められた。
毎回強化子(報酬などの刺激)を与える連続強化よりも、ときどき強化子を与える部分強化(間欠強化)の方が学習の消去(抑制)が起こりにくい(消去抵抗が大きい)。
これを部分強化効果(間欠強化効果)というが、強化スケジュールによっても消去抵抗が異なる。
強化スケジュールの以前には、すでに様々な強化学習が行われていると考えることができ、これを強化履歴と呼ぶ。
強化履歴のない個体は存在しないため、強化スケジュールに対する反応も個体差が生まれる要因となる。
連続強化スケジュールは1つだが、部分強化スケジュール(間欠強化スケジュール)は多くのパターンが考えられる。
ここでは、代表的なものとして4つの部分強化スケジュール(FR、VR、FI、VI)を紹介する。
以下の図は、横軸は時間、縦軸は累積反応回数を表している。(累積反応曲線・反応累積曲線)
固定比率スケジュール(FR:Fixed Ratio)
固定(F:Fixed)した回数比率(R:Ratio)ごとに強化子を与える強化スケジュール。
例としては、歩合給(成果報酬や出来高払い)など。
スタンプカードなどトークン(引換券)として実態のある強化子を与える場合は、トークン・エコノミー法である。
強化子が与えられるタイミングを予測できるため、強化子が与えられた後に反応が低下する強化後休止(強化後反応休止)が見られる。(グラフが線形・直線ではない。)
変動比率スケジュール(VR:Variable Ratio)
変動(V:Variable)する回数比率(R:Ratio)ごとに強化子を与える強化スケジュール。
例としては、スロットマシーンやパチンコなどのギャンブル、ソーシャルゲームのガチャなど。
強化子が与えられるタイミングを予測できないため、強化子が与えられた後に反応が低下する強化後休止(強化後反応休止)は見られない。(グラフが線形・直線に近く。)
固定間隔スケジュール(FI:Fixed Interval)
固定(F:Fixed)した時間間隔(I:Interval)ごとに強化子を与える強化スケジュール。
例としては、固定給(月給)やゲームの継続(ログイン)ボーナスなど。
強化子が与えられるタイミングを予測できるため、強化子が与えられた後に反応が低下する強化後休止(強化後反応休止)が見られる。(グラフが線形・直線ではない。)
これは、給料日の後にやる気がなくなる現象を説明する。
変動間隔スケジュール(VI:Variable Interval)
変動(V:Variable)する時間間隔(I:Interval)ごとに強化子を与える強化スケジュール。
例としては、魚釣りなど。(釣れるまで放置してアタリを待つ。)
強化子が与えられるタイミングを予測できないため、強化子が与えられた後に反応が低下する強化後休止(強化後反応休止)は見られない。(グラフが線形・直線に近く。)
スキナー箱の累積記録器
以下の動画は、スキナー箱で強化スケジュールが自動的に累積記録されている様子。(雑音のみ、1:11)
反応があるとグラフが累積されていき(動画の左側がグラフの上側)、強化されるとクロスするように線が引かれる。
このページの最初の図(累積反応曲線・反応累積曲線)と比べてみてほしい。
参考
関連する心理学用語
強化履歴
徹底的行動主義
コメント