強化スケジュール

スポンサーリンク

強化スケジュールとは

オペラント条件づけ・道具的条件づけにおいて、強化子(報酬などの刺激)をどのような間隔や時間で与えるかの配分方法。

スキナー箱では実験の記録などを自動化することで、強化スケジュールの実験が進められた。


毎回強化子(報酬などの刺激)を与える連続強化よりも、ときどき強化子を与える部分強化(間欠強化)の方が学習の消去(抑制)が起こりにくい(消去抵抗が大きい)。

これを部分強化効果(間欠強化効果)というが、強化スケジュールによっても消去抵抗が異なる。


レスポンデント条件づけ・古典的条件づけの条件づけ方法については、対提示(対呈示)と条件づけをご覧ください。

タイミングによる強化方法については、即時強化をご覧ください。


強化スケジュールの以前には、すでに様々な強化学習が行われていると考えることができ、これを強化履歴と呼ぶ。

強化履歴のない個体は存在しないため、強化スケジュールに対する反応も個体差が生まれる要因となる。


連続強化スケジュールは1つだが、部分強化スケジュール(間欠強化スケジュール)は多くのパターンが考えられる。

ここでは、代表的なものとして4つの部分強化スケジュール(FR、VR、FI、VI)を紹介する。

以下の図は、横軸は時間、縦軸は累積反応回数を表している。(累積反応曲線・反応累積曲線)

https://commons.wikimedia.org/wiki/File:Schedule_of_reinforcement.png


固定比率スケジュール(FR:Fixed Ratio)

固定(F:Fixed)した回数比率(R:Ratio)ごとに強化子を与える強化スケジュール。

例としては、歩合給(成果報酬や出来高払い)など。

スタンプカードなどトークン(引換券)として実態のある強化子を与える場合は、トークン・エコノミー法である。


強化子が与えられるタイミングを予測できるため、強化子が与えられた後に反応が低下する強化後休止(強化後反応休止)が見られる。(グラフが線形・直線ではない。)


変動比率スケジュール(VR:Variable Ratio)

変動(V:Variable)する回数比率(R:Ratio)ごとに強化子を与える強化スケジュール。

例としては、スロットマシーンやパチンコなどのギャンブル、ソーシャルゲームのガチャなど。


強化子が与えられるタイミングを予測できないため、強化子が与えられた後に反応が低下する強化後休止(強化後反応休止)は見られない。(グラフが線形・直線に近く。)


固定間隔スケジュール(FI:Fixed Interval)

固定(F:Fixed)した時間間隔(I:Interval)ごとに強化子を与える強化スケジュール。

例としては、固定給(月給)やゲームの継続(ログイン)ボーナスなど。


強化子が与えられるタイミングを予測できるため、強化子が与えられた後に反応が低下する強化後休止(強化後反応休止)が見られる。(グラフが線形・直線ではない。)

これは、給料日の後にやる気がなくなる現象を説明する。


変動間隔スケジュール(VI:Variable Interval)

変動(V:Variable)する時間間隔(I:Interval)ごとに強化子を与える強化スケジュール。

例としては、魚釣りなど。(釣れるまで放置してアタリを待つ。)


強化子が与えられるタイミングを予測できないため、強化子が与えられた後に反応が低下する強化後休止(強化後反応休止)は見られない。(グラフが線形・直線に近く。)


スキナー箱の累積記録器

以下の動画は、スキナー箱強化スケジュールが自動的に累積記録されている様子。(雑音のみ、1:11)

反応があるとグラフが累積されていき(動画の左側がグラフの上側)、強化されるとクロスするように線が引かれる。

このページの最初の図(累積反応曲線・反応累積曲線)と比べてみてほしい。

https://youtu.be/fERCCWKxp4Y


参考


関連する心理学用語

オペラント条件づけ・道具的条件づけ

スキナー箱

強化と弱化

部分強化効果(間欠強化効果)

強化履歴

即時強化

トークン・エコノミー法

レスポンデント条件づけ・古典的条件づけ

対提示(対呈示)と条件づけ

行動主義

徹底的行動主義


記述には慎重を期しておりますが、万一誤りや誤解を与えるような内容がありましたら、下部のコメントからご連絡いただけると助かります。

コメント