強化スケジュール(reinforcement schedule)
ポイント
強化スケジュール(reinforcement schedule)
連続強化スケジュール
勉強をする度に大好きなココアを毎回飲むというように、反応に毎回強化子が付随する強化スケジュール連続強化スケジュールという。
部分強化スケジュール
固定比率スケジュール(FR)
部分強化スケジュルの中で最初の9回は強化子がなく、10回目の反応が強化されるような強化スケジュールを固定比率スケジュール(FR)という。この強化スケジュールを用いた場合、強化後の反応休止があり、その後一定のペースで連続した反応を示す。
変動比率スケジュール(VR)
ギャンブルなどのように大当たり(強化子)するまでの行動の回数が一定ではなく、平均して何回かに1 回の割合で強化されるような強化スケジュールを変動比率スケジュール(VR)という。このスケジュールのもとでの典型的な行動は、強化後の反応休止がほとんどみられず、きわめて高頻度の反応を連続して行うものである。
強化子 (reinforcer)
お腹が空いているときの食べ物や電気ショックなど生得的に強化子としての機能を持つ刺激を無条件性強化子(一次性強化子)という。また、経験により強化機能を持つようになった刺激を条件性強化子(二次性強化子)という。
環境の変化と個体の行動の変容との機能的関係によって定義された刺激の類(クラス)の一つ。行動に後続して起こる環境変化のうち、その後の行動の出現頻度を増加させるものを強化子もしくは強化刺激(reinforcing stimulus)とよぶ。この行動の増加が、新たな刺激の出現あるいはすでにあった刺激の消失によってもたらされたのかで、それぞれの刺激を正の強化子、負の強化子とよんでいる。また生得的にこのような機能を獲得しているかどうかで無条件性強化子(一次強化子)・条件性強化子(二次強化子)、刺激の性質が物理的実体(食物、金銭)を伴っているか、それともある活動への従事(遊び、会話)によって表されるかで、実体的強化子(tangible reinforcer)、プレマック型強化子(Premackian reinforcer)と分類される。用法上の誤りを避けるために、正の強化子・負の罰子を好子、負の強化子・正の罰子を嫌子とよぶ場合もある。
ルール志向行動(rule-governed behavior)
「あの監督の最新作の映画、面白かったよ」と聞いて、 その映画を見に行った場合、 それを「ルール志向行動(ルール支配性行動)」という。
シェイピング技法(Shaping method)
新しい行動を獲得するときに、その行動をスモールステップに分けて、簡単にできるところから順に形成していく方法を「シェイピング技法」 という。
連鎖化(chaining)
学生食堂で食事をするためには、 自動券売機にお金を入れる、食べたいメニューのボタンを押す、 食券を受け取る、トレーを持って列に並ぶ、カウンターで食券を渡す、 料理を受け取る、空いている席に座るというようにいくつかの反応からなる複雑な行動を形成する手続を「連鎖化」 という。これについて、食券の買い方から練習し、次に列を作って順番に並ぶことを練習するように、 最初から順番に訓練していくやり方を 「順向連鎖化」という。
三項随伴性(three term contingency of reinforcement)
オペラント反応を自発する手がかりになる刺激を「弁別刺激」という。オペラント条件づけで弁別刺激-オペラント反応-強化子の関係性を3項随伴性とよぶ。
お腹が空いて学食に行くのと、友達に会いに学食に行くのは、「学食に行く」という同じ反応型が観察されるが、同じ「オペラント」 であるといえない。なぜなら反応の型が同じでも異なった随伴性が働いているなら、それらは違う行動である。ある行動をした結果、環境がどう変化したか、を経験することによって、環境に適応するような行動をオペラントという。
強化と罰(reinforcement / punishment)
ポイント
正と負
正は与える。負は取り除く。(望ましいか不快かは関係ない)
強化と弱化(罰)
強化は行動出現頻度を増やす。弱化(罰)は減らす。
強化
「強化」とは自発的行動の頻度が上昇することである。
望ましい適切な行動に対して、報酬を与えることによって、その行動の出現頻度を高める方法を強化法と呼ぶ。
罰
反応頻度が増することを強化というのに対し、頻度が減少することを罰という。
弱い罰から始め、次第に強くしていくと、どんなに強力な罰でも反応の抑制効果が弱められる。罰を与えると決めたら、適度な強度の罰を最初から与えなければならない。
正の強化
反応頻度が高まることを強化というが、タブー語を言って母親から叱られた子どもがますますタブー語を言うようになったのであれば、 これは正の強化といえる。
負の強化
いつも朝寝坊をする子どもが母親に叱られたくないから早起きをするようになった場合は負の強化であるといえる。
正の罰
タブー語を言って母親から叱られた子どもが母親の前でタブー語を言わなくなった場合、これを正の罰という。
負の罰
オペラント行動の後に、報酬刺激を除去することで行動頻度が現象すること。
cf.
タイムアウト法
友達とおもちゃをめぐってけんかをした幼児を誰もいない部屋に一人で隔離するというようなやりかたは負の罰であるが、これをタイム・アウト法という。
嫌悪性制御
正の罰と負の強化では嫌悪刺激を用いて反応の生起頻度を変化させようとすることを嫌悪性制御という。
部分罰
罰を与えたり与えなかったりする部分罰は反応抑制効果を激減させ、罰せられる反応と罰とを結びつけて学習することを困難にさせる。
遅延罰
反応して時間が経ってから罰を与える「遅延罰」は効果がないため、罰は反応の直後に与えた方がよい。
即時強化
即時強化とは、強化子の呈示のしかたとして、時間が経ってから呈示するよりも反応の直後に呈示する方が効果的であることをいう。
子どもがぐずったときに叱ったり、アメをあげたりするのは嫌悪刺激と正の強化子を同時に呈示していることになり、葛藤を引き起こしたり、ぐずるという反応を増加してしまう場合がある。