ジョゾログ

世界一わかりやすい心理学

ー未来の心理職の為の知識・情報室ー

オペラント条件づけ(operant conditioning)①

f:id:a-m-zyozo:20201031154919p:plain

 

f:id:a-m-zyozo:20190425133129p:plain

 

ポイント

 

 

オペラント条件付け 

ヒトや動物の自発したオペラント行動に強化子を随伴させ、その反応頻度を変容させる条件づけをオペラント条件づけという。

 

1898年のエドワード・ソーンダイクによる実験がはじめてであるが、1938年にはバラス・スキナーがマウスやハトを用いて体系的な研究を開始した。

 

 

 

強化と罰 
強化

 

強化」とは自発的行動の頻度が上昇することである。

望ましい適切な行動に対して、報酬を与えることによって、その行動の出現頻度を高める方法を強化法と呼ぶ。

 

反応頻度が高まることを強化というが、タブー語を言って母親から叱られた子どもがますますタブー語を言うようになったのであれば、 これは正の強化といえる。これに対し いつも朝寝坊をする子どもが母親に叱られたくないから早起きをするようになった場合は負の強化であるといえる。

 

反応頻度が増することを強化というのに対し、頻度が減少することをという。

タブー語を言って母親から叱られた子どもが母親の前でタブー語を言わなくなった場合、これを正の罰という。

 


 

 

 

強化子

 

お腹が空いているときの食べ物や電気ショックなど生得的に強化子としての機能を持つ刺激を無条件性強化子(一次性強化子)という。また、経験により強化機能を持つようになった刺激を条件性強化子(二次性強化子)という。

 

環境の変化と個体の行動の変容との機能的関係によって定義された刺激の類(クラス)の一つ。行動に後続して起こる環境変化のうち、その後の行動の出現頻度を増加させるものを強化子もしくは強化刺激(reinforcing stimulus)とよぶ。この行動の増加が、新たな刺激の出現あるいはすでにあった刺激の消失によってもたらされたのかで、それぞれの刺激を正の強化子、負の強化子とよんでいる。また生得的にこのような機能を獲得しているかどうかで無条件性強化子(一次強化子)・条件性強化子(二次強化子)、刺激の性質が物理的実体(食物、金銭)を伴っているか、それともある活動への従事(遊び、会話)によって表されるかで、実体的強化子(tangible reinforcer)プレマック型強化子(Premackian reinforcer)と分類される。用法上の誤りを避けるために、正の強化子・負の罰子を好子、負の強化子・正の罰子を嫌子とよぶ場合もある。

 

 

罰子

 

 

消去

 

 


 

 

強化スケジュール

 

勉強をする度に大好きなココアを毎回飲むというように、反応に毎回強化子が付随する強化スケジュール連続強化スケジュールという。部分強化スケジュルの中で最初の9回は強化子がなく、10回目の反応が強化されるような強化スケジュールを固定比率スケジュール(FR)という。この強化スケジュールを用いた場合、強化後の反応休止があり、その後一定のペースで連続した反応を示す。また、ギャンブルなどのように大当たり(強化子)するまでの行動の回数が一定ではなく、平均して何回かに1 回の割合で強化されるような強化スケジュールを変動比率スケジュール(VRという。このスケジュールのもとでの典型的な行動は、強化後の反応 休止がほとんどみられず、きわめて高頻度の反応を連続して行うものである。

 

 

行動形成・シェイピング

 

シェイピング技法

新しい行動を獲得するときに、その行動をスモールステップに分けて、簡単にできるところから順に形成していく方法を「シェイピング技法」 という。

 

  

三項随伴性(three term contingency of reinforcement)

 

三項随伴性は、先行刺激(stimuls)ー反応(response)ー結果(consequence)

の3つの要素の随伴性を意味する。

 

 

オペラント反応を自発する手がかりになる刺激を「弁別刺激」という。

オペラント条件づけでは、弁別刺激-オペラント反応-強化子の関係性を3項随伴性とよぶ。

お腹が空いて学食に行くのと、友達に会いに学食に行くのは、「学食に行く」という同じ反応型が観察されるが、同じ「オペラント」 であるといえない。なぜなら反応の型が同じでも異なった随伴性が働いているなら、それらは違う行動である。ある行動をした結果、環境がどう変化したか、を経験することによって、環境に適応するような行動をオペラントという。

 

 

連鎖化

学生食堂で食事をするためには、 自動券売機にお金を入れる、食べたいメニューのボタンを押す、 食券を受け取る、トレーを持って列に並ぶ、カウンターで食券を渡す、 料理を受け取る、空いている席に座るというようにいくつかの反応からなる複雑な行動を形成する手続を「連鎖化」  という。これについて、食券の買い方から練習し、次に列を作って順番に並ぶことを練習するように、 最初から順番に訓練していくやり方を 「順向連鎖化」という。  

 

 

 

 

確認問題

[1]

心理学における、行動随伴性とはどのようなことか、簡潔に説明しなさい。

名古屋市立大学大学院 人間文化研究科 人間文化専攻 臨床心理コース)

 

[2]

下記の用語を簡潔に説明しなさい。

・Skinner, B. F.

・オペラント条件づけ

静岡大学大学院 人文社会科学研究科 臨床人間科学専攻 臨床心理学コース)

 

 

 

[3]

学習理論における負の強化について、例をあげて説明しなさい。

名古屋市立大学大学院 人間文化研究科 人間文化専攻 臨床心理コース)

 

[4]

正の強化と負の強化を、その違いが分かるように説明しなさい。

名古屋市立大学大学院 人間文化研究科 人間文化専攻 臨床心理コース)

 

 

[5]

強化スケジュールに関する研究からは、定事強化よりも変率強化を行ったほうが学習の(  )が高いことが明らかになっている。

 (名古屋市立大学大学院 人間文化研究科 人間文化専攻 臨床心理コース) 

 

 

[6]

次の説明に該当する事項や用語を解答欄に記入しなさい。

・ある自発的行動に対して刺激や報酬を与えることにより、その行動の出現を促進させる操作や過程のこと。

神戸親和女子大学院 文学研究科 心理臨床学専攻)

 

 

[7]

次の括弧の中に入る適当な語句を、下の語群の中から選べ。

A:オペラント行動が生起した直後に何らかの刺激を提示し、それを起こりやすくする手続きを(1)という。その時提示される刺激を(1)刺激という。

B:オペラント行動が生起した直後に何らかの刺激を除去し、それを起こりやすくする手続きを(2)という。また、その時除去される刺激を(2)刺激という。

C:オペラント行動が生起した直後に何らかの刺激を提示し、それを起こりにくくする手続きを(3)という。また、その時提示される刺激を(3)刺激という。

D:オペラント行動が生起した直後に何らかの刺激を除去し、それを起こりにくくする手続きを(4)という。また、その時提示される刺激を(4)刺激という。

E:オペラント行動が起こっても行動結果を与えず、それを起こりにくくする手続きをオペラント条件づけにおける(5)という。

F:オペラント条件づけにおいて、予備的な手続きを導入して、段階的に求める行動が生じやすくなるようにする手続きを(6)という。たとえば、スキナーボックス内のハトにキーをつつかせるのに、まずはハトがキーに近づくとエサを与えるようにする。つぎに、触れるとエサを与える、という段階を踏む。

<語群>

般化 条件反応 消去 弁別反応 負の罰 無条件反応 

(正の)強化 転移 反応形成

分散 負の強化 回避 (正の)罰 嫌悪

日本女子大学大学院 人間社会研究科 心理学専攻)

 

 

 

[8]

オペラント条件づけにおける消去の例として、最も適切なものを一つ選びなさい。

1.遅刻をしたら、怒られたので、遅刻をしなくなった。

2.授業中に挙手をして発言したら、褒められたので、挙手することが増えた。

3.試合中にルール違反をしたら、退場させられたので、ルール違反が少なくなった。

4.教室の室温が高いので、エアコンを操作したら、涼しくなったので、エアコンを操作することが増えた。

5.授業のアンケートに答えたが、フィードバックが全くなかったので、アンケートに答えることが少なくなった。

帝京平成大学大学院 臨床心理学研究科 臨床心理学専攻)

 

 

[9]

オペラント条件つづけに関して、例えば、遊び中に暴力行為をしたために先生から遊びを禁止された結果、暴力カ行為が減少した場合、これは以下のどの操作に該当するか。最も適切なものを一つ選びなさい。

1.正の強化 2.負の強化 3.正の罰 4.負の罰 5.消去

帝京平成大学大学院 臨床心理学研究科 臨床心理学専攻)

 

 

 

[10]

オペラント条件づけに関して、例えば、タブ一語を言う子どもを母親が叱って、ますますタブー語が増加したとする。この場合、母親が叱ったことは、以下のどの操作に該当すると考えられるか。最も適切なものを一つ選びなさい。

1.正の強化 2負の強化 3.正の罰 4.負の罰 5.消去

帝京平成大学大学院 臨床心理学研究科 臨床心理学専攻)

 

 

[11]

オペラント条件づけにおける「負の強化」の例として、最も適切なものを一つ選びなさい。

①子どもがお手伝いをしたら、親から褒められたので、お手伝いをすることが増えた。②生徒が遅刻をしたら、教師に怒られたので、遅刻が減った。

③生徒が授業中に騒いだら、休憩時間を減らされたので、騒ぐことが減った。

④生徒が教室の室温が高いので、エアコンを操作したら、暑さが和らいだので、エアコン操作することが増えた。

⑤子どもが「おもちゃを買って欲しい」と駄々をこねたが、親に無視をされて、駄々をこねることがた。

帝京平成大学大学院 臨床心理学研究科 臨床心理学専攻)

 

 

 

 

 

[12]

括弧にあてはまる適切な専門用語を答えなさい。

学習のオペラント技法で、行動の質を目標に向けて徐々に変えながら新しい行動を学習させる方法を(1)、もしくは反応形成とよぶ。

東京成徳大学大学院 心理学研究科 臨床心理学専攻)

 

[13]

オペラント行動の研究の基礎を築いたのは誰か。正しいものを1つ選べ。
① A.Adler
② B.F.Skinner
③ E.C.Tolman
④ I.P.Pavlov
⑤ J.B.Watson

公認心理師試験 第1回 問5)

 

 

 

解答

 

 

 [1]

行動随伴性(behavior contingency)とはオペラント行動の自発頻度の変化とそれが自発された直後の環境の変化との関係をいう。行動随伴性には4種類がある。

1つ目の正の強化は、望ましいオペラント行動が出現したら、好ましい刺激を提示する。つまり、ご褒美などをあたえることである。二つ目の負の強化は、望ましいオペラント行動が出現したら、不快な刺激を取り除くことである。たとえば、シートベルトをしたら、警告音が消える。三つ目の正の罰は、望ましくないオペラント行動が出現した時に不快刺激を提示する(電気ショック、叱るなど)。四つ目の負の罰は、望ましくないオペラント行動が出現したら望ましい刺激を除去する。オミッション訓練(交通法違反に対する免許はく奪など)タイムアウトなど。

 

[2]

Skinner, B. F.は、ワトソンの行動主義を引き継ぎ、客観的に観察可能な行動を研究対象とした一人。新行動主義者である。動物がいつでも自由に反応できるフリーオペラント法を用い、動物実験を行った。

オペラント条件づけは、ヒトや動物の自発したオペラント行動に強化子を随伴させ、その反応頻度を変容させる条件づけである。

 

[3]

負の強化とは、反応後に嫌子(深い刺激)が消失し、その反応の自発頻度が増加することである。つまり、望ましいオペラント行動が出現したら、不快な刺激を取り除くことである。例えば、シートベルトをしたら、警告音が消える。負の強化は、逃避と回避の2つに分けられる。逃避の例として、日常的に親から早く宿題を終わらせるよう叱責されている子どもが、親の叱責を避けるために自ら宿題をするようになる場合、回避の例として、宿題をしないと親から叱責されるので、叱責される前に宿題を終えてしまう場合などがある。

 

[4]

正の強化は、望ましいオペラント行動が出現したら、好ましい刺激を提示する。つまり、ご褒美などをあたえることである。負の強化は、望ましいオペラント行動が出現したら、不快な刺激を取り除くことである。たとえば、シートベルトをしたら、警告音が消える。

 

cf.

正の罰は、望ましくないオペラント行動が出現した時に不快刺激を提示する。(電気ショック、叱るなど)

負の罰は、望ましくないオペラント行動が出現したら望ましい刺激を除去する。オミッション訓練(交通法違反に対する免許はく奪など)タイムアウトなど。

 

[5]

消去抵抗

 

[6]

強化

 

 

[7]

1、強化

2、負の強化

3、罰

4、負の罰

5、消去

6、反応形成 

 

[8]

  

[9]

 

[10]

1

 

[11]

4

 

[12]

1、シェイピング

 

[13]

2

 

① A.Adlerは、個人心理学(アドラー心理学)を創始した。
③ E.C.Tolmanは、新行動主義者であり、ネズミを用いた迷路学習の実験の結果、認知地図を形成し潜在学習をしていると考えた。
④ I.P.Pavlovは、古典的条件づけを発見したロシアの生理学者はパブロフであり、「パヴロフの犬」という有名な実験を行った。
⑤ J.B.Watsonは、行動主義(behaviorism)の創始者である。ワトソンは誰もが観察できる客観的行動を研究対象とし、刺激と反応の関係を明らかにしようとした。