今回は、「パブロフの犬」で紹介しました「古典的条件付け」と双璧をなす学習理論でもある「オペラント条件付け」について解説して行きます。この学習理論もまた、「行動心理」を学ぶ上で重要になって来ます。
前回の記事では、ゾーンダイクによるネコと道具を使った実験から導き出された、「効果の法則」をご紹介しました。
今回解説する「オペラント条件付け」は、ゾーンダイクの実験と同じく、動物と道具を使った実験ではありましたが、以下の点に違いがありますので注意をしてください。
- 主にネズミを使った実験である
- 実験道具として使われた「スキナー箱」に大きな特徴がある
- 「古典的条件付け」とは同じ学習理論でも原理が違う
B.F.スキナーによる「オペラント条件付け」は、ゾーンダイクの「効果の法則」の系統をさらに徹底的な実験により洗練化し、より科学的根拠と証明を確かなものにしたという点で、大きな功績となっています。
それでは、スキナーの「オペラント条件付け」を分かりやすく解説して行きます。
<1>
B.F.スキナーとスキナー箱
「オペラント条件付け」やB.F.スキナーと言えば、心理学の勉強の中でもとても有名ですから、皆さんも良く聞いたことがあるのではないでしょうか。
この「オペラント条件付け」は、アメリカの心理学者であるB.F.スキナー(1904-1990)の実験により提唱された理論です。「スキナー箱」という実験道具とネズミを使ったことで有名です。ゾーンダイクにより作られた「問題箱」と同様に、道具を使った実験であった事から、「道具的条件付け」や、また「スキナー型条件付け」とも呼ばれることもあります。
外部リンク ▶ B.F.スキナーとは?(ウィキペディア)
このスキナー箱の特徴は、箱の中にレバーがあり、そのレバーを押すと餌が出て来るというものでした。この中にネズミを入れて、ネズミがどのような行動に出るか、スキナーは実験と観察を続けました。
スキナーはとかく実験に実験を重ね、その結果からのみ、こたえを導き出すという「徹底的行動主義」の第一人者となりました。これは、主観が介在しない行動の結果がすべてであるという立場のことを言います。
<2>
スキナー箱の仕組み
それでは、スキナー箱の仕組みを見ていきます。
箱の中にボタン(レバー)があり、中に入れられたネズミがそのボタンを偶然に触って押したとします。そうする事により、餌が出て来るようになっています。
このボタン(レバー)には、餌が出て来るまでのボタンの押す回数を変更したり、ネズミの行動のタイミングに合わせて餌を出したりという設定が出来るよう、工夫がされていました。
図の中で説明しますと、ネズミがボタン(レバー)を押すと餌が出て来る環境を与えることを「強化」、餌にあたるものを「強因子」と呼びます。
この強因子には「正の強因子」と「負の強因子」があります。次の図で見てみましょう。
2-1. 正の強化
ボタン(レバー)を押すと、餌(正の強化子)が出て来ます。この餌は「報酬」でありネズミに取っては「正の経験」となり、ボタン(レバー)を押す回数が増えていく反応を示します。
これを「正の強化」と呼びます。
2-2. 負の弱化
今度は、ボタン(レバー)を押しても、餌(正の強化子)が出て来ないようにします。「報酬」となる餌が出て来ないことにより、ネズミに取っては「正の経験」が減少し、ボタン(レバー)を押す回数が減って行く反応を示します。
これを「負の弱化」と呼びます。
2-3. 正の弱化
さらに今度は、ボタン(レバー)を押すと、餌(正の強化子)が出て来ると学習したネズミが、同じくボタン(レバー)を押すと、電流(負の強化子)が走るようにします。この電流を「懲罰」と呼び、ネズミに取っては不快な「負の経験」が増えることにより、ボタン(レバー)を押す回数が減って行く反応を示します。
これを「正の弱化」と呼びます。
2-4. 負の強化
最後に、ボタン(レバー)を押すと、電流(負の強化子)が走ることを学習したネズミが、再度ボタン(レバー)を押しても電流が走らないようにします。電流を除去したことにより、ネズミに取っては不快な「負の経験」が減ったことになり、またボタン(レバー)を押す回数が増えて行く反応を示します。
これを「負の強化」と呼びます。
ここまで読んでいただき、おそらく「正の強化」と「負の強化」、「強化」と「弱化」が、分かりづらくなっていると思いますので、ここで一度図を参考にしてまとめてみます。
- 正が指すもの ▶ ネズミにとって報酬となる経験
- 負が指すもの ▶ ネズミにとって懲罰となる経験
- 強化 ▶ 反応の回数が増えること
- 弱化 ▶ 反応の回数が減ること
上記の4つを組み合わせて考えなおしてみると、理解しやすくなります。
また、図で説明しました流れで考えていただくと、ネズミに与えられている環境(箱の中の装置)に一定のスケジュールが組まれているのが分かるかと思います。簡単に説明しますと、以下のようになります。
- 「正の強化」でネズミはボタン(レバー)を押すと餌が出る事を学習する
- 「負の弱化」で、餌が出る仕組みを学習したネズミが、更にボタン(レバー)を押しても餌が出ないという学習をする
- 「正の弱化」で、餌が出る仕組みを学習したネズミが、ボタン(レバー)を押すと電流が走るという学習をする
- 「負の強化」で、ボタン(レバー)を押すと電流が走ると学習したネズミが、更にボタン(レバー)を押しても電流が走らなくなるという学習をする
このようにして、「強化」「弱化」「正の強因子」「負の強因子」の組み合わせにより、ネズミが様々な反応を起こし、自発的な行動に移すという実験結果が実証されています。
これらのスケジュールの種類には、「連続強化」「部分強化」などがあり、それぞれ反応の効果も違ってきます。
また、「強化」をストップさせたり「弱化」を繰り返したりするうちに、反応が生じなくなる現象を「消去」と呼びます。またこの消去に関しても、スケジュールの組み合わせによっては消去されるまでに時間がかかる事もあり、これを「消去抵抗」と呼びます。
これらを、人間の行動や社会環境の調整などに適用する場合にも、これらのスケジュールや組み合わせは、非常に重要になって来ます。
<3>
三項随伴性とABC分析
最後に、スキナーの行った一連の実験を端的に示す「三項随伴性(さんこうずいはんせい)」に関してのご説明をします。
三項随伴性とは、先行刺激(弁別刺激)から反応行動を誘発し結果を得る、という一連の理論のことを呼びます。もう少し平易に説明しますので、「<2>スキナー箱の仕組み」の図を再度確認の上、一緒に考えてみてください。
ネズミが何かの学習をし、ボタン(レバー)を押すと何が起こるかを分かっている状態とします。そのネズミに対し、再度同じボタン(レバー)が呈示されることを「先行刺激(弁別刺激 Antecedent)」と呼びます。
次に、その刺激に対してネズミが反応し、自発的に「行動(Behaviour)」をします。これを「オペラント行動」と呼びます。
それによって当然、何らかの「結果(Consequences)」が返って来ます。これが、ネズミにとって「正の経験」となるか「負の経験」となるかは分かりません。
しかし、ネズミはその結果から再び反応を示し、自発的に行動を起こします。そしてその行動内容は、先の結果がどうであったかに頼るものであり(「随伴」とはこの意味です)、ネズミの行動内容が「弱化」につながるか「強化」につながるかは、その環境によって変化するものです。
これが「三項随伴性」という理論です。ちなみに、弁別刺激(Antecedent)・行動(Behaviour)・結果(Consequences)の頭文字を取ってABC分析と呼ばれいています。