조작적 조건화(Operant conditioning; 오퍼런트 조건화; 시행착오 학습; 도구적 학습)
행동주의의 대표적인 학자 Skinner에 의해 주창되어서 매우 큰 반향을 일으킨 학습 이론입니다. 오퍼런트(operant)란 자발적으로 분출되는 반응입니다. 인간을 비롯한 생물은 여러 가지 자발적인 행동을 합니다. 울거나 주변의 물건을 건드립니다. 뛰어 다닙니다. 자발적 행동 오퍼런트는 그 행동에 의해 야기된 결과에 따라 더 자주 그런 행동을 하는 쪽으로 발전해 나가거나 소멸됩니다. 아이가 밤에 심하게 울었습니다. 엄마는 아이에 관심을 갖고 무엇 때문에 불편한지 살펴봅니다. 아이는 '운다'는 오퍼런트가 엄마의 관심을 가져온다는 것을 느낍니다. 우는 행동을 강화(reinforcement)합니다. 다음에도 엄마에게 원하는 것이 있으면 우는 행동을 합니다.

(그림 출처: Papalia. Human Development, McGraw-Hill, 1998.)
자발적으로 나타나는 행동인 오퍼런트가 우호적인 결과를 낳으면 이후 강화되어 더욱 반복적으로 특정 행동을 한다는 것이 오퍼런트 조건화입니다. 고전적 조건화는 중립적자극(종소리)이 조건화(밥을 줄 때 종소리를 들려준다)에 의해 조건반응을 일으키는 방식으로 학습된다는 것인데 반해, 오퍼런트 조건화는 개체 자신이 어떤 자발적인 행동들을 해 본 다음 그 결과에 따라 행동을 더욱 강화해 나가는 것입니다.
직원이 늦게까지 일을 하다가 상사의 눈에 띄었습니다. 그 일이 승진에 큰 영향을 미쳤습니다. 이 직원은 이후에도 계속해서 야근을 하려 합니다. 자신의 행동의 결과에 의해 강화가 되면서 야근을 하는 행동을 더욱 자주하도록 학습한 것입니다.
오퍼런트 조건화는 어떤 행동을 어떻게 강화하면 더 빨리 학습할 것인가에 관심을 가졌습니다. 담배를 끊고자 하는 사람에게 담배를 피지 않는 것을 어떻게 강화할 것인가 또는 어떻게 보상을 줄 것인가 또는 어떻게 벌칙을 가해야만 담배를 끊는 행동을 빨리 학습할 지를 생각했습니다.
이렇게 특정 행동에 점차 가깝게 행동하도록 바꾸어 나가는 방법을 행동조형(Shaping)이라고 합니다.
행동조형(Shaping)
행동조형에는 크게 네 가지 방법이 있습니다.
- 긍정적강화(positive reinforcement)는 잘한 것을 칭찬해주는 것입니다.
- 부정적강화(negative reinforcement)는 바람직한 행동을 하지 않을 때 보상을 철회하는 것입니다.
- 처벌(punishment)은 바람직하지 못한 행동에 대해 징계/벌칙을 가하는 것입니다. (부정적 강화와는 다릅니다.)
- 소멸(extinction)은 행동이 일어나게끔 하는 강화요인을 없애서 스스로 사그러들도록 만드는 것입니다.
조작적 조건화 연구자들은 위와 같은 방법을 얼마나 자주, 어떤 순서로 행하느냐가 학습의 속도나 지속성을 좌우한다는 것을 발견했습니다. 연구에 따르면 지속적인 강화는 특정 행동을 배우는 속도를 늘립니다. 담배를 피지 않으면 보상을 주는 것을 계속해서 시행하면 더 빨리 담배를 끊습니다. 이와 다르게, 간헐적 강화는 특정 행동의 지속성을 크게 늘려줍니다. 강화를 하지 않았을 때도 특정행동을 계속하게 하려면 강화를 간헐적으로 해야 합니다.
이해를 돕기 위해 재미있는 예를 들어봅시다. 도박을 좋아하는 사람이 있습니다. 어쩌다 한 번씩 잭팟이 터지는 경우, 이것이 간헐적인 강화가 되어서 더욱 도박에 열을 올리게 됩니다. 지속적으로 강화가 되고 있는 것보다 간헐적으로 강화가 되는 경우 특정 행동을 하고 싶어 하는 경향이 더욱 커집니다. 엄마의 관심을 끌기 위해 징징거리는 아이에게 이따금씩 그런 행동에 관심을 보이면 아이는 보채는 행동을 지속적으로 합니다. 이전에 가끔씩 관심을 기울인 경우, 관심을 기울이지 않을 때 더욱 맹렬하게 보챕니다. 간헐적인 강화는 특정 행동을 더욱 지속적으로 하게 합니다.
연구 결과 위의 네가지 방법 중 강화(긍정적 강화이든 부정적 강화이든) 쪽이 처벌이나 소멸보다 더 행동 학습에 큰 영향을 미치는 것으로 밝혀졌다는 점도 시사적입니다. 특정 행동을 하게 하고 싶다면 그 행동을 했을 때 적절한 보상을 주고 그렇게 하지 않으면 보상을 철회하는 것이 벌을 내리거나 관심을 아예 기울이지 않아서 스스로 소멸되도록 하는 것보다 더 효과적입니다.
그렇다면 벌칙(punishment)은 왜 효과가 적을까요.
- 벌칙은 바람직하지 않은 행동을 그만두게 하는 효과보다 처벌만을 피하는 쪽으로 행동하게 만드는 경향이 높습니다.
- 벌칙과 자신의 행위를 연관시키는 것이 아니라 벌칙을 가한 사람과 연관을 시켜서 그 사람을 미워하게 만들기 때문입니다.
- 무엇을 해야 할 지를 훈련시킬 수는 없기 때문입니다.