이 장을 들어가기에 앞서 Thorndike의 가장 유명한 실험에 관해서 먼저 이야기하도록 하겠다.
Thorndike는 굶주린 고양이를 문제상자(puzzle box)에 넣고 발이 닿지 않는 곳에 먹이를 잘 보이도록 놓아두었다.
그 상자에는 문이 달려 있었는데, 이 문은 철사 고리를 당기거나 페달을 밟는 것 같은 간단한 행동으로 열리게 되어 있었다.
Thorndike(1898)는 고양이들이 대개 다음과 같이 행동한다고 썼다.
아무 틈새이든지 비집고 나가려고 하고, 창살이나 철사 고리를 할퀴고 물어뜯고,
발을 틈새로 내밀어서 아무거나 닿는대로 할퀴고, 뭔가 느슨하고 흔들거리는 것을 치게 되면 계속 치고, 상자 안에 있는 것들을 할퀴기도 한다.
결국에는 고양이는 고리를 당기거나 페달을 밟게되어 문이 열리고 자유와 먹이를 찾아 나갈 수 있게 되곤 했다.
Thorndike가 다음 시행에서 고양이를 다시 상자에 넣으면, 이 고양이는 문이 열리는데 필요한 그 반응을 다시 할 때까지 위와 똑같은 종류의 활동을 거쳤다.
시행이 거듭될수록 고양이는 효과가 없는 행동을 점점 더 적게 하게 되었고,
많은 시행을 거친 후에는 즉시 고리를 당기거나 페달을 밟아서 빠져나갈 수 있게 되었다.
행동은 보통 두 가지 중 한 가지 결과 혹은 효과를 가져온다고 Thorndike는 결론 내렸다.
그중 한 가지 결과는 '만족스러운 사태', 다른 하나는 '성가신 사태'이다.
굶주린 고양이가 문제상자의 창살 사이로 비집고 나오려고 하면 계속 갇힌 상태에서 배가 고픈 성가신 결과가 뒤따르고,
철사 고리를 당기면 문이 열려서 빠져나가 음식을 먹을 수 있는 만족스러운 결과가 뒤따른다.
Thorndike는 행동과 그 결과 사이의 이러한 관계를 나중에 효과의 법칙(또는 효과율, law of effect)이라고 불렀다.
이 법칙은 한 행동의 강도(빈도, 지속기간 등)는 과거에 그 행동이 초래했던 결과에 좌우된다는 것이다.
즉, 행동은 그 결과의 함수라는 것이다.(결과에 따라 행동이 변한다.)
고전적 조건형성에서는 자극(S)에 따라 반응(R)이 나온다. 즉, 다음과 같다.
S → R
고전적 조건형성에서는 자극과 자극이 관련이 있다.(행동과의 관련이 아닌) 그리고 불수의적이다.
US의 수가 곧 CS의 수이다.
하지만 조작적 조건형성(혹은 조작적 학습)은 그보다 한발 더 나아간다.
반응 이후 결과가 어떠하냐에 따라서 반응이 달라지는 것이다.
S → R → 결과
만약 결과가 부정적이라면 R이 감소하는 영향을 주고 반대로 결과가 긍정적이라면 R이 증가하는 영향을 준다.
조작적 조건형성의 조작적이라는 말은 인위적인 처치가 가해졌음을 의미한다.
이러한 조작적 조건형성의 대표는 Thorndike와 Skinner라고 할 수 있다.(행동주의학파)
여기서 행동은 일반적으로 결과를 초래하는 데 도구적인 역할을 하는데, 따라서 이런 종류의 학습을 때로는 도구적 학습(instrumental learning)이라고도 부른다.
조작적 조건형성에서는 자극과 행동이 중심이 된다. 또 행동에 따라 결과가 어떻게 주어지느냐가 중요하다.
연합의 필요성이 고전적 조건형성보다 떨어진다. 대부분 수의적이다(환경에 대한 조작)
자극의 수가 곧 행동의 수다.
<기본절차>
강화(reinforcement)는 어떤 행동의 강도를 증가 혹은 유지시키는 결과를 가져다주는 절차이다.
처벌은 행동을 감소시키는 결과를 가져다주는 절차이다.(처벌에 관해 더욱 자세한 것은 6장에서 나온다)
강화와 처벌에는 각각 정적과 부적이 있다.
(정적과 부적을 알기 전에 먼저 강화는 행동의 증가, 처벌은 행동의 감소, 라고 쉽게 외우기 바란다)
정적강화는 긍정적인 보상을 제공하는 것이다.
예를 들어 열심히 공부했을때 칭찬을 해주거나 보너스를 주는 것이다.(공부하는 행동 증가)
부적 강화는 부정적인 보상을 제거하는 것이다.
예를 들어 훈련 잘하면 야간보초 빼준다거나, 공부 열심히 하면 방 청소 안해도 돼, 라는 것이다.(훈련 열심히 하는 행동 증가, 공부하는 행동 증가)
정적 처벌은 부정적인 것을 제공하는 것이다.
도둑질을 하면 회초리로 때린다거나, 죄를 저지르면 감옥에 가둔다거나, 하는 것이다.(도둑질 감소)
부적 처벌은 좋아하는 것을 제거해버리는 것이다.
숙제 안하면 컴퓨터를 부셔버리는 것이다.(숙제 안하는 행동의 감소)
부적 강화에서 행동을 강화하는 것은 혐오자극으로부터의 도피이므로 이 절차를 도피훈련(escape training)이라고도 부른다.
<불연속 시행 절차와 자유조작적 절차>
Thorndike와 Skinner는 조작적 절차를 서로 다른 방식으로 연구하였다.
Thorndike는 불연속 시행절차(discrete trial procedure)라 불리게 된 것을 사용하였다.
예를 들어 Thorndike는 고양이들 중 한 마리가 상자에서 탈출할 때마다 그 탈출은 그 시행을 종료시켰다.
그 행동을 다시 관찰하려면 그는 그 고양이를 상자에 도로 집어넣어야 했다.
불연속시행 훈련에서 종속 변인은 흔히 고리를 잡아당기기 같은 어떤 행동을 수행하는 데 걸리는 시간이다.
다른 종속 측정치로 때때로 사용되는 것들은 오류를 범한 횟수(빠져나가는데 그냥 문을 긁는다거나 소리를 지른다거나 하는 행동들)와 제한된 일정 시간 내에 참가자가 행동을 수행한 횟수이다.
(빠져나오는 시간이 짧을 수록, 즉 시행시간이 줄수록, 그리고 오류를 범한 횟수가 적을수록 학습이 잘 된 것이다)
Skinner는 자유조작적 절차(free operant procedure)를 사용하였다.
이 접근법에서는 행동이 몇 번이고 마음대로 반복될 수 있다.
예를 들어 어떤 실험들에서 Skinner는 쥐를 레버가 장치된 조작상자에 넣었다.
레버를 누르면 먹이 조각이 접시에 떨어지게 되는데, 쥐는 자유로이 레버로 돌아와서 누르고 또 누를 수 있었다.
자유조작적 실험에서 종속변인은 대개 특정 행동, 예컨대 레버 누르기가 일 분당 일어나는 횟수이다.
<조작적 학습과 파블로프식 학습의 비교>
조작적 학습과 파블로프식 학습에 대한 간단한 비교는 기본절차에 들어가기 전에 앞서 먼저 간단히 언급했다.
하지만 어떤 경우에는 파블로프식 절차와 조작적 절차가 깊이 뒤얽혀 있어서 그 각각이 어디서 시작되고 어디서 끝나는지 알기가 힘들다.
예를 들어 개를 고정대에 묶고서 소리를 들려준 다음 전기충격을 주었다.
소리에는 항상 전기충격이 주어졌으며, 개가 펄쩍 뛰거나 짖거나 어떤 짓을 하여도 전기충격에는 아무런 영향이 없었다.
실험자들이 이 개를 낮은 장벽에 의해 두 칸으로 나누어져 있는 상자에 넣고서 전기충격을 주자,
개가 탈출하려는 노력을 전혀 하지 않는다는 점이 발견되었다.
즉 이 개는 무기력을 학습한 것이다.
(학습된 무기력. 즉, 실패를 학습한 것. 취업에 계속해서 실패한 사람이 나중에 기회가 와도 아예 하려는 노력을 하지 않는 것은 바로 이러한 현상으로 풀어볼 수 있다.
나중에 개는 삑하는 벨소리만 들어도 무기력해진다.)
개가 처음 한 경험은 흔히 파블로프식 조건형성으로 기술된다.
소리가 전기충격과 짝지어지는데, 소리도 전기충격도 개의 행동에 수반되지 않기 때문이다.
그러나 이 실험을 보는 다른 방식은 모든 행동에 동일한 결과, 즉 전기충격이 뒤따르는 처벌 절차로 보는 것이다.
개가 전기충격을 피하려고 시도하면서 했던 모든 행동이 처벌된 것이다.
따라서 파블로프식 절차와 조작적 절차 사이의 구분은 호소력이 있기는 해도 다소 임의적이다.
한 가지 종류의 학습이 일어날 때에는 다른 종류의 학습도 일어날 가능성이 크다.
첫댓글 대단하십니다. 이 많은 자료 올리시느라 고생하셨겠어요. 귀한자료 너무 감사드리구요 열심히 공부하겠습니다.
제가 보는 책 정리 하셧는데 정말 많은 도움됬습니다. 감사합니다.
어떤 책인지요? 지은이좀 알려주시면 감사하겠습니다.ㅎㅎ
정말 감사합니다