|
교육심리학 제 11, 12, 13 강 보충학습자료
(교재 제 6 장. 145~170쪽)
제 11 강 행동주의 학습이론 : 수동조건형성이론
※ 학습이란 행동의 변화 과정이다. 우리가 A라는 상태에서 B라는 상태로 가기 위해서는 학습이라는 과정을 거쳐야 한다. 이때 학습의 결과 행동의 변화가 나타나게 되는데, 여기에서 말하는 행동이란 눈에 보이는 행동(외현적 행동) 뿐 아니라 눈에 보이지 않는 지식, 신념, 가치관 등과 같은 행동(내현적 행동) 모두를 포함한다. 학습과 관련한 이론으로는 학습이론의 양대 산맥이라고 할 수 있는 행동주의 학습이론과 인지주의 학습이론 이외에 사회학습이론, 인본주의 학습이론, 구성주의 학습이론 등이 있다. 여기에서는 행동주의 학습이론 중 파블로프(I. Pavlov)의 수동조건형성이론에 대해 살펴보기로 한다.
1. 행동주의 학습이론의 특징
- 행동주의(Behaviorism)의 창시자는 왓슨(Watson)이다. 1913년 초부터 시작해서 몇몇 기사와 책에서 왓슨은 그가 말하는 행동주의적 방향으로 심리학이 혁신 적인 변화를 해야 한다고 주장하였다. 그는 전반적으로는 인지적 접근에 관 해, 구체적으로는 내성주의(內省主義: introspectionism)에 대해 공격하면서 행 동주의를 창시하였다. 내성주의란 인간의 마음의 세계를 주관적인 관찰에 의 해(안을 들여다봄으로써) 알아낼 수 있다고 주장하는 관점인데, 행동주의적 관점에서는 마음의 세계에 대한 주관적인 관찰은 신뢰로운 방법이 아니라고 주장한다. 따라서 행동주의자들은 직접적으로 관찰, 측정할 수 있는 겉으로 드러난 행동만을 과학적 연구대상으로 삼는다.
- 행동주의 학습이론에서는 우리가 어떤 것을 배워서 ‘행동’상의 변화가 나타난 것을 학습이라고 본다.
- 행동주의 학습이론의 계보를 이루고 있는 사람으로는 파블로프(Pavlov), 쏜다 이크(Thorndike), 스키너(Skinner) 등을 들 수 있다.
※ 행동주의 학습이론의 기본 가정
* 인간의 모든 행동은 학습된 것 : 인간의 적응적인 행동, 부적응적인 행동 은 모두 학습된 것이다.
* 인간행동의 원인은 우리 내부에 있는 것이 아니라 바깥 세상에 있다 : 행동 주의 학습이론가에 의하면 우리 내부에 있다고 가정하고 있는 성격이라든 지, 욕구라든지 하는 개념은 직접적으로 관찰할 수 없기 때문에 과학적인 연구대상이 되지 못한다. 어떤 사람이 공격적인 행동을 하는 것은 우리 내부에 공격성이 있어서가 아니라, 외부의 환경이 공격적인 행동을 하도 록 만들었기 때문이다.
* 행동은 그 행동이 나타난 맥락(context) 속에서만 의미를 가진다 : 어떤 행동 의 의미는 그 행동이 나타난 맥락을 떠나서는 제대로 이해할 수 없다. 목 욕탕에서 옷을 벗는 행동과 길을 가다가 옷을 벗는 행동은 똑같이 옷 벗는 행동이지만 그 맥락이 다르기 때문에 옷 벗는 행동의 의미는 전혀 다르다.
2. 파블로프의 수동(고전적) 조건형성이론
- 조건형성이란 영어로 conditioning을 번역한 말인데 다른 말로 조건화(條件化)라 고도 부른다. 조건형성은 러시아출신의 유명한 파브로프(Ivan Petrovich Pavlov, 1849-1936)에 의해서 처음 체계적으로 이론화되었는데, 그래서 파브로프에 의 해서 밝혀진 조건형성 원리를 고전적 조건형성(classical conditioning)이라고 부 르고 있다.
- 생리학자인 파블로프(Pavlov)는 개의 소화액 분비에 관한 연구를 수행하던 중 본능적인 반사행동(음식물에 대한 타액분비) 이외에 학습된 반사행동(실험자의 발자국 소리, 실험자의 모습, 종소리에 대한 타액분비)이 있음을 관찰하게 된다.
- 고전적 조건형성의 과정(교재 151쪽 참조)
제 1단계 : 조건화 전
종소리 정위반응
(중성자극)
음식물 타액분비
(무조건자극) (무조건 반응)
제 2단계 : 조건화 도중
종소리 + 음식물 타액분비
(짝지움) (무조건 반응)
제 3단계 : 조건화 후
종소리 타액분비
(조건자극) (조건반응)
- 주요 개념
① 자극 일반화와 자극변별
* 자극 일반화(stimulus generalization) : 서로 다른 자극임에도 불구하고 동일 한 자극으로 인식하는 것.
* 자극 변별(stimulus discrimination) : 서로 다른 자극을 구별할 줄 아는 것.
② 소거(extinction) : 유기체가 이전에 학습했던 행동이 사라지는 것. 그러나 소거된 행동은 완전히 없어진 것이 아니라 일시적으로 무의식 속에 억 압되어 있는 것이다. 자발적 회복(유기체가 이전에 학습했던 행동을 스 스로 회복하는 것)과 재(再)조건형성(다시 조건형성을 시키면 예전의 그 행동을 다시 할 수 있다) 현상은 소거가 학습된 행동이 완전히 없어진 것이 아니라는 것을 증거해주는 것들이다.
- 수동조건형성이론의 예 : 인간의 무의식적, 불수의적, 무의도적, 정서적 반응은 고전적 조건형성이론으로 설명할 수 있다. 또한 TV 광고에도 이 이론을 응용한 광고들이 많이 있다.
- 이 고전적 조건형성은 인간에게서도 자주 발생하는 학습기제이다. 예컨대, 어 린 아기들은 보드라운 털을 가진 인형을 좋아한다. 그런데 아기가 그 인형을 만지고있을 때 갑자기 커다란 쾅 소리를 내면 아기는 소스라치게 놀라며 인형 만지기를 중단한다. 그런데 이런 일이 몇 차례 더 발생하면 아기는 아예 보드 라운 털을 가진 인형만 보아도 놀라거나 울음을 터트리는 반응을 보인다. 여 기서 털인형은 처음에는 중성자극이었다가 조건자극이 된 것이며, 쾅 소리는 무조건자극이다. 쾅 소리에 의한 공포반응은 무조건반응이지만, 털 인형에 대 한 공포반응은 조건반응이 된다. “자라 보고 놀란 가슴 솥뚜껑 보고 놀란다”라 는 속담은 이런 고전적 조건화 현상을 잘 나타내 주는 속담이다.
- 조건형성은 단순한 기계적 반사작용인가, 아니면 학습의 결과인가? 학자들은 이를 학습으로 보고 있다. 그렇게 보는 근거는 다음과 같다. 조건형성이 이루 어진 반응도 다시 무조건 자극이 없이 반복해서 조건자극만 주어지면 다시 조 건형성이 약해지거나 소거(消去) 즉 없어진다. 조건형성은 조건자극 직후에 무 조건 자극이 주어진다는 짝지움을 학습하는 과정이고, 다시 소거는 조건자극 이 더 이상 무조건자극과 짝지워지지 않는다는 사실을 학습하기 때문에 발생 한다는 것이다. 즉, 소거도 역시 학습의 과정이다.
제 12 강 행동주의 학습이론 : 작동조건형성이론
※ 수동(고전적) 조건형성은 주로 불수의적 반응으로 이루어진다. 여기서 불수의적 반응이란 타액분비와 같은 조건반사, 공포반응이나 불안반응(손바닥 땀, 가슴 두근거리기) 등을 말한다. 반면에 수의(隨意)적 반응은 우리가 의도에 의해서 조절이 가능한 행동을 말한다(예: TV채널 돌리기, 문 열기). 작동(조작적) 조건형성은 바로 이 수의적 행동의 학습기제이다. 여기에서는 먼저 작동(作動)과 수동의 차이에 대해 살펴보고, 손다이크(Thorndike)의 학습의 법칙, 그리고 스키너(Skinner)의 강화이론에 대해 살펴볼 것이다.
1. 작동(作動)의 의미
- 수동(受動)은 자극을 받아서 나타난 반응(행동)을 말하고, 작동(作動)은 유기체가 먼저 만들어 내놓은 반응(행동)을 말한다.
※ 수동 조건형성이론의 모형 : 자극(S: Stimulus) → 반응(R: Response)
작동 조건형성이론의 모형 : 반응(R: Response) → 자극(S: Stimulus)
2. 손다이크의 학습의 법칙
- 손다이크(Edward Thorndike, 1911-1970)는 미국의 심리학자이다. 그는 당초에 동 물에게도 지능이 존재하는지를 알아보고자 이른바 “문제상자”라는 것을 제작 하고 고양이를 그 안에 넣었다. 이 문제상자에는 지렛대와 같은 장치가 있어서 이를 고양이가 발로 누르면 문이 열리고 결과적으로 고양이는 밖으로 나오고 음식을 먹을 수 있도록 하였다. 문제상자 속의 고양이는 상자에서 벗어나 바깥 에 놓인 음식물을 얻기 위하여 다양한 행동을 하였다. 처음에는 만을 발톱으로 할퀴거나, 입으로 밀어보거나, 상자 안을 이리저리 돌아다니거나 등 여러 가지 행동을 한다. 그러다가 우연히 지렛대를 밟으면 문이 열리는 것이다. 상자 안에 다시 들여보내진 고양이는 다음 번에도 이런 시행착오적인 행동들을 반복하다 가 다시 우연히 지렛대를 밟게 되고 밖으로 나오게 된다. 그러나 이런 경험이 반복되다보면 고양이의 시행착오 행동은 점점 줄어들며 결과적으로 고양이가 지렛대를 밟고 밖으로 나오게 되기까지 걸리는 시간이 점점 줄어드는 것이다. 고양이는 자신이 지레를 밟는 행동과 문이 열리는 것 사이의 관계를 학습한 것이다. 처음에는 지렛대를 밟는 행동이 우연한 행동이었지만, 나중의 행동은 학습된 행동이다.
cf. 학습의 법칙
* 연습의 법칙 : 행동은 단 한 번에 학습되는 것이 아니라 여러 번 반복한 결 과 습득되는 것이다. 시간이 오래 걸려서 그렇지 학습에 있어서 중요한 한 가지 법칙은 ‘반복’(repetition)이다.
* 효과의 법칙 : 어떤 행동을 학습하는 시간을 단축시키기 위해서는 행동의 결과 뒤따르는 보상(강화물)이 있어야 한다. 열심히 공부하고 난 후 주 변에서 “고생이 많았다”, “참 잘 했다” 등과 같은 말을 듣는다면 그렇지 않았을 때보다 열심히 공부하는 행동이 훨씬 빨리 학습된다.
* 준비성의 법칙 : 학습할 준비가 갖추어져 있을 때 학습이 일어난다. 공부할 마음이 없는 사람에게는 아무리 좋은 내용의 공부할 것을 들이밀어도 학 습의 효과를 올릴 수 없다. 학습의 준비도를 갖추는 일은 학습이 잘 일 어나게 하는 중요한 요소 중의 하나다.
3. 스키너의 강화이론
- 스키너(Skinner)의 이론은 실험동물에게 학습시키고자 하는 행동을 그 동물이 할 때까지 기다리는 것이 아니라 그 행동을 계획적으로 조형(shaping)해 가는 연구를 계획한 점에서 손다이크의 이론과 차이가 있다.
- 스키너는 동물 실험에 필요한 모든 실험도구를 직접 제작하여 사용하였는데, 이 실험도구들을 통칭하여 스키너 상자(Skinner's Box)라고 부른다.
- 행동주의 학습이론에서 가장 중요한 개념은 강화(reinforcement)다. 강화란 특정 행동의 빈도를 증가시키기 위해서 사용하는 모든 것을 말한다. 인간의 행동은 이 강화를 어떻게 적절하게 잘 제공하느냐에 따라 학습시켜 나갈 수 있다. 강 화와 대비되는 개념은 벌(punishment)인데, 벌은 어떤 특정한 행동의 빈도를 감 소시킬 목적으로 사용하는 모든 것을 말한다.
- 강화는 어떤 강화물을 제공 또는 박탈하느냐에 따라 크게 두 가지로 구분할 수 있다. 그 하나는 정적 강화(positive reinforcement)인데, 이것은 어떤 특정한 행동의 빈도를 증가시키기 위해서 그 행동을 한 사람이 좋아하고 즐거워할 것 (정적 강화물: 상, 칭찬, 미소, 돈 등)을 제공해 주는 것이다. 다른 하나는 부적 강화(negative reinforcement)인데, 이것은 어떤 특정한 행동의 빈도를 증가시키 기 위해서 그 행동을 한 사람이 싫어하고 불쾌해 할 것(부적 강화물: 야단, 욕, 회초리, 숙제, 전기 충격 등)을 감(減)해 주는 것이다.
- 또한 강화는 그 제공하는 방식에 따라 계속적(successive) 강화와 부분(partial) 또는 간헐적(intermittent) 강화로 구분할 수도 있다. 계속적 강화는 어떤 행동을 학습하는 초기 단계에 매우 유용한 것으로서, 육성시키고자 하는 행동을 할 때마다 강화를 주는 것이다. 부분 강화는 어떤 학습된 행동을 유지시키는 데 매우 효과가 큰 강화방법으로서, 육성시키고자 하는 행동에 대해 가끔씩만 강 화하는 것이다.
- 간헐강화계획에는 고정비율 강화계획(일정한 수의 반응을 할 때마다 강화하는 것: 성과급 제도 등), 고정간격 강화계획(일정한 시간이 경과할 때마다 강화하 는 것: 시간급, 일당, 주급, 월급 등), 변동비율 강화계획(강화하는 반응의 수가 고정된 것이 아니라 변동하는 것 : 카지노의 슬로트머신 등), 변동간격 강화계 획(강화하는 시간의 간격이 고정된 것이 아니라 변동하는 것 : 물고기가 낚시 바늘을 무는 것 등)이 있다.
* 행동수정과 교육적 적용 *
- 행동수정은 어떤 행동 자체를 조작하는 것이 아니라, 그 행동에 선행하는 사 건(또는 자극)이나 행동의 후속 결과를 조작함으로써 궁극적으로 행동에 변화 를 가져오고자 하는 방법이다.
- 바람직한 행동의 증강 방법 : 정적 강화, 부적 강화 등
cf. 프리맥(Premack)의 원리 : 프리맥은 행동과 결과간의 관계를 순전히 상 대적인 반응확률로 다루는 것이 유용하다고 주장하고 있는데, 그 에 의하면 일어날 확률이 높은 행동은 일어날 확률이 낮은 행동 에 대해 정적 강화물이 될 수 있다. 예컨대 많이 놀고(확률이 높 은 행동) 적게 공부하는(확률이 낮은 행동) 아동에게 공부하는 행 동을 길러주기 위해서 가령 10분간 공부하고 난 후에는 15~20분 간 놀게 한다면 공부하는 시간을 늘릴 수 있을 것이다.
cf. 강화를 제공하는 요령
* 강화를 제공하기 전에 가장 먼저 해야 할 일은 저 사람에게 주어서 저 사람이 기분 좋아하고 편안해 할 것이 무엇인지를 먼저 알아내야 한 다. 왜냐하면 그 강화물(强化物: reinforcers)은 사람마다 모두 다르기 때 문이다. 어떤 사람은 생리적인 만족을 주는 것으로도 통하지만 다른 사람은 그런 것은 잘 안 통하고 칭찬, 격려, 인정 등이 통한다. 또 어 떤 사람은 돈을 주면 통하지만 그렇지 않은 사람도 있다. 그리고 저 사람에게 통할 만한 강화물을 발견하되, 그 메뉴를 다양하게 알아낼 필요가 있다. 왜냐하면 한 가지 강화물만 계속해서 제공하다보면 물려 버릴 가능성이 있기 때문이다.
* 즉각적 강화 : 강화는 우리가 육성시키고자 하는 행동이 나타났을 때 즉각 주어야 가장 효과가 크다.
* 넘치지 않게 : 강화물은 그 강화물을 받는 사람이 물리지 않도록 적절 하게 제공될 필요가 있다. 앞서 설명했듯이 강화물의 메 뉴를 다양하게 알아내는 것은 강화물에 물리지 않도록 하기 위해서다.
* 차별적 강화 : 육성시키고자 하는 행동이 나타나면 반드시 강화하고, 그렇지 않은 행동이면 절대 강화해서는 안 된다.
- 바람직하지 않은 행동의 감소 방법 : 벌, 소거, 상반행동의 육성 등
cf. 벌의 장점과 단점 : 벌은 그 효과가 즉각적으로 나타난다는 장점이 있 으나, 아쉽게도 그 효과가 오래 지속되지 못한다는 점, 벌을 자주 받게 되면 벌을 받지 않기 위하여 또 다른 문제행동을 할 수도 있다는 점, 정서적으로 좋지 않은 영향을 미친다는 점 때문에 최 후의 수단이라고 생각하는 것이 좋다.