Ⅲ. 스키너의 조작적 조건화 ① 스키너와 손다이크의 비교 ⓐ 스키너는 1930년 이후의 손다이크의 견해와 유사하게 하나의 반응이 그 반응 자체에 미치는 효과를 강조한다. ⓑ 손다이크와 같이 보상과 처벌의 효과가 비대칭적이라는 것이다. 즉 보상은 반응이 반복될 가능성을 변화시키지만 처벌은 그렇지 못하다는 결론을 내렸다. ② 스키너는 인간의 행동이 어느 정도는 고전적 조건화에 의해 설명될 수 있다는 것에 동의하지만 언어, 쓰기, 읽기, 자전거 타기, 친구 사귀기 등과 같은 복잡한 행동이나 습관 등은 조작적 조건화에 의해 학습된다고 주장하였다. ③ 스키너의 조작적 조건화와 파블로프의 고전적 조건화의 차이 == 고전적 조건화가 행동을 유발시키기 위해 자극에 관심을 두는 반면, 조작적 조건화에서는 자극보다는 유발된 행동의 결과에 관심을 둔다.
<스키너 박스> 1. 이론의 주요개념 (1) 기본적 절차 스키너는 4가지 기본적 절차를 고안했다. 두 가지는 반응률을 증가시키는 것(강화)이고, 나머지 두 가지는 반응률을 감소시키는 것(처벌)이다. ① 강화(reinforcement) == 반응을 강하게 하는 곧 반응율 또는 반응을 할 가능성을 증가시키는 기제이다. 반응의 강해짐으로 인도하는 어떤 자극 또는 사태이다. 강화인자(reinforcer) == 강화인자는 뒤따라오는 반응의 빈도를 증가시키는 어떤 자극이다. 또는 반응의 강도를 증가시키거나 유지시키는 어떤 사태이다. ⓐ 정적강화 * 어떤 반응 후에 자극이 출현하든지 자극의 강도가 증가한다. 정적 강화인자는 먹이와 같이 보통 유기체가 찾는 것이다. * 이 절차의 효과는 정적 강화인자에 선행해서 일어난 반응의 빈도를 증가시킨다. * 정적 강화에서는 어떤 반응 후에 강화자극이 뒤따른다.(R : 짖음 ⇒ S :먹이를 받음) ⓑ 부적강화 * 어떤 반응 후 자극이 제거되고나 자극강도가 감소된다. 부적 강화인자는 전기 쇼크와 같이 보통 유기체가 피하려는 것이다. * 이 절차의 효과는 부적 강화인자에 선행한 반응의 빈도를 증가시키는 것이다. * 부적 강화에서는 어떤 반응 후에 강화사건이 뒤따른다. (R : 아스피린을 먹음 ⇒ S :두통이 멈춤) ② 처벌 ⓐ 어떤 반응 후 혐오적인 자극이 제시된다. 반응 뒤에 혐오스러운 사건이 뒤따른다. (R:선글라스를 벗음 ⇒ S : 햇빛에 눈을 다침) ⓑ 반응대기 == 어떤 반응 뒤에 정적 강화인자가 제거된다. 이 경우에는 바람직한 것을 잃게 된다. (R : 음식접시를 던짐 ⇒ S : 음식이 제공되지 않음)
<스키너상자의 지렛대를 누르는 쥐와 조작적 방의 키를 쪼는 비둘기>
<누가기록: 선의 기울기가 급할수록 반응속도가 빠름을 주목해야 한다. 바닥과의 평생선은 무반응을 나타낸다.> (2) 반응적 ? 조작적 행동 ① 반응적 행동 == 분명한 자극에 의해 유발되는 행동으로, 무조건반응은 무조건자극에 의해 일어나기 때문에 반응적 행동의 예이다. 자극에 의존한다. 빛에 의해 눈을 깜빡이는 것, 핀에 찔려 손을 움직이는 것, 음식을 보고 침을 흘리는 것 ② 조작적 행동 == 유기체 스스로 시도하는 행동(자발적 행동)이다. 결과에 따라 조절된다. (3) S - 유형과 R - 유형 조건화 ① S - 유형 조건화(반응적 조건화, 고전적 조건화) == 바람직한 반응을 일으키는데 필요한 자극의 중요성을 강조하며, 강도는 조건화된 반응의 “크기”에 의해 결정된다. ② R - 유형 조건화(조작적 조건화) == 조작적 행동이 포함된다. 반응에 강조점이 주어지고, 조건화의 강도는 “반응률”로 나타난다. ☞ 손다이크는 동물이 특정한 행동을 하는 데까지 시간이 얼마나 걸리는가에 관심이 있었다면 스키너는 어떤 변인들이 반응률이나 반응패턴에 영향을 미치는지에 관심이 있었다. (4) 조작적 조건화의 원리 ① 조작이란 임의의 행동에 대하여 변별자극을 때맞추어 주는 것을 의미한다. 이를 통해 행동을 습관화시키는 것을 조작조건화라고 한다. 반사조건화를 S-R로 표현된다면 조작조건화는 R-S로 표현된다. ② 행동의 절차 ⓐ 어린이가 성인이 되었을 때 지니기를 바라는 주요 성격 특성을 결정한다. ⓑ 이러한 목적을 행동적 용어로 구체화한다. ⓒ 이러한 목적에 부합하는 행동에 보상을 주고 강화한다. ⓓ 환경의 다른 요소나 사람들도 중요 행동에 보상을 주도록 배려함으로써 일관성을 유지한다. ③ 조작적 조건화의 기본원리 ⓐ 강화자극 즉 보상이 따르는 반응은 반복되는 경향이 있다. ⓑ 반응이 일어날 확률을 증가시켜 주는 것은 어느 것이나 강화자극 또는 보상이 될 수 있다.
<조작적 조건형성> (5) 행동조성 행동조성은 어떤 행동은 강화를 하고 다른 행동은 강화를 하지 않는 “차별적 강화”와 실험자가 원하는 반응에만 강화를 하는 “점진적 근접”의 두 부분으로 구성된다. (6) 소멸과 자발적 회복 스키너는 지렛대를 밟아서 먹이를 얻어먹는 횟수가 많아짐에 따라 지렛대를 밟는 행동이 습관화되는 것을 강화라고 하였다. ① 소멸 == 먹이장치를 눌러도 음식물이 제공되지 않으면 지렛대 누르기 반응이 점차 감소하다가 결국은 전혀 나타나지 않게 된다.(보상제거 ⇒ 소멸) ② 자발적 회복 == 소멸 후에 동물을 실험상황에 다시 처하게 하면 부가적인 훈련 없이도 짧은 시간 내에 지렛대를 누르기 시작한다. (7) 강화와 강화인 강화는 어떤 행동의 강도와 발생빈도를 증가시키는 것을 의미한다. ① 적극적, 정적, 제시 강화(positive or presentation reinforcement) == 가치 있는 어떠한 것을 제공함으로써 바람직한 행동의 강도와 빈도를 증가시키는 것을 의미한다. ⓐ 교실에서는 좋은 성적, 교사의 웃는 표정, 칭찬, 게시판에 전시된 학생의 작품 등이 학생들에게 정적 강화물로 작용한다. ⓑ 학생들이 보여주는 성숙한 수업태도와 질문, 학부모나 교장으로부터의 인정 등은 교사에게도 정적 강화물이 된다. ② 소극적, 부족, 제거강화(negative or removal reinforcement) == 바라지 않는 어떠한 것을 제거하여 약화시키거나 행동의 강도와 빈도를 증가시키는 것을 의미한다. 행동을 약화시키거나 감소시키려고 의도된 “벌”과는 구별된다. 강화와 처벌의 과정
(8) 처벌(punishment) ① 개념 == 바람직하지 못한 행동을 멈추게 하기 위해 개인이 원하는 것을 제거하거나 원치 않는 것을 주는 것이다. ② 스키너와 손다이크는 벌의 효과에 대해서 의견을 같이 하였다. 벌이 반응이 일어날 확률을 감소시킨다는 것이다. ③ 벌의 한계(문제점) == 벌은 행동을 억제시키는 것처럼 보이지만 장기적으로는 효과적이지 못하다. 제1종 처벌 == 적극적, 제시 처벌(positive or presentation punishment) == 꾸짖음, 찰싹 때리기 같은 혐오자극의 제시가 포함된다. 제2종 처벌 == 소극적, 제거 처벌(negative or removal punishment) == 위반 행위에 대한 벌금과 특권의 상실 같은 즐거운 자극(적극적 강화인자)의 제거가 포함된다.
<적극적 강화, 소극적 강화, 제1종 처벌, 및 제2종 처벌> 처벌의 부작용 ⓐ 벌은 정서적으로 불쾌하여 공포심을 갖게 한다. ⓑ 무엇을 해서는 안 된다는 것만을 알려주기 때문에 부차적 학습이 요구된다. ⓒ 벌은 타인에 대한 가해행위를 정당화시킨다. ⓓ 과거에 벌 받았던 상황에서 벌을 받지 않으면 그 행동을 다시 하게 된다. ⓔ 벌을 주는 대상과 타인에 대한 공격성을 유발시킨다. ⓕ 벌은 바람직하지 못한 대체행동을 일으킨다. (9) 강화계획 스키너는 부분적 강화가 연속적인 강화 또는 100%의 강화를 주었을 때보다도 소멸에 더욱 저항하도록 만든다는 것을 발견하고, 이것을 “부분적 강화의 효과(PRE)”라 불렀다.
① 연속강화계획(CRF : Continuous Reinforcement) == 행동이 일어났을 때마다 강화물이 주어지는 것이다. 학습된 행동이 처음으로 도입될 때 용이하게 사용된다. 그 결과 반응율은 높지만, 강화가 중지되면 소거가 아주 빨리 일어난다. - 초기훈련단계 ② 고정간격강화계획(FI) == 일정한 시간 간격을 두고, 이 때 나타나는 반응을 강화한다. 예를 들면 3분 간격으로 그때 나타나는 반응을 강화하는 것이다. 초기에는 매우 느리게 반응하지만, 점차로 반응속도가 증거하고 보상이 나타날 순간을 기대하게 된다. ③ 고정비율강화계획(FR) == 반응 중 몇 번째 하는 반응마다 강화한다. 예를 들면 FR5는 매 5번째 반응마다 보상을 받는다는 것을 의미한다. ④ 변화간격강화계획(VI) == 시간간격은 일정하지만 실제로 강화가 주어지는 시간간격은 다르다. ⑤ 변화비율강화계획(VR) == 각기 다른 수의 반응에 따라 강화가 주어지는데, 평균으로 하면 일정수의 강화가 된다. (10) 프리맥 원리(Premack principle) 프리맥 원리는 “빈도가 낮은 반응의 다음에 오는 빈도가 높은 반응은 빈도가 낮은 반응의 빈도를 증가시킬 것이다.” == 빈도가 높은 반응은 유기체가 행하기를 즐기는 반응인 반면에, 빈도가 낮은 반응은 유기체가 행하기를 즐기지 않는 반응이다. 어린아이들에게 교실에서 일정 기간 조용히 하고 선생님 말씀을 경청한 다음에만 빈도가 더 높은 “활발한”행동(예컨대, 이야기하기와 교실을 돌아다니기)을 하도록 허용한다면, 조죵히 앉아 주목하기 교실 운동은 재빨리 가르칠 수 있다. 2. 교육에의 적용 ① 조작조건화의 원리를 적용하여 학습효과를 올리는 방법 ⓐ 학습은 적극적 자극(보상 : 유쾌한 자극)에 의해 강화되어야 한다. ⓑ 반응과 강화인자출현간의 시간차를 좁혀야 한다. 즉 보상은 즉시 주어져야 한다. ⓒ 강화의 빈도가 많아야 한다. ⓓ 학습내용이 계열적으로 짜여진 프로그램을 학습시켜야 한다. ② 교육자의 주요한 역할은 바람직한 행동을 강화하고, 그러한 적절한 행동이 유발될 가능성이 가장 커지도록 변별적으로 자극을 활용하는 데 있다. 이와 함께 학생들의 진전 상황에 대한 객관적 기록을 보관함으로써 변화 과정을 지켜보고, 교육 개선을 위해 이러한 정보를 활용하는 것이 필요하다. ③ 조작적 조건화를 바탕으로 하는 교육프로그램의 과정 ⓐ 바림직한 목표행동을 구체적 ? 객관적 용어로 기술한다. ⓑ 과제와의 관련성 속에서 아동의 행동목록을 평가한다. ⓒ 강화를 위해 자극자료와 행동기준 등을 계열적으로 준비한다. ⓓ 약 90%의 아동이 바르게 반응할 수 있는 행동단위에서부터 시작한다. ⓔ 바림직한 행동에 점진적으로 접근하고 과제에 내적인 조건화된 강화인이 형성되도록 강화를 준다. ⓕ 교육 자료와 수업을 수정하기 위한 기초자료로서 아동의 반응을 기록해 둔다. 3. 고전적 조건화와 조직적 조건화의 비교
① 고전적 조건화
② 도구적 조건화
|
출처: 심리의 바다 원문보기 글쓴이: 막스 데미얀