|
상대적 가치 이론[ relative value theory ]
상대적 가치 이론은 조작적 강화의 원리를 설명하기 위해 제안된 이론들 중 하나이다. 행동과 행동 간의 관계성에 주목하는 이 이론에 따르면 어떠한 행동이 학습된다는 것은 유기체가 추구하는 행위들 간의 상대적 가치 관계성에 의한 것으로, 발생확률이 높은 행위가 발생확률이 낮은 행위를 강화하기 때문이다. 이때 행동들이 발생할 확률은 고정되어 있는 것이 아니며 유기체의 선호도에 따라 달라질 수 있다.
많은 연구자들이 조작적 조건 형성에 있어, 유기체의 행동을 만들어내는 강화물이 가지는 효과에 궁금증을 가졌다. 왜 강화물이 행동을 증가시키는가를 설명하기 위해 연구자들은 여러 가설을 통해 이를 설명하려 했다. 클라크 훌(Clark Hull, 1943/1951/1952)은 추동 감소 이론(drive-reduction theory)이라는 개념을 사용하여 강화물의 효과를 설명했다. 추동이란 인간으로 하여금 어떤 행위를 하게 만드는 정신적인 힘이다. 훌은 이러한 추동을 감소시키는 자극을 강화물이라고 보았다. 즉, 유기체는 추동을 해결하는 자극들 다시 말해 추동을 감소시키는 강화물을 통해 행동을 학습한다. 하지만 추동 감소 이론은 음식이나 물과 같은 생리적 추동을 감소시키는 강화물에서만 설명력을 가진다는 단점이 있다. 따라서 추동 감소 이론은 강화물의 효과를 설명하는 적합한 설명이 아니라고 여겨졌다.
강화물의 효과에 대한 대안적 접근으로 다른 이론이 제안되었다. 데이비드 프리맥(David Premack, 1959/1965)은 발생확률이 높은 행동이 발생확률이 상대적으로 낮은 행동의 빈도를 증가시키는 강화제의 역할을 한다는 것을 발견했고, 이것을 프리맥 원리(Premack Principle)라 명명했다. 이 이론은 상대적 가치 이론(relative value theory)으로도 불리는데, 행동들의 발생확률은 특정한 시간과 공간에서 상대적인 가치를 가지기 때문이다. 상대적 가치 이론의 주요한 특징은 오로지 행동들 간의 관계성에 주목하여 하나의 행동이 다른 행동을 강화할 수 있다는 가설을 내세움으로써 추동 감소 이론에서 핵심적인 개념인 생리적인 추동을 전혀 가정하지 않았다는 점이다. 따라서 프리맥의 제안은 조작적 강화에서 강화물이 유기체에 미치는 효과를 설명할 수 있는 새로운 대안으로 여겨졌다.
상대적 가치 이론은 쉽게 말하면 어떤 일을 대가로 무언가를 보상해 주는 전략이다. 친구들과 놀러 가고 싶어하는 아이에게 “공부를 마치면 친구들과 놀게 해줄게”라는 부모들의 말이 바로 이러한 원리를 포함하고 있다. 프리맥은 특정 상황에서 어떤 행동은 다른 행동보다 일어날 가능성이 명백히 높다고 말한다. 예컨대 우리 속에 있는 고양이에게 우리 속에 장착된 레버를 누르기라는 행동과 음식 먹기라는 행동을 할 수 있는 기회가 주어졌을 때 고양이는 먹는 행동을 할 가능성이 더 클 것이다. 이렇듯 특정 순간에서 서로 다른 행동은 유기체에게 상대적인 가치를 가진다. 이러한 행동의 상대적인 가치가 바로 강화가 일어나는 원리인 것이다.
이 원리를 설명하기 위해 프리맥이 수행한 연구를 소개한다. 그는 쥐가 쳇바퀴를 돌리는 행동보다 물 마시는 행동을 더 많이 할 거라고 가정하고 물 마시기를 통해 쳇바퀴를 돌리는 행동을 강화할 수 있을 것으로 생각했다.
그는 우리 속의 쥐들에게 물을 주지 않음으로써 쥐들이 갈증을 느끼게 했다. 그리고 쳇바퀴를 돌리면 물을 제공하는 장치를 우리 속에 넣어둠으로써 쥐들이 쳇바퀴를 돌리면 물을 제공했다. 쥐들은 물을 마시기 위해 쳇바퀴를 돌렸고 그 결과 이 장치를 넣어두지 않았을 때보다 장치를 넣었을 때 쥐들이 쳇바퀴를 돌리는 시간이 더 많아졌다. 즉, 물 마시기라는 높은 확률로 일어나는 행동은 상대적으로 일어날 확률이 적은 쳇바퀴를 돌리는 행동을 강화한 것이다. 하지만 행동들의 발생 확률은 상대적인 것이므로 행동들 간의 상대적 가치가 달라져 발생확률이 역전되는 때도 있다. 쥐들에게 더 높은 가치를 지니던 물 마시기와 상대적으로 가치가 낮았던 쳇바퀴를 돌리는 행동의 가치가 역전되면 쳇바퀴를 돌리기 위해 물 마시기를 강화할 수 있다.
그는 다음으로 쥐에게 물은 자유롭게 마실 수 있도록 했지만 쳇바퀴를 돌리는 것을 제한했다. 그런 다음 물을 마시는 행동을 해야만 쳇바퀴를 돌리는 행동을 할 수 있게 했다. 그 결과 쥐들의 물 마시기 행동은 이전에 비해 더 많아졌다. 쥐들은 쳇바퀴를 돌리기 위해 물을 마셨다. 즉, 쳇바퀴를 돌리는 높은 가치를 지닌 행동은 물을 마시는 상대적으로 낮은 가치를 지닌 행동을 강화한 것이다.
프리맥이 쥐를 이용해 한 실험 출처: http://faculty.kutztown.edu/rryan/classes/LRN_MOT/OBJECTIV/premack2.html
상대적 가치 이론이 적용되려면 중요한 두 가지가 필요한데, 하나는 행동의 상대적인 가치다. 유기체에게 어떤 특정한 행동은 늘 같은 가치를 갖지만은 않는다. 달라지는 상황에 따라 변화하는 시간에 따라 유기체에게 어떤 행동은 늘 같은 가치로 느껴지지 않고 달라진다. 예컨대 우리는 운동을 하기 전에는 물을 마시고 싶은 욕구가 그다지 크게 느껴지지 않는다. 하지만 운동을 하고 나서는 물을 마시고 싶은 욕구가 증가한다. 이처럼 같은 행동이라도 상황과 시간에 따라 평가가 달라지는 유기체이기 때문에 어떠한 행동들이 연결되고 이들의 상대적인 가치가 다르다면 행동이 행동을 강화하는 현상이 나타날 수 있다.
상대적 가치 이론의 다른 중요한 한 가지는 행동을 강화하는 다른 행동의 가치 적절성이다. 다시 말하자면 어떤 행동을 강화하기 위해서는 이 행동을 강화하는 다른 행동, 즉 강화물이 유기체에게 충분한 가치가 있어야 한다. 만약 부모가 아이에게 피아노를 치게 하고 싶다고 하자. 이때 부모는 아이에게 피아노를 한 시간 치면 어떤 행동을 할 수 있게 해서 아이가 피아노를 치도록 하려고 한다. 여기서 부모는 축구를 할 수 있도록 한다고 하자. 하지만 아이의 입장에서 축구는 그다지 하고 싶은 것이 아니고 컴퓨터 게임을 하는 것을 더 원할 수도 있다. 하지만 부모가 계속해서 축구라는 조건을 내세운다면 아이가 피아노를 치지 않을 가능성이 클 것이다.
강화하고자 하는 행동이 강화물로 사용하는 행동보다 높은 가치를 지닐 때는 행동이 만들어지기 어렵다. 다시 말해 강화물은 강화하고자 하는 행동보다 늘 높은 가치가 있어야 한다. 정리하자면 상황과 시간에 따라 달라지는 행동들의 상대적 가치, 그리고 강화제의 적절한 선정은 상대적 가치 이론의 중요한 전략으로 사용된다.
프리맥(Premack)은 이 원리를 일반화하여 사람에게도 적용했다. 그는 초등학교 1학년 학생들에게 핀볼 게임하기와 사탕 먹기라는 두 가지 행동으로 실험했다. 학생들은 핀볼 게임과 사탕 먹기 중 하나만 할 수 있다. 그러자 학생들에게서도 두 행동 간의 상대적 가치가 나타났다. 어떤 학생들은 사탕을 먹는 것보다 핀볼 게임을 더 좋아했고, 반대로 어떤 학생들은 핀볼 게임보다 사탕 먹는 것을 더 좋아했다. 여기서 프리맥은 핀볼 게임을 좋아하는 학생들에게는 사탕을 먹어야 게임을 할 수 있게 했고, 사탕을 먹는 것을 더 좋아하는 아이들에게는 핀볼 게임을 해야 사탕을 먹을 수 있게 했다. 그 결과 각각의 학생들에게 일어날 확률이 높은 행동은 일어날 확률이 낮은 행동을 더 많이 하게 만들었다. 즉, 발생확률이 높은 행동은 발생확률이 낮은 행동을 강화했다.
상대적 가치 이론은 이러한 실험 상황에서 나아가 보편적인 상황에서도 바람직한 방향으로 일반화될 수 있다. 이 원리를 통해 사람들에게 어떤 한 가지 활동을 하고 난 후 다른 활동을 할 수 있게 함으로써 바람직한 행동을 만들어 나갈 수 있다. 즉, 어떤 사람이 좋아하는 행동을 하기 위해 조금 덜 좋아하거나 하기 싫은 행동을 하게 하면 그 사람이 하지 않으려 하는 행동의 빈도를 증가시키는 강화물의 역할을 할 수 있다는 것이다.
실제로 다양한 교육 장면과 임상 장면에서 상대적 가치 이론이 적용되어 쓰이고 있다. 교육 현장에서 교사들은 학생들을 수업에 집중시키기 위해, 수업 시간에 떠들지 않고 잘 집중하면 나중에 자유시간을 준다거나 맛있는 것을 먹도록 허락하겠다고 약속하기도 한다. 많은 남학생들은 교사가 체육시간에 축구를 하도록 허락할 테니 수업에 집중해서 공부하자고 말한 경험을 갖고 있을 것이다. 여기서 학생들에게 상대적으로 높은 가치를 지니는 행동은 무엇일까? 바로 체육 시간에 축구를 하는 것이다. 반면 상대적으로 낮거나 동기가 없는 행동은 수업시간에 집중하여 공부하는 것이다. 따라서 교사는 학생들에게 상대적인 가치를 지니는 두 행동을 통해 강화를 사용하고, 그 결과 학생들의 학업 능률을 향상시키는 결과를 얻을 것이다.
임상 장면에도 이 원리가 적용된다. 임상 장면에서 환자들은 다양한 문제 행동을 가지고 있다. 임상가들은 상대적 가치 이론을 이용하여 환자들이 가지고 있는 문제 행동을 도움이 되는 다른 정상적인 행동으로 대체하는 행동 수정 기법을 적용한다. 많은 연구를 통해 상대적 가치 이론은 자학 행위나 고정적인 행동을 수정하는 데 효과적이라는 것이 밝혀졌다. 한 임상 치료 장면에서는 손가락을 무는 버릇을 가진 정서 장애 아동을 치료하기 위해 이 원리를 이용했다. 이 아동은 10분에 1번 정도로 손가락을 무는 행동을 반복했다. 이 원리를 치료에 적용하려면 강화물로 무엇을 선정하는가가 매우 중요하다.
상대적 가치 이론을 적용하기 위해 이 아동이 좋아하는 행동을 관찰했더니 동전 모으기를 아주 좋아했다. 따라서 치료자는 이 아동에게 손가락을 물지 않으면 동전을 주겠다고 약속했고, 실제로 이 아동이 손가락을 물지 않았을 때 동전을 주었다. 이러한 치료를 반복한 결과 이 아동이 손가락을 무는 행동은 점차 줄어들었으며 29일이 지나자 완전히 사라졌다. 이 아동이 가진 손가락 물기 행동이 치료될 수 있었던 것은 이 아동에게 동전 모으기가 손가락 물기보다 더 높은 가치를 지닌 행동이었기 때문이다. 이 아동은 동전을 받기 위해 손가락을 무는 것을 참을 수 있었다. 하지만 만약 동전 모으기 행동이 손가락을 무는 행동보다 더 높은 가치를 지니지 않았다면 이 아동의 문제 행동은 고쳐지지 않았을 것이다.
프리맥(Premack)의 상대적 가치 이론은 실험을 바탕으로 증명된 엄격한 원리라는 점에서 높은 가치를 지닌다. 추동과 같은 추상적인 개념을 통해 설명할 필요가 없고 특정한 시간과 공간에서 어떤 행위가 가지는 가치만으로 강화의 원리를 설명할 수 있다. 하지만 상대적 가치 이론으로 강화의 모든 부분을 설명하지는 못한다는 한계가 있다. 상대적 가치 이론은 추동 감소 이론이 설명하지 못한 생리적 추동 이외의 더 복잡한 행동들이 어떻게 강화되는지 설명할 수 있다. 하지만 이차 강화물인 칭찬이나 ‘음’, ‘그래’와 같은 더 추상적인 강화물이 왜 강화의 효력을 가지는지는 설명하지 못한다. 프리맥 스스로도 이러한 부분을 한계로 인정했다. 또 다른 한계는, 가끔은 일어날 확률이 적은 행동이 일어날 확률이 높은 행동을 강화한다는 것이다.
에인스버거 등(Einsberger, karpman, & Trattner, 1967)은 가치가 낮은 행동을 금지시켰을 때 일어날 확률이 낮은 행동이 상대적으로 가치가 높은 행동을 강화하는 것을 관찰했다. 이로 인해 상대적 가치 이론은 다소 한계가 있는 이론으로 남게 되었으며 이후에 연구자들은 다른 다양한 이론으로 강화를 설명하려고 했다. 하지만 프리맥의 이론은 유기체의 행동 수준에서 여전히 효력을 지니고 있기에, 교육계와 심리 치료와 관련된 임상 장면에서 상대적 가치 이론을 이용한 치료가 여전히 사용되고 있다.
유기체가 어떠한 행동을 한다는 것은 모두 경험을 통해 학습된다는 행동주의 입장은 학습이 일어나는 원리를 설명하기 위해 여러 의견을 내놓았다. 그 중 조작적 강화는 유기체의 행동을 설명할 수 있는 흥미로운 현상이었으나 조작적 강화가 일어나게 하는 원리인 강화물의 효과를 설명할 수 있어야 했다. 따라서 연구자들은 강화물이 어떻게 유기체에 작용하는가를 설명하기 위해 다양한 의견을 내놓았다. 훌(Hull)은 강화물이 유기체의 생리적 박탈로 인한 추동을 감소시킨다는 추동 감소 이론을 제안했다. 하지만 이 이론의 한계 때문에 연구자들은 프리맥(Premack)의 상대적 가치 이론(relative value theory)을 지지했다. 프리맥은 엄격하게 관찰 가능한 유기체의 행동의 상대적 선호도에 따라 행동이 행동을 강화할 수 있다고 설명했다.
상대적 가치 이론은 빈번하게 일어나는 특정한 행동이 상대적으로 자주 일어나지 않는 행동을 강화할 수 있다는 이론이다. 예를 들어 사탕을 좋아하고 당근을 싫어하는 아동에게 저녁 식사 때마다 당근을 먹으면 후식으로 사탕을 먹을 수 있게 한다면, 아동이 싫어하는 행동인 당근 먹기를 점차 증가시킬 수 있다. 따라서 아동이 선호하는 행동을 순서대로 나열해 보는 것은 아동의 특정한 행동을 강화하는 데 매우 중요하다.
하지만 선호하는 것이 변하면 강화물도 변한다. 사탕을 좋아하는 아동의 경우 만약 사탕을 많이 먹고 배탈이 나서 그 뒤로 사탕을 좋아하지 않게 되었다면 사탕을 먹도록 허락하는 것은 더 이상 강화물의 효과를 갖지 못한다. 상대적 가치 이론은 보상이 될 수 있는 것이 개인마다 다르며 개인 내에서도 언제든지 바뀔 수 있다는 것을 보여 준다. 따라서 강화물로 기능할 수 있는 것이 무엇인지 주의 깊게 관찰하고 상대가 가장 선호하는 것으로 보상하는 세심함이 필요하다.
상대적 가치 이론이 강화물의 효과를 완벽하게 설명하는 것은 아니다. 하지만 이후에 유기체의 행동을 설명하려는 다양한 이론이 나왔으며, 이러한 이론들은 유기체의 행동을 설명하는 좋은 도구가 될 수 있었다.
집필 : 이영창(충남대학교 대학원 심리학과)
첫댓글 감사합니다.