여러분이 전국 대학생의 사회복지 인식을 조사하고 싶다고 가정해봅시다. 가장 정확한 방법은 무엇일까요? 원칙적으로는 전국 모든 대학생을 조사하면 됩니다. 하지만 현실적으로는 거의 불가능합니다. 시간도 부족하고 비용도 너무 많이 들기 때문입니다. 그래서 조사에서는 전체를 모두 조사하는 대신 일부를 선택해서 조사합니다. 이것이 바로 표본조사입니다.
이때 조사하고자 하는 전체 대상을 모집단(population)이라고 합니다. 예를 들어 “대한민국 대학생 전체”가 모집단이 될 수 있습니다. 그리고 모집단에서 실제로 선택된 일부 조사대상을 표본(sample)이라고 합니다. 즉 표본은 모집단의 일부입니다.
그런데 여기서 가장 중요한 문제가 발생합니다. 바로 “일부만 조사하고 전체를 어떻게 설명할 수 있는가?”라는 문제입니다. 예를 들어 경상국립대 학생 20명만 조사했는데 “한국 대학생 전체는 이런 생각을 한다”고 말할 수 있을까요? 함부로 일반화하면 위험할 수 있습니다. 따라서 표본은 가능한 한 모집단을 잘 대표(represent)해야 합니다. 표본추출의 핵심은 바로 대표성입니다.
표본추출에는 크게 확률표본추출과 비확률표본추출이 있습니다.
먼저 확률표본추출(probability sampling)은 모집단에 속한 모든 대상이 표본으로 선택될 확률을 가지는 방식입니다. 쉽게 말하면 “누구나 뽑힐 가능성이 있는 방식”입니다. 대표적인 방법은 단순무작위표집(simple random sampling)입니다. 예를 들어 학생 명단 전체에 번호를 붙이고 무작위로 30명을 추첨하는 방식입니다. 이런 방식은 대표성이 비교적 높다는 장점이 있습니다.
또 다른 방법으로 층화표집(stratified sampling)이 있습니다. 예를 들어 남학생과 여학생의 비율 차이가 큰 경우 단순무작위표집만 하면 특정 집단이 과소대표될 수 있습니다. 그래서 먼저 모집단을 남성과 여성이라는 층(strata)으로 나누고 각각에서 표본을 추출하는 방식입니다. 사회복지조사에서는 연령, 성별, 지역 등에 따라 층화표집을 자주 활용합니다.
집락표집(cluster sampling)도 자주 사용됩니다. 예를 들어 전국 노인을 조사할 때 모든 노인을 직접 추출하기 어렵다면 지역이나 시설 단위를 먼저 추출하고 그 안의 사람들을 조사하는 방식입니다. 현실적으로 비용과 시간을 줄일 수 있다는 장점이 있습니다.
반면 비확률표본추출(non-probability sampling)은 모집단의 모든 대상이 동일한 선택 가능성을 가지지 않는 방식입니다. 대표적으로 편의표집(convenience sampling)이 있습니다. 예를 들어 연구자가 쉽게 만날 수 있는 사람만 조사하는 경우입니다. 학부생들이 가장 많이 하는 실수가 바로 이것입니다. “친구 10명 조사” 같은 방식입니다. 이런 방식은 쉽고 빠르지만 대표성이 낮다는 문제가 있습니다.
눈덩이표집(snowball sampling)도 있습니다. 이는 조사대상이 또 다른 조사대상을 소개하는 방식입니다. 예를 들어 노숙인, 이주노동자, 은둔형 외톨이처럼 접근하기 어려운 집단을 조사할 때 사용됩니다. 사회복지연구에서는 실제로 많이 활용됩니다.
여기서 학생들이 가장 중요하게 이해해야 하는 점은 “좋은 표본은 큰 표본이 아니라 대표성 있는 표본”이라는 것입니다. 예를 들어 전국 대학생을 이해하려는데 사회복지학과 학생 500명만 조사했다면 표본 수는 많지만 대표성이 낮을 수 있습니다. 반대로 표본 수가 조금 적더라도 모집단 특성을 잘 반영한다면 더 좋은 표본이 될 수 있습니다.
또 표본추출과 관련해서 표집오차(sampling error) 개념도 중요합니다. 표본은 모집단 전체가 아니기 때문에 차이가 발생할 수밖에 없습니다. 예를 들어 실제 모집단의 평균과 표본 평균이 다를 수 있습니다. 이것이 표집오차입니다. 따라서 조사결과는 언제나 일정 정도의 오차 가능성을 포함합니다.
여기서 사회복지조사의 중요한 특징도 생각해볼 필요가 있습니다. 사회복지에서는 단순히 “대표성”만 중요한 것이 아닐 수 있습니다. 예를 들어 노숙인, 학대피해자, 중증장애인처럼 소수이지만 매우 중요한 집단을 연구할 때는 무작위표집이 현실적으로 어렵습니다. 이 경우에는 비확률표집이라 하더라도 사회적으로 중요한 의미를 가질 수 있습니다. 즉 조사방법은 단순한 기술 문제가 아니라, 연구목적과 사회문제를 어떻게 이해하느냐와도 연결됩니다.
결국 표본추출은 단순히 사람을 뽑는 기술이 아닙니다. 연구자가 “누구를 통해 사회를 이해하려 하는가”에 대한 선택의 과정입니다. 그리고 좋은 조사는 단순히 많은 사람을 조사하는 것이 아니라, 연구목적에 맞게 적절한 표본을 구성하는 데서 시작된다고 이해하면 좋겠습니다.