마을에 데이터가 왜 필요한가?
이상돈 (주)더가능연구소 수석디렉터
마을공동체에 데이터가 필요할까
마을에는 항상 다양한 문제가 있다. 또한 마을에는 다양한 구성원들이 함께 한다. 그래서 마을의 문제에 대한 공감과 동의를 얻는 과정은 필수적이다. 그러나 모든 문제가 모든 사람에게 동의받고 공감되지는 않는다. 같은 마을 즉 같은 읍·면·동 지역에 거주한다고 해도 우리는 같은 문제를 마주하지는 않는다. 각자 삶 속에서 다른 태도와 상황을 가지고 있기 때문이다. 같은 지역에 거주하는 주민들 사이에도 마을 문제에 대한 상이한 관점을 가질 수 있다. 오히려 인근 지역 주민과 문제를 공유하는 경우가 더 많기도 하다. 그렇기 때문에 마을의 문제는 지역이 아닌 권역이라는 개념에서 이해하고 논의되어야 한다. 이를 돕기 개념으로 ‘생활권’이라는 개념이 있다. 생활권은 ‘통근·통학, 쇼핑, 오락, 사회적 관계 등 사람이 일상생활을 해 나가는 공간적인 범위’로 정의(오병록, 2012)된다. 생활권의 범위는 행정구역으로 제한되지 않는다. 우리가 흔히 마을이라고 이야기하는 개념은 행정동, 법정동이 아닌 공동의 생활 영역을 공유하는 공간적인 의미를 가진다. 예를 들어 초등학생 자녀를 둔 부모의 경우 사는 지역은 다르지만 어린이 보호구역, 통학로 안전 등에 대한 공통의 관심사를 가지고, 관련 문제를 마을의 중요한 의제로 인식한다. 이처럼 생활권의 범위는 각 영역에 따라 범위가 다층적으로 구성된다. 이때 우리가 다양한 범주와 영역의 생활권을 확인할 때 활용할 수 있는 것이 데이터이다.
<의정부시 어린이 교통사고 현황>
위 그림은 도로교통공단에서 모든 사람이 이용할 수 있도록 제공하는 <교통사고분석시스템>1)에서 의정부시에서 2019년부터 2021년까지 발생한 어린이 교통사고 데이터를 분석하여 일부 지역을 발췌한 것이다. 그림의 왼쪽 중단의 붉은 색으로 표기된 지역은 해당기간 동안 어린이 교통사고가 8건 이상 발생한 지역이다. 전국적으로 어린이 교통사고가 지속적으로 감소하는 추세에서 동일 지역에서 반복적으로 사고가 발생하는 것은 사고 지역의 도로 형태와 어린이 교통사고 예방시설 등 구조적, 정책적 문제를 살필 필요가 있다.
데이터로 확인해보면 해당 지역은 멀티플렉스와 대형마트, 도서관, 근린공원 등 주민편의시설이 있으며, 유치원과 중·고등학교 등의 교육시설이 있다. 아파트가 밀집된 지역으로 면적에 대비하여 인구와 차량이 소통이 많은 지역으로 예상되어, 출퇴근 시간대, 혹은 등하교 시간대에 어린이의 보행 이동이 많거나, 휴일 등에 주민편의시설이 이용하는 주민이 많아 교통사고가 많을 가능성이 있다. 이렇게 설명 정보를 가지는 데이터와 위치정보 데이터를 연결하여 지도에 통합하는 것을 공간정보시스템(GIS : Geographic Information System)라고 한다. 이렇게 데이터로 확인하고 현장 점검과 주민·경찰·공무원 등 이해관계자의 인터뷰 등을 실시하여 이러한 문제 해결의 필요성을 확인하고 해결의 실마리를 찾아가는 탐색적인 과정에서 데이터가 매우 유용하다. 이 과정에서 우리는 이 지역에서 발생하는 어린이 교통사고가 발생 지역의 문제가 아닌 지역의 시설을 이용하는 주민 모두의 문제이며 권역이란 개념을 이해할 수 밖에 없음을 알 수 있게 된다.
데이터로 문제를 발견하고 정의하기
공동체가 혹은 공동체의 주체가 공유하는 문제를 설정하기 위해 문제를 정의하는 것은 매우 과정이다이다. 문제를 정의하는 단계는 문제를 해결하는 과정인 시작인 동시에 공동체의 커뮤니케이션 과정을 어떻게 이끌고 갈 것인지에 대한 시작이기도 하다. 마을공동체의 관점에서 정책의 대상과 목적을 충실히 정의하는 것이 중요하다. 공공데이터는 이 단계에서 하나의 유용한 도구일 수 있다. 공공데이터를 탐색하는 과정에서 사회문제를 둘러싼 정부정책과 법제, 그리고 쟁점을 파악할 수 있다. 또한 조사과정에서 최초의 문제 제기, 혹은 가설을 수정하는 계기를 갖게 되고, 다음 단계의 질문으로 이어지는데 도움이 된다.
공동체가 함께 이해하는 문제를 설정하기 위해서는 그 범위의 크기가 적절해야 한다. 함께 이해하고 공감하는 그 적절한 범위를 위해서는 구체적이고 객관적인 데이터가 필요하다. ‘우리의 문제의 대상을 어디까지 설정할 것인가’에 대한 대답을 구할 때 데이터는 활용한다. ‘골디락스 존’(Goldilocks zon)이라는 용어가 있다. 영국의 전래동화인 ‘골디락스와 곰 세 마리(Goldilocks and the Three Bears)’에 주인공인 소녀가 곰이 끓인 세 가지 수프 중 너무 뜨겁지도, 차갑지도 않는 적당한 온도의 수프를 좋아했다는 이야기에서 유래한 용어이다. 한 명의 소녀가 아닌 여러 사람들이 동의하는 ‘적당함’을 얻기 위해서는 온도계처럼 객관적인 측정 도구 혹은 지표를 통해 문제를 정의해야 한다. 무엇보다 공공데이터가 주는 근거 자료의 신뢰성을 바탕으로 현장 활동을 통해 타겟팅한 주제나 그룹을 통해 사회문제를 재구조할 수 있다. 또한 사회문제를 둘러싼 전체 맥락에서 벗어나지 않으면서도 차별화된 주제 의식을 심화시키는데 도움이 된다.
우리가 활용할 수 있는 데이터는 다양하게 존재한다. 특히 공공데이터의 형태로 기초지자체에서 정부 기관까지 생산하고 수집하는 각종 통계자료부터 현황자료 등이 있다. 경기도는 ‘경기데이터드림’이라는 공공데이터 개방 포털에서 AI학습데이터, 민간공익 데이터, 경기통계 데이터 등 다양한 데이터를 제공하고 있다. 특히 ‘맞춤형 데이터’ 카테고리에서 생애주기, 테마, 지역, 위치기반 맞춤형 데이터를 제공하고 있어 지역맞춤형 데이터를 확인할 수 있다.
<경기도 공동데이터 포털>
최근에는 통신사, 카드사의 빅데이터를 구매하여 제공하는 등 공개되어 우리가 활용할 수 있는 데이터의 범주와 형태가 되고 있다. 서울시는 서울의 생활인구2)를 서울시의 공공데이터와 KT 통신데이터를 결합하여 제공하고 있다. 이를 통해 거주 인구 중심에서 벗어나 지역의 유동인구를 살펴볼 수 있는 데이터와 그 영향도를 확인할 수 있다.
<경기도 수원시 장안구의 인구 변동(2012~2021년)>
경기도 수원시 장안구의 10년간의 인구변동의 추이를 살펴보면, 총인구수는 2014년을 기점으로 지속적으로 감소하고 있다. 반면에 세대수는 2017년까지 증가하다가 2019년에 감소, 다시 증가하는 추세를 보인다. 2022년 10월 기준으로 수원시 장안구의 세대 당 인구는 2.26명으로, 2012년 2.62명으로 큰 차이를 보인다. 우리는 이 그래프를 통해 무엇을 확인할 수 있을까?
인구통계 자료를 통해 우리는 다양한 의미값을 도출할 수 있는데, 위 통계는 총인구수와 세대수를 비교하여 세대 내 거주하는 인구수의 감소추세를 확인하는 동시에 1인 가구의 증가를 예상할 수 있다. 위 통계자료로 지역의 인구특성을 파악하고 마을공동체의 사업 대상 지역의 인구통계적 변화를 감지하여 정책과 사업의 대상을 변경할 수도 있다. 혹은 해당 지역의 1인 가구의 주요 특성 데이터를 기반하여 정책수요자의 유형을 ‘페르소나(Persona) 3) 기법’을 통해 확인할 수 있다. 예를 들어 2019년에 리빙랩 프로젝트를 진행한 경기도 양주시는 ‘페르소나 기법’을 사용했다. 즉, 목표 대상을 대표할 수 있는 사용자 유형을 가상으로 설정하고 맥락적 사용자 조사를 실시하여 문제를 구체적으로 도출했다(서울디지털재단, 2020).
마을공동체를 위한 데이터 리터러시와 플랫폼
데이터 리터러시(Data Literacy)는 데이터를 해석할 수 있는 능력을 의미한다. 필자는 여기서 데이터를 탐색하는 능력을 강조하고자 한다. 마을공동체 사업이나 프로그램을 시작할 때 다양한 데이터를 조사하고 탐색해야 하지만 쉬운 과정은 아니다. 인터넷 기반의 데이터 개방 시대에 살고 있어도 어떤 키워드로 검색하느냐에 따라 유용한 데이터를 획득 여부는 차별적이다. 더불어 데이터 리터러시는 데이터를 기초로 하여 분석 대상에 접근해가는 프레임을 만드는 역량이다. 그래서 짧은 이 글에 수차례 강조하는 것이 ‘관점’의 중요성이다.
공공데이터 등 우리가 가용할 수 있는 데이터는 많다. 문제는 다양한 데이터를 어떤 관점에서 정리하고 분석하느냐에 따라 데이터가 마을공동체에 갖는 가치가 달라질 수 있다. 물론 마을공동체 역시 단일한 관점을 가지는 것이 아니다. 집합적인 정책적 개념에서 ‘마을공동체’라는 관점을 존재하나, 세부적으로 지역, 사업의 대상과 목적 등에 따라 다양한 관점을 존재할 수 있다. 앞서 문제정의를 언급한 바와 같이 동의된 관점에서 데이터 분석을 시작하는 것이 매우 중요하다. 왜냐면 관점이 다르면 분석의 결과가 다르게 해석될 수 있기 때문이다. 왼쪽의 그림은 데이터와 데이터 분석을 통해 얻은 수 있는 이익을 설명하는데 인용된다. 데이터 자체가 우리에게 직접적으로 분석된 가치 정보를 주지는 않다. 마을공동체의 관점에서 분석된 ‘데이터’는 취합하고 선택하여 분석되는 과정에서 ‘정보’와 ‘지식’이 되며, 다양한 주체들과 논의하고 공유되는 과정에서 ‘통찰’과 ‘지혜’가 된다. 마지막으로 여러 주체들의 의견이 더해지고 다시 정리 분석되는 과정을 통해 ‘데이터’는 ‘마을공동체’의 정책과 사업에 ‘영향력’을 미칠 수 있다.
2022년 현재 경기도마을공동체지원센터에서 추진 중인 ‘경기도마을공동체 기초조사 아카이브 데이터 플랫폼’은 경기도 전역에서 추진되고 있는 마을공동체 사업과 관련된 다양한 정보를 수집하고 종합하여 마을공동체 이해관계자는 물론 시민 역시 쉽게 접근할 수 있도록 하는 데 목적을 두고 있다. 데이터와 각종 정보를 종합하여 제공한다는 점에서도 경기도마을공동체 데이터 플랫폼은 필요하지만 이 데이터가 ‘마을공동체’의 관점에서 수집되고 가동되어 제공한다는 점에서 큰 의미를 가진다. 초기의 플랫폼을 기획하고 구축이 중요한 의미를 가지지만 플랫폼의 본래 가치는 참여이다. 마을공동체에서 활동하는 모든 주체들이 자신들이 직접 생산하고 데이터를 플랫폼을 통해 공유하고, 서로의 활동을을 데이터를 통해 확인할 수 있을 때 플랫폼의 본래적 목적을 달성할 수 있다. 인간의 활동은 흔적을 남기고 현대 사회에서 그 흔적은 기록되어 데이터로 남겨진다. 고립된 공간에서의 삶이 아닌 마을이라는 공간은 우리의 일상이 기록되고 공유되면서 마을의 변화와 발전을 목격하는 가장 쉬운 방법은 관점이 더해진 데이터를 공유하는 것이다.
1) http://taas.koroad.or.kr
2) 특정 지역, 특정시점에 존재하는 모든 인구(서울시 열린데이터 광장)
3) 어떤 서비스나 제품 등을 사용하는 다양한 사용자들의 유형을 대표하는 가상의 캐릭터(서울디지털재단, 2020)
참고문헌
서울디지털재단(2020), 스마트도시 리빙랩 워크북
오병록(2012), 생활권 이론과 생활권계획 실태 분석 연구 : 도시기본계획에서의 생활권계획을 중심으로. <서울도시연구> 13권, 4호 : 1~20