4월 1일부터 교통카드 빅데이터 개방 |
- ‘데이터안심구역’ 2개소에서 개방, 분석결과 반출도 가능 |
□앞으로 교통카드 이용정보를 기반으로 한 데이터를 민간에서도 자유롭게 활용할 수 있게 된다. 국토교통부(장관 박상우, 이하 국토부)와 한국교통안전공단(이사장 정용식, 이하 TS)은 4월 1일부터 교통카드 빅데이터를 개방하고, 안전하고 신뢰할 수 있는 분석 환경을 제공할 계획이다.
□교통카드 데이터*는 대중교통 승·하차 시간 및 장소, 이용 패턴 등 관련 정보를 포함하고 있어, 공공(국가, 지자체, 공공기관 등)에서는 신규 버스노선 도입 등 교통정책 수립에 활용되고 있다.
ㅇ 하지만, 개인정보 보호를 위하여 현행 대중교통법에 따라서 민간에는 가공하여 집계한 형태**로만 제공되고 있다.
* (수집량) 약23백만 건/일, 2018년부터 총 110TB 분량 수집
** 통행량(수단,환승), 평균 통행시간, 노선별·정류장별 이용현황 등
□ 이러한 규제를 해소하기 위하여 국토부는 민간도 교통카드 데이터를 자유롭게 분석하고 가공·활용할 수 있도록, 지난해 10월 모빌리티 규제샌드박스 실증특례를 승인하였다.
ㅇ 이에 따라, TS와 한국데이터산업진흥원(K-DATA)은 4월 1일부터 보안이 갖춰진 데이터안심구역*을 통해 민간에 교통카드 빅데이터를 개방한다.
* 미개방 데이터를 외부 유출 걱정 없이 안전하게 분석할 수 있도록 지원하는 국가 지정 구역[서울과 대전 두 곳에서 운영 중(http://dsz.kdata.or.kr)]
□ 데이터안심구역은 데이터산업법에 따라 지정된 기술적·물리적·관리적 보안대책 등이 갖추어진 시설로서, 누구든지 데이터를 안전하게 분석·활용할 수 있는 구역이다. 다양한 미개방데이터의 안전한 분석 환경 제공, 분석도구 및 분석결과 반출 지원 등의 기능을 수행한다.
ㅇ 이번에 제공되는 교통카드 빅데이터는 개인정보가 철저하게 보호될 수 있도록 암호화*된 상태이며, 사전에 승인을 받은 경우에 한하여 인터넷이 연결되지 않은 독립된 공간에서만 데이터를 분석하고, 분석한 결과만 반출할 수 있다.
* 개인을 특정할 가능성이 있는 카드번호는 가상카드번호로 대체
□ 국토부는 이번 개방으로 민간 기업, 연구기관, 학계 등 다양한 주체가 교통카드 빅데이터를 연구와 서비스 개발에 활용할 수 있을 것으로 기대하고 있다.
ㅇ 교통카드 빅데이터를 활용하여 대중교통 이용량이 많은 시간대 및 노선 정보를 파악할 수 있고, 이를 바탕으로 수요응답형 대중교통(Demand Responsive Transit, 이하 DRT) 서비스와 공유 모빌리티(전동킥보드, 자전거 등) 연계 서비스 개발 등에 활용할 수 있다.
□ 국토교통부는 ‘26년 12월까지 데이터안심구역에서 개방 서비스를 제공하고 이용자 만족도 조사 및 활용사례 분석 등 운영결과를 기반으로 필요시 대중교통법 개정도 검토할 계획이다.
ㅇ 데이터안심구역을 통한 교통카드 데이터 분석을 희망하는 경우, 데이터안심구역 신청포털(http://dsz.kdata.or.kr) 내 전용 페이지에서 회원가입 후 이용신청서를 작성하고 승인을 받은 후 분석이 가능하다.
이용신청 | ▶ | 이용신청 심사 | ▶ | 데이터 분석* | ▶ | 결과반출 요청 | ▶ | 반출심사** | ▶ | 반출 |
4.1 | ~4.10 (10일 소요) | 4.11~5.6 (기본 25일) | 5.6 | 5.7~5.16 (10일 소요) | 5.17 |
* 1회에 한해 2주까지 연장가능
** 기본 10일이 기준이며, 상황에 따라 연장될 수 있음.
□ 국토부 엄정희 교통물류실장은 “교통카드 데이터는 사람의 이동경로를 파악하여 통행 특성을 분석할 수 있는 고부가가치 데이터로서, 그동안 민간에는 공급자 중심의 분석지표 제공으로 이용자 수요를 충족하지 못한 측면이 있었으나,
ㅇ 민간 역량을 활용하여 대중교통 이용자가 원하는 지표에 대한 데이터 분석이 가능함에 따라 다양한 신규 대중교통 서비스 개발이 기대된다”고 밝혔다.
□ 교통카드 빅데이터 통합정보시스템 개요
ㅇ 교통카드 이용 데이터를 수집·가공(약 23백만 통행/일)하여 공공·민간분야 제공 및 활용
- (근거) 「대중교통법」 제10조의10에 따라 시스템 구축, 데이터 수집・관리
- (수집항목) 승ㆍ하차 위치 및 일시, 노선, 환승, 차량 정보 등
□ 활용현황
ㅇ (데이터 활용) 공공(원천데이터 포함) 및 민간에 집계자료 형태(웹서비스, Open API)로 65개 지표*에 대한 대국민 서비스 제공
* 통행량(수단, 목적, 환승), 평균통행시간, 평균운행거리, 노선/정류장별 이용현황 등
- (민간) O/D데이터*, 노선별/정류장별 이용통계 등의 대중교통 통행패턴 분석을 통해 공모전, 논문 기초자료 등으로 활용
* O/D : 승객의 출발지(Origin)와 도착지(Destination)를 기반으로 한 이동 수요 분석
- (공공) DRT 도입, 대중교통 정책 및 노선개편 등의 기초자료 활용
* 원천데이터 제공 실적 : (’20년) 19건 → (’21년) 27건 → (’22년) 30건 → (’23년) 61건 → (’24년) 84건 (연평균 45% 증가)
□ 데이터안심구역 제공 데이터
ㅇ 가상카드번호, 교통수단코드, 노선ID, 승·하차일시, 정류장ID, 사용자 구분코드(버스), 탑승시간 등