■Topic
2019년도 항공 여객 이동특성 조사 결과 분석/시각화
■Data
#Dataset 1
https://www.airportal.go.kr/knowledge/od/main/main.jsp
위의 사이트에서 2019년 조사데이터 .xlsx파일을 다운받아 필요한 컬럼만 추리고 누락값 처리 등의 전처리 과정을 거쳐서 csv파일로 저장
수정한 csv파일:
#Dataset2 (Sub data)
1) 2019년 항공사별 운항편 수, 여객 수 데이터 (국내 모든 공항 출발 기준)
https://www.airportal.go.kr/knowledge/statsnew/air/airline.jsp
수정한 csv 파일:
■Maria DB Create table scrips
#1
drop table tripinfo;
create table tripinfo
( origin varchar(50),
sex varchar(50),
age varchar(50),
currair varchar(50),
flightcode varchar(50),
airlinetype varchar(50),
arrcoun varchar(50),
arrairport varchar(50),
countoforg varchar(50),
triptype varchar(50),
ticket varchar(50),
newline varchar(50) );
LOAD DATA LOCAL INFILE '/home/scott/proj/trip11.csv'
REPLACE
INTO TABLE orcl.tripinfo
fields TERMINATED BY ','
ENCLOSED BY '"'
LINES TERMINATED BY '\n'
IGNORE 1 LINES
(origin,sex,age,currair,flightcode,airlinetype,arrcoun,arrairport,countoforg,triptype,ticket,newline);
#2
drop table mostair;
create table mostair
( airline varchar(50),
supp int,
linenum int,
passnum int,
freight int);
LOAD DATA LOCAL INFILE '/home/scott/proj/mostair11.csv'
REPLACE
INTO TABLE orcl.mostair
fields TERMINATED BY ','
ENCLOSED BY '"'
LINES TERMINATED BY '\n'
IGNORE 1 LINES
(airline,supp,linenum,passnum,freight);
■Python Codes
*너무 길어서 첨부파일로 대체
■ Results
다른 공항들의 이용객 수는 유사한데, 인천공항의 이용객 수는 다른 공항 이용객 수의 두 배 가까이 된다.
전국 공항 이용객 응답자의 국적과, 국적별 거주지 비율을 나타낸 표이다. 외국인과 한국인 중엔 외국인 이용객이 근소한 차이로 더 많다. 파란색은 자국에 거주하는 응답자를, 연한 파란색은 타국에 거주하는 응답자를 뜻한다. 전체 외국인 응답자 중 약 5.5% 정도가 한국에 거주 중인 외국인이며, 전체 한국인 응답자 중 약 12.7%가 외국에 거주 중인 한국인인 것으로 나타났다.
응답자의 연령대는 40대가 30대보다 근소한 차이로 많고, 50대와 20대도 근소한 차이였으며, 60대, 15세~20세 미만, 70대 순으로 많았다. 연령대만 보면 40대, 30대 순으로 가장 많으나 오른쪽 차트에서와같이 성별, 나이대를 함께 보면 40대 남성이 가장 많고 여성은 20대 이용객이 가장 많다. 남성은 40대, 30대, 50대, 20대 순으로 많으며, 여성은 20대, 40대, 30대, 50대 순으로 남성과 여성은 다른 양상을 나타내고 있다. 70대 이상은 남녀 모두 이용객이 가장 적은 연령대이다.
여행 형태의 비율은 개별 여행객의 수가 패키지 여행객의 수보다 약 4배가량 많다. 하지만 개별 여행객 중 출장, 친구/친지 방문 등 개인적인 용무를 제외한 여행 자체 목적으로만 본다면 패키지여행의 비율도 결코 적은 비율이라고만 할 수는 없다.
응답자의 항공권 구매경로 순위가 높은 순으로 나타낸 표이다. 응답자의 대부분은 항공권을 가격비교 사이트, 쇼핑몰 등의 온라인 사이트를 통해 구매했으며, 여행사 홈페이지 또는 모바일 앱에서 구매한 경우가 3,362명으로 2위이다. 그다음 많은 경로가 항공사를 통해 구매한 경우이며, 그다음이 여행사에서 직접 구매한 경우이다. 1위부터 4위까지 각각 대략 1,000명의 응답자 정도가 차이 나므로 온라인 사이트를 통한 구매가 압도적으로 많다.
그림 1-1에서 전체 응답자의 약 46%가 국내 저비용 항공사(LCC)를 이용한 것으로 나타났다. LCC 중 가장 많이 이용된 항공사는 제주항공이며 그다음이 에어부산, 티웨이항공 순이다. 본 설문조사 결과에 따르면 제주항공의 이용객은 대형항공사(FSC)인 대한항공과 아시아나항공 각각의 이용객보다 더 많은 것으로 나타난다. 하지만 그림 1-2가 나타내는 바와 같이 2019년 전체 항공통계에서 대한항공의 총 여객 수는 27,834,934명으로 제주항공의 13,352,537명보다 약 48%가량 많다. 또한, FSC의 총 여객 수는 48,141,846명으로 전체 LCC 이용객 수인 46,103,168명보다도 많다. 따라서 본 조사 데이터는 실제 통계 데이터와 다소 차이가 있다. 외항사 중에선 중국동방항공과 중국남방항공이 1, 2위를 나타내며, 중국 국적 항공사들이 전체 외항사 이용객 수의 약 40%가량을 차지하고 있다. 그림 1-2에서도 외항사 중에선 중국동방항공과 중국남방항공이 나란히 1, 2위이다. 본 설문조사 데이터에서 전체 항공사 중 외항사의 비율이 30%가량 되는데, 실제 데이터에서도 외항사의 비율이 30% 정도이다.
그림 1-3은 도착 도시를 이용객 수의 비율로 나타낸 지도이다. 그림 1-3과 그림 1-4가 나타내는 바와 같이 상위 10개 도착 공항(도시)들은 모두 아시아권에 속한다. 설문조사 인원만을 대상으로한 결과이기 때문에 실제 데이터와 다소 차이가 있지만 2019년 전체 통계 또한 여객 수 상위 14개 도시는 모두 아시아권 도시들이다. 1위 도착 도시는 타오위안 공항과 쑹산 공항을 합친 대만의 타이베이이다. 일본은 하네다 공항과 나리타 공항을 합하여 도쿄가 1위이고, 그다음은 오사카, 후쿠오카 순이다. 중국은 푸동 공항과 홍차오 공항을 합한 상하이가 1위이고, 북경, 연길이 그 뒤를 따르고 있다.
희망 신설 노선 문항에서 없음/확인불가와 무응답을 제외하면 1위는 상하이이다. 본 설문조사는 2019년도에 실시되었으며, 2019년 말부터 LCC의 중국노선 취항이 허가되면서 앞으로 상하이 노선이 더욱더 많아질 것으로 예상된다. 하지만 방콕의 경우 실제 2019 항공 통계에 의하면 총 노선 수 대비 여객 수의 비율이 약 43.8%로, 바로 밑 순위인 5위의 베트남 다낭 행이 약 50.8%인 것에 비해 여객 수 대비 노선 수가 부족하다. 타이베이 또한 총 노선 수 대비 총 노선 수의 비율이 약 33.4%에 불과하다.
■ Conclusion
본 데이터는 응답자 9,235명(외국인 4,920명)을 대상으로 한 표본 조사이기 때문에 공항별 이용객 수, 항공사별 이용객 수 등의 면에서 실제 2019년 전국 공항 전체 이용객의 통계와는 다소 차이가 있다. 세밀한 데이터는 다르지만, 인천공항이 전국의 다른 공항들에 비해 이용객의 수가 최소 2배 이상 차이 난다는 점, LCC에선 제주항공이, FSC에선 대한항공, 외항사 중엔 중국동방항공이 가장 많은 이용객을 보유하고 있다는 점 등을 미루어보아 본 설문조사 데이터는 충분히 실제 전체 이용객의 표본으로 볼 수 있다. 본 분석에 따르면 전국 공항 이용객 중 응답자는 40대, 30대, 50대, 20대 순으로 많았으며, 남성은 40대, 여성은 20대가 가장 많고, 패키지여행보단 개별 여행의 경우가 더 많은 것을 알 수 있다. 응답자는 대부분은 가격 비교 쇼핑몰 등에서 항공권을 구매했으며, 본 분석에서 나타내는 바와 같이 실제 전체 통계 데이터에서도 상위 10개 도착 도시는 모두 아시아권 국가의 도시들이다. 응답자들의 희망 신설 노선으로는 상하이, 방콕 타이베이 순으로 많은 것을 알 수 있다.