품목별 머신러닝 예측을 통한 단기 물가전망
1. 인플레이션은 경제 전반에 큰 영향을 미치는 주요 지표일 뿐 아니라, 팬데믹 이후 물가 변동성이 크게 높아짐에 따라 새로 입수되는 데이터에 기반한data-dependent 물가 판단과 단기적인 인플레이션 예측의 중요성이 어느 때보다 높아졌다. 본고는 국내 인플레이션에 대한 단기 예측력을 향상시키기 위해 머신러닝 기법과 상향식bottom-up 추정을 결합한 예측모형을 소개한다. 이 방식은 소비자물가지수를 구성하는 세부 품목군별 가격 변화를 머신러닝 기법으로 예측한 후 이를 가중합산하여 전체 인플레이션의 단기 흐름을 전망하는 방법이다.
2. 품목군별 물가 예측에는 보루타-랜덤포레스트Boruta-Random Forest 알고리즘을 이용한 머신러닝 기법을 적용하였다. 설명변수로 각 품목군의 가격과 연관성이 높은 주요 거시변수뿐만 아니라 세부품목별 물가지수, 주유소 판매가격, 농축수산물가격, 지역별 기후, 공공요금 관련 뉴스 등 미시변수와 이들의 시차변수까지 포함하여 총 2,300여개의 정보를 활용하였다. 또한 상향식 예측에는 품목군의 세분화 정도가 크게 영향을 미치는데, 그 정도에 따라 1단계(총지수)부터 6단계(33개 품목군)까지 구분한 후 과거 10년 간의 월별 소비자물가 상승률을 이용하여 단계별 예측력을 비교하였다.
3. 분석 결과 상향식 예측방식이 전체 소비자물가지수를 직접 예측하는 방식이나 전통적인 시계열 모형을 통한 전망에 비해 예측력이 우수한 것으로 확인되었으며, 30개 품목군(5단계)으로 세분화한 후 예측·집계하는 방식의 정확도가 가장 높은 것으로 나타났다. 특히 상향식 모형의 예측오차는 당월 예측기준 0.141%p(21년 이후: 0.136%p), 익월 예측기준 0.188%p(0.201%p)로 시장 서베이나 기존 연구의 머신러닝 예측오차에 비해 30~60% 정도 작은 것으로 분석되었다. 이는 상향식 머신러닝 예측에는 개별 품목 단위의 물가 흐름과 연관성이 높은 정보들이 효과적으로 활용되었기 때문인 것으로 판단된다. 예측의 정확성 외에도 상향식 방식은 직접 예측방식과 달리 품목군별 물가상승률 예측치를 도출하고 변동요인을 점검해 볼 수 있다는 장점이 있다.
4. 5단계 상향식 모형을 사용하여 이번달(24.8월)과 다음달(9월)의 인플레이션을 추정해본 결과, 7월에 소폭 반등하였던 소비자물가 상승률이 8월 2%대 초반, 9월 2.0% 내외로 수준으로 둔화되는 것으로 모형은 예측하였다. 근원물가 상승률은 8~9월중 2.1% 내외 수준에서 하향 안정될 것으로 추정었다. 품목별로는 최근 유가가 다소 하락한 가운데 농산물가격도 둔화되면서 농산물·석유류 등 비근원물가 상승률의 둔화 흐름이 이어질 것으로 예측되었다. 근원물가의 경우 더딘 수요회복 등으로 당분간 낮은 수준에서 안정될 것으로 나타나는데, 모형에서는 근원상품가격 상승률이 1%대 후반 수준, 근원 서비스물가(집세 제외) 상승률은 2%대 중반 수준에서 완만한 둔화 흐름을 이어갈 것으로 예측되었다.