|
제목: 한국의 기계학습 기반 뉴스심리지수
저자: 서범석(경제통계국 통계연구반), 이영환(경제통계국 통계연구반), 조형배(경제통계국 통계연구반)
<요약>
본 논문은 인터넷에서 스크랩한 뉴스기사를 일별로 분석하여 국내 경제주체들의 경제심리를 추정하는 한국의 뉴스심리지수(news sentiment index, NSI) 개발방법을 제시하였다. 이를 위해 일련의 자연어처리 기법들을 활용하였으며 NSI 작성에 적합하도록 트랜스포머(transformer) 인공신경망 모형을 기반으로 감성분류 모형을 구축하였다. NSI는 월별 서베이에 의존하는 공식 통계보다 고빈도로 신속하게 작성하는 것이 가능하며 따라서 공식통계 발표전에 경제 심리변화를 포착하는 데 유용하다. 또한, NSI는 경제심리 변화 요인을 키워드 분석과 부문별 지수 작성을 통해 파악 가능한 점도 장점이다. NSI는 사람의 개입 없이 자동으로 추계되도록 설계되었다. 본 논문은 작성한 NSI의 타당성과 유용성을 여러 각도에서 평가하였다. 평가 결과는 NSI가 선행 지표로서 유용하며 경제심리의 변곡점 포착에 유용한 정보를 제공할 수 있음을 시사한다.
<Abstract>
We develop the Korean news sentiment index(NSI) that measures the economic sentiment of Korea by computing it daily from the news texts scrapped from the internet. We use a set of natural language processing techniques and develop a state-of the-art transformer-neural-network-based sentiment classifier particularly designed for computing NSI of Korea. The proposed model handles large news samples effectively and computes NSI efficiently. NSI is more frequently and immediately compiled than official indices based on monthly surveys, and hence, helps to identify changes in economic sentiments before the official statistics are released. Also, NSI provides explanations for why the economic sentiments fluctuate via its keyword analysis and sector indices. NSI is designed to be compiled automatically. We assess the validity and utility of NSI from multiple perspectives. The assessments support our findings that NSI is useful as a leading index and informative to find inflection points in economic sentiments.
1
2
3
4
5
|