|
AI 등 통계 기법을 이용하면 무수히 많은 사람의 언어를 종합해서 빠르게 분석하는 것이 가능하다. 본 연구는 기업분석 전문가인 증권사 애널리스트들의 기업 평가 보고서 12만 8천건을 빅데이터로 구축하고, 이로부터 유의미한 산업별 모니터링 정보를 추출하였다. 이를 위해 자연어처리(natural language processing)등 다양한 통계 기법을 이용하여 텍스트 정보를 가공하였으며, 동 과정의 알고리즘화를 통해 사람의 개입 없이 산업 동향을 파악하는 방안을 점검하였다.
구체적으로 본 연구는 증권사 보고서에 나타나는 숫자 정보는 모두 제거하고, 오직 텍스트에 나타나는 정성적(qualitative) 정보만을 이용하여 애널리스트들의 생각을 취합하였다. 이를 통해 애널리스트들이 평가하는기업 업황을 산업별·지역별로 추정하고, 업황의 변동요인을 통계 알고리즘을 이용하여 요약·정리하였다.또한 증권사 보고서의 텍스트 분석을 통해, 환율, 금리 등 주요 경제 이슈에 대한 전문가들의 견해를 알고리즘으로 취합하고, 취합 결과를 새로운 정량 지표로 제시하였다.
분석 결과 새롭게 제시한 텍스트 지표는 GDP, BSI 등 거시경제 지표를 예측하는 데 매우 유용한 것으로 나타났고, 산업별 변동요인 파악에도 효과적인 것으로 나타났다. 특히 텍스트 지표와 경기선행지수 순환변동치와의 Granger 인과관계를 분석해 보면, 코스피 컨센서스 전망치에는 나타나지 않는 경기선행지수로의 일방향적 인과관계가 텍스트 지표에는 존재하는 것으로 나타난다. 이러한 결과는 애널리스트들이 제시하는 텍스트 정보에 숫자가 전달하지 못하는 새로운 정보가 반영되고 있을 가능성을 시사한다.
본 연구에서 제시한 텍스트 분석 과정은 통계 알고리즘을 이용하여, 웹 스크래핑(web-scraping)을 통한 보고서의 입수부터, 업황 파악과 변동요인 분석, 그리고 분석 결과의 시각화까지 모두 알고리즘화가 가능하도록 설계되었다.
기술 발전에 따른 자동화와 효율성 제고가 가속화되고 있다. 자연어처리를 이용한 경제분석은 아직 연구 초기 단계이지만, GPT 모형 등 최근의 기술 발전 속도를 생각하면 빠른 시일 내에 스스로 정보를 취합하고 경제 판단을 내릴 수 있는 통계 모형의 실현이 가능할 것으로 판단된다. 따라서 본 연구에서 제시한 알고리즘 등 텍스트 분석 연구를 지속해 나갈 필요가 있으며, 경제 분야의 연구 효율이 개선될 수 있도록 AI 등의 통계 기법을 계속 발전시켜 나가야 할 것이다.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|