gingado: 경제 및 금융에 초점을 맞춘 기계 학습 라이브러리
BIS 작업 보고서 | 1122번 |
2023년 9월 8일
더글러스 키아렐리 고도이 드 아라우조(Douglas Kiarelly Godoy de Araujo )
PDF 전문
(260kb)
| 30페이지
요약집중하다
기계 학습(ML)은 경제 연구 및 실습에 엄청난 잠재적 이점을 제공하지만, 시행착오를 통해서만 다양한 알고리즘과 모델 매개변수 중에서 최선의 선택을 알 수 있습니다. 시계열 연구의 경우 모델 개선을 위해 추가할 수 있는 경제 계열을 대규모로 테스트하는 것은 현재 원활한 프로세스가 아닙니다. 단면 인과 연구를 연구하는 경제학자는 어떤 ML 모델이 복잡한 비선형 인과 관계를 식별하는지 테스트하기 위해 대규모 인과 데이터 세트를 시뮬레이션하는 기능을 통해 이점을 얻을 수 있습니다. 또 다른 과제는 ML이 적용되는 다른 영역과 달리 경제학자들이 일반적으로 모델을 문서화하거나 더 넓은 의미를 고려하도록 권장되지 않는다는 것입니다. 이는 민간 및 공공 부문의 다양한 사용자가 ML을 사용할 때 중요한 점입니다.
기부금
나는 5가지 주요 기여를 포함하는 사용하기 쉬운 오픈 소스 ML 라이브러리인 gingado에 대해 설명합니다. 첫째, 사용자가 여러 공식 통계 소스로부터 수백 개의 시계열을 자동으로 얻을 수 있도록 도와줍니다. 둘째, 다양한 경우에 잘 작동하지만 사용자가 쉽게 맞춤 설정할 수 있는 Random Forest를 기반으로 한 자동 벤치마크 모델을 제공합니다. 셋째, Gingado를 사용하면 사용자는 데이터 생성 프로세스에서 선형 및 비선형 인과 관계를 통해 대규모 및 다차원 패널 데이터를 유연하게 시뮬레이션할 수 있습니다. 넷째, 해당되는 경우 모델 사용에 대한 윤리적 고려 사항을 포함하여 ML 모범 사례를 기반으로 모델 문서화를 용이하게 합니다. 다섯째, 시계열 데이터 분석을 위한 보조 유틸리티를 제공합니다.
결과
더 많은 경제학자가 ML의 실제 적용을 탐구함에 따라 기존 범용 라이브러리를 기반으로 구축된 전문 도구 세트의 이점을 누릴 수 있습니다. gingado는 독립적으로 또는 함께 작동하여 다양한 경제적 사용 사례에 도움이 될 수 있는 도구 세트를 제공하여 그 공간을 채우는 것을 목표로 합니다. 이 라이브러리는 널리 사용되는 ML 소프트웨어와 호환되며 사용자는 기성품으로 사용하거나 도구를 맞춤 설정할 수 있습니다. gingado는 활발하게 개발 중이므로 새로운 기능이 기대됩니다.
추상적인
gingado는 경제 연구에서 기계 학습의 사용을 지원하기 위해 다양한 편의 기능과 개체를 제공하는 오픈 소스 Python 라이브러리입니다. 널리 사용되는 기계 학습 라이브러리와 호환되도록 설계되었습니다. gingado는 SDMX 데이터 및 메타데이터 공유 프로토콜을 활용하여 공식 소스에서 직접 얻은 관련 데이터로 사용자 데이터 세트를 쉽게 확장합니다. 또한 라이브러리는 기본적으로 합리적으로 좋은 성능을 갖춘 랜덤 포레스트를 생성하고 후보 모델이 제공되는 경우 최고의 성능을 가진 모델을 유지하는 벤치마킹 개체를 제공합니다. gingado에는 윤리적 고려 사항을 포함하여 기계 학습 모델 문서화에 도움이 되는 방법도 포함되어 있습니다. 또한 gingado는 다양한 비선형 인과 치료 효과를 갖춘 패널 데이터세트의 유연한 시뮬레이션을 제공합니다. 인과 모델 프로토타이핑 및 벤치마킹을 지원합니다. 라이브러리는 활발하게 개발 중이며 정기적으로 새로운 기능이 추가되거나 개선됩니다.
JEL 분류: C87, C14, C82
키워드: 기계 학습, 오픈 소스, 데이터 액세스, 문서화
저자 소개
더글러스 키아렐리 고도이 드 아라우조
이 작가의 작품 더보기