본 연구는 (주)에스이랩(연구책임자: 유재홍)이 2016년부터 2017년 3월까지 기상청과 한국기상산업진흥원의 지원으로 수행한 프로젝트입니다. 연구의 핵심 목적은 기상정보와 지역정보를 융합하여 소상공인들이 실질적으로 활용할 수 있는 날씨경영 서비스 기술을 개발하는 것이었습니다.
오히려 지금 더 의미있게 다가와 공유하고자 합니다.
제1장 연구개발과제의 개요
연구개발 목적은 소상공인들도 대기업처럼 날씨정보를 활용한 경영 전략을 수립할 수 있도록 지원하는 것입니다. 기상청의 기상자료개방포털과 기상·기후 빅데이터 플랫폼을 통해 공개되는 날씨정보는 전문성이 높아 소상공인이 직접 활용하기 어렵다는 문제가 있었습니다.[1]
연구의 필요성은 날씨경영이 대기업과 공기업 중심으로만 진행되고 있으며, 소상공인들은 이를 분석할 지식과 인력 확보에 어려움이 있다는 점에서 비롯되었습니다. 머신러닝과 시각화 기술을 활용하면 소상공인도 쉽게 날씨정보를 가공처리하고 경영전략에 활용할 수 있는 도구 개발이 가능하다고 판단했습니다.[1]
연구범위는 ①기상·기후 빅데이터 플랫폼 연계 날씨정보 활용 기술 개발, ②날씨정보와 지역정보를 결합한 소상공인 매출 연관성 분석을 위한 기계학습 모형 수립, ③대국민 날씨경영 지원을 위한 시각적 서비스 프로토타입 개발 등 3개 영역으로 구성되었습니다.[1]
제2장 국내외 기술 개발 현황
국내 기술으로는 기상청의 기상·기후 빅데이터 분석 플랫폼을 중심으로 기상정보 활용이 발전하고 있었으나, 소상공인을 위한 맞춤형 서비스는 부족했습니다. 최근 연구에서는 수산가공품 유통회사의 매출과 날씨의 유의미한 관계를 회귀분석으로 증명했으며, 제품에 따라 영향받는 날씨인자가 상이함을 밝혔습니다.[1]
해외 기술로는 미국의 WeatherPredict Consulting Inc.가 NOAA 기상정보를 바탕으로 자체 예보서비스와 함께 기상정보를 재가공하여 날씨 리스크 분석을 실시하는 사례가 있습니다. 이를 통해 다양한 산업에 대한 경제적 손실 최소화 상품을 서비스하고 있습니다.[1]
제3장 연구 수행 내용 및 성과
1. 기상·기후 빅데이터 플랫폼 연계 날씨정보 활용 기술 개발
자료 수집은 동네예보실황 자료, 실제 베이커리 매장의 2014-2015년 상품별 판매수량 및 매출액 정보, SK지오비전의 신용카드 승인정보를 포함합니다. 강남구 지역 제과·제빵 전문점 10만여 건 및 프랜차이즈 제과·제빵 전문점 3.7만여 건의 자료를 구축했습니다.[1]
데이터베이스 구축은 5개 테이블(지역정보, 판매정보, 동네예보 실황, 동네예보 예측, 분석결과)로 구성되며, 지역데이터를 기준으로 매출 데이터와 기상 데이터를 매칭했습니다. 동네예보 자료는 5km×5km 격자로 전국을 37,697개 격자로 분할하여 저장합니다.[1]
기상·기후 빅데이터 플랫폼 활용에서는 매출자료를 플랫폼에 업로드하고, 기상자료를 신청하여 R 환경에서 분석을 수행했습니다. 플랫폼에서 제공한 시간별 자료를 일별 자료로 변환하여 매출액 자료와 융합분석에 적합하게 처리했습니다.[1]
2. 날씨정보와 지역정보를 결합한 기계학습 모형 수립
업종별 날씨-매출 연관성을 분석한 결과, 제과·제빵 전문점은 금/토요일이 일/월요일보다 24.5% 높은 매출을 기록했습니다. 강수가 없는 날이 강수가 있는 날보다 12.8% 높은 매출을 보였으며, 강수량 5mm 이상인 날은 5mm 이하인 날보다 28.5% 낮은 매출을 기록했습니다. 평균습도 70% 이상인 날은 70% 이하인 날보다 47.4% 적은 매출을 보였습니다.[1]
제품별 분석에서 피자빵과 소시지빵은 비오는 날 12.2% 더 많이 판매되었으며, 기온에 민감하여 일평균 20도 이상인 날이 2배 이상 판매되었습니다. 조각케이크는 여름철 고온에서 매출이 증가하는 특이한 경향을 보였으며, 기온 28도 이상일 때 28도 이하일 때보다 9.9% 많은 판매량을 기록했습니다.[1]
기계학습 모형에서 Random Forest(RF)와 Support Vector Machine(SVM)을 적용했습니다. RF는 평균기온이 설명변수 중 가장 높은 중요도를 보였고, SVM 모형은 다중회귀법보다 우수한 예측력을 보였습니다. 비오는 날 피자빵·소시지빵 매출에서 SVM은 상관도 r=0.705를 기록했으며, 이는 다중회귀법의 r=0.614보다 상당히 높습니다.[1]
3. 대국민 날씨경영 지원을 위한 시각적 서비스 프로토타입 개발
시각화 구조는 웹 클라이언트 서비스로 d3.js 기반의 시각화 라이브러리(MAPISODE)를 활용합니다. 인포그래픽 디자인의 Annotated map 템플릿을 적용하여 지도를 중앙에 두고 관련 그래프를 연결하는 방식입니다.[1]
서비스 화면은 상단에 업종별·요일별 자료 추출 UI, 중앙에 지역별 매출액 지도, 우측 상단에 머신러닝 분석결과 주석 영역, 우측 하단에 매출액과 날씨 정보 그래프를 배치했습니다.[1]
시각적 분석 기능은 주제도 시각화 도구, 그래프 기반 시각화 도구, 인터랙티브 분석 기능을 제공합니다. 사용자가 지역을 클릭하면 해당 지점의 색상이 변하고 관련 정보가 표출되는 방식으로 동적 탐색을 지원합니다.[1]
제4장 목표 달성도 및 관련 분야 기여도
연구는 계획된 3대 과제를 모두 100% 달성했습니다. 특히 10만여 건의 실제 매출 데이터를 분석하고 다중회귀법보다 우수한 머신러닝 모델을 개발했다는 점에서 이론을 실제 소상공인 지원 도구로 발전시켰습니다.[1]
관련 분야 기여도로는 소상공인시장진흥공단의 '나들가게' 날씨경영 서비스에 개발된 머신러닝 모델을 적용 가능하며, 기상청의 기상·기후 빅데이터 플랫폼을 직접 활용하여 플랫폼 사용성을 검증했습니다.[1]
제5장 연구개발성과의 활용계획
기상청 플랫폼 활용도 향상을 위해 R 프로그래밍 진입 장벽을 낮추고, 프로그래밍이 아닌 쉬운 절차를 통한 자료 분석 환경을 제공합니다. 개발된 기상정보-지역정보 융합형 날씨경영 서비스 기술을 신규 콘텐츠로 탑재하여 플랫폼의 사용자층 확대와 다양한 수요 창출을 기대합니다.[1]
제6장 해외 과학기술 정보
머신러닝 관련으로 Random Forest의 mean decrease in accuracy 유형, CRAN 패키지 'randomForest', Support Vector Machine 관련 'e1071' 패키지를 참고했습니다.[1]
시각화 관련으로 Oracle Data Visualization Cloud Service, SAS Visual Analytics, Tableau 등 해외 visual analytics 서비스를 조사했습니다. 본 연구의 시각화 서비스는 DBMS 자료 취득·정제, 주제도 시각화, 그래프 시각화, 인터랙티브 분석 기능을 제공하여 해외 최신 동향을 따릅니다.[1]
제10~11장 연구실적 및 소스코드
연구 성과로 학술논문 1편 투고, 소프트웨어 3건 등록(기상-지역정보 융합분석 전처리 프로그램, 기계학습 기반 기상-매출 분석 프로그램, 날씨경영 지원 프로그램)을 창출했습니다.[1]
소스코드는 기상·기후 빅데이터 플랫폼 활용 코드(외부 기상자료 추출·가공), 기상-매출 분석 코드(Random Forest·SVM 기반 모델링), 시각화 라이브러리 코드(d3.js 기반 MAPISODE)를 제공합니다.[1]
본 연구는 날씨경영의 민주화라는 목표 아래 기상정보와 지역정보를 결합한 기계학습 기술로 소상공인의 매출을 예측하고, 직관적인 시각화를 통해 누구나 쉽게 날씨경영을 실천할 수 있는 기반을 마련했습니다.[1]
⁂
1. sosanggonginjiweoneulwihangisangjeongbojiyeogjeongboyunghabhyeongnalssigyeongyeongseobiseugisulg.pdf
https://scienceon.kisti.re.kr/srch/selectPORSrchReport.do?cn=TRKO201800022666
https://blog.naver.com/neoyounggod/224093330096
출처 : https://www.perplexity.ai/search/재구성