인공지능에 필요한 수학/통계학적 지식은 물론 ML의 두개의 큰 양대산맥인 CNN/RNN 중 CNN에 대한 대충(?)의 이해를 마친 후 나의 분야인 RNN/LSTM을 공부중이다. 이 분야는 과거의 데이터를 기억하고 또 새로운 데이터와 결합을 시켜서 다시 원하는 데이터만 저장을 하는 과정을 무한히 반복하기 때문에 메모리도 많이 필요하고, 계산시간도 오래 걸릴 것 같다.
그리고 샘플로 돌려 본 코드들은 주가 숫자를 단순히 학습시키고 새로운 숫자를 넣어서 주가를 예측하는 방식인데, 이건 사실 예측이 아니다.
삼성전자 주가가 가령 20만원에서 50만원일때의 주가를 학습시켰는데 이 주식이 갑자기 200만원이 되었다면 과연 학습된 숫자가 이 회사의 주가에 어떤 전망값을 가져다 줄까?
그리고 어느날의 종가인 55,500원과 55,400원이 얼마나 주가에 틀리게 영양을 미칠까? 다 부질없는 짓이다.
CNN에서 코에 점이 하나 있고, 두개가 있고 하는 것이 개나 고양이를 결정하는데 중요할 지 몰라도, RNN에서 어제와 오늘의 숫자의 근소한 차이가 주가예측에 영향을 미친다는 사실을 받아들이기 힘들다.
통계적인 해석으로도 많은 사례들이 Sigmoid 등 cost(error) 를 최소화하는 방법으로 MSE를 선택했는데, 이 방법 또한 이론적으로 가장 오늘 주가와 비슷할 것 같은 어제의 주가를 선택하게 만드는 결과를 가져다 준다. 따라서 많은 사람들이 자기의 전망자료가 실제주가와 거의 똑같다는 의미로 그린 그래프를 보면 마치 매일 정확한 전망을 하는 것 처럼 보이지만, 오늘의 종가부터 과거 500개의 주가 데이터와 어제의 종가부터 과거의 500주가 테이터를 그리면 마치 동일한 그래프인 것 처럼 보이는데, 이를 2주일 등 짧은 기간동안의 그래프를 그린다면 이것 마저도 시장 상황에 따라 들쑥 날쑥 할 것이다.
더우기 실제 주가가 아닌 가령 500개의 RANDOM NUMBER를 가지고 예측한 모델에서도 실제값과 예측값이 정확히 예측이 된 사례를 보았는데, random number의 정의가 예측이 않되는 임의의 숫자를 말하는데, 이것이 예측이 된다면 그 개발자는 노벨경제학상을 받아야 한다.
이처럼 RNN/LSTM을 공부중인 나에게 인공지능을 이용한 주가 예측은 무리다는 결론에 이르게 되었다. 그러나 이미지를 인식하고, 자율주행에서 신호등을 real time으로 인식하는 등 CNN에 대한 발견은 위대한 것이었다.
결국 알파고가 고수들의 바둑기술을 학습하고, 이 과정에서 지지않는 기술을 터득했듯이 인공지능을 이용한 주가전망도 전문가들의 know-how를 컴퓨터가 학습하는 과정이 반드시 필요하다. 단순히 주가를 넣고 인공지능이 인간이 인지할 수 없는 블랙박스형 로직으로 주가를 예측한다면, 이것은 인간이 애기나 원숭이에게 주가를 전망하는 방법을 전수하는 것과 같다. 따라서 인공지능을 이용한 주가전망에는 고수의 품격에 격이 맞는 기술들을 심어 주어야 한다.
이러한 전제하에 일차적으로 생각이 나는 것이 첫째, 기술적 분석 등 이미 검증된 고수의 알고리즘을 학습시키는 방법이다. 최근 읽은 학술 논문(이공계)에서 단순한 기술적 분석지표보다 인공지능으로 학습으로 보강된 기술적 지표가 더 수익율이 높다는 것을 증명했는데, 이것이 인공지능(GRU, LSTM, RNN 등)이 해야할 일을 잘 말해주고 있다.
둘째로 CNN이 개와 고양이를 인식하듯이, double-top, head and shoulder 등 주가에 영향을 미치는 중요한 패턴들을 학습시키고, 이 패턴이 보이면 현재의 주식시장의 환경에 맞도록 인공지능이 블랙박스를 통해 전망값을 조정하는 방식이다. 아직 이 분야의 논문을 찾질 못했는데, 내가 현재 학술논문을 무료로 다운받는 없는 상황이라 하루 날잡아서 국회도서관에서 자료를 검색할 예정이다.
세째 Idea는 인터넷등에서 상위의 주제어를 검색해서 (가령 남북통일 등), 그날의 주가와의 관계를 연구해서 남묵통일이 검색어 1위가 되면 경협주, 건설주, 철강주, 전력주, 가전주, 제약주 등이 오르더라는 식의 알고리즘을 개발해야 한다. 이 아이디어는 주가전망이라기 보다는 종목 선정에 필요한 알고리즘이다. 사실 이 분야가 Big-data를 이용한 종목선정 알고리즘을 개발하는 근거가 되어야 한다.
참 가야할 길이 먼데, 이공계 논문들은 사회과학을에 대한 이해가 부족하다보니 엉뚱한 전망아이디어만(당시에만 한시적으로 맞게 입력값들이 조절한...)을 내놓고 있고, 나같은 전문가는 인공지능에 대한 지식이 부족하고. 더우기 내가 놀고 있다 보니 거금을 투자해서 투자연구회사를 설립할 여력이 없고, 벤처들도 이공대출신들이 인공지능에 대한 확신으로 시작을 하고 있지만, 시장과 경제이론, 투자경험 등을 가지고 있는 나같은 전문가의 도움을 필요로 하지 않는다.
사실 나도 나의 노하우를 연봉을 받고 남들에게 헐값으로 팔 이유가 없다. 내가 호주에서 10년 체류를 하면서 약 20억을 지출했다.10억은 대학생 두딸과 본인의 학비였고, 나머지 10억은 체류비였다. 1년에 1억 생활비라 많아 보이지만, 한국에 있을 때도 나의 생활비는 1억이 넘었었고 여기에는 집세가 포함되질 않았었는데, 호주에서는 월세만 1년에 4천만원이 들었다. 한국으로 치면 마포정도의 동네의 40평 아파트에 살았는데. 일반적으로 해외유학에 연간 1억이 필요하다는 사실을 감안하면, 우리 4인 가족이 체류 당시 경험했던 역사적으로 최고수준의 환율과 물가가 폭등에도 불구하고 절약을 하면서 사용한 생활비다. 이것이 현재 20년 직장생활을 하면서 벌은 돈을 거의 탕진한(?) 스토리다. 만일 연봉1억을 준다면 단순비교로도 나는 20년을 일을 해야 본전이 된다. 그리고 내가 10년을 투자해서 공부를 하는 동안 포기한 연봉까지 따지면 나는 연봉을 가령 5억정도는 받아야 하는데, 이 돈을 나에게 줄 회사가 없다. 그래서 나는 독자적인 회사설립외에는 이 분야에 진출할 생각하고 있지 않다.
지금 비록 내가 후발주자지만, 나는 이미 내 머리에 수십억을 투자해서 가상으로 만든 1인 투자연구소를 운영하고 있다고 생각하고 있고, 선발주자들이 허겁지겁 만든 회사들 보다 더 빨리, 더 확고하게, 그리고 더 정확한 예측이 가능한 연구소/회사를 만들 것이다. 여러분들도 본싸이트를 통해 저와 같은 방향으로 계속 공부를 해 나간다면, 저와 같은 길을 걸어갈 기회가 있을 것이라는 희망을 주고 싶다.