카카오브레인 AI모델 시아, 첫 시집 '시를 쓰는 이유' 출간
1만3천여 편 시 읽으며 작법 익혀...8일부터 중대형 서점서 판매
카카오브레인(대표 김일두)이 미디어아트 그룹 슬릿스코프와 함께 시 쓰는 인공지능(AI) 모델 'SIA'(이하 시아)를 개발, 이달 8일 시아의 첫 번째 시집 ‘시를 쓰는 이유’를 출간한다.
시아는 카카오브레인의 초거대 AI 언어 모델 KoGPT를 기반으로 시를 쓰는 AI 모델로, 1만3천여 편의 시를 읽으며 작법을 익혔다. 주제어와 명령어를 입력하면 ‘시아’가 입력된 정보의 맥락을 이해하고 곧바로 시를 짓는다.
AI 기술을 활용한 다양한 문화 콘텐츠를 창작하고자 기획된 시집 ‘시를 쓰는 이유’는 총 53편의 시로 구성돼 있다. 시아의 언어인 디지털 연산을 위한 기계어 0, 1를 활용해 1부의 주제는 공(0), 2부의 주제는 일(1)로 선정했다. ‘영’ 대신 ‘공’으로 표기한 것은 존재와 비존재, 의미와 무의미의 관계를 함께 담고자 하는 카카오브레인과 슬릿스코프의 의도가 담겨있다.
카카오브레인-슬릿스코프 시집 '시를 쓰는 이유'
무의미·비존재(off)의 뜻을 담고 있는 공(0)은 슬릿스코프가 그동안의 작업 노트에서 나온 임의의 표현들을 시상으로 제시해 생성된 시가, 의미·존재(on)의 뜻을 담고 있는 일(1)은 수학과 과학에 관한 주제를 시상으로 한 시가 수록됐다. 즉, 1부는 ‘개인의 주관적인 부분’을, 2부는 ‘객관적인 대상이나 사실’을 시상으로 하여 시를 생성한 것이다.
슬릿스코프는 연출가·미디어 아티스트인 김제민과 AI 연구자·소프트웨어 개발자인 김근형이 예술과 과학이라는 서로 다른 분야에서 활동해오다 2018년, AI와 예술가들이 즉흥적으로 텍스트를 만들어가는 퍼포먼스 ‘I Question’을 작업하면서 시작하게 된 미디어아트 그룹이다. 이번 프로젝트에서 슬릿스코프는 1만3천여 편 시를 수집해 카카오브레인의 KoGPT 모델에 추가 학습시켜 시아를 개발했으며, 다양한 시제로 시를 생성해 다듬고 최종적으로 53편의 시를 선정하는 역할을 담당했다.
슬릿스코프는 이달 12일부터 14일까지 대학로예술극장 소극장에서 ‘시를 쓰는 이유’에 수록된 시들을 활용한 시극 공연을 진행할 예정이다.
한편, 카카오브레인이 개발한 한국어 특화 초거대 AI 언어 모델 KoGPT는 60억개 매개변수(파라미터)와 2천억 개 토큰(token)의 한국어 데이터를 바탕으로 구축됐다. 한국어를 사전적, 문맥적으로 이해한다. 작년 11월 KoGPT 모델을 오픈소스 커뮤니티 깃허브(GitHub)에 공개한 바 있다.