카카오브레인은 미디어아트 그룹 슬릿스코프와 함께 시 쓰는 AI 모델 ‘SIA(이하 시아)’를 개발하고 오는 8일 시아의 첫 번째 시집 ‘시를 쓰는 이유’를 출간한다고 1일 밝혔다.
‘시아’는 카카오브레인의 초거대 AI 언어 모델 KoGPT를 기반으로 시를 쓰는 AI 모델로 1만 3000여 편의 시를 읽으며 작법을 익혔다. 주제어와 명령어를 입력하면 ‘시아’가 입력된 정보의 맥락을 이해하고 곧바로 시를 짓는다.
AI 기술을 활용한 다양한 문화 콘텐츠를 창작하고자 기획된 시집 ‘시를 쓰는 이유’는 총 53편의 시로 구성돼 있다. ‘시아’의 언어인 디지털 연산을 위한 기계어 0, 1를 활용해 1부의 주제는 공(0), 2부의 주제는 일(1)로 선정했다. ‘영’ 대신 ‘공’으로 표기한 것은 존재와 비존재, 의미와 무의미의 관계를 함께 담고자 하는 카카오브레인과 슬릿스코프의 의도가 담겨있다.
무의미, 비존재(off)의 뜻을 담고 있는 공(0)은 슬릿스코프가 그동안의 작업 노트에서 나온 임의의 표현들을 시상으로 제시하여 생성된 시가, 의미, 존재(on)의 뜻을 담고 있는 일(1)은 수학과 과학에 관한 주제를 시상으로 한 시가 수록됐다. 1부는 ‘개인의 주관적인 부분’을, 2부는 ‘객관적인 대상이나 사실’을 시상으로해 시를 생성한 것이다.
슬릿스코프는 연출가이자 미디어 아티스트인 김제민과 AI 연구자이자 소프트웨어 개발자인 김근형이 예술과 과학이라는 서로 다른 분야에서 활동해오다 2018년, AI와 예술가들이 즉흥적으로 텍스트를 만들어가는 퍼포먼스 ‘I Question’을 작업하면서 시작하게 된 미디어아트 그룹이다. 이번 프로젝트에서 슬릿스코프는 1만 3000여 편의 시를 수집해 카카오브레인의 KoGPT 모델에 추가 학습시켜 '시아'를 개발했다. 다양한 시제로 시를 생성해 다듬고 최종적으로 53편의 시를 선정하는 역할을 담당했다.
슬릿스코프는 오는 8월 12일부터 8월 14일까지 대학로예술극장 소극장에서 ‘시를 쓰는 이유’에 수록된 시들을 활용한 시극 공연을 진행할 예정이다.
한편 카카오브레인이 개발한 한국어 특화 초거대 AI 언어 모델 KoGPT는 60억개의 매개변수(파라미터)와 2000억 개 토큰(token)의 한국어 데이터를 바탕으로 구축됐으며 한국어를 사전적, 문맥적으로 이해한다. 작년 11월 KoGPT 모델을 오픈소스 커뮤니티 깃허브(GitHub)에 공개한 바 있다.
김일두 카카오브레인 대표는 “시집 출간을 통해 KoGPT의 무궁무진한 예술적 가능성을 확인할 수 있었다”며 “앞으로도 카카오브레인의 초거대 AI 모델이 활용될 수 있는 다양한 문화 및 예술 분야에서의 접점을 지속 탐색할 계획”이라고 밝혔다.
시집 ‘시를 쓰는 이유’는 오는 8일부터 전국 중대형 서점에서 만날 수 있다.