2024년 2월 오픈AI가 출시한 텍스트 기반 영상 생성 모델(text-to-video model) ‘소라(Sora)’는 챗GPT 출시 당시와 맞먹을 정도로 뜨거운 반응을 일으켰다. 소라는 단순히 고품질 비디오를 생산해주는 제품 정도가 아니라 물리적 세계를 이해하고 현실을 시뮬레이션할 수 있는 AI의 출현을 상징한다. 이는 범용인공지능(AGI)의 실현을 향한 하나의 이정표이자 발판이기도 하다. 이런 AI 기술 퀀텀점프의 초입에서 인간 아티스트의 존재 의의를 증명하려면 인간과 AI의 차이를 계속해서 고민해야 한다. AI는 창작 행위를 단순화하고 ‘창의성의 표준화’를 시도한다는 점에서 인간과 예술을 접근하는 방식이 근본적으로 다르다. 이런 차이에 주목하고 작가 정신의 훼손을 막으려면 작가들 스스로도 주체성을 잃지 않고 각자의 내러티브가 응축된 이야기들을 표현해야 하며 AI의 저작권 세탁 시도에도 경각심을 가지고 행동해야 한다.
“게임이 시작됐다(game on).”
비디오 생성형 인공지능(AI) 분야의 대표 주자인 미국 스타트업 런웨이(Runway)의 CEO 크리스토발 발렌주엘라가 멀티 모달11텍스트, 이미지, 음성 등 여러 종류의 데이터를 동시에 처리할 수 있는 AI 기술
닫기 AI 모델 ‘소라(Sora)’ 출시 직후 X(옛 트위터)에 남긴 말이다. 2018년 미국 뉴욕대 인터랙티브 텔레커뮤니케이션 프로그램 졸업생들이 공동 창업한 런웨이는 지난해 구글·엔비디아·세일즈포스 등으로부터 1억4100만 달러(약 1883억 원) 규모의 투자를 받고 AI 동영상 서비스를 고도화하는 중이다. 지난 2월 15일(현지 시간) 챗GPT 개발사 오픈AI가 출시한 텍스트 기반 영상 생성 모델(text-to-video model) 소라는 비디오 생성형 AI 경쟁이 본격화된 2024년 단연코 런웨이가 예의주시해야 할 대상이다. 소라라는 이름은 ‘무한한 창의성’을 연상케 하고자 하늘(空)을 뜻하는 일본어에서 따왔다.
소라는 명령어 프롬프트를 입력하면 최대 1920×1080픽셀의 해상도로 1분 정도 길이의 고품질 영상을 뚝딱 만들어 내며 충격과 경탄, 우려와 기대를 동시에 자아냈다. 시장의 반응은 마치 챗GPT가 처음 출시됐을 당시를 연상케 할 정도로 뜨거웠다. 이처럼 AI로 동영상을 생성하려면 많은 데이터를 처리하기 위한 고성능 그래픽처리장치(GPU)와 고대역폭메모리(HBM) 같은 메모리 반도체가 필요하다. 최근 AI 반도체 생산을 위해 7조 달러(약 9300조 원) 규모의 투자 유치에 나선 오픈AI의 행보에 대해서 여러 논란이 잇따르고 있지만 적어도 이 회사가 사람들의 마음을 사로잡는 서비스가 무엇인지는 기민하게 파악하고 있는 듯하다.
필자는 서울대에서 미학을 전공하고 KAIST 문술미래전략대학원에서 과학저널리즘 석사 학위를 받았다. 15년간 예술 관련 강의 및 진행 활동을 해왔으며 미래 교육 및 문화예술 콘텐츠 스타트업에서 근무했고, 경제방송에서 ‘김민지의 Art & Tech’ 앵커로 활동한 바 있다. 저서로는 『NFT Art 그 무엇으로도 대체 불가능한 예술(2022, 아트북프레스)』이 있다.