우리는 이제 몇 번의 검색이면 딥페이크로 만든 음악을 접할 수 있다. 인공지능으로 가수의 목소리를 학습해 그가 전에 부른 적 없는 새로운 곡을 부르도록 할 수 있는 것이다. 그런데, 딥페이크로 만든 음악 역시 창작물로 인정할 수 있을까? 이러한 상황에서 목소리의 권리는 어떻게 지켜져야 할까? 음악가 홀리 헌든(Holly Herndon)은 이러한 질문에 적극적인 해답을 내놓는다. 그의 프로젝트 홀리 플러스(holly+)를 통해 목소리의 권리는 누구에게 있고 이를 어떻게 활용할 수 있을지 상상력을 펼쳐 보도록 하자.
샘플링은 모방인가 창작인가
힙합 음악을 듣다 보면 ‘샘플링’이라는 말을 쉽게 접할 수 있다. 샘플링은 ‘기존의 음악 일부분을 빌려와 자기 음악의 재료로 삼는 행위’를 뜻한다. 힙합은 샘플링 작법을 고유의 근간으로 삼는 장르다. 악기를 배울 형편이 안 됐던 미국 흑인들이 궁여지책으로 레코드플레이어를 음악 창작에 활용하면서 샘플링의 역사는 시작됐다. 레코드의 특정 부분을 반복해 틀며 그 위에 랩을 얹은 것이다.
단순히 기존 음악을 반복 재생하는 것에 불과했던 초장기 샘플링은 시대를 거듭하며 창작의 영역으로 발을 넓힌다. 원곡의 형태를 알아볼 수 없을 정도로 독창적으로 재창조하는 경우가 많아졌고, 이후 힙합을 넘어 현대음악 창작 전반에서 샘플링은 광범위하게 사용된다. 그런데 기존의 음악을 활용한다는 점에서 샘플링은 저작권 문제와 필연적으로 만나게 된다. 샘플링으로 인한 저작권자와 사용자 간의 법적 분쟁이 흔히 일어나며, 그 판례 역시 손쉽게 찾아볼 수 있다.
2010년 6월, ‘노란 셔츠의 사나이’의 작곡가 5명은 SKT의 CF송 ‘되고송’이 자신들의 노래를 일부 사용했다고 주장하면서 통신사를 상대로 저작권 침해 소송을 제기하였다. 그러나 재판부는 이를 저작권 침해로 인정하지 않았고 SKT의 손을 들어주었다. 판례는 샘플링된 부분의 길이, 사용된 악기, 독창성 등을 하나하나 짚어가며 이 소송에 대한 판단 근거를 설명한다. 필자는 판사가 저작권 침해를 인정하지 않게 된 경위보다도, 판례의 한구석에 적힌 다음 문장이 인상 깊었다. “일부 음의 배열을 저작권법에서 보호되는 저작물로 쉽게 인정된다면 저작물의 공정한 이용을 도모해 문화 및 관련 산업의 발달에 이바지한다는 저작권법의 목적에 반할 수 있다.”
이 문장은 저작권법이 문화의 발전을 위해 존재하며, 과도한 규제보단 예술가의 창작의 자유를 우선시하는 방식으로 문화의 발전을 도모하겠다는 뜻으로 읽힌다. 물론 하나의 판례를 가지고 저작권법이 샘플링에 있어 얼마나 관대한지 판단하는 건 위험하다. 저작권 침해 여부를 판단하는 덴 수십 가지의 판단기준이 뒤따를 것이기 때문이다. 다만 확실한 것은 저작권법이 예술 내의 모든 모방 행위를 감시하고 처벌하기 위해 존재하는 게 아니라는 점이다.
샘플링으로 곡을 만들던 힙합의 역사 위로, 인공지능을 통해 타인의 목소리로 곡을 만드는 딥페이크의 시대가 도래한다. 샘플링은 저작권의 침해인지 묻는 질문을 넘어, 우리는 새로운 질문을 마주한다. 타인의 목소리를 사용하는 건 샘플링과 마찬가지로 창작 활동의 일부로 인정해주어야 하는가? 인공지능을 활용한 딥페이크 음악이 창작활동의 새로운 표준이 된다면 우리는 어떤 판단을 내려야 할까? 목소리의 주인 될 권리보다 예술가의 창작의 자유를 우선시할 수 있을까? 목소리의 주권은 누구에게 있는가? 이러한 질문들에 음악가 홀리 헌든은 적극적으로 대안을 제시한다. 우선 헌든의 예술세계를 간략하게 살펴보고 그가 딥페이크 기술에 발맞춰 어떠한 새로운 시도를 하고 있는지 살펴보자.
인공지능과 협업하기
홀리 헌든은 인공지능을 작곡에 활용해온 아티스트 겸 작곡가이다. 10대 시절 베를린에서 지내며 테크노와 전자음악의 세계에 매료된 그는 이후 미국에서 음악을 공부했고 스탠포드의 음악 및 음향 컴퓨터 연구 센터에서 박사 학위를 마친다. 그는 음악이라는 매체를 통해 전자음악과 머신러닝, 인간과 기계의 상호작용에 관련된 자신의 호기심을 자유롭게 전개한다.
그는 스펀(Spawn)이라는 이름의 아기 인공지능을 만들었다. 헌든 자신을 포함한 14명의 합주단 멤버들은 인공지능에게 매일 노래를 불러주거나 말을 건넸다. 스펀은 세상에 갓 발을 디딘 갓난아기처럼 멤버들의 목소리를 학습해 나갔다. 신경망 학습을 통해 스펀은 점점 자신만의 소리를 만들어내기 시작했고 2년째엔 완전한 합주단 멤버로서 앨범 제작에 참여할 수 있었다. 말 그대로, 인간과 인공지능의 ‘협업’이다.
헌든은 인공지능이라는 훌륭한 도구를 단순히 기존 예술을 흉내 내는 데 사용하는 것에 반대한다. 인공지능에게 바흐의 음악을 학습시킨 뒤, 바흐 스타일의 새로운 곡을 만들게 하는 건 이미 만들어진 세계에 대한 끊임없는 동어 반복인 셈이다. 거기엔 어떠한 창조도 없으며, 이러한 방식으로 만들어진 결과물을 예술이라고 부를 수 없다.
헌든 자신은 기존의 음악을 재현하지 않기 위해 스펀에게 현존하는 음악들을 들려주는 게 아닌, 합주단을 꾸려 직접 노래를 불러주고 책을 읽어주는 방식으로 인공지능을 훈련시켰다. 그러나 현실에선 수많은 예술가의 작품이 인공지능의 학습을 위해 무단으로 활용되고 있다. 타인의 목소리를 학습해 따라하는 딥페이크 음악이 난무한다. ‘인공지능과 예술’ 분야의 최전선에 있는 사람으로서 헌든 역시 작금의 상황에 대한 문제의식을 느껴왔을 것이다. 그리고 이에 대한 대답인 듯, 그는 새 프로젝트 홀리 플러스(holly+)를 공개한다.
목소리를 판매하다
헌든은 네버 비포 허드 사운즈(Never Before Heard Sounds)와 협력하여 홀리 플러스라는 이름의 새로운 음성 악기를 만든다. 이 음성 악기는 머신러닝 기술을 사용하여 만들어진 것으로, 사용자가 오디오를 입력하면 인공지능이 오디오를 헌든의 노래하는 목소리로 변환해준다. 이는 딥페이크 음악과 같은 원리이다. 그러나 여기엔 중요한 차이점이 있다. 헌든의 목소리 사용권은 완전히 오픈되었다는 것이다. 헌든은 이 프로젝트를 대중에 공개하며 자신의 음성 모델을 오픈소스화한다. 이제 누구나 ‘합법적으로’ 헌든의 목소리로 음악과 미디어를 생산할 수 있게 되었다. 그는 왜 이 프로젝트를 기획했을까? 홈페이지에 적힌 그의 설명에서 힌트를 얻을 수 있었다.
헌든은 딥마인드의 웨이브넷, 구글의 타코트론 등 음성 딥페이크 프로그램의 발달로 타인의 목소리를 가져다 쓰는 것이 너무도 쉬워졌으며, 이것이 곧 음악 창작의 표준 관행이 될 것이라고 예감한다. 딥페이크 기술로 곡을 만들고자 하는 사람들은 점점 많아질 것이고 목소리가 무단으로 학습되고, 활용되는 일 또한 비일비재해질 것이다. 이러한 현실 속에서 헌든은 오히려 ‘목소리에 대한 수요’를 발견한다. 딥페이크의 발달이라는 현실을 피할 수 없다면, 목소리를 적법한 절차를 통해 판매하는 것이야말로 건강한 창작 생태계를 만드는 데 일조하는 게 아닐까?
헌든의 제안에 따르면 공인(가수, 연예인 등)은 음성 모델에 대한 오픈 소스를 제공함으로써 두 가지 이점을 얻을 수 있다. 그의 목소리를 활용해 만들어진 모든 작품 역시 오픈 소스가 되고, 자신의 목소리가 무단으로 상업적으로 이용되는 것을 막을 수 있다. 유튜브를 떠올리면 이해가 쉬울 것이다. 유튜브에 저작권이 있는 음악이 포함된 영상을 업로드하면 그로 인한 수익이 음악의 저작권자에게 돌아간다. 이와 같은 방식으로, 누군가 헌든의 목소리를 사용해 음악을 만들었다면 그 음악으로 발생한 수익의 일부가 헌든에게 돌아간다. 헌든의 이 대담한 프로젝트는 딥페이크의 발달을 두려워하고 피하는 게 아니라 수용하고 공존하는 방법을 모색한다는 점에서 큰 의의가 있다.
공유되지 않으면 사라진다
2020년 9월 지브리는 공식 홈페이지를 통해 <센과 치히로의 행방불명>을 포함한 애니메이션 8개 작품, 총 400장의 이미지를 무료로 다운로드받을 수 있게 하였다. 지브리는 이미지를 제공하며 상식적인 선에서 자유롭게 사용하도록 하였다. 스튜디오 지브리의 프로듀서인 스즈키 토시오는 도쿄FM 라디오에서 저작권에 대해 “모두가 사용하기 쉬운 환경을 만드는 것이 목표다. 그렇지 않으면 사라지는 것이고, 그게 무서운 일이다.”라고 말했다.
예술 소비는 무조건적 수용에서 능동적 활용으로 그 형태가 바뀌었다. SNS를 통해 소비자는 예술을 자르고 뒤집고 붙이고 포스팅한다. 그리고 이런 현상은 음악뿐만 아니라 미술, 영화 등 분야를 막론하고 벌어진다. 이런 시대에서, 예술은 더 적극적으로 ‘재료’가 돼야 한다. 콘텐츠의 재료로써 활용되며 끊임없이 재생산될 때 예술의 수명은 늘어난다. 잊힌 예술은 죽은 것과 다름없다. 지브리의 저작권 오픈 또한 이러한 맥락에서 발생한 이벤트일 것이다. 이제 저작권은 배타적으로 운용되기보다 공유와 재생산을 포용하고 장려하는 방식으로 나아가야 하는 게 아닐까?
기술의 발달은 뒤로 감을 수 없다. 우리는 어떻게든 딥페이크 기술의 발달 속에서 예술의 갈 길을 모색하고 예술에 새로운 의미를 부여해야 한다. 자신의 목소리를 기꺼이 재료화하고 사람들이 자신의 목소리로 노래할 수 있게 하는 것. 헌든의 홀리 플러스 프로젝트는 딥페이크 시대 예술가의 능동적인 생존방식이자 ‘지극히 현실적인’ 제안이다.
- 박혜섭, “오픈 AI 딥페이크가 만든 음악… 가짜인가, 창작인가” Ai타임스, 2020.11.17.
- 김봉현, “샘플링, 표절과는 달라… 국내 힙합 뮤지션도 법적 기준 만들어야” 중앙일보, 2014.1.23.
- 박경신, “음악 샘플링과 저작권 – 미국과 독일의 최근 사례를 중심으로” 한국저작권위원회, 2016.12.8.
- Stuart Stubbs, “Holly Herdon – AI is not going to kill us; it might make us more human” LOUD AND QUIET, 2019.4.30.
- Emily McDermott, “Holly Herdon on Her AI Baby, Reanimating Tupac, and Extracting Voices” Artnews, 2020.1.7.
- 남선우, “지브리, 명작 사진 700장 무료 제공…누리꾼들 환호”, 한국경제TV, 2020.10.22.