취향 다양성이라는 환상,
개인화의 함정

추천 시스템의
명암 바로보기
Edited by

미국의 영화감독 웨스 앤더슨(Wes Anderson)이 <해리포터>, <스타워즈>, <반지의 제왕>, <아바타> 시리즈를 만든다면? 미학 세계가 뚜렷한 그의 작품이 유달리 인공지능의 사랑(?)을 받고 있다. ‘AI 웨스 앤더슨’이 올봄부터 여름에 걸쳐 각종 영화 시리즈물을 그만의 스타일대로 선보이고 있는 것. 먼저 인스타 계정 파노라마채널(Panoramachannel)이 해리포터 이미지를 올린 시도가 있었다. 나아가 유튜브 채널 큐리어스 레퓨지(Curious Refuge)는 스타워즈 트레일러를 공개했다. 대칭이 도드라지는 미장센, 의도적으로 인위성을 부여하는 촬영방식, 동화적 색감 등 웨스 앤더슨이 찍는 인장은 모방하기 쉬운 명확함을 가지고 있기 때문일까.

큐리어스 레퓨지(Curious Refuge)가 공개한 웨스 앤더슨 스타일 스타워즈 트레일러

초반에는 유쾌한 공감을 불러왔지만 작업이 거듭될수록 반감의 목소리가 터져나왔다. 가디언지, 영화 비평 매체 콜라이더 등에서 인공지능은 웨스 앤더슨을 잘못 이해하고 있으며 패러디에 실패했다고 지적했다. 실제 AI 웨스 앤더슨은 외형적 모방을 할 뿐이었다. 스타일 너머에 있는 의도와 가치는 읽지 못한 것이다. 일종의 도식화였다. 일정한 형식이나 틀에 그야말로 ‘기계적으로’ 반응한 셈이다.

이 사례는 비단 인공지능이 한 영화 감독을 편협하게 바라본 문제에서만 그치지 않는다. 빅데이터, 인공지능과 떼려야 뗄 수 없는 환경에 놓인 우리에게 시사하는 바가 많다.


빅데이터와 인공지능,
그리고 추천시스템

이미지 출처: Unsplash

빅데이터, 인공지능, 머신러닝은 이미 귀에 익은 개념들이지만 유기적인 상관성과 활용 원리를 간단히 짚고 갈 필요는 있다. 다양한 형태로 생긴 데이터의 집합인 빅데이터는 인공지능을 가동하기 위한 원천이 되고 딥러닝 혹은 머신러닝과 같은 기술은 데이터를 의미 있게 한다. 그리고 인공지능은 학습하는 (자연)지능의 특성을 구현하도록 설계된 소프트웨어, 프로그램, 기계 모두를 일컫는다. 인공지능에 공급하는 땔감인 데이터와 그 해석 기술은 서로 상호작용한다고 볼 수 있다.

빅데이터와 인공지능이 친숙하게 활용되는 경우는 특정 대상자에게 맞춤형 결과를 추천해주는 ‘추천 시스템’일 터. 이 시스템은 추천 정확도를 높이기 위한 원리를 정교화하는 일이 무엇보다 중요한데, 가장 고전적이고도 핵심적인 원리는 ‘협업 필터링(Collaborative Filtering)’이다. 유사한 성향을 가진 사람들은 관심사가 유사하다는 가정에서 출발한다. 온라인 쇼핑몰에서 특정 상품을 구매하면 같은 선택을 한 소비자가 함께 구매한 상품들을 접할 수 있지 않던가. 협업 필터링은 사용자 기반과 아이템 기반으로 갈라지기도 하며 유사성을 따지는 대상이 사람인가 아이템인가에 따라 세분화된다.

물론 협업 필터링이 가진 한계를 극복하고자 고안된 방식도 있다. 콘텐츠 자체의 정보를 분석해 과거의 선택과 연관성 높은 것을 추천하는 ‘콘텐츠 기반 필터링(Contents-based Filtering)’이다. 협업 필터링과 콘텐츠 기반 필터링이 결합하면 하이브리드 추천 시스템이 되고, 나아가 머신러닝 추천 방식 등이 등장하기도 했다.


개인화 성공의 표상 넷플릭스

추천 시스템은 감당하기 어려운 정보 더미에서 ‘개인화’된 방향을 제시함으로써 일상에 파고들었다. 넷플릭스는 그 표본이다. 넷플릭스는 본래 온라인상에서 DVD를 대여하는 서비스로 출발해 2007년부터 스트리밍 서비스를 제공했다. 넷플릭스가 추천 시스템을 도입하며 서비스를 개인화한 초기 목적은 DVD 사업 시기에 목격했던 인기 혹은 신작 콘텐츠 쏠림 현상을 개선하는 것이었다. 주목받지 않았던 작품들도 관심을 가질만한 대상에게 정확히 노출시켜 수요를 조절하고 공급 콘텐츠를 효율적으로 관리하고자 했다. 그리하여 상상 이상의 데이터가 수집되고 개인화 전략은 나날이 고도화됐다. 축적되는 데이터는 고객 정보, 콘텐츠 관련 정보, 시청자 평가는 기본이고, 영화를 재생한 시간과 장소, 당시 사용한 디바이스, 스크롤 동작, 일시정지나 빨리감기 되감기 패턴 등에 이른다.

이미지 출처: 넷플릭스

넷플릭스는 개인화 작업을 위해 콘텐츠 태깅을 한다는 사실도 유명하다. 새로운 콘텐츠가 들어오면 콘텐츠 분석을 하는 내부 전문가들이 해당 콘텐츠를 일일이 감상하고 카테고리 태그를 생성한다. 의도와 분위기, 스토리라인, 작품 외적 배경 등 수많은 요소를 따져 최대한 상세하게 기술한다. 가령 초자연적인 콘텐츠 태그 혹은 로맨틱 콘텐츠 태그를 달고 하위에 마이크로장르까지 붙인다. 이로써 ‘시각적으로 뛰어난 해외 작가주의 영화’와 같은 설명이 가능해진다. 개인화는 궁극적으로 사용자가 선호할 가능성이 높은 콘텐츠를 추천할 뿐 아니라 홈페이지 화면 및 섬네일 아트워크까지 변주한다.

<하우스 오브 카드>, 이미지 출처: IMDb

한편 첫 오리지널 콘텐츠 제작은 빅데이터와 인공지능의 강력한 힘을 재입증하는 계기가 됐다. 콘텐츠 제작 전력이 없던 넷플릭스가 BBC에서 방영된 영국의 정치 스릴러 TV 미니 시리즈 <하우스 오브 카드>를 리메이크하는 데 있어 파일럿 과정도 없이 1억 달러 예산을 과감히 집행한 이유는 분명했다. 영국판 <하우스 오브 카드>를 시청한 취향 그룹은 배우 케빈 스페이시의 작품이나 데이비드 핀처 감독 작품을 즐긴다는 사실을 파악해 그대로 반영했다. 시리즈의 성공을 미리 예측하기도 했다. 넷플릭스의 방식은 업계에 큰 영향을 끼쳐 각본을 사전에 분석하고 흥행 가능성을 점친 결과에 따라 수정하는 일도 자연스러워졌다.


공고해지는 취향 울타리

이미지 출처: 파노라마채널 공식 인스타그램

개인화는 분명 편리하다. 하지만 함정이 존재한다. 데이터를 수집하는 주체는 다양한 취향을 세세하게 범주화하지만 한 개인의 입장에서는 안락한 울타리에 갇히고 만다. 칼럼니스트이자 온라인 정치시민단체 무브온의 활동가인 엘리 프레이저(Eli Pariser)는 ‘필터 버블’이라는 개념을 제기했다. 필터 버블은 정보 제공자가 이용자에게 맞춤형 정보를 제공함에 따라 선별된 정보만 받아들이게 되는 현상이다. 무한한 데이터를 학습하며 점점 치밀해지는 기술도 기본은 필터링을 전제로 한다. 우리에게 뜻밖에 노출되기도 했던 정보들이 걸러지기에, 좋아하는 대상은 더 좋아하고 외면하는 대상은 더 마주칠 일이 없어진다. 미디어에 의해 ‘취향의 확증 편향’을 경험한다.

웨스 앤더슨의 사례를 다시 떠올려본다. 인공지능이 감독의 작품을 이해하는 잣대를 솎아냄을 보여주는 동시에, 웨스 앤더슨의 자리에 개인의 취향으로 대치하면 취향 역시 단 몇 가지 특징으로 고착화됨을 암시한다. 감독의 경향은 언제든 변화할 수 있지만 AI 웨스 앤더슨은 변화의 여지를 닫아둔다. 마찬가지로 우리의 취향은 다양성을 좇을 수 있지만 개인화는 확장을 더디게 한다. 조금은 불편한 영역을 우연히 마주할 때 충돌을 겪고 타협점을 찾으며 새로운 취향을 발견하기에 게을러진다.


편견이 녹아든 데이터 오류

이미지 출처: Unsplash

개인화의 역설을 이야기할 때 인공지능의 연료가 되는 빅데이터 자체를 뜯어볼 필요도 있다. 데이터가 이미 사회적 편견을 안고 있다면, 과거의 것과 최신의 것을 견주는 양이 비대칭적이라면, 결과를 적극적으로 의심해야 한다. 내재적 편향성이 형성하는 추천 시스템은 위험하다.

서울과학기술대학교 IT정책대학원 이광석 교수의 말을 빌리자면, “인공지능 세계관 안에서는 젠더 편향이나 인종, 약자 혐오 등이 사회적인 논쟁이나 주장 없이 수면 아래 가라앉거나 전산학적으로 소독된 형태의 뻔한 모범 답안으로 해결될 공산이 크다.” 2018년 아마존은 AI 채용 프로그램을 통해 채용을 자동화하고자 테스트했으나 한계를 인지하고 폐기했다. 개발 직군 직원이 많은 아마존에는 직군 특성상 남성 비율이 절대적으로 높았는데, 해당 구성원들의 성과를 토대로 학습한 시스템은 여성들을 배제하고 남성들을 적극 추천했다. 기존의 구조가 답습된 것이다. 현재를 가늠한 후 ‘성찰을 거친’ 미래 예측을 기대하기는 어려웠다.


빅데이터와 인공지능의 잠재성은 전적으로 의존할 수 있거나 단호히 배척하도록 그려지곤 한다. 평가가 ‘모 아니면 도’에 가깝다. 그러나 빅데이터와 인공지능에 모든 것을 맡기는 기술 기업으로 주목하느라 잊은 넷플릭스 추천 시스템 최적화의 진실 하나. AI의 변별력을 다듬기 위해 사람의 자연지능 적용을 반드시 병행한다는 점이다. 인간 전문가와 인공지능의 적절한 협업이 최상의 결과를 낳는다고 믿는다. 협업의 실천은 자율적인 수용자의 시선으로도 가능하다. 종종 자기 취향을 해석하는 주도권에 대해 생각해보면 어떨까. 울타리 밖, 취향 간 횡단도 좋겠다.

  • The Guardian, Please stop using AI to make Wes Anderson parodies (2023. 5. 11)
  • 이호수, 『넷플릭스 인사이트』, 21세기북스, 2020
  • 이광석, 생태정치학, 기술 독성을 재사유하는 법, 문화과학사, 2022
  • 경향신문, 아마존에서 채용을 AI에 맡겼더니···“여성을 추천하지 않았다” (2022.12.09.)
  • 이코노미조선, 넷플릭스 콘텐츠 추천의 비결 ‘태거(Tagger)’ (2019. 5. 12)

한나

한나

가장 보편적인 일상의 단면에서 철학하기를 좋아합니다.

에디터의 아티클 더 보기


– 위 콘텐츠는 저작권법에 의해 보호받는 저작물로 ANTIEGG에 저작권이 있습니다.
– 위 콘텐츠의 사전 동의 없는 2차 가공 및 영리적인 이용을 금합니다.