티스토리 뷰




넷플릭스라는 한 기업이 영상물의 소비방식 자체를 바꾸어놓고 있다. 영상물이 지난 100여년간 축적해온 노하우가 송두리째 뒤바뀌는 광경을 우리는 목격하고 있다. 장르 구분, 캐스팅, 최적 스크린, 본방사수, 홀드백 무용화 등 넷플릭스 이전과 이후의 영상소비 트렌드는 확연히 다르다. 그 이면에는 빅데이터를 경영에 적극 활용한 넷플릭스의 차별화 전략이 숨어 있다. 1997년 리드 헤이스팅스(Wilmot Reed Hastings Jr.)가 넷플릭스를 창업했을 때만 해도 이 작은 스타트업이 10여년 후 영상소비 문화까지 바꾸게 될 것이라고 생각한 사람이 있었을까? 시작은 인터넷을 통해 우편으로 DVD를 대여하는 사업이었으나 2009년 온라인 스트리밍 서비스에 본격적으로 뛰어든 이래 넷플릭스는 기존 전통산업의 거인인 블록버스터 비디오 체인, 케이블업계에 이어 대형 배급사마저 위협하는 게임체인저로 급성장했다. 뜨는 영화는 대개 3부작이라고 했던가, 필자는 3부작으로 넷플릭스의 빅데이터 활용이 어떻게 영상소비 트렌드를 바꾸어놓았는지 살펴보고자 한다.



(1) 영화를 정의하는 76897개의 방법


넷플릭스는 아직 한국에 진출하지 않았기에 체험해볼 기회가 없었지만 미국에서 사용하는 사람들의 이야기를 들어보면 그들이 공통적으로 하는 말이 있다. 한 달에 7.99 달러만 내면 원하는 콘텐츠를 무제한으로 시청할 수 있는데 추천 기능이 막강해서 끊임없이 취향에 맞는 드라마나 영화를 보게 된다는 것이다. 예전엔 TV에서 유명한 드라마가 방영되는 시간이면 SNS 타임라인에 공통의 화제가 넘쳤는데 넷플릭스의 스트리밍 서비스가 보편화된 이후에는 사람들이 더이상 본방사수를 하지 않기 때문에 SNS에도 공통의 화제가 올라오지 않는다. 그대신 어떤 콘텐츠가 재미있었는지 자신의 경험을 SNS를 통해 공유하려는 글이 늘었다.


넷플릭스가 영화를 추천하는 시스템의 바탕에는 사람과 사람과의 관계성에 기초한 협업적 필터링(collaborative filtering)인 ‘시네매치 알고리즘’과 특정 상품을 중심으로 관계를 재구성한 내용기반 필터링(content based filtering)인 ‘넷플릭스 양자이론’이 있다. 우선 전자는 전세계 가입자 4400만명의 시청이력 데이터를 분석해 회원이 좋아할 만한 콘텐츠를 추천해주는 알고리즘으로 수학, 컴퓨터공학, 인공지능, 엔지니어링 기술을 기반으로 가입자의 클릭패턴, 검색어, 시청목록, 평점, 위치정보, 기기 정보, 플레이버튼 클릭 수, 평일과 주말에 따른 선호프로그램, 소셜 미디어 내에서 언급된 횟수 등을 분석해 취향을 알아낸 뒤 이를 분석한다.


빅데이터의 가장 큰 효용은 상관성 분석을 통해 유의미한 인과관계를 밝혀내는 것이다. 넷플릭스는 가입자의 프로필에는 전혀 관심이 없다. 다만 그가 어떤 영화를 봤고, 몇 개의 별점을 줬으며, 같은 영화를 본 사람들이 영화를 어떻게 평가했는지에 관심이 있다. 가입자가 어떤 영화를 보고 평점을 매기면 상관관계가 높은 평점을 준 사람들을 찾아 비교한다. 그들이 좋아하는 영화를 그가 좋아할 가능성이 높고, 그 역시 그들이 좋아하는 영화를 좋아할 가능성이 높기 때문이다. 이런 분석을 통해 그가 좋아할 만한 영화 중 보지 않은 영화를 추천해 주게 된다.


장르를 대체한 맞춤태그


그러나 이와 같은 행태 분석을 통한 개인화 추천 시스템만으로는 넷플릭스의 막강한 추천 기능을 제대로 설명할 수 없다. 이런 추천 시스템은 다른 곳에서도 많이 시도하고 있는 방식이기 때문이다. 넷플릭스는 추천기능을 강화하고 가입자들의 영상소비 트렌드를 파악하기 위해 행태분석을 넘어 콘텐츠 분해에 나섰다. 구글이 전세계 도서관의 모든 책을 스캔해 무식한 방식으로 빅데이터를 쌓으려고 했던 것처럼 넷플릭스도 보유한 수만 개의 영상 콘텐츠를 일일이 분석해 빅데이터를 만들어낸 것이다. 세상은 가끔 이렇게 무식한 방식을 고안해 실행하는 자들이 바꾼다.


넷플릭스는 대략 3만 여개의 영상 콘텐츠를 보유하고 있다. 그러나 그들은 콘텐츠를 기존의 멜로드라마, SF, 스릴러, 호러 등의 장르로 구분하는 대신 영상 콘텐츠를 분해해 내용별 맞춤태그를 달아 분류한다.


The Atlantic의 알렉시스 마드리갈 기자가 쓴 '넷플릭스는 어떻게 할리우드 영화를 분해하는가' 기사에 따르면, 넷플릭스는 영화 장르를 아주 세분화해 무려 76,897개로 분류해 놓았다고 한다. 기자는 이를 분석해 넷플릭스의 장르구분 방정식을 만들었는데 이에 따르면 넷플릭스에게 영화 장르란 “어느 지역영화(Region) + 부사(Adjectives) + 명사 장르(Noun Genre) + ~에 기반한(Based On…) + 배경은 어디이며(Set In… ) + 누가 만들었고(From the…) + ~에 관한 것이며(About…) + 타겟연령대는 X에서 Y임(For Age X to Y)” 이런 식으로 구분되는 것이다. 예를 들어, “고양이에 관한 폭력적인 스릴러, 타겟 연령대는 8~10살”이라는 구체적인 장르가 탄생하는 것이다. 이 장르명은 영상콘텐츠 화면의 제일 위에 표시된다.


넷플릭스식 세부 장르를 개발한 상품혁신총괄(VP) 토드 옐린에 따르면, 넷플릭스는 메타데이터를 작성하기 위해 무려 36페이지짜리 문서에 꼼꼼하게 각 콘텐츠의 정보를 채워넣는다고 한다. 이를 내부적으로는 넷플릭스 양자이론(Netflix Quantum Theory)이라 부르는데 그 취지는 영화를 구성하는 ‘양자’가 무엇인지 모두 기록한다는 것이다. 성적인 수위는 어느 정도인지, 얼마나 잔인한지, 얼마나 로맨틱한지, 주인공은 얼마나 도덕적인지, 해피엔딩인지 아닌지까지 모든 정보를 1~5점 점수로 수치화해 입력한다. 플롯에는 어떤 이야기가 나오는지, 주인공의 직업과 로케이션 장소 정보도 기본적인 입력 대상이다. 입력된 정보를 바탕으로 기계가 ‘맞춤화 장르’를 만들어낸다. 그리고 이를 회원에게 추천할 때는 딱딱한 기계어로 하는 것이 아니라 인간이 개입해 취향에 따른 분류를 만들어낸다. 예를 들어, ‘해피엔딩 5점을 받은 영화’ 대신 ‘기분이 좋아지는 영화’라는 형식으로 태깅해 제공하는 것이다.


넷플릭스에서 회원이 플레이하는 영화의 세 편 중 두 편 가량이 추천을 통해 소개받은 영화다. 구글 뉴스(Google News)의 경우에도 38% 이상이 추천을 통해 조회가 발생하고, 아마존의 경우에도 추천을 통한 판매가 전체 매출액의 35%를 넘는다고 하니 막강한 추천 기능은 곧 매출 확대로 이어지는 지름길이다.


좋아서 본 영화와 그냥 본 영화의 구분


넷플릭스는 월 정액제로 영상콘텐츠를 제공하기 때문에 표준화된 기존의 시청률 개념은 그다지 중요하지 않다. 가입자가 만족할 만한 영화를 많이 봤다고 느껴야 해당 서비스를 계속 갱신하려 할 것이다. 사람들은 좋아서 보기도 하지만 그냥 보기도 한다. 특히 추천해준 영화의 만족도가 낮을 때 추천시스템은 치명적인 타격을 입을 것이다. 따라서 얼마나 많은 사람들이 시청했는지와 같은 정보보다는 실질적으로 가입자의 시청 행위와 만족도를 측정할 수 있는 지표가 필요하다.


조영신 SK경영경제연구소 수석연구원에 따르면, 최근 넷플릭스는 추천 시스템을 한 단계 더 업그레이드해 딥 러닝(Deep Learning) 방식을 고안하고 있다고 한다. 인공신경망을 활용해 사용자의 선호도나 영화 감상에 숨어있는 지표들을 학습시켜 인공지능이 추천 알고리즘을 만들어내게 하는 것이다. 기계가 스스로 학습하게 하는 ‘머신 러닝’ 개념을 적용해 회원의 선호도 변화까지 추적 반영하려는 것 아닌가 싶다. 넷플릭스의 딥 러닝을 위한 인공신경망은 아마존 클라우드 서비스에서 운영을 맡기로 했다. 아마존 역시 텍스트 영화 정보의 최강자인 IMDB라는 영화 데이터베이스 서비스를 운영중인데 IT와 영상 콘텐츠 소비문화의 두 거인이 어떤 서비스를 만들어낼지 궁금하다.


한편 넷플릭스가 보유한 영상콘텐츠의 편수는 대략 3만 편 정도로 후발주자인 아마존 인스턴트 프라임(Amazon Instant Prime)의 8만5천편에 비해서도 적은 편인데 그럼에도 불구하고 넷플릭스가 경쟁력을 가질 수 있는 비결은 다양성을 통해 전체 매출을 증대시키는 아마존식 '롱테일 전략'이 아니라 빅데이터 분석을 통해 비용 대비 가장 효율적인 영상콘텐츠를 선택하고 이에 마케팅을 집중하기 때문이다.


디지털 유통채널인 넷플릭스는 전통의 콘텐츠가 디지털로 전환되는 2000년대를 통과해 오면서 두 업계가 빚어왔던 끊임없는 갈등에 익숙한 기업이다. 넷플릭스에게 영상콘텐츠 사업자는 때론 막강한 영향력을 행사하는 ‘갑’이기도 하고 때론 넷플릭스의 플랫폼으로 붐업을 일으키려는 ‘을’이기도 하다. 스트리밍 시장이 계속 커지면서 지속적으로 콘텐츠 사용료 역시 증가하고 있다. 넷플릭스는 콘텐츠 사용료가 본격 인상된 2011년 적자로 돌아서며 위기를 맞기도 했다.


넷플릭스는 VOD 사업자와 재계약을 앞두고 기싸움에서 밀리지 않기 위해 지표를 개발했다. 총 시청 횟수, 소비자의 피드백, 해당 상품과 유사한 장르가 있는지 등 다양한 방식으로 평가를 한다. 만약 해당 VOD 사업자가 콘텐츠 제공 비용을 높이려 한다면, 그 비용을 해당 상품과 유사한 장르를 확보하는데 들어가는 비용과 비교한다. 그래서 충분히 대체가 가능하다는 판단이 서면 기존 사업자와 재계약을 하지 않는다. 그런 식으로 플랫폼의 입지를 강화하고 VOD 사업자와 긴장관계를 유지한 것이 넷플릭스가 위기를 돌파하고 효율성을 유지해온 비결이다. 그들은 축적해온 빅데이터 분석을 통해 콘텐츠를 구입하는 것보다 직접 제작하는 것이 비용 대비 더 효율적이라고 판단되면 경쟁력 있는 콘텐츠를 자체 제작하기도 한다.



이 글에서 참조한 The Atlantic 기사의 링크:

Madrigal, Alexis. C. (2013. 1. 2). How Netflix Reverse Engineered Hollywood.

http://www.theatlantic.com/technology/archive/2014/01/how-netflix-reverse-engineered-hollywood/282679



(2) 게임체인저 <하우스 오브 카드>

(3) 흥행은 도박 아닌 정교한 예측



Youchang
저널리스트. [스쳐가는 모든것들 사이에서 버텨가는] [세상에 없던 생각] 저자
댓글
댓글쓰기 폼