티스토리 뷰


데이터 분석으로 센세이션을 일으킨 야구영화 <머니볼>처럼 빅데이터가 영화 산업에 변화를 가져오고 있다.



"감독, 배우, 배급사 파워, 관객 호감도 등을 빅데이터로 분석해보니 이 영화는 관객 수 30만~100만명으로 예상됨."


지난해 여름 빅데이터 아카데미의 한 연구팀이 국내 개봉예정작의 흥행 스코어를 빅데이터 분석을 통해 예측해본 결과다. 그로부터 몇 달 후 영화가 개봉하고 극장에서 내려간 뒤 연구팀은 최종 흥행 스코어를 확인해보았다. 39만 명으로 예상 스코어의 범위 내에 있었다. 빅데이터가 영화 흥행 예측에도 유용한 도구가 될 수 있음을 증명한 순간이었다.


연구팀이 사용한 방법은 이랬다. 우선 관객 수를 총매출에서 차지하는 비중에 따라 30만명 미만, 30만~100만명, 100만~220만명, 220만~400만명, 400만~600만명 등 총 9개의 카테고리로 나눴다. 이후 영화 흥행에 영향을 미칠 데이터를 분석해 해당 영화가 어떤 카테고리에 들어갈 지를 예측했다. 마치 수능처럼 등급 구간을 나누어 영화 흥행 예상 스코어에 따라 등급을 매기는 방식이었다. 데이터는 기본적으로 감독, 배우, 배급사 등의 정형 데이터와 관객의 호감도를 측정하는 비정형 데이터를 혼합해 사용했다.


연구팀은 영화에 대한 관객의 호감도를 분석하기 위해 2008년 이후 네이버, 다음, 네이트 등 포털 사이트에 올라온 네티즌 영화평 84만여 건을 일일이 수집했다. 문장을 형태소 단위로 쪼갠 뒤 이를 긍정적인 메시지와 부정적인 메시지로 나누어 카운트하고, 두 개의 비율과 해당 영화의 흥행 성적을 비교해 상관관계를 찾았다.


분석 결과 연구팀은 영화 흥행에 영향을 미치는 가장 중요한 변수는 감독이라는 결론을 얻었다. 그 뒤로 배우, 감성 데이터, 배급사 순으로 효과가 컸다.


이와 같은 성과를 바탕으로 연구팀은 2013년 8월 개봉한 영화 세 편의 흥행을 예측했는데 개봉 후 최종 스코어와 비교해보니 두 편은 관객수를 정확히 구간 내에서 맞혔고, 한 편은 100만~220만명을 예측했으나 결과는 95만명으로 비교적 근사치에 가깝게 틀렸다.


또, 포털 사이트의 검색쿼리를 이용해 간단하게 영화의 관객 수를 예측하는 방법도 있다. 개봉 전 일주일 동안의 영화 제목 검색량에 전국 상영관 수를 변수로 넣어 계산하면 첫 주 박스오피스를 예측할 수 있는데 이미 많은 국내외 영화 마케팅 업체에서 활용하고 있다. 구글 코리아 관계자는 이 방법으로 오차허용범위 7%의 비교적 정확한 데이터를 얻을 수 있다고 한다.


이처럼 영화 흥행 예측에 빅데이터를 활용하려는 움직임이 늘고 있다. 빅데이터의 효용성을 먼저 알아본 사람은 돈에 민감한 투자자들이었다. 기획, 감독 섭외, 배우 캐스팅은 물론 마케팅과 배급 과정에서도 빅데이터는 불확실한 콘텐츠 시장을 예측 가능한 시장으로 만들어주는 도구가 되어가고 있다. 특히 다양한 미디어의 등장으로 영화 개봉 과정에서 마케팅 비용이 계속 늘어나 제작비에 맞먹을 정도로 비중이 커진 요즘 빅데이터 분석은 영화사에 가뭄의 단비와 같은 존재다.


빅데이터로 영화 흥행을 예측하는 시도는 스튜디오 시스템이 발달한 할리우드에서 먼저 시작됐다. 영화시장 분석 업체인 릴펄스(Reel Pulse)는 미국 박스오피스를 추적하는 서비스를 개발해 신작 영화가 개봉하기 8주 전에 흥행성적을 예측한다. 이를 바탕으로 스튜디오가 사전에 보다 효과적인 마케팅 전략을 전개할 수 있도록 지원한다. 이들의 무기 중 하나는 소셜 미디어인데 릴펄스는 소셜 미디어에 올라온 단어들을 분석해 흥행 가능성을 구체적인 수치로 제시한다.


피지올로지의 <그래비티> 소셜 버즈 분석 예시


소셜 미디어 여론 분석업체 피지올로지(Fizziology) 역시 빅데이터를 이용해 영화 흥행 예측 서비스를 제공하고 있다. 피지올로지는 2009년 서비스 개시 이후 영화 500편 이상의 박스오피스 실적을 추적해왔다. 이들은 각 영화마다 개봉 4주 전부터 개봉 후 3주까지의 기간에 걸쳐 트위터, 페이스북, 블로그 등 소셜 미디어의 연관 단어들을 수집하고 이를 분석해 `이프스코어(Eff-Score)'라는 순위 산출 서비스를 내놓았다. 피치올로지는 이를 바탕으로 분석 내용과 흥행 예측을 담은 주간 보고서 `무비 트래커(Movie Tracker)'를 스튜디오에 제공하고 있는데 정확도가 95% 수준에 달한다고 한다.


그동안 영화 시장은 확률 게임이었다. 열 편의 영화를 만들면 그중 한 편이 소위 `대박'을 쳐서 나머지 아홉 편의 손실을 보전해주는 방식으로 운영돼 왔다. 스타 시스템, 작가 시스템, 프로듀서 시스템 등 안정적 흥행수익을 얻기 위한 여러 시도들이 있었지만 과학적인 흥행 예측과는 거리가 멀었다. 오히려 노련한 제작자의 감과 트렌드를 읽어내는 능력이 더 잘 들어맞곤 했다. 그러나 위 사례들처럼 영화 흥행에 빅데이터 분석이 도입되면서 영화 제작은 더이상 감에 의존한 도박이 아닌 예측 가능한 산업으로 바뀌고 있다.


그러나 어떤 일에나 양면이 있는 법이다. 예측 가능한 시장이 된다는 것은 투자자에겐 리스크를 줄여주기 때문에 반가운 일일 수 있지만 한편으로는 흥행이 잘 안 될 것으로 예측된 영화는 아예 만들 시도조차 하지 않을 것이기에 콘텐츠 다양성을 해칠 수 있다. 특히 사회적으로 의미 있지만 비대중적인 드라마나 다큐멘터리들이 희생양이 될 것이다. 흥행을 담보할 수 있는 안전지향 위주의 영화만 만들어진다면 오히려 영화계는 활력을 잃을 가능성이 크다. 영화계가 빅데이터를 통한 흥행 예측으로 산업의 안정성을 높이되 다양한 콘텐츠를 만드는데 주저하지 않을 수 있는 묘수를 찾아내기를 기대해본다.



Youchang
저널리스트. [스쳐가는 모든것들 사이에서 버텨가는] [세상에 없던 생각] 저자
댓글
댓글쓰기 폼