LG경제연구원 ‘걸음마 뗀 소셜 분석, 한계 아는 만큼 가치가 보인다’

뉴스 제공
LG경제연구원
2013-02-17 11:16
서울--(뉴스와이어)--지난 연말, 온 나라를 달구었던 선거전에서 매일매일 달라지는 지지율만큼이나 흥미로웠던 관전 포인트는 소셜 미디어 상의 여론이었다. 소셜 미디어가 갖는 여론 증폭제로서의 파급력과 기존 매체와의 차별성 때문에 지지율 수치가 반영하지 못하는 민심을 소셜 미디어 안에서 찾아보려는 시도가 활발했다. 현상을 어떻게 분석했느냐에 따라 다르겠지만, 실제 민심이 드러났을 때 전반적인 반응은 소셜 미디어를 통한 민심 파악이 생각보다 어려운 작업이라는 것이었다.

기존의 소통 방식을 바꿔놓은 소셜 미디어가 점차 활용의 도구에서 분석의 대상으로 진화하고 있다. SNS 서비스의 대표격인 페이스북의 경우 전세계 사용자 수가 이미 9억 7천만 명에 달하고 그 뒤를 잇는 트위터는 1억 5천만 명의 사용자가 매일 2억 개 이상의 메시지를 쏟아낸다. 21세기의 원유라고 불리는 빅데이터의 일부로서 소셜 미디어 데이터의 분석은 최근 몇 년 사이 새로운 연구 영역으로 주목받기 시작했다. 언어학자 벤 지머는 방대한 트위터 메시지를 분석하는 연구 방식을 ‘트위터롤로지(Twiterology: 트위터학)’라고 이름 붙였다. 트위터에 나타나는 대중의 기분을 감지해 주가를 예측하거나 트위터 메시지 분석을 통해 전염병의 전파 경로를 파악할 수 있다는 연구가 대표적이다. 트위터와 같은 소셜 미디어가 연구대상으로 각광받게 된 이유는 방대한 데이터의 양 때문만은 아니다. 자발적으로 표현된 의견이라는 점, 실시간으로 확보 가능한 정보라는 점 등이 기존에 인위적으로 만들어진 실험 환경이나 구조화된 설문 방식을 통한 연구와 차별화되기 때문이기도 하다.

이렇게 기존 조사가 가지는 한계를 보완해 준다는 장점 때문에 거시 사회 분석뿐 아니라 기업 활용 목적에서도 소셜 데이터 연구에 대한 관심이 높아지고 있다. 기업들은 페이스북이나 트위터 같은 파워 SNS에서 사람들이 자신의 기업이나 브랜드에 대해 하는 이야기들을 엿듣고 싶고, 그 이야기들을 활용하고 싶어한다. 포브스가 2012년 5월 발표한 ‘10년 전에는 존재하지 않았던 유망직업 10선’에는 데이터마이너(정보수집, 분석가)와 CLO(Chief Listening Officer)가 포함되어 있었다. 둘 다 소셜 미디어가 부상하면서 새로 생긴 직업이다. 뉴욕타임즈는 미국에서만 14~19만 명의 심층 분석가가 필요할 것이라고 전망했다. CLO는 페이스북, 트위터, 유튜브와 같은 소셜 미디어를 통해 고객의 목소리를 듣고 인터넷에 쏟아지는 정보의 홍수 속에서 유용한 정보를 찾아내는 업무를 총괄하는 사람이다. 이전에는 코닥과 델 컴퓨터 정도가 공식적으로 CLO라는 직함을 두었으나 최근에는 기업 내에서 실질적으로 CLO의 역할을 맡는 담당자들이 훨씬 빠르게 늘고 있다. 그만큼 온라인상에서 고객의 소리를 듣는 일이 중요해 졌다는 의미다.

소셜 분석 서비스를 전문적으로 제공해 주는 업체들도 늘고 있다. 국내에도 SAS, Microstrategy같은 글로벌 BI(Business Intelligence) 업체뿐 아니라 소셜 분석 전문 업체, 검색엔진 업체, 로컬 BI 업체 등 15여 곳 이상이 소셜 분석 서비스 사업에 진출해 시장 키우기에 고심 중이다.

Ⅰ. 사례를 통해 본 소셜 분석의 활용 가능성

소셜 분석의 가능성에 주목하고 있는 기업들과 전문 분석 서비스 업체들은 자연어 처리, 시멘틱 검색, 감성 분석, 형태소 분석 등 저마다 차별적인 분석 기술들을 내세우고 있다. 방법은 제각각 이지만 결국 이를 통해 경영 활동의 효과를 높이자는 것이다. 소셜 분석은 기술이나 산업 성숙도 측면에서 이제 막 걸음마를 뗀 단계이기 때문에 아직 이렇다 할만한 성공 사례는 많지 않다. 하지만 최근까지 시도된 노력들을 통해 앞으로 더 큰 활용 가능성을 짐작해 볼 수 있다.

(1) 여론 모니터링을 통한 위기대응

소셜 분석의 가장 기본적인 출발점은 온라인상의 이슈를 모니터링하고 소비자의 의견을 청취하는 것이다. 온라인 정보관리 총괄인 CLO의 직함에 ‘청취자(Listening Officer)’라는 말이 들어가는 것만 보아도 알 수 있다. 대중매체 등을 통해 보도된 부정적 기사가 온라인 상에서 증폭되는 경우도 있지만 최근에는 반대로 소셜 미디어 등 온라인 채널을 통해 시작된 위기가 걷잡을 수 없이 확대돼 기사화 되는 경우도 빈번하다. 지난해 온라인 게시판의 고객 불만에서 시작돼 사회적으로 큰 이슈를 불러일으켰던 채선당 사건이 대표적이다. 이는 기존의 위기관리 개념을 완전히 뒤흔드는 것이며 위기관리의 포인트가 주요 대중매체뿐 아니라 분산된 개인으로 확대되었음을 의미한다. 사실 이 경우 기업이 할 수 있는 최선은 온라인 상에서 갑자기 늘어난 기업, 브랜드 관련 부정적 버즈량을 감지해 가능한 한 빠른 대응을 하는 것이다. 현재 대부분의 소셜 미디어 모니터링을 통한 위기관리는 이 정도 단계에 와 있다.

여기에 좀 더 과학적인 분석을 동원해 발생한 위기의 차단이 아닌 예방적 차원으로까지 위기관리의 범위를 확대해 볼 수도 있다. 잠재적으로 위기가 될만한 부정적 요소를 수시로 감시하고 문제가 발생하기 전에 해당 요소를 잠재운다는 것이다. 대중의 분위기를 감지하는 정서분석(Sentimental Analysis)도 이와 관련한 소셜 분석의 대표적인 연구 분야다. 기업에 대한 부정적 여론의 확산은 사건 자체의 심각성도 있지만 평상시 해당 기업에 대한 사람들의 인식에 따라서도 파급효과가 달라질 수 있기 때문이다.

(2) 마케팅 활동 성과 측정 및 평판 관리

기업에게는 매출이라는 성적표 말고도 고객 만족도나 브랜드 가치와 같은 경영 성과에 영향을 줄 수 있는 관리 지표들이 있다. 광고나 이벤트 같은 개별 마케팅 활동의 성과도 향후 활동을 설계하거나 자원을 배분함에 있어서 중요한 관리 대상이다. 하지만 만족도, 평판, 마케팅 활동 성과는 개별적으로 측정, 관리하기가 어려운 부분이다. 고객 만족도나 브랜드 가치 조사 같은 것들이 시행되고 있기는 하지만 측정 시기나 방법 측면에서 한계가 있는 것도 사실이다. 조사를 통한 만족도나 가치 측정은 관리 시점 자체가 1년 또는 짧아야 분기 정도로 긴 것이 보통이고 따라서 그 사이에 있었던 다양한 활동들 가운데 어떤 활동이 어떤 결과를 만들어 냈는지 파악하기 힘들다. 소셜 분석은 고객들의 반응을 즉각적으로 확인할 수 있다는 데서 기존 방법들의 한계를 일부 보완해 줄 수 있을 것으로 기대된다.

가장 직관적인 평가는 경쟁사 대비 얼마나 많은 팬수, 조회수, 팔로워 수, 좋아요 수, 댓글 수 등을 확보했는지의 여부일 것이다. 특히 소셜 미디어 도입 초창기에는 이렇게 눈으로 보이는 네트워크의 규모를 늘리는 것이 중요해 보였다. 최근에는 각 소셜 분석 업체들마다 고유의 관리 지표를 개발해 제공한다. 국내 소셜 분석 업체 펄스 K의 경우 KLOUT 지수라고 해서 팔로워 수, 트윗 수, 생성일자, RT수 및 자체적인 기준과 계산방식을 적용한 소셜 스코어를 제공하고 있다. 물론 이러한 지수가 정확한 평가지표가 될 수 있는지는 논란의 여지가 있다. 하지만 여러 한계에도 불구하고 고객만족도나 브랜드 평가 지수가 여전히 많은 기업들에게 참고되는 것처럼 지속적 관리 기준을 제공해 준다는 측면에서는 의미가 있다.

지수화 외에도 마케팅 캠페인이나 광고 이후 해당 브랜드에 대한 사람들의 반응 변화를 분석해 정성적으로 성과를 확인해 보는 것이 가능하다.

(3) 트렌드 모니터링을 통한 사업기회 발굴

스티브 잡스는 고객 스스로도 자신이 원하는 것을 알지 못한다는 생각에 시장 조사를 하지 않았던 것으로 유명하다. 실제로 의미 있는 변화는 과거의 경험을 통해 유추하기 어려운, 전혀 새로운 곳에서 등장하는 경우가 많아 앞으로의 변화 방향을 예측하는 데 있어서 질문-응답 방식의 서베이 조사는 한계가 있다. 이런 서베이 방식의 한계 때문에 고객 인사이트를 찾기 위해서 민속지(Ethnography)와 유사한 고객 관찰기법을 채용한 기업들도 많았다.

하지만 이 역시 오랜 조사 기간과 규모 면에서 제약이 따랐다. 반면 소셜 미디어 정보는 ‘라이프로그’라고 불릴 정도로 그 사람의 일상을 고스란히 담고 있고 질문을 통해 ‘유도된’ 답변이 아닌 ‘자발적인 나레이션’으로 조사자 편향을 배제할 수 있으며 분석 가능한 데이터도 방대하기 때문에 이러한 한계들을 극복해 줄 대안으로 주목 받고 있다. 인터넷에 떠도는 고객 정보로부터 인사이트를 발굴한다는 의미에서 네스노그라피(인터넷을 뜻하는 Net과 민속지 연구를 뜻하는 Ethnography의 합성어)라 불리기도 한다.소셜 미디어에서 사람들의 관심사, 불안 등을 파악하면 새로운 상품 기획에 유용한 인사이트를 발굴할 수 있다.

미국 MTV는 마이클 J. 폭스가 1980년대 주연한 영화 ‘틴 울프(Teen Wolf)’의 TV 시리즈 리메이크작을 준비하면서 소셜 분석을 활용했다. 처음 예고편을 제작할 당시에는 원작의 확고한 고정 팬층을 우선 겨냥해보자는 판단에 예고편에 원작의 일부를 삽입했다. 하지만 예고편에 대한 소셜 미디어의 반응은 ‘혼란스럽다’, ‘옛날 영화와 무슨 상관이 있는지 모르겠다’와 같은 부정적인 것들이 많았다. 더구나 MTV의 주된 타깃층인 10대들의 관심을 이끌어내지 못하고 있음이 파악되었다. 전략의 수정이 필요함을 깨닫고 MTV는 전문 소셜분석 업체와 함께 온라인상에서 떠도는 틴 울프에 대한 코멘트 및 광범위한 주제에 걸친 10대들의 관심사를 분석했다. 분석 결과 십대들은 캐릭터들 간의 로맨스에 관심이 많은 것으로 드러났다. 이에 리메이크작은 원작의 코믹한 요소를 배제하고 로맨스를 강조하기로 결정했다. 이런 철저한 사전기획의 결과 첫 방송에서 2백만 이상의 시청자들을 확보하고 방송 다음날 24,000여 건의 관련 트위터를 만들어 낼 만큼 이목을 끄는 데 성공했다.

사실 엔터테인먼트는 소셜 미디어상에서 가장 많이 회자되는 주제 중 하나다. 뱀파이어와 평범한 소녀의 로맨스를 다룬 트와일라잇 시리즈와 같은 최근 흥행작들의 패턴을 살펴봐도 틴 울프가 목표한 기획 방향이 판타지·로맨스·공포·액션 등 다양한 장르의 결합에서 매력을 느끼는 요즘 10대들의 취향과 잘 맞아떨어짐을 알 수 있다. 여기 소셜 미디어에서 확보된 트렌드 정보를 좀 더 일상적인 경영 활동에 활용한 기업 사례도 있다.

글로벌 유통 기업 월마트는 지난 2011년 소셜 분석 업체 코스믹스(Kosmix)를 3억 달러에 인수하고 자사의 데이터 분석 프로젝트 월마트랩(@WalmartLabs)에 투입시켰다. 유통업체와 소셜 분석업체라는 다소 의외의 만남은 소셜 미디어를 통한 인사이트 확보에 월마트가 얼마나 적극적인지를 보여준다. 우선 월마트는 상품 구성 결정에 소셜 분석 결과를 반영하고 있다. 대표적인 예가 케잌팝을 판매하기로 한 결정이다. 월마트는 스틱 위에 작은 케잌이 달린 막대사탕 모양의 케잌팝이 소셜미디어 상에서 자주 회자되고 있는 것을 발견하고 시장 조사에 들어갔다. 이미 스타벅스에서 해당 제품을 취급해 좋은 반응을 얻고 있었다. 이에 월마트도 서둘러 케잌팝 입고를 추진했다. 또 타키스(Takis)라는 매운맛의 멕시칸 스낵을 취급했을 때 특히캘리포니아와 미 남서부 지역에서 제품에 대한 긍정적인 대화가 오가는 것을 발견하고 해당 지역에 다이너마이트(Dinamita)라는 이름의 유사 브랜드를 도리토스와 공동 개발해 출시하기도 했다. 최근에는 영화 어벤져스(The Avengers)와 다크 나이트 라이즈(The Dark Knight Rise) 개봉을 앞두고 소셜 미디어상에서 해당 영화들에 대한 관심이 높다는 것을 파악하고 관련 상품들을 매장에 배치토록 했다.

월마트는 향후에는 소셜 분석을 통해 파악된 정보가 상품 구성뿐 아니라 맞춤화된 홍보 전략이나 재고 관리에도 활용될 수 있기를 기대하고 있다. 예를 들어 어떤 고객이 칸쿤으로의 휴가 계획을 트윗했을 때 그 고객에게 자외선 차단 제품에 대한 할인 쿠폰을 발행하거나, 더운 지역으로 휴가를 계획하는 사람들의 수를 잠정 파악해 자외선 차단 제품 재고가 얼마나 필요할지 추정한다는 것이다. 물론 이러한 수준까지 활용되기 위해서는 더 많은 개인 정보와 훨씬 정교한 분석이 요구될 것이다. 소셜 데이터 이외의 다른 데이터들이 요구될지도 모른다. 그러나 기존의 경영 판단을 보완할 새로운 근거 자료로서 소셜 미디어 정보의 가치는 충분히 기대해 볼 만 하다.

(4) 사용 행태 분석을 통한 마케팅 전략 수립

기업들이 고객으로부터 가장 듣고 싶지만 듣기 어려운 답변은 ‘왜’에 대한 설명일지 모른다. 왜 우리 제품을 구입하는지 혹은 구입하지 않는지, 왜 만족하는지 또는 불만족하는지, 이런 질문들에 해당하는 답변을 구하기 위해 다양한 방식으로 시장 조사를 시행하지만 성과는 만족스럽지 못한 경우가 대부분이다. 원하는 답변을 얻을 수 없는 것은 질문이 잘못되었거나 질문에 답하고 싶지 않은 상황이기 때문이다. 구조화된 조사 방식이 가지는 공통된 한계다. 반면 소셜 분석은 개인들간의 대화를 통해 자연스럽게 드러난 감정, 인상, 소비 습관 등을 통해 ‘왜’에 대한 대답을 유추하려 시도한다. 그리고 사람들의 행동에 대한 이해를 통해 더 효과적인 마케팅 전략을 수립할 수 있게 한다.

한가지 예로 사람들의 감정 추이를 분석해 가장 효과적인 광고 시간을 정할 수 있다. 다음소프트의 소셜 분석 서비스 소셜메트릭스의 분석에 따르면 우리나라 사람들은 금요일에 기분에 대한 긍정 언급이 최고점을 찍고 토요일을 기점으로 하락하다가 월요일에 최하위를 기록한다고 한다. 이러한 정보에 근거한다면 우울증 치료제를 위한 최고의 광고 시간대는 사람들의 기분이 가장 침체되어 있는 월요일과기분이 하락하기 시작하는 토요일이라는 결론이 나올 수 있다.

사용자들이 제품에 대해 가지고 있는 이미지나 사용 패턴을 사람들의 대화를 통해 추출해 보는 것도 가능하다. 제품에 대한 이미지나 사용패턴 파악은 우리 제품이 의도한대로 잘 포지셔닝 되어 있는지, 혹은 미처 감지하지 못한 소구 포인트가 있었던 것은 아닌지 파악할 수 있게 한다. 소셜메트릭스가 아이패드와 사람의 연관관계를 측정해보니 아이폰, 노트북, 스마트폰, 닌텐도, 책 등 온갖 ‘가지고 다닐 수 있는 것들’ 중 아이패드가 어린이와의 연관도가 가장 높은 것으로 나타났다고 한다. 또 아이패드와 손님, 소비자, 친구, 부모, 남편, 여자, 가족 등 여러 종류의 사람에 관한 언급 가운데 어린이의 비율이 20%로 매우 높았다. 구체적으로는 아이들이 아이패드를 좋아하는 내용과 관련한 글들이 많았다. 이러한 발견은 아이패드가 소구될 수 있는 새로운 타깃 계층이 첨단 디지털에 관심이 많은 성인 남성뿐 아니라 어린 아이들로 확대될 수 있음을 말해준다. 어린 아이들이 직접 구매를 하지는 않겠지만 아이들을 위한 교육 및 오락 목적을 강조한다면 교육에 관심 많은 부모들을 고객으로 끌어들일 수도 있을 것이다.

소셜 분석으로 제품 구매 행동을 유추해 판매 전략을 재점검 하는 것도 가능하다. 소셜메트릭스 제공 자료를 토대로 비스퀵에 대한 최근 한 달간 온라인 키워드를 살펴보았다. 비스퀵은 미국 제너럴 밀즈에서 나온 일종의 쿠키 믹스 제품으로 일반 마트에서는 쉽게 구할 수 없고 주로 인터넷을 통해 수입된 제품을 현지 판매가보다 훨씬 높은 가격에 구입해야 한다. 하지만 입소문을 타고 번진 제품의 인기로 벌써 온라인에 상당수의 관련 블로그 포스팅이 올라와 있는 상황이다. 비스퀵의 연관어를 보면 웰치스, 스타벅스 등 다른 식음료 브랜드의 이름이 나열된다. 베네피트나 코치와 같은 매스티지 패션 브랜드도 언급된다. 단순하게 생각하면 비스퀵과 해당 제품간의 소비 상관관계를 의심해 볼만 하다. 하지만 개별 트윗이나 블로그 멘션 등을 자세히 들여다보면 해당 제품들이 모두 해외 직구(직접구매) 사이트에서 비슷한 시기에 공동구매 알림이 뜬 제품들임을 알 수 있다. 제품간 연관성보다 구매 경로의 공통성으로 해당 제품들이 연결된 셈이다. 이러한 정보는 어떻게 활용될 수 있을까? 유통업체들이 비스퀵이라는 제품의 유통이나 가격 정책을 재점검해서 효율화 할 계기로 활용할 수 있을 것이다. 기존 유통 채널이 있음에도 불구하고 해외 직구에 대한 관심이 압도적으로 높다는 것은 기존 유통 채널이 충분치 않거나 판매 가격에 대한 소비자들의 만족도가 떨어진다는 것을 의미하기 때문이다.

(5) 관계망 분석을 통한 영향력자 파악

앞에 제시된 내용들이 주로 키워드 분석에 관한 것이었다면 전문가들은 향후 소셜 분석의 가치는 영향력자와 영향 전파 매개자 등 소셜 네트워크 상의 상대적 위치를 파악하는 관계망 분석에서 찾을 수 있을 것이라고 전망한다. 단순 키워드 분석은 유명인과 일반인의 언급을 동일한 것으로 취급한다. 물론 유명인이 언급해 많은 사람에게 리트윗 된다면 그만큼의 파급효과가 이미 전체 트렌드에 반영된 것이겠지만, 이러한 효과를 향후에도 전략적으로 활용하기 위해서는 사용자들간의 관계를 이해하는 것이 중요하다. 관계를 파악하면 불특정 다수가 아닌 이슈 전파의 핵심 인물 중심으로 버즈 마케팅 등을 전개할 수 있다. 소셜 분석이라는 말이 본격적으로 관심을 받기 이전에도 파워 블로거나 많은 팔로워 수를 가진 인물들이 기업들의 관심 대상이기는 했다. 다만 지난 해 두 차례 선거를 통해 드러난 각 정치인들의 네트워크 분석 결과가 말해주듯 절대적인 팔로워 수와 영향력이 곧바로 일치하는 것은 아니다. 네트워크 안에서의 상대적 위치와 인맥들이 가진 네트워크의 질 등 영향력 파악을 위해 고려해야 할 여러 가지 요소가 있어 ‘분석’이 요구되는 것이다.

특히 관계망 분석이 네트워크 안의 사용자 정보와 결합된다면 강력한 마케팅 수단으로 활용될 수 있다. 예를 들어 기업의 페이스북 팬페이지에 등록한 고객들의 프로파일 정보를 활용해 어떤 집단이 무엇을 좋아하는지 알아낸다면 홍보나 이벤트 전략과 적절히 결합시킬 수 있다. 월마트의 소셜 분석팀인 월마트랩은 쇼피캣(Shopycat)이라는 페이스북 앱을 개발해 회원들과 그 친구들의 좋아요, 공유, 포스팅 정보 등을 분석해 적절한 선물 추천을 한다. 월마트 상품은 물론이고 반즈앤 노블(Barnes & Noble), 레드인벨롭(RedEnvelope), 씽크킥(ThinkGeek) 등 타사 사이트 상품도 추천 선물에 포함된다. 소셜 분석 기업 MicroStrategy의 경우 위즈덤 네트워크(Wisdom Network)라는 자체 앱을 개발해 정보 개방을 허용한 1,500만 명과 그 친구들의 페이스북 프로파일 정보를 활용한다. 예를 들어 축구팀 FC 바르셀로나의 팬들 중 상당수가 액션 스타 빈 디젤(Vin Diesel)을 좋아한다는 분석 결과가 나오면 둘을 결합한 홍보 전략을 제안한다.

Ⅱ. 소셜 분석의 현실과 한계

현재 가능한 소셜 분석의 수준과 한계

소셜 분석 업체 또는 이 분야에 빠른 관심을 보인 기업들이 기대하는 소셜 분석의 활용 가치는 매우 높다. 하지만 산업으로서 소셜 분석 분야는 아직 제대로 자리잡지 못한 상황이다. 이제 겨우 출발점을 지난 셈이긴 하지만 베인앤컴패니의 조사에 따르면 대부분 산업의 평균 NPS4(순 추천지수)가 30%인데 반해 소셜 분석 산업의 NPS는 -60%로 매우 낮다. 일각에서는 현재 대부분의 업체들이 제공하는 서비스가 데이터를 모으고 키워드 빈도를 세고, 연관어 다발을 보여주고, 기초 지표를 테이블로 정리하는 등 분석이라기보다 ‘묘사’ 수준이라고 폄하하기도 한다. 물론 잘 정리된 자료만으로도 해석하는 사람의 통찰에 따라 충분히 가치 있는 정보가 될 수 있다. 문제는 소셜 분석의 대상인 소셜 미디어 데이터의 특징을 이해하지 못한 데서 오는 오해, 소셜 분석을 데이터를 넣으면 답이 나오는 수학 문제쯤으로 생각하는 자동화된 분석에 대한 지나친 기대에 있다. 소셜 분석의 중요성을 강조할 때 항상 뒤따르는 ‘향후 몇 년 안에 통계 분석자가 몇 명이 필요하고……’와 같은 논의는 소셜 분석에 대한 사람들의 시각을 단적으로 보여준다. 소셜 분석의 제대로 된 활용을 위해서는 소셜 분석의 한계를 이해할 필요가 있다.

(1) 잘못된 정량화

사실 매출액, 시장점유율, 신규 고객 수 등 숫자만큼이나 편한 관리지표가 없다. 소셜 미디어 활동 관리에 있어서도 좋아요 수, 팬 수, 조회수, 팔로워 수, 트윗 수 확대라는 유혹에서 많은 기업들이 자유로울 수 없는 이유다. 실리콘밸리 기업가이자 뉴욕타임즈 베스트셀러 ‘린 스타트업(The Lean Startup)’의 저자인 에릭 리즈(Eric Ries)는 이러한 정량화된 수치들이 보기에는 좋아 보이지만 ‘그래서?’라는 질문에 답을 던져주지 못한다면 ‘허무한 측정법(Vanity Metrics)’에 불과하다고 비판했다. 단순히 신규 고객 수 확보에 매몰되어 고객 개개인의 수익성이나 이탈 고객 비중을 간과하는 것처럼, 많은 팔로워 수나 트윗 숫자만으로는 큰 의미가 없다는 것이다. 예를 들어 트위터의 경우 리트윗, 리플, 멘션 등 다양한 상호작용을 기반으로 하고 이에 따른 파급력이 크기 때문에 단순 팔로워 수보다는 리트윗이나 업데이트 빈도 등 이용자의 적극적인 관여 수준에 비중을 둘 필요가 있다.

주요 영향력자를 판단할 때도 마찬가지다. 단순히 팔로워 수가 많은 사람이 꼭 영향력 있는 사람은 아니다. 흔히 인지도가 높으면 영향력이 따라가는 것으로 생각하지만 알고 보면 영향력에도 ‘뉘앙스’가 있다. 전반적인 인지도가 높아도 영향력을 발휘할 수 있는 분야는 다르다는 것이다. 물론 이외수씨같이 사회, 예술, 소비 등 전반적인 측면에서 영향력을 발휘하는 파워 트위터리안이 있기는 하지만 각 분야별로 그가 발휘할 수 있는 영향력의 차이는 있다. 따라서 단순한 인지도(Share of Voice)와 영향력(Influence)은 구분될 필요가 있다.

(2) 자동화된 분석 기술의 한계

소셜 분석이 정량화의 유혹에서 벗어나 ‘분석’의 결과다운 의미를 전달하기 위해서는 메시지 안의 의미를 정보로 치환해 내는 텍스트 분석과 오피니언 마이닝이 필수적이다. 하지만 현재 기술로는 여러 가지 면에서 만족할만한 수준의 분석 결과를 얻기가 어렵다.

우선 가장 기본적으로 동음이의어 구분이다. 자동차 스타일별로 사람들이 느끼는 감성을 파악하기 위해 소셜메트릭스 검색을 해 보았다. 최근 한 달간 트위터에서 ‘쿠페(Coupe)’와 관련돼 가장 많이 등장한 감성은 ‘이별’이라는 결과가 나왔다. 한 유명 트위터리안이 모리에토의 ‘검은 마법과 쿠페 빵’ 중 ‘이별’이라는 단어가 포함된 구절을 인용한 멘션이 여러 사람에게 리트윗되면서 집계된 결과다.

‘시슬리’라는 화장품 브랜드를 검색했을 때도 분석 내용의 절반은 동일한 이름의 가방 브랜드에 대한 얘기다. 사실 두 브랜드는 이름만 같을 뿐이지 하나는 프랑스, 하나는 이탈리아 기업으로 전혀 상관이 없다. 이렇게 세상의 수 많은 경우를 따져 동음이의어를 정확히 구분해내는 데는 아직까지 어려움이 따른다.

두 번째로 일반적으로 자동화된 키워드 분석은 단어의 사전적 의미에 따라 긍정/부정으로 나누지만 제대로 된 의미 파악을 위해서는 문맥상에서의 의미도 매우 중요하다. <“나는 그저 네 번째 타자일 뿐”이라던 LG 정성훈이 해결사 본색을 뽐내고 있다>에서 ‘본색’은 긍정적인 의미다. 그러나 일반적으로 본색이라는 단어는 <내 편인 것처럼 행동하더니 드디어 본색을 드러냈다>에서와 같이 부정적인 의미로 쓰이는 경우가 더 많다.

세 번째로 키워드 분석은 아직까지 전체 문맥에서 해당 키워드가 가진 중요성을 정확히 파악할 수 없기 때문에 잘못된 정보를 제공하기도 한다. 예를 들어 라고 했을 때 옵티머스라는 단어는 등장하지만, 글 전체적으로는 제품의 본질적인 속성과는 상관 없는 내용을 얘기하고 있다. 하지만 문장 속의 ‘짜증’이라는 단어 때문에 옵티머스에 대한 부정적인 글로 분류되기도 한다. 특히 장문의 블로그 포스팅에서는 키워드가 전체 내용에서 차지하는 중요도를 제대로 파악하기가 상당히 어렵다. 단순히 해당 키워드가 전체 글에서 많이 언급되었다고 해서 중요도가 높다고 할 수 없고, 관심 있는시사점이 포함되어 있는지의 여부까지 고려되어야 하기 때문이다. 전체적으로는 바닷가에서의 휴가를 얘기하고 있지만 글 중간에 ‘어디서든 잘 터지는 LTE’에 대한 내용이 있다면 해당 기업 입장에서는 가치 있는 정보를 뽑아낼 수 있는 글이다.

또 긍정/부정을 나누기 모호한 경우도 많다. ‘디자인은 좋은데 비싸다’와 같이 한 문장 안에 긍정과 부정이 혼재되어 있는 경우 자동 분류는 어떤 선택을 할까? 긍정과 부정이 섞여 있다고 해서 중립적인 것은 아니다. 사실 화자가 좋은 디자인에 무게 중심을 두는지, 비싼 가격에 방점을 찍고 싶었는지는 저 한 문장만으로는 알 수 없다.

자동화된 분석의 기술적, 본질적 한계에 대해 몇 가지 사례를 언급했는데, 사실 현재 수준에서 완벽한 해결 가능 여부를 단언하기는 어렵다. 트위터롤로지에 대해 다룬 뉴욕타임즈의 한 기사에서도 ‘소셜 분석을 통한 감성분석은 특히 풍자와 언어유희가 많은 트위터라는 매체의 특성상 위험할 수 있다’는 비판적 입장을 소개했다. 텍스트 분석을 통한 감성 분석의 정확도가 70~80% 정도에 불과하다는 얘기도 있다. 동전을 던져 앞면이 나오는 확률이 50%이니 ‘분석’을 통해 높인 예측치는 높지 않다는 얘기다. 하지만 완벽하게 자동화된 분석이 어렵다고 해서 무용지물은 아니다. 해석을 할 때 이러한 한계를 이해하고 보완적으로 사용한다면 제약조건 안에서도 활용가치는 충분이 있을 것이다.

(3) 데이터의 질

앞서 분석의 한계와 관련된 문제들을 언급했지만 더 본질적으로는 소셜 미디어의 데이터가 얼마나 보편적인 정보를 담고 있느냐 하는, 데이터의 질 자체에 대한 질문을 하지 않을 수 없다. 분석에 앞서 가장 중요한 출발점은 데이터의 대표성이다. 일반적인 조사 방식에서는 연령, 성별, 지역 등 샘플의 다양한 조건들을 최대한 모집단과 일치할 수 있게 조정한다. 하지만 소셜 분석에서는 메시지는 개방된 반면 ‘누가’에 대한 정보는 확보가 어렵고 사용자층도 편향되어 있어 결과를 일반화시키기가 훨씬 조심스럽다. 대표적으로 우리나라 페이스북 사용자들은 10대에서 35세까지가 약 80% 정도를 차지하는 것으로 조사되고 있다. 특히 18세에서 24세 사이의 비중이 38% 이상으로 압도적이다. 이 가운데서도 적극적인 사용자와 그렇지 않은 사용자가있다. 차미영 카이스트 교수가 2010년 5,200만 명의 트위터 이용자에 대해 조사한 결과에 따르면 적극적 트위터 사용자는 전체의 8.6%에 불과했다고 한다. 하지만 이 8.6%의 적극적 사용자가 발송하는 메시지가 분석 데이터의 상당 부분을 차지할 것이다. 결국 소셜 미디어 데이터는 통계적으로 매우 편향된 데이터이며 여기서 해석된 결과를 일반 소비자, 또는 전체 국민의 대표적인 의견으로 일반화시키기 어렵다.

사용자 편향 문제 말고도 데이터의 정보적 측면에서 기업에게 시사점을 줄 수 있을만한 데이터는 생각보다 많지 않을 수 있다. 실제로 기업, 브랜드가 언급되었다 하더라도 기업측에서 발송한 단순 홍보성 글이 전파된 경우가 상당수다. 리서치 기관 가트너는 소셜 미디어 평가 및 리뷰에 대한 소비자들의 의존도 증가로 기업들이 지원하는 대가성 소셜 미디어 평가 및 리뷰가 2014년까지 전체 리뷰의 10~15%를 차지할 것이라고 추산하기도 했다8. 해당 기업, 브랜드에 대한 솔직한 고객의 의견을 담은 ‘목소리’를 찾기는 더욱 어려워진다는 얘기다.

결론적으로 소셜 분석의 가장 큰 장점 중 하나가 ‘광대한’ 데이터였지만 아이러니하게도 소셜 분석에서 데이터의 양은 크게 중요한 것이 아닐 수 있다. 오히려 데이터의 특성을 이해하고 그에 따라 분석 결과가 의미하는 바를 제대로 도출해 내는 통찰력이 더 중요할 수 있다. 소셜 데이터의 특성에 맞는 분석을 하고 그 결과를 전통적인 소비자 조사와 결합해 접근할 수 있을 때, 소셜 미디어는 사람들의 생각과 감성을 읽을 수 있는 또 하나의 중요한 소스가 될 것이다.

Ⅲ. 소셜분석, 제대로 활용하려면

전문적인 분석 기술을 활용하는 것이 아니더라도 기업이 자사와 관련된 소셜 미디어 상의 의견들을 끊임없이 모니터링하고 일관된 기준으로 관리하는 것은 중요하다. 텍스트 분석 같은 기술은 전문 업체를 활용해도 단기간에 정확성을 담보하기 어렵다. 하지만 그 밖에 이슈들은 대부분 소셜 미디어 데이터의 특징을 이해하면 목적에 따라 충분히 합리적인 해석을 거친 활용이 가능하다.

(1) 무엇으로 인기도(성과)를 측정할 것인가?

앞서 소셜 미디어에서 팔로워 수, 조회수를 단순 집계한 정량화로 성과를 평가하는 것의 문제를 지적했다. 유튜브의 ‘K-pop’ 상위 동영상 분석 사례를 통해 이러한 한계를 어떻게 보완할 수 있을지 살펴보았다.

유튜브의 인기 동영상은 조회수를 기준으로 정해진다. 그러나 조회수는 일종의 점유율 개념이고 단순히 조회수가 높다고 해서 반드시 해당 동영상의 반응이 좋다고 말하기는 어렵다. 특히 홍보물과 같이 시청자에게 영향력을 행사할 목적으로 만들어진 동영상이라면 노출이 많이 되었다는 사실로 반응까지 좋았다고 유추하는 것은 문제가 있다. 다행히 유튜브에는 조회수 이외에도 댓글을 남기거나 ‘좋아요’나 ‘싫어요’를 클릭하는 방식으로 사용자가 의견을 표현할 수 있어 반응을 평가할 때 이런 정보들을 종합적으로 고려해 볼 수 있다.

기업들은 사업의 규모나 특징을 감안해 자사 소셜 미디어 활동 수준을 점검하는 지표를 설정할 수 있다. 글로벌 컨설팅 업체 부즈앨런해밀턴은 소셜 미디어상의 브랜드 가치 지표로 LPM(Like per Million)이라는 것을 제시하기도 했다. 기업 규모가 클수록 네트워크의 크기도 커지기 쉬운데 페이스북의 ‘좋아요(Like)’ 숫자를 단순 비교하는 것은 이러한 규모 차이를 적절히 반영하지 못한다는 문제의식에서 출발했다. 그래서 백만 달러 수익 당 ‘좋아요’ 수를 환산해 지수화시킨 것이다. 그 지수를 대표적인 브랜드 가치 척도인 인터브랜드사의 브랜드 지수와 비교해 보아도 상당한 상관관계를 나타내는 것으로 드러났다. 다만 페이스북이라는 소셜 네트워크상의 브랜드 가치이기 때문에 해당 브랜드의 고객 구성이라든가 전략 방향에 따라서 LPM이 인터브랜드 지표보다 높거나 낮을 수는 있다. 이러한 비교 자체도 해당 브랜드의 현재 포지셔닝이나 특정 고객층에 대한 상대적 위치를 짐작할 수 있게 해 준다는 데서 의미가 있다.

온라인 활동의 성과를 측정하는 데 있어 어디에나 적용되는 정확한 지표가 존재할 수는 없다. 매체의 특성, 활용 목적, 기업의 특징 등을 감안해 자사 고유의 기준을 고민해야 할 것이다.

(2) 누가 영향력자인가?

소셜 미디어가 있을 때나 없을 때나 소문이란 원래 ‘일파만파’ 번진다. 차이점이라면 사람 사이의 관계와 정보의 흐름이 공개된 소셜 미디어에서는 소문의 중심에 누가 있고 그 정보가 어떤 흐름으로 어떻게 퍼지는지 파악할 수 있다는 점이다. 널리 알리고 싶은 소문이 있거나 반대로 감추고 싶은 소문이 있는 경우 누가 그 중심에 있는지 파악하는 것은 매우 중요하다. 소셜 분석에서 네트워크 분석이 가장 주목 받을 수 밖에 없는 이유다.

일반적으로 ‘인맥이 좋은’ 사람은 알고 있는 사람들이 많기도 하지만 중요한 사람, 다방면의 사람을 고루 알고 있는 사람이다. 소셜 네트워크 안에서 영향력자를파악할 때도 마찬가지다. 친구나 팔로워 수가 많은 사람도 중요하지만, 네트워크는 작아도 정보를 전파하는 데 적극적이거나 다른 성격의 집단과 연결고리가 되는 매개자들도 중요하다. 각각의 중요성은 기업의 활동이 어느 정도 범위의 네트워크를 대상으로 하는지, 무엇을 의도하는지 등의 여부에 따라 달라질 수 있다.

세계 최고의 자연과학 연구소 중 하나인 독일 막스플랑크 연구소팀은 ‘백만 팔로워의 오류(The Million Follower Fallacy)’라는 보고서를 통해 “팔로워가 많은 사람이 인기 트위터리안일 수는 있지만 반드시 영향력 있는 트위터리안이라고 할 수는 없다”는 사실을 증명하기도 했다. 팔로워 수가 많은 소위 ‘파워 트워터리안’은 다른 사람들의 트위터에 대한 관심보다 본인의 트위터 운영에 더 관심을 가지고 팔로워 확장과 관리에 집중하는 경향을 보인다는 연구 결과도 있다. 따라서 기업의 트윗을 확산하는 것이 주 목적이라고 한다면 자신의 메시지를 주로 보내고 타인의 메시지를 전달하는데 소극적인 ‘파워 트위터리안’을 찾을 것이 아니라 네트워크 내 정보 흐름에 영향을 줄 ‘정보 전달자’를 찾아 집중 관리하는 것이 더 효과적일 수 있다.

(3) Data 활용이슈

소셜 분석은 정의상으로는 소셜 미디어 데이터 외에도 넓은 의미에서는 블로그, 카페, 유튜브, 웹문서 등 인터넷상에 올라오는 각종 정보를 분석 대상으로 삼는다. 하지만 현실적으로 소셜 분석에 활용되고 있는 대부분의 데이터는 확보와 분석이 용이한 트위터에 국한되어 있다. 물론 트위터는 네트워크의 확산성이나 정보의 즉시성 측면에서 나름 의미가 있는 정보원이지만 트위터 분석이 곧 소셜 분석처럼 받아들여지는 것은 문제가 있다. 지난해 한국을 방문한 오스만 라라키 트위터 부사장도 ‘트위터는 아직 전체의 의견을 대표하기에는 부족하다’며 기존 미디어나 여론 조사를 대체할 대안으로서 트위터 데이터의 한계를 언급한 바 있다. 트위터와 같은 일부 소셜 미디어 분석을 소셜 분석이라고 하는 것도 과장이지만, 반대로 소셜 분석을 빅데이터 분석인 것처럼 포장해 지나치게 기대를 부풀리는 것도 문제다. 소셜 미디어 데이터는 빅데이터의 일부에 불과하다. 데이터를 누르면 자판기처럼 답이 나오는 자동화된 분석은 진정한 빅데이터 시대가 오면 모르겠지만 적어도 소셜 분석, 그것도 트위터에 국한된 일부 데이터만을 활용하는 불완전한 소셜 분석에서는 기대할 수 없다.

결국 문제는 소셜 분석 자체에 있는 것이 아니라 트위터에 편향된 데이터와 매체별 데이터 특성을 고려하지 않은 지나치게 높은 기대에 있다. 따라서 가장 기본적으로는 분석 대상이 되는 소셜 미디어를 다원화시키고 매체별 특성에 맞는 활용을 고민해야 한다. 예를 들어 트위터는 타임라인 기준의 실시간 소통으로 정보 공유 및 확산이 주 목적이기 때문에 빠르게 트렌드를 파악하는 데 유리하다. 다만 개인간의 관계가 다소 느슨하고 사용자의 개인 정보가 많지 않아 타깃 마케팅의 용도로 활용하기에는 제약이 있다. 반면 페이스북은 트위터보다 폐쇄적이고 지인들간의 소통 중심이기 때문에 관심사 등이 유사한 집단을 찾아내 타깃 마케팅을 펼치기에 유리하다. 개인 정보 노출에 대한 논란이 있는 것은 앞으로 정보 활용에서 주목해야 할 이슈다. 플리커는 주제별로 다양한 사진과 사람들이 올린 관련 태그 정보를 통해 제품이나 조사 대상에 대한 연상의 흐름을 이미지 맵으로 보여준다. 예를 들어 존 레논에 대한 이미지를 찾아 연관 태그 분석을 하면 존 레논의 일대기를 이미지 맵으로 볼 수 있다. 또한 장소에 대한 키워드를 입력하면 해당 지역 근처에서 가 볼만한 다른 관광지 정보도 얻을 수 있다. 유튜브도 플리커처럼 동영상 관련 태그를 분석해 유사 동영상끼리의 관계망을 그려보며 대상에 대한 정보를 파악한다던가 댓글 정보를 분석해 사람들의 구체적인 반응을 수집해 낼 수 있다. 장문의 블로그는 트위터나 페이스북 같은 단문 메시지와는 달리 키워드 몇 개만 가지고 단순히 긍정, 부정, 중립을 구분하는 것 보다 어떤 면에서 긍정, 또는 부정적으로 생각하는지 구체적인 원인 파악의 통로로 사용할 때 유용하다.

Ⅳ. 소셜 분석은 발전 중

가트너의 수석 애널리스트 제니 수신(Jenny Sussin)은 현재 소셜 분석 분야는 잠재 시장의 5~10% 정도만 침투했을 뿐이며 특히 단순 모니터링이 아니라 분석 결과를 경영 활동에 필요한 다양한 예측 목적으로 활용하는 기업들은 5%도 채 되지 않을 것이라고 말했다. 엄밀히 말하면 소셜 ‘분석’은 아직 제대로 시작되지도 않은 셈이다. 그럼에도 불구하고 아직 제대로 싹트지도 못한 소셜 분석에 벌써부터 거품론이 등장하는 것은 최근 IT 분야에서 가장 뜨거운 화두인 ‘빅데이터’ 분석에 대한 관심 덕분에 소셜 분석에 대한 잘못된 기대가 높아진 탓도 있다. IT관련 시장조사업체 하이파티아 리서치 그룹(Hypatia Research Group)이 지난해 소셜 분석 서비스를 도입하고 있는 기업 경영자 500인을 대상으로 한 조사에 따르면 40%에 가까운 경영자가 소셜 분석과 관련된 분야에 마케팅 예산의 5% 이상을 투자할 계획이라고 한다. 하지만 보고서는 아직도 대부분의 기업이 소셜 분석을 어떻게 활용하겠다는 목적보다 ‘활용하면 좋겠지’라는 막연한 기대만을 가지고 있을 뿐이라고 지적했다.

소셜 분석은 질문을 하면 무엇이든 대답해 주는 지니의 요술램프가 아니다. ‘소셜 분석에 얼마를 들였는데 결과는 고작……’이라고 ROI를 따지기에 앞서 기업 내부에서 소셜 분석을 어떻게 활용할 것인지에 대한 뚜렷한 목표를 세우는 것이 더 중요하다. 분석은 전문 업체가 해 줄 수 있지만 사업에 시사점을 찾는 것은 결국 기업의 역할이다.

또 현재로서는 데이터와 분석 기술의 한계로 시장 조사 등 기존 조사의 대체가 아닌 보완 차원에서 활용하는 것이 바람직하다. 특히 텍스트 분석과 같은 일부 기술들의 경우 계속 발전하고 있기는 하지만 아직까지는 전체적인 맥락을 파악하기 위한 참조값 정도로 고려할 수준이다.

마지막으로 데이터의 양에 함몰되지 말아야 한다. 소셜 분석의 장점 중 하나는 엄청난 데이터임에 분명하지만 여론의 바로미터가 되기에는 아직 그 데이터가 완전하지 않다. 페이스북, 트위터에서 보여준 여론과 실제 투표 결과의 차이가 말해주듯 완전하지 않은 데이터에 기반한 여론 예측이 오히려 현실을 왜곡할 수도 있다. 반면 수집된 데이터 양이 적더라도 어떻게 이슈를 바라보았는지에 따라 충분히 통찰력을 얻을 수도 있다.

향후에는 소셜 미디어 데이터 수집의 범위가 트위터, 페이스북을 넘어 블로그, 카페, 유튜브 등 다양한 매체로 확대되면서 종합적인 통찰력을 제시하는 방향으로 발전해야 한다. 현재의 기초 통계, 키워드 나열 등 묘사적 수준의 정보에서 벗어나 핵심적인 성과 지표의 개발과 개별 소셜 미디어의 특성을 반영한 분석이 가능할 때 정말 가치 있는 대안이 될 수 있을 것이다.[정지혜 책임연구원 jyes@lgeri.com]

*위 자료는 LG경제연구원이 발표한 보고서의 주요 내용 중 일부 입니다. 언론보도 참고자료로만 사용할 수 있습니다.

웹사이트: http://www.lgeri.com

연락처

LG경제연구원
정지혜 책임연구원
02-3777-0537
이메일 보내기