- 이 글의 축약본은 조선일보(2012. 5. 25) 컬럼에 게재되었습니다.

 

1. Prologue

 

IT업계에 2~3년 동안 클라우드 컴퓨팅 바람이 거세게 불더니, 이제는 그 바람이 빅 데이터로 옮겨 붙었다. 내 노라 하는 글로벌 IT 기업들은 모두 빅 데이터 관련 비즈니스에 뛰어들고 있다. 전문가들은 빅 데이터가 정부와 기업의 생산성을 획기적으로 개선시킬 것이고, 빅 데이터를 활용한 새로운 비즈모델과 제품도 크게 성장할 것이라고 전망하고 있다.

그러나 내 생각은 좀 다르다. 빅 데이터는 분명한 대세이며, 우리 생활 모든 곳에 깊숙이 스며들 것이다. 하지만 기업이 빅 데이터를 활용해서 돈을 벌기는 쉽지 않다. 그 이유는 대략 다음의 세 가지이다.

- 생산성의 역설: IT 투자가 늘어도 이것이 기업의 생산성 향상으로 이어지는 건 어렵다.

- 군비 경쟁: 모든 기업이 빅 데이터를 도입하면 기업 간 경쟁력 차이는 나지 않는다.

- 개인화된 마케팅에 대한 환상: 일정 수준 이상의 개인화는 마케팅 성과에 큰 도움이 되지 않는다.

그에 비해 빅 데이터 관련 하드웨어와 솔루션 회사들은 큰 돈을 벌 것이다. 기업과 공공부문이 앞 다투어 빅 데이터 투자를 할 것이기 때문에. 군비 경쟁이 벌어지면 군수업체가 돈을 버는 것과 같은 이치이다.

 

 

2. 빅 데이터란 무엇인가 - Volume, Velocity & Variety

 

맥킨지 컨설팅은 빅 데이터를 “일반적인 데이터베이스 소트프웨어 툴로 저장·관리·분석하기 어려울 정도로 큰 규모의 데이터 세트”라고 정의하였다. 지난해 전 세계에서 생성된 디지털 정보의 총량이 1.8ZB(Zetabyte)를 넘어섰고, 2년마다 2배씩 증가하여 2020년에는 50ZB에 이를 것이라고 한다. (1.8ZB는 2시간 분량의 HD급 영화 2000억 개의 정보량에 해당하는데, 이는 한 사람이 쉬지 않고 4,700만 년 간 시청해야 하는 분량이다.) 이처럼 데이터가 급격하게 증가하는 이유는 SNS와 M2M(Machine-to-Machine) 통신이 활성화되면서 엄청난 양의 데이터를 쏟아내기 때문이다. 예컨대 페이스북에서는 매일 2.5억 명이 사진을 업로드하고 27억 개의 ‘좋아요’와 댓글이 생성되고 있다.

그러나 빅 데이터는 단순한 용량(Volume)뿐 아니라, 속도(Velocity), 다양성(Variety)이라는 측면에서 기존의 데이터와 뚜렷한 차이를 보인다. 먼저 속도와 관련해서는, 각종 센서를 통해 입수하는 사물정보, 스트리밍 정보 등 실시간성 정보가 증가하고 있다. 따라서 실시간으로 쏟아지는 대규모 데이터를 처리하고 이를 실시간으로 활용하기 위해서는, 데이터 처리 속도가 중요하다. 한편 다양성이라 함은, 동영상·음악·SNS 메시지·진료기록 등 데이터마다 크기와 내용이 제각각인 상황을 의미한다. 이처럼 비정형 데이터가 90% 이상을 차지하기 때문에 새로운 분석 기법이 필요하다.

 

 

3. 빅 데이터 관련 기업 - 돈을 버는 쪽

 

빅 데이터를 제대로 활용하기 위해서는 네트워크·스토리지·컴퓨팅 파워·처리 및 분석 SW· 인공지능 기술들이 종합적으로 어울러져야 한다. 특히 인공지능은 비정형 데이터를 분석하고, 사람과의 상호작용을 통해서 정보를 입·출력하기 위해서는 반드시 필요한 기술이다. 최근에 IBM의 Watson 컴퓨터나 애플의 Siri가 주목을 받는 것도 이처럼 빅 데이터에서의 활용 가능성 때문이다.

한편 빅 데이터는 본질적으로 클라우드 컴퓨팅을 기반으로 한다. 정보를 생산하는 주체가 M2M, SNS, 온·오프라인 상의 소비자 등 다양한 위치에 있기 때문에 정보의 생산과 저장, 그리고 처리가 여러 곳에서 이루어질 수밖에 없다. 또한 대규모 데이터를 처리하기 위해서는 다수의 스토리지 및 서버를 마치 하나처럼 묶어서 사용할 수 있는 분산 컴퓨팅이 필요한데, 이러한 인프라와 SW는 모두 클라우드 컴퓨팅에서 사용되고 있는 것이다.

다양한 기업들이 빅 데이터를 가능하게 하는 하드웨어와 솔루션을 제공하고 있다. EMC·히타치·HP·델은 자신의 하드웨어 역량을 근간으로, 한편 IBM·MS·SAP·오라클 등은 SW에서의 강점을 최대한 살리면서, 빅 데이터에 대한 통합 솔루션을 제공하려고 노력하고 있다. 그리고 이들 글로벌 기업들은 자신에게 부족한 역량을 채우기 위해서 빅 데이터 전문 벤처기업들을 적극적으로 인수·합병하고 있다.

한편 아마존과 구글 등은 빅 데이터를 자신의 본업에 활용하는 이외에도, 자신들의 클라우드 컴퓨팅 기반을 이용하여 다른 기업들에게 빅 데이터 서비스를 제공하고 있다. 예컨대 구글은 빅쿼리(BigQuery)라는 서비스를 출시하였는데, 이는 기업고객들이 자신들의 대규모 데이터를 구글의 클라우드 인프라에 업로드해서, 구글의 컴퓨팅 파워와 솔루션을 활용하여 분석하도록 하는 서비스이다. 아마존도 아마존 웹 서비스(AWS)라는 이름으로 유사한 서비스를 제공하고 있다.

전문조사기관인 IDC에 따르면, 하드웨어, 소프트웨어 서비스 등 빅 데이터 전 분야에 걸쳐 기업들이 2015년까지 1,200억 달러를 투자하게 될 것이라고 추정하고 있다.

 

 

4. 빅 데이터를 활용하는 기업 - 돈을 쓰는 쪽

 

빅 데이터를 활용하는 주체는 크게 기업과 정부로 나눌 수 있다. 기업은 다시 빅 데이터를 활용한 서비스나 제품을 소비자에게 판매하는 경우와 자신의 내부 경영활동을 위해 사용하는 경우로 나눌 수 있다. 전자의 대표적인 예가 빅 데이터 역량을 활용한 검색 서비스, 아이폰의 인공지능 서비스 시리(Siri), 실시간 교통정보를 활용한 내비게이션 서비스 등이다.

한편 후자에서 가장 주목받는 것은 빅 데이터를 활용한 개인화 마케팅이다. 물론 지금도 기업들은 고객 특성에 따른 세분화된 마케팅(segmented marketing)을 시도하고 있다. 그러나 이제는 SNS나 고객의 위치정보 등을 활용하면 훨씬 더 개인 맞춤형 상품을 제공할 수 있을 것으로 기대하고 있다. 이 밖에도 빅 데이터를 활용하면 재고관리·유통망 관리 등을 통한 효율성 제고, 의사결정 능력 향상, 기존에 발견하기 어려웠던 문제 발견 및 해결 능력 등이 향상될 수 있다. 조기 문제 발견의 대표적인 예로 볼보의 빅 데이터 활용 사례를 들 수 있다. 볼보는 자동차에 센서와 CPU를 내장하여 운전 과정에서 수집된 데이터를 자동 전송하도록 하여 빅 데이터를 축적·분석하고 있다. 따라서 종래에는 50만대의 차가 팔린 뒤에나 제기되었을 결함을 이제는 천여 대의 판매 시점에서 포착하여 사후 관리 비용이 크게 줄어들게 되었다.

대부분의 전문가들은 빅 데이터를 활용하는 기업의 성과에 대해서 아주 긍정적으로 전망하고 있다. 빅 데이터는 분명 중요한 변화이며 앞으로 기업경영에 깊숙이 녹아들게 될 것이다. 또 빅 데이터를 활용하여 성공적으로 새로운 비즈모델을 만드는 기업들도 있을 테고, 정도의 차이는 있겠지만 대부분의 기업들은 빅 데이터를 활용하여 고객가치와 효율성도 제고시킬 것이다. 그러나 그것이 기업의 전반적인 이윤 증가나 수익성 향상으로 연결되는 것은 아니다.

 

 

5. 빅 데이터로 큰 돈 벌기 어려운 세 가지 이유

 

그럼 왜 이런 현상이 생기는 걸까?

첫 번째가 ‘생산성의 역설(Productivity Paradox)' 가능성이다. 이와 관련하여 노벨 경제학상 수상자인 Robert Solow는 “어디에서나 컴퓨터를 볼 수 있지만 정작 생산성 통계에서는 볼 수 없다. (You can see computers everywhere but in the productivity statistics.)"라는 유명한 말을 남겼다. 즉 ’90년대 초반까지 연구들은 많은 IT투자에도 불구하고 생산성은 향상되지 않는 문제를 지적하였다. 물론 최근 연구들에 따르면 IT투자가 생산성 증대로 이어지는 것으로 나타나지만, 여전히 기업 간에는 생산성 향상의 편차가 매우 크다. 즉, IT를 잘 활용하면 생산성이 올라가는 것은 사실이지만, 모든 기업들이 그런 능력을 가진 것은 아니라는 뜻이다. IT투자가 생산성 향상으로 연결되려면 기업전략·프로세스·조직·인력 쇄신이 함께 이루어져야 하고, 이는 고도의 실행력과 시간이 필요한 과정이기 때문이다. 그런데 빅 데이터는 데이터의 규모, 비정형성, 속도 때문에 다른 IT투자에 비해 더 어렵다.

그래서 가트너는 포춘 500대 기업 중에서 85% 이상이 빅 데이터 활용에 실패할 것으로 예상했다. 각 기업마다 데이터는 엄청나게 늘고 있지만 이를 효과적으로 분석해 경쟁력 강화에 적용할 수 있는 기업은 별로 없다는 냉정한 판단이다.

과거에 ERP, CRM, e-biz 등 새로운 개념이 등장할 때마다 IT투자를 해 보았지만 실제론 별로 성과를 거두지 못했던 부정적인 경험은 이와 맥을 같이 한다.

 

두 번째 해석은 빅 데이터 투자를 ‘군비 경쟁’과 유사하게 보는 것이다. 즉, 군비경쟁이 붙으면 각국의 군사력이 좋아지긴 하지만, 두 나라간 군사력 차이는 그대로 라는 점에서 ‘소모적’이다. 예컨대 검색에 빅 데이터를 가미하고 시리 같은 인공지능을 붙이면 그만큼 제품이 좋아진다. 그러나 문제는 경쟁사들도 곧바로 이를 따라할 것이기 때문에 차별적인 경쟁력으로는 연결되지 않는다는 점이다. 설사 경쟁사들이 쉽사리 따라오지 못한다고 하더라도, 이런 종류의 제품에 대한 소비자들의 일반적인 반응은 “있으면 좋지만 돈을 지불할 용의는 없는 것(good to have, but unwilling to pay)"이다. 크리스텐센의 표현을 빌자면 소비자들이 원하는 수준의 품질을 넘어선 "존속적 혁신(sustaining innovation)"에 해당한다. 이런 제품에 대해 소비자에게 추가 부담을 시키는 것은 어렵다. 인터넷 서비스 업체들이 경쟁적으로 클라우드 서비스의 일환으로 스토리지를 무료로 제공하는 것이 이와 유사한 상황이다.

재고관리, 의사결정 지원 등 기업경영활동을 지원하는 빅 데이터 시스템도 분명 생산성 향상에 기여하겠지만, 경쟁기업들도 유사한 시스템을 도입할 것이기 때문에 차별적인 경쟁력과 수익성 향상으로 연결되기 어렵기는 마찬가지이다.

 

마지막으로 경계할 것은 개인화된 마케팅에 대한 지나친 기대이다. 지금도 많은 기업들이 고객 그룹별로 차별화된 마케팅(segmented marketing)을 시행하고 있다. 산업별로 큰 편차가 있긴 하지만, 이러한 마케팅이 매출 증대와 수익성 향상에 기여하는 것은 분명하다. 그러나 실제 기업 현장에서는 투자 대비 효과라는 관점에서 segmented marketing에 대한 부정적인 견해가 만만치 않다.

이것은 소비자들이 개인화된, 맞춤형 상품에 대해서 얼마나 가치를 부여하는지, 그리고 어느 정도의 개인화가 적정 수준인지에 대한 컨센서스가 없기 때문이다. 그러나 개인화를 더 많이 할수록 무조건 좋다는 결론은 위험하다. 개인화 정도에 완전히 비례하여 마케팅 성과가 좋아지는 것은 아니기 때문이다. (즉, 여기에도 한계생산 체감의 법칙이 작용한다.) 심지어는 빅 데이터에서 개인 이력·취향·위치정보 등을 취득하여 마케팅에 활용하는 것에 대해 소비자들이 거부감을 보일 가능성도 배제할 수 없다.

직접적으로 연관된 것은 아니지만, 가장 개인화된 플랫폼으로 평가받는 페이스북의 광고효과가 적다는 이유로 미국 GM이 광고를 중단한다고 최근에 발표하였는데, 개인화된 서비스의 가치에 대해서 시사하는 바가 크다. GM은 P&G, AT&T에 이은 미국의 3대 광고주로 지난해 페이스북에 4천만달러의 광고비를 지급하였다.

 

 

6. Epilogue

 

빅 데이터는 그 영향력이나 기업에 미치는 효과 등이 인터넷의 경우와 매우 유사하다. 인터넷은 기업경영의 일부가 되었다. 인터넷을 활용함으로써 고객에게 더 나은 서비스와 상품을 제공할 수 있게 되었고, 기업경영의 효율성도 증대되었다. 또 인터넷을 활용한 새로운 기업들, 예컨대 검색·포털·SNS·인터넷 상거래 기업들도 등장하였다. 그러나 대부분의 기업들에게 인터넷이 더 많은 이윤과 수익성 향상을 가져다 준 것은 아니다.

개별 기업의 입장에서 빅 데이터에 대한 지나친 기대나 냉소 모두 금물이다. 차분하게 자신의 위치를 점검하고 이를 바탕으로 꼼꼼한 실행 전략을 수립해야 한다.

 

Addendum: 빅 데이터를 정부와 공공부문에서 활용하는 것은 좀 다르다. 기업과는 달리 다른 조직과의 경쟁에서 이기는 것이 목표가 아니기 때문에, 빅 데이터 투자 대비 효율성 증대 또는 비용절감 가능성만을 비교하면 안 된다. 그런데 외국의 사례에서 볼 때 공공의료, 세금징수 등 공공부문에서 빅 데이터가 활용될 때 크게 비용절감을 할 수 있을 것으로 예상되고 있다.

그 밖에 국가 안보, 치안, 공공보건, 교통, 일기예보 등 경제적 효과를 측정하기 어려운 부분에서 빅 데이터의 활용은 이미 가시적인 성과를 보이고 있다. 따라서 이런 부분에 대한 투자는 기업에서의 투자와는 달리 정책적으로 판단해야 할 부분이다.

Posted by 조 신 :