Creating Value through Open Government Data in Big Data Industry: Forming an alliance and avoiding the lateral league
빅데이터의 강자는 누구일까? 구글, 아마존, 마이크로소프트가 언뜻 떠오른다. ’13년 9월 타임지의 커버 스토리는 ‘구글이 죽음을 해결할 수 있을까?(Can Google Solve Death?)’였다. 의학기업도 아닌 소프트웨어(SW) 기업이 죽음과 무슨 상관이란 말인가? 전문지식을 겸비하고 고도로 숙련된 사람에 한해 이루어지던 의학분야에도 인공지능기술을 활용하는 시대가 도래하였다. IBM에서 개발한 인공지능 기술인 왓슨은 암진단 정확도가 96%로 전문의보다 높다고 한다. 이러한 혁신의 배경에는 이세돌을 이긴 알파고에도 사용되어 유명세를 타고 있는‘ 딥러닝’ 알고리즘과 같은 인공지능 기술의 발전이 주를 이루고 있다.
그러나 숨은 이면에는 분석의 근간이 되는 다량의 데이터 축적이라는 것을 간과해서는 안 된다. 구글, 아마존, 마이크로소프트 등 글로벌 거대 SW기업들은‘ 누가 얼마나 많은 양질의 데이터를 보유하느냐’를 기업 경쟁우위에 핵심적인 요소로 인식하고 있다. 구글이 죽음을 해결하는데 앞장설지도 모른다는 타임지의 예상은 구글의 의학적 지식이 아닌 구글이 처리하고 있는 데이터 크기에서 근거하고 있다. 구글은 하루 평균 약 35억 건의 요청을 처리하고, 10엑사바이트(10exabytes≒100억 기가바이트)의 데이터를 저장하고 있다. 이러한 데이터 보유량의 크기는 의료 기업을 제치고 구글을 죽음 해결사에 가장 근접한 기업으로 만들었다.
국내 몇몇 기업들도 한발 늦긴 했지만 데이터 전쟁터에 발을 들여놓기 시작했다. 정부 또한 전 세계 1위의 전자정부 시스템을 활용하여 공공데이터 센터를 설립하고 공공데이터를 민간에 적극 제공함으로써 국내 기업들을 지원하고 있다. 이러한 결과에 힘입어 한국은 OECD 나라 중 공공데이터 개방지수 1위를 차지하기도 하였다.
그렇다면, 국내 기업은 데이터 전쟁 속에서 우위를 차지할 가능성이 얼마나 될까? 불행하게도 답은 “ 매우 희박하다”이다. 그 근거는 정보학에서 중요시하는 데이터의 정보화 가능성, 즉, 데이터의 유효성 혹은 활용가능성에서 기초한다. 단순히 많은 데이터가 있다고 하더라도 사용 불가능한 데이터가 월등히 많다면 그 속에서 유용한 정보를 뽑아내는 것은 쉽지 않다.
가트너(Gartner)에서 빅데이터의 개념을 3Vs (데이터의 양-Volume, 데이터 입출력 속도-Velocity, 데이터 종류의 다양성-Variety)로 정의한 이후, 얼마 되지 않아 IBM에서 4번째 V인 Veracity(진실성 혹은 정확성)를 추가한 이유이기도 하다.
국내에서는 정부의 공공데이터 개방정책에 힘입어 약 1만7,000여 건의 공공데이터가 민간에 제공되고 있다. 그러나 이를 활용한 민간사업은 약 853건 정도에 불과하다. 개방된 공공데이터의 양보다는 질을 먼저 고려해야 한다는 것을 단적으로 보여주는 예이다. 또한 한국이 단순한 개방정도를 측정하는 공공데이터 개방지수는 1위를 했지만, 개방형 데이터의 품질까지 고려한 순위인‘ 세계 공공데이터 지수’(Global Open Data Index)는 23위에 그친 이유이기도 하기도 하다.
정부에서 공개된 대부분의 데이터는 현재 원천데이터가 아닌 특정 주제에 관련된 정보를 정리한 엑셀 형태를 이루고 있다. 공개된 소수의 원천데이터들 조차 공통된 표준 부재, 중복 문제, 지속적인 데이터 제공이 아닌 일회성 데이터 등 여러 문제점 때문에 데이터 활용가능성이 매우 낮은게 현실이다. 더욱이 부처 간 파편화되어 제공되는 데이터를 모아서 유용한 정보를 만드는 일은 매우 쉽지 않는 일이다. 부처간 칸막이는 데이터에도 높게 존재하고 있다.
춘추전국시대를 평정한 중국 최초 통일 국가 진(晉)나라의 초대 황제인 진시황을 가장 위협한 전략은 합종이고, 가장 도움을 준 전략은 연횡이다. 조(趙), 한(韓), 위(魏), 제(齊), 연(燕), 초(楚)의 6개의 나라가 종적으로 연합하여 합종을 통해 진나라에 대항하여 진나라를 풍전등화의 위기에 몰아 넣었고, 이를 극적으로 해결하기 위해 진은 6개의 나라에게 각각 달콤한 제안을 통해 횡적인 평화 조약인 연횡을 이루어 합종을 와해하였다. 결국 진나라는 중국 최조의 통일국가를 세우게 되고, 6개의 나라는 역사의 뒤안길로 사라져 갔다.
정부에서는 부처 간 이기주의를 탈피하고 눈앞의 작은 이익을 위하다 결국 서로 반목하게 되는 연횡을 피하여야 한다. 궁극적인 빅데이터 산업 발전을 위해서 부처간 합종을 통한 공공데이터 허브체계 구축 및 표준화를 시행하여 민간에서 활용이 가능한 유용한 데이터를 제공하여야 한다. 이에 더해 국내기업들 간에 공동으로 데이터 분석 노하우를 공유하는 체계를 구축하여 기업 간 합종을 이룬다면 국내 기업이 구글, 아마존 등의 글로벌 거인을 제치고 데이터 전쟁의 승리자로 우뚝 설 수 있지 않을까 기대해 본다.