삼국지에서 가장 잔인한 전쟁은 ‘적벽대전’이다. 제갈공명(諸葛孔明)은 단을 쌓아 천지신명께 기도하고 바람을 부른다. 그는 천문 기상에 대한 경험적 혹은 사전적 지식을 가지고 있었다. 단(壇)에 깃발을 세워 바람의 풍향과 풍속을 정확히 수집하고, 기온, 구름, 지리적 특성 등의 데이터와 함께 종합적으로 분석하여 날씨를 예측하였다. 그리고 최종적으로 화공(火攻)을, 승리를 위한 최후의 수단으로 처방한다. 그는 이미 데이터를 분석하고 활용할 수 있는 최고의 전문가였다.
현대는 데이터 중심 사회다. 일상적으로 데이터를 분석하여 소비 트렌드, 기술의 발전 동향, 여론, 정책, 리더의 성향 등을 투입하여 의사결정을 한다. 자율주행차, 인공지능컴퓨터(이하 AI) 등도 데이터와 접목 없이는 존재할 수조차 없다. 때문에 ‘데이터를 21세기의 원유(Gartner. 2011)’라 주장하기도 한다.
데이터란 사실(fact)자체를 말한다. 이는 문자, 숫자 등으로 표현하는 정형화된 데이터와 스마트 기기 등을 통해 만들어지는 음성, 영상 등 비정형화된 데이터로 구분할 수 있다. 빅데이터는 이러한 모든 데이터를 종합하여 분석하고 처리함으로써 새로운 의미를 산출해 낸다. 빅데이터는 대량(Volume)의 데이터와 다양성(Variety), 그리고 빠른 처리(Velocity)를 그 속성으로 한다.
빅데이터 활용사례
대한민국은 ‘코로나19’의 세계적인 유행(汎流行 pandemic) 사태에서도 방역에 성공적으로 대처하는 국가 중 하나로 꼽힌다. 이는 “보균가능성이 있는 사람들의 활동데이터를 추적(Tracing:역학조사) 수집하고, 빠르게 검사(Testing)하여 치료할 수 있는 체제(3T: Tracing, Testing, Treating)를 만들어 재빠르게 대응할 수 있었기 때문”이라고 말한다.
스마트폰과 신용카드 시스템 그리고 CCTV에서 발생되는 모든 데이터는 네트워크 시스템을 통해 실시간으로 수집 저장된 후 과학적으로 분석되고 가공되어 방역 활동에 활용된다.
빅데이터를 창업이나 비즈니스 활동에 활용하는 것은 필수적이다. 검색엔진의 키워드 분석을 통하여 소비자 트렌드를 읽어 낸 후 사업계획을 수립하고 행동한다. 국내에서는 네이버의 ‘데이터랩(Data Lab)과 검색광고’, 구글 ‘트렌드(Trends)’, 다음의 ‘클릭(Clix)’ 등을 많이 활용한다.
서울의 심야버스(올빼미버스)운행노선은 심야시간에 통화량과 위치기반 데이터를 활용하여 배치한다. 구글의 플루 트렌드(Flu Trend)는 ‘감기’라는 키워드와 위치기반 데이터를 활용하여 감기가 발생한 지역과 유행의 경중을 찾아내기도 한다.
선거에서는 유권자에 대한 빅데이터를 과학적 분석하여 활용하는 것은 이미 일반화되었다. 2012년 오바마 선거캠프에서는 유권자들의 개인적 성향을 분석하여 민주당에 대한 지지확률, 설득할 수 있는 예상확률, 투표가능성 등을 선거운동에 활용함으로서 승리할 수 있었다.
빅데이터 활용의 그림자
빅데이터의 활용은 긍정적인 측면과 함께 부정적 측면도 목격된다. 개인정보의 남용은 사생활과 인권을 심각하게 침해한다. 뿐만 아니라 공권력에 의해 잘못 관리된 개인정보는 사람들의 행동을 감시하는 조지 오웰(George Orwell)의 『빅브러더(Big Brother. 1984)』처럼 시민을 통제할 수도 있다.
AI는 개인의 유전자와 학력, 구매형태와 삶의 방식, 커리어에 대한 스크리닝(screening)으로 맞춤형 상품이나 서비스를 추천한다. 사람들은 상품이나 서비스에 대한 정보에 의지하거나 추천받는 데 익숙해져간다. 스스로 선택할 수 있는 능력조차 상실하게 된다. 자기 선택능력이 거세된 사람은 꼭두각시처럼 쉽게 통제되고 조정된다. 이쯤 되면 데이터는 권력이 된다.
식별가능한 개인정보는 극히 제한된 범위에서만 사용될 수 있도록 보호되고 관리되어야 한다. 개인정보에 의한 사생활 침해와 공익목적으로 활용하는 것에 대한 균형점을 찾는 부단한 노력이 필요하다. 개인정보 보호와 빅데이터 활용은 상대적 관계가 아니기 때문이다.
모든 사람들은 자기가 알고 있거나 좋아하는 것을 확인하려는 확증편향성(確證偏向, Confirmation bias)을 가지고 있다. 유튜브 등 비즈니스 알고리즘은 개개인의 성향을 분석하여 그가 좋아하는 분야의 데이터와 정보를 제공할 수 있도록 프로그래밍되어 있다. 때문에 제공되는 맞춤형 정보를 무의식적으로 수용하다 보면, 스스로 편협한 의식의 덧에 갇혀 버리는 것을 경계하여야 한다. 무분별하게 수용하는 행태에서 벗어나 비판적으로 선별하고 소비해야 하는 이유다.
자타가 공언하듯 우리나라의 정보통신기술(IT)기반은 세계적이다. 초고속 연결망과 스마트 폰 보급률, 전자화된 사회 환경과 디지털 사회에 빠르게 적응하는 국민들은 대한민국의 자산이다. 한마디로 우리나라의 빅데이터 토양은 비옥하다. 이를 활용하여 ‘코로나19’ 이후 문명사적 변화의 소용돌이에서 선진국으로 도약할 수 있는 절호의 기회다.
구슬이 서 말이라도 꿰어야 보배다. 아무리 좋은 IT기술과 정보통신망 등, 기반시설과 하늘 뒤엎는 데이터가 있어도, 이를 분석 가공하고 구조화시키지 않으면 쓰레기일 뿐이다. 빅데이터를 분석하고, 이를 활용하여 미래를 예측하고, 자기성장과 국가 및 사회발전에 활용할 수 있는 ‘바람을 부르는 공명(孔明)의 지혜’를 기대해본다.