본문내용 바로가기

빅데이터를 알면 미래가 보인다
최신 트렌드 읽는 법2015/10/16by 현대자동차그룹

빅데이터로 언어의 변화를 추적하는 일은
우리의 삶에 어떤 영향을 미칠까요?

빅데이터를 통해 우리는 무엇을 알 수 있을까요?
l 빅데이터를 통해 우리는 무엇을 알 수 있을까요?



8월 1일부터 9월 21일까지 약 2달 동안의 현대자동차그룹 공식 홈페이지 인기검색어는 무엇이었을까요? 바로 채용 관련 키워드였습니다. 더불어 커뮤니케이션 채널 관련 키워드도 인기를 끌었죠. 많은 사람들이 회사를 이해하기 위한 접근으로 그룹의 사보나 방송을 찾는다는 걸 알 수 있었습니다. 빅데이터가 각광받고 있는 요즘엔 이와 같은 키워드 분석이 활발히 이뤄지고 있습니다. 빅데이터는 왜 필요하며, 그 결과는 어떻게 활용할 수 있을까요?



언어의 변천을 보여주는 로봇의 등장

앤그램 뷰어는 구글 북스 프로젝트로 축적된 데이터를 분석해 그 결과를 보여주는 도구입니다
l 앤그램 뷰어는 구글 북스 프로젝트로 축적된 데이터를 분석해 그 결과를 보여주는 도구입니다

최근 현대자동차그룹 블로그에선 현대자동차 쏠라티 관련 키워드가 상위 10위권 인기검색어 중 30%를 차지했습니다. 미니버스, 캠핑카 등과 함께 검색됐죠. 캠핑과 레저 문화에 대한 최근의 뜨거운 관심을 알 수 있습니다. 이처럼 IT분야의 발달로 하나의 네트(Net)로 묶인 현대 사회는 사람들이 자주 사용하는 문자, 관심 대상 등이 순식간에 수치화, 동기화됩니다. ‘오늘은 어쩐지 캠핑이 가고 싶어지네요’와 같은 자연스러운 문장까지도 모두 데이터에 포함되어 분석이 가능해졌죠.

언어 분석을 통해 우리는 무엇을 알 수 있을까요? 의사소통의 핵심수단인 언어는 인류 문화를 총체적으로 연구할 수 있게 해주는 거대한 소우주입니다. 방대한 문헌 기록 속에서 언어를 분석하면 인류의 변화를 추적할 수 있죠. 빅데이터를 활용하면 인류 지식의 흐름이 보입니다.

구글의 공동 창업자 래리 페이지(Larry Page)는 2002년 전 세계 도서관에 있는 책들을 스캔해 디지털화하겠다는 목표를 천명했는데요. 2010년 공개된 앤그램 뷰어(Ngram Viewer)는 800만 권의 출판물을 데이터베이스로 삼아 지난 200년 동안 출판된 책과 잡지 등에서 특정 단어들이 특정 시기에 얼마나 많이 쓰였는지를 눈깜짝할 사이에 보여주죠. 1800년 이래로 170년이 넘도록 인류는 암(Cancer)보다 열(Fever)에 대해 더 자주 이야기했으나, 1973년 역전돼 2000년에 이르러선 암이 열에 비해 3배나 더 자주 언급됐다는 걸 굳이 200년을 살며 다 겪지 않더라도 알게 됩니다.



인류의 두뇌를 스캔할 수 있는 하나의 툴

이미 광고회사와 마케팅 회사들은 거의 실시간으로 언어의 변화를 분석합니다
l 이미 광고회사와 마케팅 회사들은 거의 실시간으로 언어의 변화를 분석합니다

빅데이터를 통해 본 언어, 문화의 변화는 사실 직관적으로 느낄 수 있는 것들입니다. 학자들의 연구 결과나 일반인의 상식에서 크게 벗어나지는 않습니다. 하지만 화성에 도착한 탐사로봇이 보내온 화성의 모습이 우리가 상상했던 것과 크게 다르지 않은데도, 우리는 눈에 들어오는 화성의 지표면을 보고 감격합니다. 막대한 데이터에서 나타난 수량적 변화를 갖고 추적한 언어의 변화를 눈으로 목격하는 것 역시 매우 흥분되는 일입니다.

빅데이터를 통해 언어의 진화를 추적하는 작업은 이제 시작에 불과합니다. 현재 우리가 쓰는 말과 글은 곧바로 전자 데이터로 저장되고 있습니다. ‘기하급수적’이라는 표현으로 다 담을 수 없을 정도로 빠르고 크게 데이터가 증가하고 있죠. 이미 광고 회사와 마케팅 회사들은 거의 실시간으로 언어 쓰임새의 변화를 들여다봅니다. 조금 비약하자면, 인류의 뇌를 실시간으로 살펴볼 수 있게 된 것이죠. 이렇게 본 것에서 무엇을 읽어내는가는 개인의 호기심, 학문적 탐구의 문제를 넘어 인류의 미래에도 영향을 미치게 될 것입니다.



글. 김재중 <경향신문> 기자









TOP