[김대식의 브레인 스토리][38] 컴퓨터의 '빅 데이터' 분석은 인간 뇌의 정보 처리 방식 모방한 것

조선일보
  • 김대식 KAIST 교수·뇌과학
    입력 2013.06.25 03:03

    김대식 KAIST 교수·뇌과학
    알렉산더 대왕의 후계자 중 한 명이던 프톨레마이오스 1세는 이집트 알렉산드리아에 세계 최대 도서관을 설립한 당사자로 유명하다. 로마공화국에 의해 정복될 때까지 300년간 이집트를 통치했던 프톨레마이오스 왕조는 알렉산드리아에 들어오는 모든 방문객의 책을 압수해 복사본을 만들었다고 한다. 헬레니즘의 영향을 받은 그들이 물론 책 수집 그 자체를 사랑했었을 수도 있지만, 조금 더 다른 생각을 해볼 수도 있다. 책은 정보고, 정보를 가진 자가 세상을 통치한다는 사실을 프톨레마이오스 가문은 이미 알고 있었을 수도 있다.

    알렉산드리아의 도서관이 파괴된 지 1500년 넘은 오늘 미국 국가안보국(NSA· National Security Agency)의 인터넷 감시 프로그램 '프리즘'이 큰 이슈가 되고 있다. 구글·페이스북·야후·MS 등의 인터넷 이메일, 메시지, 동영상, 검색기록 등을 대량으로 수집하고 분석했다는 것이다. 인터넷 정보 전달 기본 방식인 TCP/IP 구조상 정보는 작게 나뉘어 가장 가까운 길이 아닌, 가장 저렴한 길을 따라가게 되어 있다. 대부분 인터넷 라우터들이나 서비스 제공자들이 미국에 있어 세계 모든 정보가 미국을 지날 확률이 상대적으로 높을 수밖에 없다는 이야기다. 문제는 이 천문학적으로 많은 정보를 어떻게 분석할 수 있느냐는 점이다. '폭탄'이라는 단어가 들어 있는 테러리스트들 간의 이메일과 '폭탄주' 마시러 가자는 일반 시민의 문자 내용을 자동으로 구별해야 한다는 기술적 문제가 생기게 된다.

    미국 국가안보국 인터넷 감시 프로그램‘프리즘’로고.
    대규모로 수집된 데이터를 통해 통계학적 패턴을 자동적으로 찾아내는 게 현대 '빅 데이터(big data)'와 '데이터 마이닝(data mining)'의 목적이라 할 수 있다. 이를 위해 다양한 통계학적 또는 기계학습(machine learning) 방법들을 생각해볼 수 있겠지만, 근래에는 뇌의 정보 처리 과정을 모방한 '깊은 학습'(deep learning) 방법이 많은 관심을 받고 있다. 시각 뇌에서 사물에 대한 다양한 정보가 계층적으로 나뉘어 처리되는 방법을 모방한 깊은 학습 방법은 이미 다양한 데이터 마이닝 문제에 사용되고 있다. 구글 차세대 연구 담당을 하는 'X-실험실'에서는 깊은 학습 방법으로 인터넷상에 있는 사진 중 '고양이' 같은 동물 사진을 자동으로 찾아내기도 했다. 그런가 하면 중국 검색 엔진 회사인 '바이두'는 '깊은 학습 연구소'를 설립해 구글과 경쟁에 나서고 있다.

    회학자 막스 베버(Max Weber)는 "무력을 합법적으로 독점화"한 게 바로 현대국가라고 정의한 바 있다. 온라인 세상에 존재하는 다양한 테러 위험이나 범죄 예방을 위해서 인터넷 정보 역시 어느 정도 독점화되어야 할 수도 있겠다. 하지만 합법적이지 않은 무력의 독점화는 독재가 되듯, 시민과 국회의 통제가 없는 정보 독점화 역시 위험한 결과를 낼 수 있다.
    내가 본 뉴스 맨 위로

    내가 본 뉴스 닫기