[김대식의 브레인 스토리] [281] 기계는 어떤 보상을 기대할까?

조선일보
  • 김대식 KAIST 교수·뇌과학
    입력 2018.03.14 03:09

    김대식 KAIST 교수·뇌과학
    김대식 KAIST 교수·뇌과학
    우리가 열심히 일하는 이유는 다양하다. 높은 연봉과 복지를 기대할 수도 있고, 미래 가능성과 일 그 자체로서의 의미를 더 중요하게 생각할 수도 있다. 그렇다면 만약 머지않은 미래에 인공지능 기술로 무장한 기계들이 일을 한다면? 공장을 운영하고, 국가 자금을 관리하고, 새로운 반도체를 설계하게 될 기계들. 그들은 어떤 보상을 기대할까?

    물론 이렇게도 생각할 수 있겠다. 기계는 우리가 켜면 작동하고, 끄면 멈추지 않는가? 스위치만 누르면 잘만 돌아가는 전자레인지같이 인공지능 역시 인간의 명령에 복종만 하면 되지 않을까? 하지만 여기서 문제가 하나 생긴다. 최근 인공지능 시스템들은 기계 학습을 전제로 한다. 예를 들어 강아지와 고양이를 구별하는 기계를 만들기 위해선 빅데이터를 통한 학습이 필요하다는 말이다. 물체 인식에서는 강아지 또는 고양이라는 정답이 정해져 있기에 가능한 일이다.

    하지만 기계가 만약 다양한 선택을 요구하는 복잡한 절차를 학습해야 한다면? 바둑은 한 번의 선택이 아닌 수백, 수천 번의 선택을 잘해야만 이길 수 있다. 이럴 경우 기계의 선택이 사전에 정해진 결과에 접근할 때마다 보상해주는 '강화 학습'을 사용할 수 있다. 강화 학습은 하지만 본질적인 문제를 하나 가지고 있다. 어떤 선택을 강화하고 보상해주어야 할까? 바둑이나 비디오게임같이 정확한 목표가 주어진 상황에서의 보상은 상대적으로 쉽다. 하지만 기계가 만약 우리가 의도하지 않은 방식으로 문제를 해결하려 한다면? 극단적인 예를 들어보자. 실업률을 낮출수록 더 많은 보상을 받는 강화 학습으로 훈련된 미래 인공지능을 상상해보자. 기계는 새로운 일자리를 만들 수도 있지만, 반대로 일자리를 찾는 사람들을 없애버릴 수도 있다.

    사회·경제·정치·국방에서의 핵심 임무들을 인간이 아닌 기계가 책임지게 될 미래 사회. 우리가 원하는 것과 기계가 원하는 것이 일치하는 완벽한 보상 시스템을 반드시 설계해야만 하는 이유다.

    내가 본 뉴스 맨 위로

    내가 본 뉴스 닫기