인공지능 알파고가 남긴 숙제

알파고 충격은 역설적 행운

알파고와 이세돌 기사의 대국은 우리 국민들에게 인공지능의 능력과 한계를 명확하게 보여주었다. 대국 전에는 이세돌이 전승할 것이란 예측이 우세했었으나 첫 번째 대국에서는 “어 알파고 생각보다 잘하네”하더니, 두 번째 대국에서는 많은 분들이 “와 알파고 놀랍네. 사람이 못 보는 수도 두네”라고 했다. 세 번째 대국도 알파고 승리로 이어지니까 “인공지능이 인간을 지배하나?”라고 하며 충격에 빠졌다. 네 번째 대국에서는 이세돌이 이기니까 “인간 승리”라고 안도하면서도 인공지능이 실수도 한다고 어리둥절하더니, 다섯 번째 대국에서는 “역시 인공지능이 대단하구나”라고들 반응했다.
소프트웨어의 중요성을 역설하고 다니던 인공지능 학자로서 알파고가 인공지능의 능력과 중요성을 전국민에게 깊이 있게 각인시켰으니 이 얼마나 좋은 일인가? 더구나 알파고가 전승했으면 인공지능에 대한 맹신이 있었을 텐데 한번은 져줌(?)으로서 그 한계도 알려주어서 금상첨화였다.
알파고 덕분에 청와대 간담회에도 참석하는 영광을 누렸다. 이 자리에서 박 대통령은 우리 국민이 받은 알파고 충격을 역설적 행운이라고 평가하며 이를 계기로 혁신을 가속화하자는 취지의 말씀이 있었다. 알파고는 우리 사회에 과연 어떤 숙제를 남겼는지, 우리는 그 숙제를 어떻게 풀어야 하는지 알아보고자 한다.
알파고는 인류의 승리
알파고의 성과는 인류의 승리다. 인공지능은 인간 지능의 산물이기 때문이다. 경기의 승패와 관계없이, 이번 대국 그 자체가 인류 역사에서 커다란 기념비적인 사건이다. 인류가 생각을 담을 수 있는 컴퓨터를 발명한 것이 어언 70년. 이후 꾸준히 발전한 컴퓨터과학은 인간 최고수를 능가하는 바둑 프로그램을 만들기에 이르렀다. 많은 가능성을 순식간에 검토하여 최적의 한 수를 찾아내는 능력은 계산 속도에 의한다고 하더라도 기보를 통해서 수를 배우고, 기계끼리 두는 바둑에서 좋은 수를 더하는 학습능력이 놀랍지 아니한가? 컴퓨터 프로그래밍을 예술이라고 하지만 아, 알파고는 최고의 예술 작품이다 !

컴퓨터와 기계학습은 인류 최고의 발명

컴퓨터는 인류 역사상 최고의 발명품이다. 사람의 생각을 옮겨서 자동화하는 기계이기 때문이다. 사측계산과 비교하는 능력뿐인 이 기계에게 일을 시키는 것은 사람이 작성한 프로그램, 즉 소프트웨어다. 소프트웨어의 명령에 따라 컴퓨터는 빠른 속도로 지시된 작업을 수행한다. 반도체 기술에 의하여 컴퓨터 하드웨어는 손톱만해 졌지만 엄청난 속도와 계산 능력을 갖게 되었다. 컴퓨터가 여기 저기에 탑재되고, 그 위에 소프트웨어로 해결책을 만들어 나누어 쓰는 것이 일상이 되었다.
그런데 역사적 사건이 일어났다. 컴퓨터가 학습할 수 있도록 프로그램을 만드는 방법을 인간이 터득한 것이다. 지난 50여년간 인공지능 학자들의 연구를 통해서 점진적으로 발전시켜 얻어진 것이지만 그 성과는 충격적이다. 컴퓨터가 데이터로부터 배운다! 물고기를 주지 말고 물고기를 잡는 방법을 가르쳐주라는 격언이 실현된 것이다.
컴퓨터는 이제 사람이 가르쳐 주지 않아도 데이터로부터 학습하여 프로그램을 만들어 내는 능력이 생겼다. 18년전 서양장기에서 인간 최고수를 물리친 딥불루는 사람이 만든 프로그램이 판단은 했었지만 이번 알파고는 기보로부터 배운 능력과, 또 자기들끼리의 대국에서 스스로 깨우친 능력으로 대국에 임했다. 기계학습의 가공할 능력을 전 세계인이 같이 본 것이다. 알파고를 만든 개발자들도 그 능력에 놀랐다고 하지 않는가!

알파고에서의 학습

바둑은 매 순간 놓을 수 있는 수가 평균적으로 200개 정도된다. 따라서 바둑 판이 만드는 모든 경우의 수는 10의 170승, 즉 10 다음에 0이 170개 있는 큰 수가 된다. 전통적인 탐색기법으로는 아무리 빠른 컴퓨터라고 할지라도 이를 주어진 시간 내에 다 탐색하여 좋은 수를 고를 수 없다. 어쩔 수 없이 판세에 따른 어림셈이나 확률적 판단을 할 수 밖에 없다.

바둑의 경우의 수는 우주 상의 원자 수보다 많다

<그림 1> 바둑의 경우의 수는 우주 상의 원자 수보다 많다

알파고는 판단을 하는데 세 가지의 학습 결과를 사용하였다. 첫 번째 학습 목표는 주어진 바둑 판의 상황에서 ‘다음 수를 어디에 놓아야 바람직한가’이다. 3000만개의 데이터로부터 학습하여 다음 수를 놓아야 할 곳의 확률을 구했다고 한다. 즉 ‘잘 두는 사람들이 이렇게 두더라’는 것을 배운 것이다. 이를 위해 알파고 팀에서는 딥러닝이란 이름의 신경망 기법을 사용하였고 이렇게 학습한 결과를 정책망이라고 부른다.
정해진 시간 내에 다음 수를 결정하여야 하기 때문에 알파고는 마지막 수까지 탐색하지 못하고 중간에서 중단하여야 할 경우가 대부분이다. 두 번째 학습 목표는 현 탐색 위치의 판세가 나에게 얼마나 유리한가를 학습하는 것이다. 알파고는 이 학습도 16만개의 기보로부터 딥러닝 신경망 기법을 사용하였다. 이렇게 학습한 결과를 가치망이라고 부른다.

알파고의 정책망과 가치망
<그림 2: 알파고의 정책망과 가치망 >

세 번째 학습은 알파고 프로그램끼리의 대국에 의하여 발생한 기보를 이용하여 판세를 학습한 것이다. 이는 사람이 두지 않았던, 그래서 기보로 존재하지 않았던 경우도 학습할 수 이는 강력한 기능이다. 컴퓨터끼리 두니까 쉬지 않고 기보를 모을 수 있다. 매일 3만회의 알파고 프로그램끼리의 대국을 진행시켰디. 작년 가을 프로2단인 영국 프로기사 판후이와의 대국에서 보인 능력보다 이번 이세돌과의 대국에서 알파고가 더 나은 기량을 보였던 것이 학습 때문이라고 판단된다. 물론 판후이와의 대국을 보고 알파고의 실력을 가름하는 것은 무리이다. 왜냐하면 알파고는 많이 이기는 것이 목표가 아니고 확실히 이기는 것이 목표이기 때문에 안전하게 두는 경향이 있기 때문이다.

인공지능 70년의 역사

인공지능은 지능이 필요로 하는 일을 기계에게 시키는 방법을 연구하는 컴퓨터과학의 한 분야다. 컴퓨터를 사람의 계산과 생각을 자동화하기 위한 기계라고 본다면 컴퓨터과학이 바로 인공지능 그 자체라고 할 수 있다. 지난 70년간 지속적으로 컴퓨터의 계산 능력을 키우고, 많은 데이터를 모으고 관리하는 기법, 사람이 쉽게 프로그램을 만드는 방법을 연구해 왔던 것이 오늘날 인공지능이 이룬 성과의 바탕이 되었다.
인공지능은 물체를 보고 이해하며, 복잡한 언어를 이용하여 소통하는 사람을 능력을 컴퓨터로 흉내 내고자 한다. 또 복잡한 상황에서 많은 지식과 정보를 취합하여 의사결정하는 방법에 대하여도 연구한다. 불확실한 정보로도 가장 그럴듯한 결정을 내리는 방법도 주요 연구 과제 중 하나였다 물론 데이터로부터 학습하는 능력, 즉 기계학습은 오랜 연구 주제였다. 체스나 바둑 같은 보드게임은 인공지능 연구의 초기 시절부터 방법론의 테스트베드로 사용되었다. 알파고 이전 최고의 바둑 프로그램은 아마5단 정도의 수준이었다.
인공지능은 오래 전부터 우리 일상생활에 자연스럽게 스며들었다. 우편물에서 주소를 읽어서 이를 분류하거나, 손으로 쓴 글씨를 인식하고, 세탁 시간을 스스로 선택하는 인공지능 세탁기 등이 대표적이었다. 그러나 요즘에는 더욱 똑똑해 졌다. 사람과 자연스럽게 대화하며 도움을 주는 가상 비서가 이미 여러분의 스마트폰에 들어와 있다. 이를 가정용 로봇과 연결하여 요리 방법을 도움 주기도 하고, 독거 노인의 친구가 되기도 한다. 사진 속 친구의 얼굴을 사람보다 정확하게 인식하고, 로보어드바이져는 어느 펀드메네져보다 실적이 좋다. 무인 자동차는 이미 복잡한 시내를 질주하고, 골프 로봇은 몇 번의 시도로 홀인원을 기록했다. 인공지능 컴퓨터는 퀴즈대회에 나가서 사람들을 모두 물리치고 최고의 상금을 획득하는 능력을 보였다. 방대한 자료를 모아서 이해하고 학습하는 이 능력을 투자 상담이나 병원에서 암 진단하고 처방하는데 사용한다.

인공지능이 사람을 지배한다?

이쯤 되면 사람들은 로봇이 인간을 공격하고 지배하거나, 또는 구매한 인공지능 인형이 인간에게 정을 느끼는 공상과학영화를 연상한다. 불안해 하거나 불쾌감을 느끼는 분들이 많다.
프로그램이 프로그램을 ‘스스로’ 만드는 상황, 그래서 인공지능이 스스로 그 능력을 신장하는 상황을 특이점(Singluarity) 상황이라고 한다. 그런 상황에서는 인공지능이 생산하는 지식이 폭발적으로 증가해서 인간이 이해 못하는, 그래서 통제불능의 세상이 될 것으로 예측되기도 한다. 한 연구원은 2045년경이면 그런 상황이 올 것으로 예측 했다. 그 때는 “인공지능이 가라사대”라고 하면 누구도 거부할 수 없는 진리가 되는 세상일 될 것이리라.
그러나 걱정할 필요는 없다. 현재의 인공지능 수준은 ‘지시하면’ 학습하고 사람의 지능을 흉내 내지만 ‘스스로’ 의지를 갖고 목표를 추구하지는 못한다. 충직한 하인이 더욱 똑똑해 진다고 생각하면 된다. 영혼이 있거나 자아의식이 있는 인공지능, 사랑이나 증오 등의 감정을 느끼는 인공지능, 그래서 스스로 의지를 불태우는 인공지능은 아직도 과학의 영역은 아니다. 위험할 수 있으니 인공지능의 발전 방향에 대한 관심을 갖자는 데에는 동의하지만 그렇다고 인공지능의 연구를 중지하거나, 발전을 늦추려는 시도는 동의할 수 없다.
인공지능은 도구다. 복잡한 데이터를 분석하여 의사결정을 잘하기 위하여 필요한 도구일 뿐이다. 어떤 목적으로 사용하느냐는 것은 인간의 의지이다. 선한 목적으로 사용하면 득이 되고, 악한 목적으로 사용하면 해가 될 것이다.

키워드 인공지능 AlphaGo 알파고 월간SW중심사회 2016년 4월호