먼저 기계학습이 무엇이며, 각 산업분야에서 개발중인 현황을 살펴보도록 하자.
- 기계학습이란 기계 또는 컴퓨터가 스스로 데이터를 분류하고, 패턴을 학습하여 어떤 일의 정확성을 높이거나 미래의 일을 예측하는 기술과 방법론을 말한다. 기계학습은 기존의 정교한 규칙에 의한 기계의 동작이 아니라, 엄청난 양의 데이터에서 기계가 스스로 배우면서 규칙을 만들어가며 문제를 해결하는 형태를 띤다. 대표적으로는 생물학의 신경망을 모방한 통계적 학습 알고리즘인 인공신경망(Artificial Neural Network)이 있다.
- 현재의 기계학습은 기존의 인공신경망을 발전시켜서 여러 계층의 단계를 가지고 훨씬 더 복잡한 문제를 해결할 수 있는 딥러닝(Deep Learning)으로 발전되었다. 딥러닝은 다량의 데이터 속에서 핵심적인 내용 및 기능을 요약 추출 하는 기계학습의 집합으로 정의된다. 쉽게 말해 컴퓨터가 사람처럼 생각하고 학습 할 수 있는 보다 진보된 인공지능 기술이다.
- 인공지능에 대한 뜨거운 관심은 이미 세계적으로 산업 전 분야에 걸쳐 나타나고 있다. 상당한 수준의 인공지능을 갖춘 IBM의 왓슨(Watson)은 퀴즈대회에서 우승하고, 요리책을 출간하며, 의료플랫폼으로까지 진화하고 있다. 벤츠, BMW, 볼보를 비롯한 수많은 글로벌 자동차 업체들과 글로벌 IT업체(구글, 애플 등)들은 인공지능을 갖춘 자율주행 자동차의 개발과 상용화를 진행중이며, 이를 실현하기 위한 각종 법안을 만들고 규제를 풀어가고 있다. 페이스북, 아마존, 마이크로소프트 등은 인공지능 디지털 비서를, 미국의 국방고등연구계획국(DARPA)은 무인 항공기를, 인텔과 바이두 등은 헬스케어 및 웨어러블에 인공지능을 탑재하는 등 수많은 기업들이 각자의 분야에서 인공지능을 연구개발 중에 있다. 이처럼 인공지능은 점점 모든 분야에 필연적으로 융합되면서 우리 일상으로 다가오고 있다.
- 첫 번째 배경은 바로 ‘BigData 시대의 도래’이다. 앞서 살펴본 다양한 경우처럼 엄청난 양으로 쏟아져 나올 데이터를 분석하고 학습하고 각각의 상황에 최적화된 결과를 도출해 낼 수 있도록 하기 위해서는 깊이 있는 기계학습, 즉 딥러닝이 필요하다.
- 두 번째 배경으로는 하드웨어의 발전에 있다. 기존 인공신경망 모델은 많은 계산이 필요하기 때문에 고성능 하드웨어가 필요했다. 또한 국지적인 데이터에만 과도하게 학습되는 과적합(overfitted)1) 문제를 가지고 있었다. 하지만 컴퓨터 하드웨어의 성능이 비약적으로 향상되면서 인공신경망 모델의 단점은 많이 완화 되었다. 최근에는 GPU를 이용한 병렬연산을 통해서 상대적으로 값싼 상용컴퓨터상에서도 딥러닝 연산이 가능한 수준에 이르기도 했다.2) 따라서 기존 기계학습의 낮은 성능과 활용하기 힘들었던 문제가 해결되었다.