효율을 주요한 가치로 생각하는 민간과 투명성과 정당성을 주요한 가치로 생각하는 공공 부문의 생태계는 많은 차이가 있다. 정부에서 인공지능을 활용하기 위한 중요한 질문 두 가지는 첫째, 인공지능을 공공부문에 활용한다면 어디에 할 수 있고, 선행 사례가 있는가? 라는 것이며, 둘째, 민간과 정부의 인공지능 역량 격차는 어떻게 해결할 수 있는가? 라는 것이다. 이 글에서는 미국연방 정부에서 인공지능을 활용한 사례를 살펴보고 위 두 가지 질문에 대한 해답을 고민해 본다.
기술적 배경
인공지능(Artificial Intelligence) 및 관련 기술은 사회 광범위한 분야에 점점 더 널리 보급되고 있다. 이러한 기술은 제품이나 서비스의 고유한 목적을 달성하는 데뿐 아니라 산업 내 가치사슬을 변화시킬 수 있는 잠재력을 갖고 있다. 디지털 전환 시대를 맞아 가치사슬의 해체와 재구성이 동시에 일어나면서 기존에는 부가가치를 단독으로 창출하지 못했던 단위 프로세스들이 분화하면서 자동화되고, 제품이나 서비스와 같은 다양한 형태로 공급이 되기 시작하고 있다. 인공지능 기술은 단일하게 구성된 기술이 아니라 복합적이고 통합적인 기술 포트폴리오이다. 인공지능 기술은 크게 지능형 로보틱 프로세스 자동화, 규칙기반 전문가 시스템, 자연어 처리, 기계학습 등으로 나누어 볼 수 있다.
지능형 로보틱 프로세스 자동화(RPA, Robotic Process Automation)
RPA는 특정한 업무의 관리를 위해 구조화된 작업을 수행하는 소프트웨어 로봇을 일컫는다. 노동자원의 행동을 모사하는 스크립트나 규칙, 배치 작업 등을 의미하는데, 다른 형태의 인공지능에 비해 상대적으로 저렴하고 프로그래밍이 쉬우며, 투명한 규칙 하에 수행된다. 워크플로우, 비즈니스 규칙, 정보 시스템과의 표현 계층의 통합을 통해 사람과 같이 작동한다. 예를 들면 차트 기록 갱신, 청구 및 지불결제 등의 반복적인 업무에 이용되는 것이다. 이미지 인식과 같은 다른 기술과 함께 사용하면 송장, 상품 팩스 이미지와 같은 데이터를 추출하여 거래 시스템에 입력하는 데 사용할 수 있다.
규칙 기반 전문가 시스템
‘~인 경우, ~이다’와 같은 규칙의 집합에 기반한 전문가 시스템은 1980년대에 주류였던 인공지능 기술이었고 상용화되어 널리 사용되었다. 예를 들면 의료 분야의 전자 환자 기록(EHR, ElectronicHealth Records) 제공 업체들은 통합 의료 기록 관리 및 행정 시스템과 관리 규칙 집합(Rule Set)을 동시에 제공한다. 전문가 시스템에서는 도메인 전문가와 인공지능 기술자가 특정 도메인 분야에서 필요한 규칙 집합을 구성한다. 사전에 정의된 규칙이 유효하다면 잘 작동하고 직관적인 이해가 가능하다. 그러나 규칙의 집합이 복잡해지고 커지면서, 규칙 간 충돌이 발생하는 경우 동작이 중단될 수 있다. 또한 도메인 분야가 이를테면 의료에서 운송 등과 같이 변경되면 규칙을 변경하는 것이 어렵고 시간도 많이 소요된다.
자연어 처리
1950년대 이후부터 인공지능의 주요 연구 분야였던 자연어 처리 분야는 인간의 언어를 이해하는 것을 목표로 한다. 이 분야는 음성 인식, 텍스트 분석, 번역 뿐 아니라 음성 인식 후 텍스트 출력, 텍스트 인식 후 음성 출력과 같은 언어와 관련된 다양한 응용을 포함한다. 통계적인 자연어 처리는 이후 설명할 기계학습에 기초하고 있으며 최근 인식의 정확도가 급격히 개선되었다. 이는 학습을 위한 말뭉치(Corpus)집합이 기반이 된다. 이러한 자연어 처리 기술은 문서나 도식 등의 생성·해석과 분류를 자동화할 수 있고, 대화형 챗봇, 가상개인비서 서비스 등을 제공하는 데 도움을 준다.
기계 학습과 딥러닝
1기계학습은 모델에 적합하게 데이터를 사전에 준비하고 이 데이터를 사용하여 모델을 학습함으로써 새로운 데이터를 입력으로 받았을 때 결과를 예측하는 통계적 기술이다. 기계학습은 광범위하게 응용될 수 있는 기술이고 여러 세부 분야로 분화되고 있다. 그 중에서도 가장 일반적인 형태는 결과 변수와 알려진 속성들을 포함하는 학습 데이터 집합을 바탕으로 한 지도 학습이다. 더 복잡한 모델은 신경망을 예로들 수 있는데, 대부분 분류 작업에 활용되고 있다. 그리고 가장 복잡도가 높은 모델은 결과를 예측하는 고수준의 계층, 혹은 변수를 갖는 고층신경망 모델인 딥러닝이다. 이러한 모델에는 수천 개의 은닉층(Hidden Layer)이 있을 수 있어 집중적이고 많은 연산을 필요로 하는 작업들을 수반한다. 최근 그래픽처리 장치와 고성능 클라우드 등을 활용하여 효율적으로 처리가 가능해지면서 급속도로 발전하고 있다. 하지만 이전의 통계적 처리나 분석 방식과 달리 딥러닝 모델은 일반적으로 어떠한 원리나 의미를 갖지 않는다. 즉, 모델의 예측 결과에 대한 설명은 해석하기가 어렵다는 한계가 있다. 그래서 근래에는 신뢰가능하고 설명가능한 인공지능에 대한 연구도 많은 관심을 받고 있다.
공공부문 업무 관점의 자동화 도입 효과 분석
공무원들은 하루종일 무엇을 하는가? 미국의 경우, 연방정부에서는 연간 총 43억 시간, 주정부에서는 연간 총 1억 8천만 시간의 노동시간이 소요되는 것으로 추정된다(Deloitte, 2017). 연방 및 주 정부 공무원 모두에게 가장 많은 시간이 소요되는 활동은 정보를 문서화하고 기록하는 것으로, 총 근무 시간의 10%를 차지한다.
이 중 정량화 및 자동화가 가능한 다섯 가지의 가장 노동집약적인 활동들을 뽑아보면 다음 그림과 같은 작업들이다.
인공지능은 양식을 작성하거나 개체를 이동시키는 것과 같은 일부 활동들을 개선하고 자동화할 수 있다. 이들은 작업의 중요성이나, 기술적 요구사항, 작업량 및 기술적 장벽 등의 요소를 고려하여 인공지능을 시험적으로 도입할 첫 번째 그룹으로 선정될 수 있다. 동일한 딜로이트 보고서에 따르면 인공지능을 적극적으로 도입하는 시나리오의 경우 5~7년 이내 27~30%의 공공 분야 업무시간을 절약할 수 있다고 추정한다.
미국 연방 정부의 인공지능 활용 사례
2020년 2월 발간된 스탠포드 대학의 Goverment by Algorithm 보고서에 의하면 120개 미 연방 기관, 부서와 기타 공공 기관 중에 45%가 인공지능이 적용된 공공 관리 도구를 시범 운영한 적이 있거나 현재 사용 중이다. 실 사례로서 약 160건의 사용 사례를 분석하여 분야별로 분류하면 다음과 같은 분야와 업무에 사용되고 있다.
가장 대표적인 사례로, 머신러닝 도구를 사용하여 규제 분석과 모니터링을 한다거나, 형사 사법적 분야의 얼굴인식이나 범죄 예측에 사용한 경우가 보고되었다. 또한 FDA(식품의약국)의 공중 보건을 위협하는 약물의 예측과 의약품 부작용 보고서 분석, DHHS(보건후생부)의 인공지능 조달에 필요한 도구의 개발과 시범 운영 사례도 있었다. 나아가 공공주택 검색이나 세금 업무와 관련한 대국민 소통을 위한 챗봇, 우편 배달을 위한 자율 주행 서비스의 시범적 운영, 상표권의 침해 여부 분석 등에 사용되는 것으로 파악되었다.
주로 어떤 도구를 사용하였는가를 살펴보면 분류, 회귀분석 등 지도학습을 구조화된 데이터에 활용한 경우가 아직까지도 대다수이다. 이는 비정형 데이터까지 일반적으로 활용하여 결함 등을 탐지하고있는 민간 부문의 활용 수준과 많은 차이가 있다. 나아가 미국 공공 부문 인공지능 투자는 2020년 기준 110억 달러였으나, M&A, 기업 공개 등을 제외한 순 민간 부문 인공지능 투자는 236억 달러로 2배 이상이다(Standford, 2021).
어떻게 인공지능을 적용했는지를 살펴보면 계획이나 프로토타입 단계에서 활용되는 경우가 많았으며, 용역 등을 통해 조달할 경우에 발생할 수 있는 이슈사항 등으로 인해 기관 내(In-house) 개발이 많았다.
시사점과 추후 정책 연구 방향성
이런 업무(Task)기반 데이터 분석 및 사례연구를 바탕으로 알 수 있는 점은 아직 정부, 공공 분야 업무의 정량화와 자동화는 도입 시작, 혹은 초기 단계에 있다는 점이다. 정부는 현존하는 가장 거대한 데이터셋을 보유하고 있지만, 법률 문서, 이미지 등 구축한 방대한 양의 문서와 비정형 데이터를 잘 활용하지 못하고 있다. 왜냐하면 인공지능에 의사결정을 맡기기 위한 사회적 기대 수준에 부응하는 기술적 성숙도가 부족하고, 도메인 전문성과 기술 전문성이 모두 필요한데 그러한 인적자원이 절대적으로 부족하며, 소스코드 접근 권한, 지식재산권의 소유 문제, 조달된 서비스의 투명성과 설명가능성 등 용역, 구매와 같은 조달과 관련한 불확실성이 크기 때문이다.
또한 민간과 정부의 인공지능 활용 수준에는 격차가 있다. 정부, 공공 부문에서 인공지능을 활용하는 데에는 조달이라는 채널도 중요하지만 내부에 현장의 문제를 잘 알고 일정 수준 이상의 기술적 전문지식을 가진 전문가가 필요하다. 이들은 요구사항을 정의하고 문제를 해결하는데 핵심적인 자원이 되기때문이다. 그에 앞서, 사회적 기대 수준과 공공의 가치에 부응하는 기술적 성숙도를 갖출 수 있도록 민간과 공공이 부단히 노력하여 인공지능 윤리 및 개인정보보호 관련 불확실성을 제거할 수 있도록 해야 한다. 나아가, 인공지능 활용과 현재의 조달 관련 제도의 충돌을 고려하여 개선점을 찾아야 한다. 따라서 아주 제한적인 응용 분야부터 자동화의 보조 도구로써 활용해 나가야 할 것이다.
참고문헌
김진형(2020), AI 최강의 수업
한국디지털융합진흥원(2021), 인공지능이 변화시키는 미용, 화장품 산업의 현재와 미래
Deloitte Insights(2017), How much time and money can AI save government?
Stanford University(2020), Government by Algorithm