4차 산업혁명 시대의 자산운용: 글로벌 자산운용 업계의 인공지능 활용 동향
※ 이 글은 한국투자공사 최원혁이사의 기고를 받아 작성되었습니다.
4차 산업혁명(Industry 4.0), 인공지능(AI)의 시대
인공지능(AI)이란 단어는 이미 오래전부터 중요한 기술 연구 분야로 언급되어 왔지만, 현재와 같이 폭발적으로 관심이 증가한 것은 최근의 일이다. 2011년 IBM의 인공지능 왓슨(Watson)은 미국의 유명 퀴즈 쇼 ‘Jeopardy’의 역대 우승자들을 제치면서 대중의 주목을 끌었고, 2016년 구글의 딥마인드가 개발한 알파고(Alphago)는 세계 최상위 바둑기사인 이세돌 9단과의 대국에서 4승 1패로 승리해 세계를 놀라게 하였다. 또한 2017년 테슬라가 자율주행기술을 발표하면서 인공지능 기술의 폭발적인 성장과 무한한 가능성에 대하여 사회적 관심이 급증하게 되었다.
인공지능(Aritificial Intelligence, AI)이란 인간과 같은 지적 능력과 자율 학습의 능력을 보여주는 기계의 능력을 의미한다. 적응적인 예측 능력과 자율 학습 능력을 통하여 인간의 능력을 획기적으로 개선시킬 수 있는 일련의 기술을 통칭하기도 한다. 인공지능은 특히 패턴 인식, 미래의 이벤트 예상, 적절한 규칙 및 기준 수립, 의사결정의 개선, 커뮤니케이션 방식의 개선에 있어서 높은 수준의 능력을 발휘한다. 이러한 인공지능의 기술을 활용하여 각 주체들은 새로운 가치를 창출하고 기존의 운용 모델을 재편할 수 있다.
“4차 산업혁명(Industry 4.0)”은 2016년 1월 스위스 다보스 포럼에서 이슈화되면서 세계인의 관심을 끌었고, 마찬가지로 알파고 대국을 계기로 사회적인 관심이 증가하였다. 산업혁명의 역사를 돌이켜보면, 18세기 증기터빈기관 기반의 기계화 혁명인 1차 산업 혁명, 19세기말 전기 에너지 기반의 대량 생산 혁명인 2차 산업 혁명, 20세기 후반 컴퓨터와 인터넷 기반의 지식정보혁명인 3차 산업 혁명이 있었다. 이어서 빅데이터, 사물 인터넷(IoT), 인공지능 등 사이버물리시스템 기반의 만물초지능 혁명인 4차 산업 혁명이 대두되고 있다. 모든 것이 네트워크로 연결되고, 모든 것들이 빅데이터로 저장되고 있다. 이를 기반으로 인공지능 및 데이터 과학기술이 학습을 하고 판단을 내리는 시대로 접어들고 있다.
4차 산업혁명의 시대에서는 모든 산업들이 데이터 중심으로 산업을 재구성하여 시대와 소비자 요구에 맞게 변화하는 자가 앞서 나가게 될 것이다. 쌓여 있는 지식, 암기하는 지식은 죽은 지식인 반면, 인공지능에 의해 재해석되고 가공되는 지식의 양이 늘어날 것이다. 이러한 지식을 활용하는 것이 인간의 영역이 될 것으로 예상해본다. 즉 인간이 보여줄 수 있는 협동하여 창의적으로 생각하는 능력, 스스로 문제를 발굴하여 해결하는 능력, 기계를 활용하는 능력이 더욱 중요하게 고려될 것이다. 4차 산업혁명은 인공지능에 의한 자동화 및 연결성이 극대화되는 산업환경의 변화인 만큼 인공지능이 그 중심에 있다고 해도 지나친 말이 아닐 것이다.
자산운용 업계의 도전과 인공지능의 기회
글로벌 자산 운용 업계는 다양한 산업 이슈에 직면하면서 많은 변화가 요구되고 있는 상황이다. 자본수익률의 변동성 확대로 인하여 지속적으로 알파(Alpha[1])를 창출하는 매니저의 숫자가 줄어들고 있다. 높은 수수료 대비 액티브(Active) 매니저들의 알파 창출력에 대한 의구심이 높아지면서 자금유출 압박이 높아지고 있는 상황이다. ETF및 인덱스 펀드 중심의 패시브(Passive) 매니저들의 지속적인 비중 확대[2]와 더불어 수수료 인하 경쟁, MiFID II 도입 등 규제 강화를 통한 수익구조 투명화, 기술 개발 등 경쟁 심화로 인한 마진 압박 상황이 거세지고 있는 상황이다.
기존 자산 운용 업계에서 전통적으로 차별화 요인으로 언급된 것들은 점점 상품화(commoditized)되어 그 효과를 잃어가고 있는 상황이다. 인공지능은 비용 감축과 운영 효율화를 넘어 전략 차별화 관점에서 새로운 기회를 제공해 줄 수 있을 것이다. 자산 운용에 인공지능이 도입되면 운용사들은 기존에 할 수 없던 것을 시도할 수 있게 될 것이다. 인력들의 지적능력을 보강할 수 있을 것이고, 차세대 운용 능력의 개발을 촉진하게 될 것이다. 인공지능의 활용을 통해 자산운용 업계가 어떤 기회를 발견할 수 있을 것인지, 또한 현재 어떠한 노력을 기울이고 있는지 상세하게 살펴보고자 한다.
글로벌 자산운용 업계의 인공지능 기법 활용
현재 글로벌 자산운용 업계에서는 인공지능 및 대체 데이터(Alternative Data)의 활용가능성과 관련해서 높은 기대감과 더불어 현실적인 고민과 혼란이 공존하고 있는 상황이다. 알파 소스를 찾는 것은 언제나 자산 운용사들이 자신을 차별화하고 영역을 넓혀 가는데 가장 중요한 요소이다. 끊임없이 새로운 데이터 소스가 확대되고, 컴퓨팅 기술의 비용이 지속적으로 하락하면서, 새로운 인공지능 기술이 도입되는 상황은 업계의 판도를 근본적으로 바꿔 놓을 수 있는 가능성이 있다.
인공지능 및 데이터 사이언스 관련된 자산운용 업계의 최신 동향은 첫째, 인공지능 및 기계 학습등 새로운 기법을 모델 수립 과정에 활용하려는 노력, 둘째, 데이터 프로세싱 개선 등을 통한 업무의 효율화, 셋째, 새로운 대체 데이터 소스를 발굴하려는 노력으로 크게 요약할 수 있다.
거의 모든 메이저 운용사들이 인공지능 및 기계학습 기법을 활용한 투자 프로세스를 준비하거나, 실제 활용하려는 다양한 시도를 하고 있다. 이러한 경향은 현재 단계에서는 새로운 것을 자연스럽게 추구하는 경향이나, 고객들이 무엇을 원하고 무엇을 구매할 것인지에 대한 마케팅 적인 접근과 맞닿아 있는 것으로 보인다.
특히 글로벌 자산운용 업계에서의 인공지능 모델의 활용의 현주소는 아직은 초기 단계로 보이며, 특히 알파 창출의 관점에서는 운영 효율성 개선, 비용 감축에 비해 확신이 높지 않은 상황으로 보인다. 일부 작은 운용사들이 인공지능 및 기계학습 기반의 독립적인 운용 전략을 출시하고 있기는 하나, 업계 차원에서 독자적으로 완성된 인공 지능 모델이 있다고 언급하기에는 시기 상조인 상황이다. 기존 투자 프로세스에서 부분적으로 개선점을 찾아 나가는 관점에서 인공지능 활용 노력들이 활발히 진행되고 있는 상황이다.
알파 창출의 관점에서, 많은 회사들이 공통적으로 가능성을 인지하고 인공지능 및 기계학습 등 최신 기법을 적용하려고 활발히 노력하는 주제는 1) 자연어 처리 기법을 활용한 텍스트 마이닝(text mining), 2) 트레이딩 알고리즘을 통한 마켓타이밍과 거래규모 관점에서 거래 실행(trade execution) 전략 개선, 3) Feature Extraction(특징 추출)을 통한 데이터 분석 정도로 요약할 수 있을 것 같다.
대체 데이터(Alternative Data)의 활용과 데이터 프로세싱
최근 들어 급팽창한 소셜미디어, E-commerce, 사물인터넷 산업 등에 힘입어 경제, 산업 전 분야에 걸친 디지털화가 진행되어 데이터 홍수가 현실화되면서, 대체 데이터(비정형 데이터, 빅 데이터)의 활용이 중요해지고 있다. 이에 따른 빅데이터를 분석할 수 있는 최신 통계기법 및 그 기법을 시현할 수 있는 새로운 기술력이 매우 중요한 시점이다. 개별 스토리에 의존하는 투자 방식 보다는 빅데이터, 소셜미디어 데이터 등 폭넓은 데이터를 활용하여 전반적인 인간 특유의 행태나 트렌드를 분석하는 작업이 보다 더 의미 있는 작업이 될 가능성이 크다.
투자 데이터의 처리과정은 다음의 4단계로 구분할 수 있다: 1)데이터 수집 및 저장, 2)데이터의 전처리(Pre-processing) 및 특징 추출(Feature extraction), 3)전략적 의미 도출, 4) 알파 소스 개발. 각 단계별로 산업내에서 다양한 변화가 이루어지고 있는 상황이다. 데이터 프로세싱과 데이터 과학은 엄연히 다르다는 관점에서 좀 더 핵심이 되고 높은 스킬을 요구하는 고도의 업무에 역량을 집중하려는 시도들이 이어지고 있다.
데이터 수집 및 저장과 같은 업무는 차별화가 어려운데 비해 시간과 노력이 많이 소요되므로 합리적인 가격에 아웃소싱하여 프로세스를 효율화하는 시도가 일부 기업에서는 이뤄지고 있는 상황이다. 데이터를 소싱하여 내부화하는 방식은 물리적인 부하를 많이 야기하지만, 차별화보다는 점점 범용화(coomoditized), 표준화(standardized) 되어가고 있는 상황이다. 무엇보다도 새롭고 다양한 데이터를 확보하는 것이 차별성 확보의 핵심이다.
데이터 전처리(pre-processing)와 특징 추출(Feature extraction)은 자주 간과되지만 굉장히 중요한 단계라고 볼 수 있다. 특징 추출(Feature engineering)은 기계학습 알고리즘을 작동하기 위해 데이터에 대한 도메인 지식(Domain knowledge)를 활용하여 특징(feature)을 만들어내는 과정이다. 모델의 성능을 높이기 위해 모델에 입력할 데이터를 만들기 위해 주어진 초기 데이터로부터 특징을 가공하고 생성하는 전체과정을 의미한다. 특징 추출(Feature engineering)은 모델 성능에 미치는 영향이 크기 때문에, 응용에 있어서 굉장히 중요한 단계이며, 전문성과 시간과 비용이 많이 요하는 작업이라고 볼 수 있다.
데이터 프로세싱과 관련해서는 다양한 산업 과제들이 있는 상황이다. 대체 데이터 소스 확보와 관련해서는 수많은 데이터 제공자와 높은 수준의 대체 데이터 소스 활용이 가능해지면서 많은 발전이 있는 상황이다. 데이터 전처리, 자산 매칭, 커버리지 분석등을 아우르는 데이터 클린징에 대한 이슈와 표준화된 환경으로 데이터를 평가하는 이슈에 대해서는 다양한 노력이 진행되고 있다. 모델 운영과 관련해서는 분산화된 아키텍처를 통합하기 위한 다양한 수요가 증가하고 있다.
인재 확보 및 산학 연계
빅데이터, 인공지능 등 관련 기술의 비약적인 발전은 해당 분야의 전문가를 필요로 하기 때문에, 업계 입장에서는 우수한 인재 확보가 무엇보다 중요한 요소이다. 인공지능 관련 분야가 각광을 받기 시작하면서 해당 인재에 대한 채용수요가 기하 급수적으로 증가한 상황이다. 특히 산업의 경계를 뛰어넘어 우수 인재에 대한 수요가 증가하고 있는 상황이기 때문에 우수 인재 확보를 위해 금융업계가 실리콘 밸리내 IT 기업 및 미디어 산업과도 경쟁을 펼쳐야 하는 어려운 상황이다.
컴퓨팅, 계산 능력도 중요하지만 더욱 중요한 것은 데이터 탐색 능력이라고 할 수 있다. 즉 이와 같은 과정에서 사람의 판단력은 필수 불가결한 요소이다. 따라서 데이터를 분석, 판단할 수 있는 인력 보유가 빠른 기술력 선점보다 오히려 중요할 수가 있다. 컴퓨팅 파워의 발전으로 인공지능, 기계학습 기법이 급부상하였지만, 여러 기법의 장단점을 파악하여 데이터에 따라 특화된 알고리즘을 선택할 수 있는 사람의 역할이 중요할 것으로 예상된다.
기술의 급속한 발전으로 산업과 학계의 연계도 점점 강화되고 있는 상황이다. 영국의 MAN Group은 Oxford University와 미국의 SSGA는 Havard University와 산학 연계 프로그램을 운용하며 새로운 아이디어 발굴을 위해 노력하고 있다. 학계 역시 실제 시장에서 실시간 성과를 관찰할 수 있기 때문에 오직 시뮬레이션에만 의존했던 기존의 연구 방식에서 탈피 가능하고 이에 따라 향후 연구 주제가 다각화되는 서로 간의 시너지가 높아지는 상황을 기대해 볼 수 있다.
자산운용 업계의 인공지능 적용 사례
알파 창출/정보 해석 및 아이디어 도출의 관점: 기업분석을 하는 펀더멘탈 분석가들은 소화해야 할 정보량, 업무량에 비해 물리적으로 절대적으로 부족한 시간의 제약을 받게 된다. 그러므로 통상 자신들이 커버하는 몇몇 기업에 대해서만 실적 자료를 분석하거나 컨퍼런스콜에 참여한다. 실적시즌이 본격화되는 경우에는 100여개가 넘는 기업들이 같은 날에 실적을 발표하고 관련 컨퍼런스콜을 진행하는 경우가 부지기수이다. 텍스트 마이닝을 기반으로 하는 AI기법을 활용하는 경우, 인간보다 훨씬 빠른 속도로 모든 가용정보에 대한 분석을 마친 후 필요로 하는 정보를 단기간에 추출하고 요약하고 분석할 수 있다.
알파 창출/투자 모델의 개선 측면: 기본적으로 투자 모델은 다음의 세가지 요건을 갖추고 있어야 한다. 첫째, 개선 및 향상이 가능해야 한다. 적은 수의 설명 변수로 모델이 구축되어야 하며, 이해가능한 형태여야 한다. 둘째, 적응성을 갖추고 있어야 한다. 변화하는 시장 환경에 유기적으로 변화/진화할 수 있어야 한다. 셋째, 과학적으로 예측가능 해야 한다. 그러기 위해서는 모델은 보편성과 인과성을 가지고 있어야 한다. 보편성(Universality)은 어떤 현상이 특정 조건하에서 반복적으로 관측 가능한 것을 의미하고, 인과성(Causality)은 어떠한 현상의 상세한 원인과 결과사이의 역동적인 관계가 수학적으로 표현이 가능함을 의미한다. 이러한 관점에서 볼 때, 인공지능 기반 투자는 전통적인 모델 대비 이러한 요건을 더욱 잘 갖추고 있다고 볼 수 있다.
운영 효율성 개선: 새로운 규제의 도입, 수수료 인하 압력, 저비용 passive 상품으로의 투자흐름 전환등 다양한 어려움에 맞서서 운영비용을 효율적으로 관리하는 것은 생존을 위한 필수적인 전략이다. 많은 기업들이 아웃소싱이나 프로세스 자동화를 통하여 전체적인 운영 비용을 효율화하기 위하여 노력하고 있다. 표준화되거나 상품화된 데이터 프로세싱 과정의 일부를 아웃소싱하거나 자동화하려는 모습도 이러한 노력의 일환이라고 볼 수 있다.
상품 배급/마켓팅 체계 개선: 인공지능은 전통적인 배급모델이 적절하게 대응하지 못했던 시장이나 고객군에 대한 접근을 가능하게 해준다. 또한 고객별로 차별화된 정보와 분석기법을 제공하여 기업들의 고객접근성을 높일 뿐만 아니라, 신규 사업을 발굴할 수도 있다.
리스크 관리 모델의 개선: 보통 리스크 관리 관점에서는 쉽게 이해하거나 설명할 수 없는 것들에 대해서는 꺼리는 경향이 있다. 하지만 전통적인 리스크 팩터 모델이 오직 시장 시스템 위험의 일부분만 설명할 수 있기 때문에, 인공지능은 기존의 리스크 모델의 한계를 극복하고 개선할 수 있는 수단이 될 수 있는 가능성이 있다.
글로벌 최대 퀀트 운용사중 하나인 AQR과 구겐하임 파트너스(Guggenheim Partners)에서 머신러닝 퀀트 전략을 이끌었던 Marcos Lopez de Prado 박사의 최근 저술[3]에서 머신러닝의 적용사례를 다음과 같이 언급하고 있다. 기계 학습을 통해 고차원의 비선형적 관계까지도 표현이 가능해지므로 비정형 데이터내 인과 관계 및 패턴 관찰 및 습득이 가능하다. 금융 데이터를 이용한 기계학습의 성공적인 구현은 무인 운전이나 안면인식보다 어렵다고 볼 수 있다. 하지만 다음과 같은 금융 데이터 기반 기계학습 사례는 적용가치가 충분하다고 주장하고 있다: 1)비선형 모델을 활용한 가격 예측 모형 수립, 2)포트폴리오 구축, 위험 분석 방법론 개선, 3)데이터 세트내의 아웃라이어 탐지 모형, 4)Feature importance: 기계학습은 패턴을 찾아내는 데 특화되어 있으므로 데이터내 주요 feature를 추출하는 데 용이, 5)Sentiment Analysis: 자연어처리와 같은 기계학습 기법을 활용한 텍스트 데이터 분석, 6)Execution Analysis: 거래 데이터에 대한 기계학습 분석으로 거래 효율성 개선등.
인공지능/머신러닝 활용의 한계
머신러닝의 모수적 접근법(parametric approach)이 선형모델(linear model) 대비 상대적으로 유연하므로 창의적인 사고가 가능한 측면이 있다. 하지만 이게 오히려 약점으로 작용할 수 있는데, 머신러닝은 통상 샘플에 더욱 민감하게 반응하고, 모델을 구성하는 내부 인과관계에 대한 분석이 어려운 측면이 있다. 그렇기 때문에 투자아이디어의 경제적인 근거(Economic Rational)가 더욱 중요한 비중을 차지한다.
비용, 데이터의 질 측면에서 유효성에 대한 의문이 제기되는 경우도 있다. 인공위성 이미지나 각종 필드 데이터를 활용하는 것은 어떤 특정 주제를 얘기할 때는 좋은 접근이 될 수 있다. 하지만 이런 데이터들은 가격이 굉장히 비쌀 뿐만 아니라, 데이터의 질도 활용하기에 좋지 않은 경우가 많이 있다. 데이터의 가용성을 높이기 위해 들어가야 될 비용이 막대할 수도 있고, 실제 데이터가 유효하다 하더라도 소수 종목의 투자 근거를 위해 막대한 비용과 노력을 지불하는 것은 비용대비 효과 혹은 포트폴리오 운용 관점에서는 유효성이 떨어질 수도 있다.
인공지능 기반의 투자방식은 지속가능하고 반복 가능하고, 비용 효율적인 효과적인 투자 전략을 창출할 수 있다. 하지만 도메인 지식(domain knowledge)없이 모델을 훈련시키게 되면 잘못된 학습이 될 위험성이 크다. 이러한 부분을 보완하기 위해서는 인간의 경험과 가치판단 능력이 필수적이라고 볼 수 있다.
인간과 기술의 협업
글로벌 자산 운용 업계는 알파창출 능력 다각화, 운영 효율성 개선, 상품 배급 체계 개선, 리스크 관리 모델의 개선을 위해 신규 대체 데이터소스를 발굴하고 활용하려는 노력, 신규 인공지능 기법을 도입하여 기존 프로세스를 개선하고 신규 전략을 개발하려는 노력을 더하고 있다. 향후 인공지능은 금융 분야에 있어서 막대한 데이터를 이해하고 새로운 알파 투자 기회를 창출하는 데에 큰 역할을 할 수 있을 것이다. 폭발적으로 증가하는 산업데이터를 어떻게 활용할지 고민하지 않는 다면 어떤 산업이든 업계에서 뒤쳐질 가능성이 높아질 것이다.
인공지능의 아버지라고 불리는 Marvin Minsky교수는 저서에서 다음과 같은 말을 남겼다.
시간이 흐를수록 인간이 확보할 수 있는 데이터의 양은 증가할 것이며, 기술은 발전할 것이고, 기존의 가치판단의 관점에서의 불가능의 영역은 점점 줄어들 것이다. 데이터의 양이 증가하고, 분석 기술이 발전할수록 인간의 역할은 더욱 중요해질 것이라고 생각한다.
투자를 넘어 삶에 있어서 대부분의 가치판단이 명확하게 비교 우위가 있기 보다는 취향 또는 다양한 옵션 중 선택의 영역인 경우가 많다. 기술의 빠른 발전 속에서도 인간의 역할이 강조되는 이유가 여기에 있는 것 같다. 인간은 전체적인 프로세스를 가이딩해나가는 능력이 있고, 높은 가치 단계에서 종합적인 사고가 가능하다. 또한 기술은 인간 특유의 편견(bias)을 제어하여 지속, 반복 가능한 프로세스를 창출하기에 인간과 기술의 발전은 상호 보완적이라고 볼 수 있다. 새로운 기법을 도입하는 것보다 더욱 중요한 것이 전체적인 프로세스 관점에서 높은 수준의 가치판단을 할 수 있는 인력을 갖추고 나아가 지속적이고 견고한 시스템(robust system)을 갖추고 운용하는 것일 것이라고 생각된다.
[1] 알파(Alpha): 액티브 투자의 성과. 시장수익률 혹은 벤치마크(기준) 수익률대비 상대적인 초과 수익률을 의미. 투자전략의 운용능력을 측정. 이에 비해 베타(Beta)는 시장수익률 혹은 벤치마크 수익률을 의미. 최종수익률에서 베타를 제외한 것이 알파.
[2] The shift from Active to Passive Investing(2018, FRB Working Paper)
[3] “Ten Applications of Financial Machine Learning(2018) – Marcos Lopez de Prado” -(https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3365271)