[IS-098] AI기술의 국가통계 활용 사례 및 국내 도입 촉진 방안 (다운로드 : 515회)

김정민, 전이슬, 황유림

■ 요약문

국가통계는 사회통합 기능과 정책수립·평가기능을 갖추고 있는 국가의 중요한 공공재로서 통계법을 통해 엄격히 관리되고 있다. 특히 새로운 국가통계를 생산하기 위해서는 반드시 통계청의 통계작성 승인을 득해야 하므로 승인 기준과 품질 척도의 변화는 통계 생산자 모두에게 중요한 사안으로 볼 수 있다.

최근 국내외를 막론하고 AI 및 빅데이터 기술을 국가통계에 활용할 수 있는가에 관한 논의가 본격적으로 진행되는 추세다. 같은 맥락에서 실제 국가통계에 한시적으로 도입해 보거나 테스트하는 사례 또한 증가하고 있다. 이는 결국 AI 및 빅데이터 기술을 통계 생산에 활용할 시 국가통계로 승인 가능한지에 대한 고려로 확대된다. 국내 통계청 또한 올해 상반기 중 조사통계 심사에 맞추어져 있던 승인 심사 문항을 조사 통계 외 생산 방식에도 적용할 수 있도록 일부 개정하는 방안을 추진하고 있으며, 중장기적으로는 국가의 통계 관리 범위를 확대하기 위한 신규 제도 검토를 예고했다. 국가통계 승인 기준의 변화가 가시화되는 시점이다.

제도적 변화 조짐에도 불구하고 AI 및 빅데이터 기술은 그간 활용했던 통계적 기법과는 방법론의 구조, 평가 기준 등이 상이해 실제 도입에 대한 저항이 존재한다. 그런 연유에서 보고서는 해외의 앞선 논의와 실제 적용 사례를 소개하고 AI기술이 통계 생산에 활용될 시 예상되는 기술적 쟁점이 무엇일지 구체적으로 분석해봄으로써, 도입 촉진에 필요한 요소를 발굴하고 이를 달성하기 위한 방안을 제시하였다.

예상 쟁점 도출을 위해 국가통계에 AI 기술을 도입하는 이슈를 두 가지 시각으로 분리하였다. 조사통계에서 완전히 탈피해 빅데이터에 기반한 통계를 생산하는‘신규 통계 생산’의 시각과 조사통계 생산 과정을 그대로 수용하되 각 생산 과정의 효율성과 성능을 향상시키고자 AI를 도입하는 ‘통계 생산 프로세스의 현대화’가 그것이다. 서로 다른 두 시각에서 바라본 예상 쟁점은 다음과 같이 요약된다.

AI 기술을 도입하는 이슈 두 가지 - 구분, 예상 쟁점, 시사점의 순서로 구성된 표
구분 예상 쟁점 시사점
신규 통계 생산 AI·빅데이터 기반의 분석결과에 관한 신뢰가 보편적으로 형성되지 않음 신규 통계 생산 시 활용에 적합한 검증된 알고리즘을 공표하고 이에 대한 세부적인 활용 지침 마련이 요구
신규 통계의 생산방식은 기존의 통계 생산 프레임워크에 맞추어 해석하기에 적합하지 않음 빅데이터 분석 프로세스를 포괄할 수 있는 통계프로세스 표준의 개정 고려
재현 불가능한 비결정론적(Non-deterministic) 알고리즘 기반의 결과를 국가통계로 관리 가능한지 여부 인공지능 기술의 특성 분석 및 표준화된 평가 기준 정립이 요구됨
통계 생산
프로세스의 현대화
기존의 방법 대비 우수성을 객관적으로 비교가능한가 전통적 통계 기법-AI 알고리즘의 비교 검증 방안 발굴이 필요
AI 기술 도입은 통계 생산부터 공표까지의 제한된 생산 기간을 준수할 수 있는 해법인가 다수의 실증 사업을 통한 도입 적합성 진단 필요

분석된 예상 쟁점들과 그에 따른 시사점을 토대로 AI 및 빅데이터 기술의 국가통계 도입이 촉진되기 위해 필요한 두 가지 요소를 도출하였다. 첫 번째로 AI 기술의 대표성 부여를 위한 표준화 된 기술 개발 및 품질 평가 기준 마련을 꼽을 수 있겠으며, 두 번째로는 실증 사업 확대를 통해 국가통계 유형별 도입 적합성을 지속적으로 테스트 해볼 수 있는 장이 마련되어야 한다는 점이다.

끝으로 국가통계에 AI 및 빅데이터 기술 도입을 촉진할 수 있는 실질적 방안을 제시하기 위해, UN 유럽경제위원회「빅데이터 샌드박스」프로젝트의 일환으로 결성된 아일랜드 통계청-기술연구소 간 협력 사례를 참고하였다. 이를 통해 국내 통계청-AI 표준수립기관 간 협력 체계 및 기관별 역할 기능을 제안하였다.

통계 승인 관리 기관(통계 품질 관리) 국가 통계 시범 통계(도입 시) (승인 심사) (승인 대상 요건 충족 시) (등록 신고) 승인 대상 통계 AI 활용 통계(실증 사업) 통계 생산 기관(통계 생산 관리) AI 표준 수립 기관(AI 통계 품질 기준 및 심사 가이드라인 제공) (AI 기술의 국가통계 활용 지침 배포) AI 표준 수립 기관 AI 빅데이터 활용 국가통계 생산 절차 수립 AI 기술 표준화 AI 평가 기준 마련 국가 통계의 AI 기술 활용 지침 개발

■ Executive Summary

National statistics are important public goods of the country with functions of social integration and policy establishment·evaluation, and are strictly managed through statistical laws. In particular, in order to produce new national statistics, changes in approval criteria and quality measures can be seen as important for both statistical producers, as new national statistics must be approved by the National Statistical Office.

Recently, discussions on whether AI and Big data technologies can be used for national statistics, both at home and abroad, are underway in earnest. In the same vein, there are also increasing number of cases of temporary adoption or testing of actual national statistics. This eventually extends to the consideration of whether AI and Big data technologies can be approved as national statistics when utilizing them for statistical production. In the first half of this year, the National Statistical Office is also pushing to revise some of the approval screening questions that were tailored to the examination of survey statistics so that they can be applied to production methods other than survey statistics, and in the mid- to long-term, it announced a new system review to expand the scope of the nation’s statistical management. This is when changes in the national statistical approval criteria are visible.

Despite signs of institutional change, AI and Big data technologies differ from the statistical techniques used so far, so there is resistance to actual adoption. For such a reason, the report introduced advanced discussions and actual application cases abroad and specifically analyzed what technological issues would be expected when AI technology is used for statistical production, thus exploring the necessary factors for promoting the adoption and presenting measures to achieve them.

The issue of adopting AI technology to national statistics has been divided into two perspectives to draw expected issues. They include the view of ‘new statistical production’ that produces statistics based on big data, completely deviating from survey statistics, and ‘modernization of statistical production processes’ that adopts AI to accommodate the process of producing survey statistics but to improve the efficiency and performance of each production process. The expected issues from two different perspectives are summarized as follows.

AI 기술을 도입하는 이슈 두 가지 - Categorization, Expected issues, Implications의 순서로 구성된 표
Categorization Expected issues Implications
New statistical
production
Trust in analysis results based on AI and Big data is not universally formed When producing new statistics, it is necessary to publish proven algorithms that are suitable for utilization and to provide detailed utilization guidelines.
The production method of new statistics is not suitable to be interpreted in accordance with the existing statistical production framework Consider amending statistical process standards that can encompass the Big data analysis process
Whether results based on non-deterministic algorithms that cannot be reproducible are manageable as national statistics Characteristic analysis of artificial intelligence technology and establishment of standardized evaluation criteria are required
Modernization of
statistical production
processes
Is it possible to objectively compare excellence compared to existing methods? Discovering methods of comparison verification of Traditional statistical techniques-AI algorithms is required
Is the adoption of AI technology a solution to comply with the limited production period from statistical production to publication? Need to diagnose suitability of adoption through a number of demonstration projects

Based on the expected issues analyzed and their implications, two factors were derived to facilitate the adoption of national statistics for AI and Big data technology. First, standardized technology development and quality evaluation criteria for the representativeness of AI technology should be considered, and second, there should be a place to continuously test the suitability of adoption by type of national statistics by expanding demonstration business.

Finally, to present practical measures to promote the adoption of AI and Big data technologies to national statistics, we referred to examples of cooperation between the National Statistical Office and the Institute of Technology in Ireland, which was formed as part of the UN Economic Council’s Big Data Sandbox project. Through this, the cooperative system and role functions of each institution were proposed between the Korean National Statistical Office and AI Standard Establishment Agency.

■ 목차

1. 서론

2. 국가통계의 AI 기술 도입 논의와 적용 사례

(1) AI·빅데이터 통계의 도입 논의

(2) 해외 각국의 AI·빅데이터 통계 주요 도입 사례

3. AI·빅데이터 통계 도입 시 예상 쟁점

(1) 신규 통계 생산

(2) 통계 생산 프로세스의 현대화

4. 국가통계 AI 도입 촉진 방안

(1) 국내 통계 제도의 개편 방향

(2) 국가통계 AI 도입 촉진 방안

5. 요약 및 시사점

《 참고문헌 》

■ Contents

1. Introduction

2. Use cases and Discussion on the use of AI technology in National statistics

(1) Discussion on the use of AI·Big Data in statistics

(2) Use cases of AI·Big Data statistics in Foreign Countries

3. Expected Issues using AI·Big Data statistics

(1) Production of new statistics

(2) Modernization of statistical production processes

4. Promoting the using AI in National Statistics

(1) Direction of the Reform of the National Statistical System

(2) Promoting the using AI in National Statistics

5. Result and Implications

《 References 》

키워드 AI 국가통계