Classifications of Software Occupation and Labor Force Trends : Big Data Analytics Perspective 


요  약  문

1. 연구 목적 및 필요성

 산업 환경의 변화와 기술 기반의 4차 산업 혁명의 도래는 소프트웨어(이하 SW) 기반 산업 영역의 확산을 이끌어 오고 있다. 과거 기업의 생산성을 높여주는 지원 도구로서의 SW는 이제 기업의 핵심역량이 되어가고 있다. 이에 따라, 전 세계적으로 읽기, 쓰기, 계산하기의 기본 능력에서 추가적으로 갖추어야할 필수역량으로 SW역량이 대두되고 있다. 국내에서도 ‘초중등 SW교육 필수화’및‘SW중심대학’ 등을 통해 정부 주도로 국가 SW인재 양성을 강화하고 있다. 

한편, 고질적인 학력위주 사회 타파 및 능력중심 사회 구현을 위해 국가직무능력표준(National Competency Standards, NCS)을 개발하였고, 국내 대학 교육 체계를 NCS와  일원화 시키려는 정책도 꾸준히 시행되고 있다. 그러나 기존 NCS 개발 과정에서 일부 전문가들 의견 중심의 Top-down방식으로 SW분야의 체계가 개발 되면서, SW산업계의 수요를 면밀히 반영하지 못했다는 지적이 꾸준히 제기 되고 있다.

SW의 중요성 대두와 더불어, 대학 SW인재 양성의 근간이 되는 NCS의 SW분야 직무체계분류는 시급히 수정되어야 할 부분이다. 대학에서 배출되는 SW분야의 인력은 각 대학의 교육 체계 특성에 따라 다양한 방식으로 양성되어 오고 있으나, 여전히 SW전문인력 부족 현상은 심화 되고 있다. 이 현상은 SW전공 분야의 학문적 능력에 대해 기업에서 느끼는 활용도가 매우 낮음을 의미한다. 다시 말해, 산업 관점의 수요와 대학 관점의 교육 체계는 그 간극이 존재하고 있음을 알수 있다. 따라서 산업계 수요를 정확히 반영하는 전문 인력 양성 교육의 가이드라인이 필요한 시점이다.

이런 배경을 바탕으로 본 연구에서는 기존 소수의 의사결정자들에 의한 Top-down 방식에서 벗어나 SW분야 직무체계분류를 워크넷 SW분야 채용공고의 빅데이터 분석을 통해 분류하는 Bottom-up 방식의 접근을 진행하였다. SW 산업 분야의 실제 구인 수요를 바탕으로 SW직무·직종 분류체계를 개발 및 정의함으로서 NCS에 산업 수요를 반영하고, 산학간 수요·공급의 간극을 줄일 수 있는 단초를 제공할 수 있을 것이라고 기대된다.

2. 연구 범위 및 방법

본 연구 보고서의 구성은 다음과 같다. 먼저, 1장에서 SW 분야의 특성과 산업계 관점에서의 인력 수요에 대하여 구분하였다. 2장에서는 NCS와 워크넷의 SW분야 구분체계를 비교분석하였다. 이 후 워크넷의 SW인력 채용공고(총 20,408건)를 수집하여, 공고 내용의 핵심단어를 기반으로 직무·직종 분류체계를 정의하였다. 이를 위해, 텍스트마이닝(Text Mining)을 통해 채용공고 데이터에 대해 수집 및 단어별 전처리를 끝낸 후 잠재디리클래할당(Latent Dirichlet allocation, LDA) 알고리즘 기반의 토픽모델링(Topic Modeling) 분석을 수행하여 직무·직종의 분류체계를 신규 도출하였다. 이렇게 분류된 직무·직종에 대한 정의는 국제표준직업분류(International Standard Classification of Occupations, ISCO), 미국표준직업분류(Standard Occupational Classification, SOC), 직업정보네트워크(Occupational Information Network, O*NET)를 참고하여 작성되었고, 기존에 없었던 신규 직무·직종에 대한 정의는 여러 참고 문헌들을 기반으로 작성하였다. 3장에서는 전체 연구에서 확인된 결과의 해석 및 시사점을 도출하고 최종 정책적 제언을 제시하고자 하였다.

3. 연구 내용 및 결과

본 연구의 주요 연구 내용과 결과는 다음과 같다. 첫째, 본 연구는 NCS와 워크넷 기반의 직무 분류가 현재 어떤 형태로 구축되어 있는지 확인하였다. 분석 결과 워크넷의 직무 분류 형태와 NCS의 직무 분류 형태가 불일치되는 점을 확인하였고, 각 직종분류별로 세분화된 직무가 존재하지만 상호 매칭이 되지 않는 형태임을 확인하였다. 

둘째, 워크넷과 NCS의 불일치 직무 체계를 보완하기 위하여, 워크넷의 SW관련 채용공고 내용을 텍스트마이닝으로 분석하여 데이터를 수집하고 LDA 토픽모델링을 바탕으로 빅데이터 기반 직무·직종 분류체계를 도출하였다. 이 결과 총 9가지 직종별 15가지 직무를 구분해 내었으며, 이 중 신규 직종 3가지와 신규 직무 5가지를 도출해 내었다.

셋째, 도출된 직무·직종 분류체계의 각 직무 및 직종에 대해 3가지 국제직무표준을 참고하여 각 직종 및 직무를 정의하고 업무내용을 구분하였다. 기존 국제직무분류표준으로 활용되는 ISCO, SOC, O*Net의 분류체계로부터 유사 분류 정의를 비교하고 이를 바탕으로 9가지 직종, 15가지 직무에 대한 정의를 수립하였다.

4. 정책적 활용 내용

본 연구는 기존 불명확했던 워크넷 분류체계와 NCS 분류체계의 SW분야 산업계의 현실 반영이 미흡했다는 단점을 보안하기 위해 빅데이터 기반의 새로운 분류 체계를 개발하였다는데 그 의의가 있다. 먼저, SW분야 기업들의 실제 채용공고를 전수 활용하여 직무·직종 분류체계를 반영하였다는 점에서 SW산업 분야의 인력 수요를 보다 실무적 관점에서 바라보고 SW인재 육성 정책 개발에 가이드라인을 제공할 수 있다. 둘째, 새로이 분류된 직무·직종 분류체계에서 각 직무·직종 별 채용공고상 핵심단어들을 도출하여, 보다 현실적인 직무·직종 별 필요역량을 파악할 수 있을 것이다. 본 연구 결과를 SW관련 정책 수립에 개선에 활용한다면, 더욱 효과적인 SW분야 전문 인력 양성이 가능할 것이다. 

5. 기대효과

SW분야는 매우 빠르게 변화하고 있는 산업 군이다. 채용공고를 단어 단위로  분석한 빅데이터 기반의 분석방법은 향후 급변하는 SW분야 산업 직군의 특성을 파악하기 위한 최적화된 도구로써 판단할 수 있다. 본 보고서에서 도출한 직무·직종 분류체계의 경우, 분류된 체계를 기반으로 각 직무·직종 별 역량을 객관적으로 확인할 수 있고, 지속적으로 데이터를 수집한다면 시간 흐름에 따라 분야별 산업 수요의 변화를 확인할 수 있을 것이다. 이는 기존 NCS 체계의 보완뿐만 아니라 SW산업 영역의 수요 변화에 따른 시의적 정책 수립에 매우 유용할 것이다. 마찬가지로 SW분야 관련 산업계와 대학의 SW교육체계의 간극을 줄이기 위해서 본 연구결과를 활용하여 교과과정을 개선한다면, 고질적인 SW업계의 산학간 수요·공급의 간극을 줄일 수 있을 뿐만 아니라, 대학별로 실제 산업계에서 요구하는 직무·직종 별로 특화된 다양한 교육과정이 개발 될 수 있을 것으로 기대된다. 


목   차

제1장 서 론  

제1절 연구 배경    
제2절 연구 목적 

제2장 빅데이터 분석을 통한 SW 분야 직무·직종 체계 개발    

제1절 데이터 분석 개요  
1. 분석 자료의 수집 대상 및 적합성   
제2절 분석 자료의 전처리 과정  
1. 범주형 및 숫자형 데이터의 전처리 사항
2. 문자형 데이터 전처리   
제3절 SW산업 관련 기술통계 분석    
1. 전체 구인 기업에 대한 현황   
2. 워크넷 직업 분류 기반 채용공고 기술통계   
3. 전체 구인 기업 및 워크넷 분류에 따른 SW분야의 특성 
제4절 텍스트마이닝 분석   
1. 채용공고 데이터  
2. NCS 직종분류 데이터  
제5절 분류체계 간의 기술역량 일치도 검토   
1. 워크넷 직업 분류와 NCS 직무 분류 체계의 일치성 비교  
2. 분류체계 비교를 위한 데이터 선택 및 분석 과정   
3. 계산방법  
4. 결과비교   
5. 워크넷 분류와 NCS분류 체계 비교에 따른 시사점  
제6절 빅데이터 분석 기반의 직무·직종 분류체계 개발  
1. 핵심단어 주제 분류를 위한 분석 알고리즘 적용
2. LDA 분석 기반의 SW 직종직무 분류체계
3. 빅데이터 분석 기반의 직무·직종 분류 체계의 시사점

제3장 시사점 및 제언   

제1절 시사점 및 향후 연구 방향  
제2절 제언    


SUMMARY

1. Research Purpose and necessity

Changes in the industrial environment and the advent of technology-based fourth industrial revolution have led to the spread of software-based industries. Software, as a support tool to enhance corporate productivity in the past, is now becoming a core competency of the enterprise. As a result, Software capabilities are emerging as essential competencies that must be additionally provided in the basic skills of reading, writing, and computing around the world. In Korea, it is strengthening the training of software specialist through ‘essential elementary Software education’ and 'Software core university'.

On the other hand, National Competency Standards (NCS) have been developed for the achievement of solid academic-oriented society and ability-based society, and then The policy to unify domestic university education system with NCS is also being implemented steadily. However, it is pointed out that NCS has not been able to reflect the needs of the SW industry as a result of the development of the system of SW field as a top-down method based on opinions of some experts in the NCS development process.

In addition to the importance of SW, the classification of the SW field of the NCS, which is the basis of training the university SW human resources, should be urgently revised. The number of employees in the SW field of the university has been graduated in various ways according to the characteristics of the education system of each university. However, the demand of the SW company mainly requires 1-3 years of experience. This phenomenon means that companies' demand for academic ability in the major field of university graduation is very low. In other words, there is a difference between the industry-oriented demand and the university-based education system. Therefore, it is necessary to establish guidelines for the training of professional manpower that accurately reflects SW industry demand.

Based on this background, this study conducted a bottom-up approach to classifying SW job classification through Big Data analysis of job announcements from Worknet SW category as against the top-down approach by a small number of existing decision-makers. It is expected that it will be possible to reflect the industrial demand of NCS and reduce the gap between demand and supply of industry by developing and defining SW job classification system based on actual job demand of SW industry.

2. Research Scope and Methodology

The contents of this research report are as follows. Based on our research purpose, section 1 described the characteristics of the software industry and the demands of the workforce from an industrial point of view. In Section 2, we compare and analyze the SW division of existing NCS and Worknet. After that, we collected SW job announcements (totally 20,408) and defined the job and occupation classification system based on the keyword of the job announcement.

To accomplish this, we collected the job announcement data through text mining and finished preprocessing by word, and then performed topic modeling analysis based on Latent Dirichlet allocation (LDA) algorithm to newly derive classification system of job and occupation. The developed job and occupation classifications were defined as International Standard Classification of Occupations(ISCO), Standard Occupational Classification(SOC), Occupational Information Network(O*NET). Definitions of new jobs and occupations that have not existed are based on several references. In Section 3, the interpretation and implications of the research results are presented and the final policy suggestions are presented.

3. Research Contents and Results

The main contents and results of this study are as follows. First, this study confirmed the current classifications of NCS and Worknet-oriented job classifications. In order to compensate the gap between two classifications, we developed a SW job classification system based on Big data Analysis. As a result of analysis, it was confirmed that Worknet 's Job Classification and NCS Job Classifications were inconsistent, and it is confirmed that there are subdivided jobs but not mutually matching between two classifications. Second, in order to improve the system of disagreement between the Worknet and NCS, this study analyzed the contents of the Worknet job announcement of the SW industry by text mining. We gathered the total job announcements from Worknet and derived a job classification system based on LDA topic modeling. As a result, 15 kinds of jobs were classified by 9 kinds of job families, and 3 of them were new job families and 5 were new ones. Third, we defined each occupation and divided their tasks by referring to three international job standards for each occupation classification(ISCO, SOC and O*Net).

4. Political Implications

This study has developed a classification system to improve the unclassified classification from Worknet classification system and NCS classification system. 

First, it is possible to provide a guideline for the development of SW specialists training policy by the demand of manpower in the SW industry field from the practical point of view, since it reflects the job classification system by utilizing the actual all job posting of companies in the SW field. Second, it is possible to grasp keyword in job announcements by each job category in newly classified job classification system, and to identify more realized job competency.

5. Expected Results 

The SW sector is one of the rapidly changing industries. Big data-based analysis method which analyzing the job announcements by word-level can be judged as an optimized tool to identify the characteristics of the rapidly changing SW industrial sector in the future. Through the job classification system that is developed from this report, it is possible to objectively confirm the competence of each job that is classified system, and identify  the changes in industry demand according to the time if the data is continuously collected. This will be useful not only for complementing the existing NCS system but also for establishing a timely policy in response to changes in demand in the SW industry. Likewise, it is expected that not only the gap between demand and supply of industry-academy in SW industry can be reduced, but the results of this study be used to improve the curriculum to reduce gap between SW industry and university SW education system.


CONTENTS

Chapter 1. Intronduction  

     Section 1. Research Background  
     Section 2. Research Purpose  

Chapter 2. The Development of Occupation Classification for SW Industry based on Big Data Analysis   

     Section 1. Introduction of Data Analysis  
     Section 2. The Process of Data Cleansing 
     Section 3. Descriptive Statistics for SW Industry   
     Section 4. Text Mining Analysis 
     Section 5. The Matching Test of Technical Competence between  previous Occupation Classifications   
     Section 6. The Development of Occupation Classification Based on  Big Data Analysis   

Chapter 3. Implication and Critical Review    

     Section 1. Implication and Future Study  
     Section 2. Conclusions

[연구보고서 2016-016] 빅데이터 분석 기반 SW산업 직종·직무 분류체계 개발 및 동향 연구 (다운로드 : 2348회)

키워드 빅데이터 SW산업 직종