공개SW 활용 동향
  • 권영환SW정책·인재연구팀 책임연구원
날짜2018.04.30
조회수16148
글자크기
  • The Latest Trends of Open Source Software
    • 공개SW는 기존 영역(예: 운영체제, 데이터베이스)과 새 영역(예: 인공지능, 빅데이터, 클라우드)에서 모두 중요해지고 있음
    • 특히, 허용적 사용권(Permissive License)의 증가와 GPL(GNU Public License)의 감소는 공개SW의 상업적 활용의 증가를 의미함
    • The open source software have been more important in both traditional fields (e.g. OS, DB) and new fields (e.g. AI, BigData, Cloud)
    • Specially, increase of permissive licenses and decrease of GPL(GNU Public License) mean that it is the economical usages increment of open source software
  • 공개SW 정의와 특징
    • 공개SW 특징과 사용권(License)
    • ( 공개SW) 해외에서는 오픈소스(Open Source) 또는 오픈소스 SW로 불리우며, SW의 핵심 구성요소인 소스 코드가 공개되어 정해진 사용권 범위 안에서 사용자가 자유롭게 사용 하거나 변경 및 공유(배포)할 수 있는 SW를 의미함
    • ( 탄생 배경) 상용SW의 발달로 인하여 발생한 폐쇄성이 자유로운 지식 교환을 방해하여 SW 발전을 저해한다는 인식하에 소스코드를 공개하여 누구나 사용 가능하게 하여 SW 혜택을 다 같이 누리고 SW 발달을 촉진시키고자 탄생함
    • (오픈소스 특징) 오픈소스 관련 대표적인 비영리 단체인 OSI(Open Source Initiative)1에서는 오픈소스 SW 특징에 대해 <표 1>과 같이 10가지를 정의하여 오픈소스의 정의를 대신하고 있음
    • <표 1> OSI에서 정의한 오픈소스의 10가지 특징
    • ( 공개SW 사용권) OSI(Open Source Initiative)는 <표 1>의 10가지 조건을 따르는 공개 SW 사용권을 승인하여 2018년 4월 기준 75개의 사용권을 규정하고 있음
    • ( SW 사용권) SW 사용권한에 대한 규정을 의미하며 공개SW의 경우, 타 SW와의 결합 가능 여부, 결합 방법, 배포 방법 그리고 저작권 및 특허권 규칙 등을 정의하고 있기 때문에 공개SW 사용자와 개발자들은 필히 사전 검토해야 함
    • ( 국내) 오픈소스SW 사용권 종합정보시스템(https://olis.or.kr)과 공개SW 포털(https://www.oss.kr)에서 공개SW 사용권 정보와 자문 서비스를 제공함
    • 공개SW 장점과 현황
    • (공개SW 장점) 공개된 소스코드를 활용 가능하기에 이를 통한 제품 종속성 탈피, 외부기술의 내재화, SW 품질 향상, 개발기간 단축 같은 기술 혁신들이 가능해지고 개발비용과 SW 사용권 비용 절약으로 인한 경제적인 효과를 얻을 수 있음
    • (활용 분야 확대) 1990년대에는 운영체제, 데이터베이스, 웹 서버용 SW 같이 인터넷 서비스에 필요한 SW들이 주로 공개SW로 개발되어 지속적으로 널리 활용되고 있으며 최근에는 인공지능, 클라우드, 통계분석과 같은 제4차 산업혁명을 이끌어가는 신SW 분야에서도 공개SW 활용이 주목받고 있음
    • (상업적 활용 증가) 일반적으로 공개SW는 무료라는 인식이 널리 퍼져있지만, 최근에는 이러한 인식에 반하여 상업적으로 적극 활용하는 사례가 발생하고 있으며, 실질적으로 수정한 코드를 공개하지 않아서 상업적 활용에 유리한 MIT 사용권이 증가하고 수정한 코드를 반드시 공개해야 하는 GPL(GNU Public License)은 감소하고 있음
  • 기존과 새로운 분야에서 공개SW 활용
    • 전통적인 공개SW 동향
    • ( 초기 공개SW) 공개SW 생태계가 구축되기 시작한 초기에는 인터넷 서비스를 제공하기 위해 리눅스 계열 운영체제, MySQL 같은 데이터베이스, Apache HTTP 서버 같은 공개SW들을 활용하여 낮은 비용으로 인터넷 서버를 구축하는 용도로 주로 활용되었으며 이와 같은 초기 공개 SW들은 지금도 널리 활용되고 있음
    • ( 리눅스 커널) 1991년 공개된 이후 공개SW 활성화를 가능하게 한 대표적인 사례로 초기에는 RedHat, Suse 등 리눅스를 기반으로 하는 공개SW 기업들을 탄생시켰고 2000년대에는 구글에서 리눅스 커널을 기반으로 Android를 개발하여 모바일 플랫폼 시장을 주도하고 있음
    • 미래 자동차 인포테인먼트(Infortainment) 시장에서도 <그림 1>에서 보는 바와 같이 리눅스의 활용이 폭발적으로 증가할 것으로 예상되고 있을 정도로 리눅스 커널의 중요성은 커지고 있음
    • <그림 1> 차량용 인포테인먼트 시장에서의 리눅스 활용 예상(연평균 성장률 : 32.9%)
    • ( MySQL) <그림 2>에서 보는 바와 같이 MySQL은 세계에서 가장 인기있는 데이터베이스 시스템으로 1995년 처음 공개되어 지금까지도 계속 신규 기능 추가 및 성능 개선을 통해 지속적으로 개발되고 있는 대표적인 공개SW로 이 프로젝트를 기반으로 하여 다양한 공개SW 기반 데이터베이스 프로젝트들이 파생되었음
    • <그림 2> 2018년에 가장 인기있는 데이터베이스
    • (Apache) 1995년 웹 데이터 전송 프로토콜인 HTTP(HyperText Transfer Protocol) 서버용 SW로 공개되었으며 이를 관리하기 위해 1999년 Apache 재단이 출범하였고 이후 다양한 공개SW 프로젝트들이 Apache 재단의 관리하에 개발되고 있고 2018년 지금도 성능 개선을 위해 지속적으로 갱신되고 있는 대표적인 공개SW임
    • (Apache 사용권) 2000년에 Apache 사용권이 제정되었으며, 구글의 안드로이드, 텐서플로우 그리고 구글 웹킷 등은 대표적인 Apache 사용권 SW들임
    • 새로운 공개SW 활용 분야
    • (신 SW기술) 최근 SW산업은 인공지능, 빅데이터, 클라우드와 같은 신 SW기술들이 주도하고 있으며 특히 공개SW 형식으로 개발된 텐서플로우(Tensorflow), R 그리고 오픈스택(Open Stack) 등이 새로운 SW 분야의 기술 발전을 이끌어 가고 있음
    • (텐서플로우2) 구글에서 2009년도부터 개발하였던 DistBelief의 후속 프로젝트인 텐서플로우는 구글 브레인팀의 주도로 개발된 기계학습 오픈소스 SW 라이브러리이며 2015년 Apache 사용권으로 공개된 이후 2018년 현재 기계학습 분야에서 가장 활발한 공개SW 프로젝트임
    • (활용) 최신 기계학습 기술을 CPU, GPU, TPU 등의 다양한 컴퓨팅 환경에서 이용할 수 있도록 개발되었고 퀄컴, 엔비디아, 인텔, 우버, 에어비엔비 그리고 AMD 등 대표적인 IT 기업들에서 활용되고 있으며 텐서플로우를 활용하는 기업들은 지속적으로 늘어날 것으로 예상됨
    • (깃허브 동향) 텐서플로우는 대표적인 공개SW 저장소인 깃허브(Github)에서 2017년 가장 많이 포크(Fork)된 프로젝트로서, 약 2.4만 번 포크되었으며 참여한 개발자 수는 약 7,300명으로 5위를 차지했고 관련 프로젝트인 텐서플로우 모델(Tensorflow Models)은 약 8천 번 포크되어 포크 순위로 5위를 차지함3
    • (오픈스택4) 2010년 미국 NASA와 Rackspace가 공동 추진한 클라우드 플랫폼 개발 프로젝트를 기반으로 하고 있으며 2012년 오픈스택 재단이 창립되어 Apache 사용권이 적용되어 관리되고 있으며 클라우드 플랫폼 구축에 필요한 서버, 저장장치(Storage), 네트워킹 자원을 가상화하기 위한 다양한 세부 프로젝트들이 진행되고 있음
    • (활용) 가상화 기술을 기반으로 클라우드 업무 분산을 위한 엣지(Edge) 컴퓨팅, 통신분야에서 네트워크 가상화, 금 융 분 야에서 빅데이터 분 석과 고 성능 컴퓨팅 자원이 필요한 과학 분야 등 다양한 분야에서 활용이 가능하며 레드햇, 시스코, HP, 델, IBM, Huawei 등 500개 이상의 기업들이 오픈스택을 활용함
    • (시장전망) 초연결 기반의 제4차 산업혁명의 다양한 서비스들을 제공하기 위해서는 컴퓨팅 자원 활용의 효율화를 위한 클라우드 플랫폼 구축이 필수적이기에 오픈스택을 이용하여 사설 및 공용 클라우드 자체 구축 방안이 주목받고 있기 때문에 관련 시장은 <그림 3>과 같이 급성장할 것으로 예상됨
    • <그림 3> 오픈스택 세계 시장 전망
    • (R5) 1992년부터 뉴질랜드 오클랜드 대학에서 개발되기 시작하여 2000년에 안정적인 빅데이터 분석이 가능해진 통계 프로그래밍 언어 겸 공개SW로서, 현재 R 재단에서 GPL 사용권을 적용하여 관리하고 있으며 하둡(Hadoop)과도 연동이 가능하고 MS 윈도우, 애플 맥, 리눅스 그리고 유닉스 등 다양한 환경에서 동작 가능함
    • (활용) 데이터 입출력, 조작 처리, 계산뿐만 아니라 시각화 작업이 가능한 통계 SW로써 투표 데이터, 마이닝 데이터(Mining Data), 교육 및 연구용 데이터 등 다양한 유형의 빅데이터를 효율적으로 처리가 가능하기 때문에 구글과 페이스북에서는 주요 분석 플랫폼으로 활용하고 있으며 오라클, SAP 그리고 IBM에서도 주요 솔루션에 적용함
    • (성장) 200만 명 이상의 사용자를 가지고 있는 R은 사용자들이 주도적으로 R 컨소시엄을 조직하여 전세계 사용자 및 관리자 그리고 개발자를 지원하고 있으며 다양한판(Version)의 R 관련 코드와 문서를 내려받기 가능한 CRAN(Comprehensive R Archive Network)의 R 패키지 수는 <그림 4>처럼 급속히 늘어나고 있음
    • <그림 4> CRAN에 공개된 R 패키지의 수
    • 공개SW의 상업적 활용 현황
    • (공개SW 전략적 활용) 국 내에 공 개SW 도 입될 당시에는 무 료 사용이 가능하다는 점 때문에 독점적인 일부 상용SW를 대체하기 위해 공개SW를 활용하였지만 해외 선진 SW기업들은 공개SW를 전략적으로 활용하여 시장 선점, 기술 우위 유지 등의 상업적으로 활용하는 사례가 늘어나고 있음
    • (국내) 공개된 소스코드를 기반으로 무료로 활용할 수 있었기에 운영체제, 데이터베이스 등의 일부 분야에서 SW기술력을 확보하고 이를 통해 독점 상용SW를 대체하였지만 무료라는 인식이 과도하여 상업적 활용을 저해하는 이유가 되었고 이는 SW 선진국에 비해 SW경쟁력을 약화되는 부작용이 있었음
    • (구글) 모바일 플랫폼 구축에 있어서 리눅스 커널을 기반으로 안드로이드 플랫폼을 개발하여 개발기간을 단축하였고 API를 공개하여 HTC, 삼성, LG, Huawei 등 주요 스마트폰 제조업체들이 낮은 가격으로 모바일 플랫폼을 사용하게 하여 모바일 플랫폼 시장의 주도권을 확보하였고 이를 통해 광고 수익 및 구글 지도, 구글 플레이 등의 서비스 사용료로 수익을 창출함
    • (공개SW 기업 증가) 공개SW 시장이 성숙되는 초기에는 일부 업체들이 리눅스 커널과 MySQL 등을 활용하여 일부 상업화에 성공하였으나 현재는 클라우드 주도로 성장하는 SW시장을 기반으로 분산처리, 기계학습, 저장장치 관리 등 다양한 분야로 확산되어 <그림 5>처럼 많은 공개SW 기업들이 등장함
    • <그림 5> 지난 세대와 현재 세대의 공개SW 기업들
    • (사용권 활용 변화) GPL 사용권의 공개SW의 경우 수정된 소스코드를 반드시 공개해야 하지만 BSD 사용권과 Apache 사용권 같은 허용적 사용권(Permissive License)들의 공개SW들은 수정된 소스 코드의 공개에 대한 강제조항이 없기 때문에 상업적으로 공개SW 활용에 있어서 유리하기 때문에 근래에는 허용적 사용권 기반의 공개SW들이 증가하고 있음
    • (대세인 허용적 사용권) 강제적인 카피레프트(Copyleft) 조항이 없는 MIT 사용권과 Apache 사용권들이 적용된 공개SW들은 연구·개발 결과가 반영된 소스 코드를 공개하지 않아도 되어서 상업적 활용에 유리하기 때문에 최근 이들 사용권들을 활용한 공개SW들이 대세로 되어가고 있으며 <그림 6>처럼 BSD 사용권을 활용한 공개SW들을 포함할 경우 55%에 가까운 비율을 차지함
    • <그림 6> 2017년 공개SW 사용권 배포 현황
    • (GPL 사용권 감소) 허용적 사용권을 활용하는 공개SW가 늘어남에 따라 상대적으로 공개SW의 대표적인 사용권인 GPL 계열의 비중은 <그림 7>처럼 줄어가고 있으며 이는 공개SW의 상업적 활용이 증가되는 공개SW 진화의 단면을 볼 수 있는 대표적인 사례임
    • <그림 7> 2010년과 2017년 공개SW 사용권 활용의 변화
  • 요약 및 시사점
    • 공개SW의 상업적 가치에 주목할 필요가 있음
    • 더욱 중요해진 공개SW) 전통적인 공개SW인 운영체제, 데이터베이스뿐만 아니라 인공지능, 빅데이터, 클라우드 분야와 같은 신SW 분야에서는 공개SW가 기술 개발을 주도하기 있기 때문에 미래 SW 경쟁력 측면에서 공개SW 중요성은 더욱 커질 것으로 예상됨
    • (공개SW와 상용SW의 공생관계) MS, 오라클, SAP, SPSS 등의 전통적인 상용SW 기업들도 공개SW로 개발된 신SW 기술들을 자체 솔루션에 적용하여 제품 경쟁력을 강화하고 있고 또한 공개SW 프로젝트에 참여하고 있다는 사실은 공개SW와 상용SW가 서로 적대적인 관계가 아니라 상호 공생 관계가 될 수 있다는 것을 의미함
    • (서비스 사업의 경쟁력, 공개SW) 최근 두각을 나타내고 있는 IT 기업인 구글, 페이스북, 우버 그리고 에어비앤비 등의 기업들은 공개SW를 기반으로 사업화에 필요한 서비스 플랫폼을 구축하여 성공한 기업들로 공개SW를 전략적으로 활용하여 해당 분야의 주도권을 확보하였고 지속적으로 생태계 확장 및 서비스 질 개선을 위하여 공개SW를 적극 활용하고 있음
    • 공개SW 활용에 있어서는 체계화된 전략이 필수
    • (전략적 사용권 활용) 허용적 사용권을 가진 공개SW를 연구·개발에 활용할 경우 결과물인 소스코드를 공개하지 않아도 되기 때문에 이를 제품과 서비스 경쟁력으로 활용할 수 있지만 공개SW 개발의 장점인 다양한 외부 자원을 활용한 신기술의 빠른 적용 같은 기술 혁신을 저해할 수 있기 때문에 사용권 활용에 있어서는 전략적 선택이 필요함
    • (체계화된 접근 필요) 상업적인 목적으로 공개SW를 활용하기 위해서는 1차적으로 비즈니스 모델의 정립, 기술적 우월성 확보가 필요하기 때문에 단기적인 접근 보다는 장기적 관점에서 체계화된 접근이 필요하며, 다수의 유명 공개SW 프로젝트들은 몇 년간의 각고의 노력을 통해 유용성을 인정받은 사례들이며 이상적인 접근 또는 단편적인 접근으로 공개SW 활용은 성공하기 어려움
    • (상호 호혜적인 공개SW) 공개SW 프로젝트를 활성화하기 위해서는 운영자와 참여자 모두 혜택을 볼 수 있는 환경이 조성되어야 하므로 운영자의 필요에 의해 공개SW 프로젝트를 만들었다고 가정하면, 참여자가 기술 습득 및 활용이라는 혜택을 누릴 수 있는 공개SW 프로젝트를 만드는 것은 공개SW 활성화를 위한 필요조건임
  • 참고문헌(Reference)
    • 1. Open Source Initiative, https://opensource.org
    • 2. Tensorflow, https://www.tensorflow.org.
    • 3. The State of Octoverse 2017, https://octoverse.github.com.
    • 4. Openstack, https://www.openstack.org.
    • 5. The R Project for Statistical Computing, https://www.r-project.org/
    • 6. Global automotive infotainmnet market worth $40.17 billion by 2024, Autonomous Vechicle Technology(https://www.autonomousvehicletech.com), Aug 2017.
    • 7. Most popular databases in 2018 according to StackOverflow survey, EverSQL(https://www.eversql.com), March 2018.
    • 8. OpenStack global market revenues from 2014 and 2021(in billion U.S. dollar), Statista (https://www.statista.com), 2018.
    • 9. CRAN now has 10,000 R packages. Here how to find the ones you need, Revolutions Blog(http://blog.revolutionanalytics.com/), January 2017.
    • 10. Jake Flomenberg, The Rise of OPEN Innovation: The 3P’s for Building a Durable OPen Software Company, Revolutions Blog(http://blog.revolutionanalytics.com/), February 2016.
    • 11. Open Source Licensing Trends: 2017 vs. 2016, Jake Flomenberg, Medium(https://medium.com), April 2018.
    • 12. Jono Bacon, The declie of GPL?, opensource.com(https://opensource.com), February 2017.
    • 1  Open Source Initiative(https://opensource.org)
    • 2  Tensorflow, https://www.tensorflow.org.
    • 3  The State of Octoverse 2017, https://octoverse.github.com.
    • 4  Openstack, https://www.openstack.org.
    • 5  The R Project for Statistical Computing, https://www.r-project.org/