빅데이터 분석 기술이란 기존 데이터베이스 관리 도구의 능력을 넘어서는 대량의 정형 또는 비정형의 데이터로부터 가치를 추출하고 결과를 분석하는 기술 (후략)
빅데이터 분석 기술이란 기존 데이터베이스 관리 도구의 능력을 넘어서는 대량의 정형 또는 비정형의 데이터로부터 가치를 추출하고 결과를 분석하는 기술 (후략)
SW Keyword 10은 소프트웨어정책연구소에서 SW산업 및 시장의 환경 변화에 적기 대응하기 위한 기반자료를 제공하고자, 빅데이터 기반 텍스트마이닝 (후략)
빅데이터(BigData)는 제4차 산업혁명의 핵심 요소기술 중 하나로 사물인터넷(IoT), 인공지능(AI)과 동반성장하는 생태계에 속해있다. (후략)
CCTV 영상을 SW 기술로 분석하여 기상현상을 관측할 수 있으며, 나아가 다양한 현장의 문제 해결에 영상분석 SW기술이 활용 가능
1. 사회연구를 위한 비교실험은 정책결정에 있어 필수적임에도 불구하고 다양한 환경 요인을 고려하기 어렵다는 문제가 있으며, 이를 극복하기 위한 다양한 통계적 방법론이 활용되고 있음을 소개
2. 빅데이터의 활용은 정책 평가에서 새 기회이자 위협임을 인지해야 하며, 통계적인 셈플링을 거친 신뢰 가능한 스몰데이터를 기반으로 점진적인 빅데이터 대체가 이루어져야 한다 제언
빅데이터의 강자는 누구일까? 구글, 아마존, 마이크로소프트가 언뜻 떠오른다. ’13년 9월 타임지의 커버 스토리는 ‘구글이 죽음을 해결할 수 있을까? (후략)
트럼프 정부의 출범으로 국제 사회가 긴장하고 있다. 트럼프는 특히 통상에 있어 다자주의적 접근에서 양자주의 협상으로의 전환을 강조하고, 강경파 반중(反中)인사들을 대거 기용했다.
한국의 직접적인 SW對美 수출은 13억달러 수준으로 SW통상마찰은 크지는 않을 것으로 예상된다. 비통상적 측면에서 해외 전문인력 유출, 지적재산권 보호 강화, 망중립성 폐지, 인터넷 통제와 데이터 감시 강화, 인프라 투자와 제조업 친화적 정책 등이 한국에도 영향을 미칠 것으로 보인다.
■ 빅데이터의 특성
- 미래 ICT 산업을 선도할 4차산업혁명의 핵심기술요인으로 데이터를 수집 및 분석하여 미래를 예측하고 새로운 가치를 창출
- 데이터를 생성 및 수집하는 IoT, 생성된 빅데이터를 분석하기 위한 인공지능과 직접적으로 연계
국내는 전국민을 대상으로 한 보건의료빅데이터를 장기간 보유하고 있는 특수성이 있으며 심평원은 보유하고 있는 다양한 보건의료데이터를 유의미하게 활용할 수 있도록 빅데이터 개방 플랫폼을 구축하여 빅데이터의 유용성과 접근성을 높여 나가고 있음, 향후 심평원의 데이터와 외부 데이터의 연계·융합하여 새로운 가치창출에 기여하고자 함
ㅇ 최근 클라우드, 빅데이터, 인공지능, 사물인터넷 등 디지털 기술의 발전으로 모든 사물이 연결되고 보다 지능화된 사회로 진화하는 ‘4차 산업혁명’의 시대가 도래하고 있고,
이를 실현하는 핵심 동력인 소프트웨어의 중요성이 강조되고 있음
ㅇ 본 연구는 전통산업에서의 소프트웨어 기반 혁신활동의 실태를 파악하기 위하여 소프트웨어 융합 전략, 소프트웨어 기반 혁신을 위한 투자와 개발환경 조성, 기술수준, 인력현황, 애로사항 등을 조사하고, 산업별 SW융합수준과 기업의 소프트웨어중심 혁신 수준을 파악하고자 함
에너지 플랫폼은 전력 수요 절감뿐만 아니라, 시니어 케어 등 다양한 분야에서 활용이 가능하여 미래 유망 플랫폼으로서의 기능을 할 것으로 예측됨
▮ 연구결과 - SW 대한 부정적 인식은 점차 줄어드는 추세 (17.6% ➔ 15.8% ➔ 14.0%)
‘빅테이터의 허와 실’이란 주제로 이야기 하겠습니다.
먼저, 다음과 같이 지식, 정보, 데이터의 차이 및 정의에 대해 이야기를 한 후, 빅데이터의 정의, 빅데이터의 허와 실, 마지막으로 빅데이터 시대에서 무엇이 과연 중요한가에 대해 언급하는 것으로 마무리를 지려고 합니다.
지식, 정보, 데이터 이 새가지 개념의 차이를 정확히 알고 계시는 분들은 많지 않을 것 같습니다. 이 세가지 개념의 차이를 알아야 빅데이터가 무엇인지를 명확히 이해하기 위해서 도움이 된다고 생각되기에 간단히 설명 드리겠습니다. (후략)
■ 머신러닝, 빅데이터 활용을 위한 방안으로 부상
- 컴퓨터가 스스로 데이터를 분석해 의미있는 결과를 도출하는 머신러닝에 대한 관심이 증가
- 글로벌 IT 기업들의 머신러닝 관련 사업 진출이 활발하며 국내기업들도 머신러닝을 활용하기
위한 노력을 강화
클라우드 산업의 지속적인 성장을 위해서는 무엇보다 기업들이 자율적으로 혁신역량을 발휘할 수 있는 여건을 마련하는 것이 중요하다. 개인정보는 엄격하게 보호돼야 하겠지만, 정보통신자원의 유연한 이용환경을 만들어내는 클라우드 컴퓨팅 환경에서 한국 SW는 한 차원 높은 성장을 이룰 것으로 기대된다.
[embedyt alt="혁신을 이끄는 데이터"]https://www.youtube.com/embed/ZaHj9tv4h9M[/embedyt] 최근 기술의 발전은 놀라울 정돕니다. 무인자동차는 예상보다 빨리 나올 것 같고, 얼굴인식은 사람이 하는 것과 비슷한 수준까지 왔습니다. 왓슨컴퓨터는 챔피언과의 퀴즈대결에서 우승했고, 작년엔 투링시험에서 사람인지 인공지능인지 헷갈리게하여 그 성과를 두고 논쟁이 벌어지기도 했죠. 기술의 가치도 커져서 이제 기술만 있으면 몇십명의 개발자만 있는 회사가 수천억에서 수조원의 가격에 인수되고 있습니다. 정말 최근의 현상은 정신이 없고 겁이 날 지경입니다. 이런 급성장의 배경에는 하드웨어 기술의 발전, 인터넷의 보급 확대, 그리고 소프트웨어와 데이터, 좀 더 포괄적으로 얘기하면 디지털화 등이 주요 요인이라고 합니다. 이 중에도 지난 몇년만을 놓고 본다면 특히 디지털화된 데이터가 많아진 것이 가장 중요한 이유라고 생각합니다. 하드웨어는 90년대와 2000년대 초반까지 큰 영향을 미쳤지요. 그러나 XP에서 더 이상 업그레이드 안하려고 하듯 영향력이 떨어졌습니다. 인터넷은 2000년대 중반에 구글, 트위터, 페이스북이 급성장할 때 가장 중요한 기반이었죠. 물론 이런 기술이 지금도 아주 중요하고 여전히 발전하고 있지만 이제는 데이터가 이들이 구축해놓은 기반위에서 발전을 이끌고 있습니다. 요새 주목받는 딥러닝은 알고리즘의 개선도 있지만 데이터가 많아졌기 때문에 현실적인 결과를 내고 있고 왓슨컴퓨터도 위키피디아를 비롯한 여러 정보가 있어서 우승할 수 있었죠. 그런데 데이터는 수렴하지 않고 발산합니다. 데이터가 데이터를 낳는거죠. 그래서 데이터는 점점 늘어날 것이고 이 데이터의 영향력도 당분간 계속 커질 것으로 보입니다. 그럼 어떻게 해야 할까요? 회사는 데이터를 모으고 활용해서 매출로 연결하는데 노력해야겠죠. 반면 공공데이터는 공개해서 국민들이 쓸 수 있게 해줘야 할겁니다. 며칠전에 정부에서 공공데이터 개방에 더 적극적으로 나선다는 발표가 있었습니다. 좋은 일이고, 기대하고 있습니다. 그런데 여기에 쪼끔 덧붙이고 싶은 얘기가 있습니다. 제가 연구때문에 찾는 싸이트가 있습니다. 공공데이터를 공개하는 싸이트고 실제로 적극적으로 활동하는 곳입니다. 그런데 검색한 내용을 PC로 가져와서 분석하려면 화면을 긁어서 복사해야 합니다!!! 텍스트나 엑셀로 내보내기 기능이 있으면 좋을텐데요. 한 백, 이백개 정도면 그냥 긁어오겠지만 만개, 이만개 정도가 검색되면 고민에 빠지죠. 이걸 꼭 가져와야 하느냐. 연구에 꼭 필요한 데이터라면 할 수 없이 복사해 와야겠죠. 근데 문제는 이 데이터가 꼭 필요한지 어떤지를 미리 알기 어려운 때가 많다는 겁니다. 데이터를 가져와서 이리저리 돌려보다보면 뭔가가 발견되는건데 이런건 미리 알 수가 없습니다. 그래서 꼭 필요한 경우가 아니면 더 이상 살펴보지 않게되죠. 이번에 공공데이터를 공개하면서는 개인정보와 같은 민감한 내용은 제외하더라도 검색한 데이터를 PC로 내려받을 수 있게 해주면 좋겠습니다. 공공데이터를 공개하는 기관에선 미리 예상할 수 없는 방법으로 데이터를 활용하여 혁신이 일어나는 것이 현실입니다. 그러니, 데이터를 풀어줍시다. 잘. 마법은 거기서부터 시작될지도 모릅니다. 감사합니다. 소프트웨어정책연구소 김석원 연구2실장