빅데이터 분석용 무상 통계 프로그램 개발
상태바
빅데이터 분석용 무상 통계 프로그램 개발
  • 이광재 기자
  • 승인 2013.09.26 08:31
  • 댓글 0
이 기사를 공유합니다

제타바이트 수준 빅데이터 시대에 우리나라가 주도권을 잃지 않기 위해 준비해야 할 것은 무엇일까.

폭발적으로 증가하는 방대한 양의 데이터를 분석해 미래예측이나 의사결정을 위한 새로운 가치를 창출하는 빅데이터 중심으로 IT 패러다임이 변화되는 가운데 국내 연구진이 빅데이터 분석이 가능한 통계 패키지(가제 : SRC-STAT)를 개발했다.

이번 성과는 서울대 데이터과학과지식창출연구센터(센터장 이영조 교수)에서 미래창조과학부와 한국연구재단이 추진하는 선도연구센터지원사업의 지원 및 에스이(랩)과 서울대학교 빅데이터센터 등의 후원으로 수행됐으며 센터에서는 개발한 통계 패키지를 국내 교육기관에서 사용할 수 있도록 무상으로 보급하고 있다.

현재 서울대학교 통계학과는 물론 서울대 의과대학 및 의료정보센터에서 시범적으로 활용하고 있으며 전남대학교·부경대학교·대구한의대학교 등에서 통계학 교과과정에 활용하고 있다.

최근 글로벌 IT기업인 IBM이 대형 통계 소프트웨어사 SPSS를 인수하는 등 세계적으로 빅데이터 분석용 통계 소프트웨어 개발·활용에 대한 관심이 높아지고 있으나 현재 국내 대학, 연구소, 기업 등에서 주로 사용하는 통계 프로그램은 대부분 외국제품으로 매년 저작권료를 지불해야 하기 때문에 국산 프로그램 개발에 대한 요구가 많았다.

이번 개발된 통계 패키지는 평균, 분산 등 기초통계부터 의학분야에서 사용되는 생존자료, 사회과학 분야에서 활용되는 다변량 자료 및 다수준 모형뿐만 아니라 금융분야에서 활용되는 시계열자료 등 다양한 자료를 분석할 수 있는 범용 프로그램이다.

실제 센터는 동 패키지를 활용해 서울의대 핵의학과와 공동으로 대용량 고차원 뇌영상 기술을 개발했으며 신경과와 함께 급성허혈증 뇌졸중 응급환자 20만건의 혈압 데이터 분석에 적용해 뇌졸중 내원 후 증상이 악화되는 경우를 예측하는데 활용한 바 있다.

특히 센터가 보유한 다양한 다단계일반화모형 등에 기반한 독창적인 통계기법과 계산 알고리즘을 구현하고 데이터 분석결과에서 직관적으로 데이터의 의미를 알 수 있도록 일목요연하게 시각화하는 등 기존 기술과 차별화했다고 연구진은 밝혔다.

센터의 국산 통계패키지 개발은 외국산 기존 통계 프로그램들에 대한 도전의 시작이며 빅데이터 시대 핵심인 국내 소프트웨어 산업의 촉매제 역할을 할 것으로 기대되고 있다.

센터는 앞으로도 다양한 분야에서 활용할 수 있도록 지속적으로 통계패키지의 기능을 개선해 나갈 예정이다.

이영조 센터장은 "빅데이터 가운데 의미 있는 지식을 발견할 수 있는 분석도구인 통계 소프트웨어가 없다면 지식가뭄 현상을 마주할 것"이라며 "SRC-STAT으로 빅데이터 분석이 가능할 것이고 이번 성과는 국내 통계SW 산업 발전의 계기"라고 밝혔다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.