“하둡·NoSQL, RDB 보완재…특성 맞게 데이터 저장해야”
상태바
“하둡·NoSQL, RDB 보완재…특성 맞게 데이터 저장해야”
  • 이광재
  • 승인 2013.05.27 00:00
  • 댓글 0
이 기사를 공유합니다

장성우 한국오라클 상무

빅데이터 분석에서 DB 등 각각의 역할 분담 필요

"최근 하둡(Hadoop) 및 NoSQL이 빅데이터 시대 주도할 것으로 주목받고 있지만 기존 RDB를 대체하는 수단보다 상호보완적인 관계가 더 적합할 것 같다. 이에 기업들은 데이터의 특성과 상황에 맞게 RDB, 하둡, NoSQL 중에서 선택하면 될 것이다"

오라클은 최근 '빅데이터 트렌드 및 오라클의 지원 아키텍처' 미디어 브리핑을 갖고 빅데이터 시대에서도 여전히 데이터베이스는 중요하며 특정 기술이 모든 기술을 대체하기 보다는 각자의 영역을 명확히 해야 한다고 밝혔다.

장성우 한국오라클 상무는 "최근 하둡이 기존 관계형 DBMS인 RDB를 대체 가능하다고 하지만 이것은 잘못된 생각"이라며 "실제적으로 하둡의 사용 환경을 보면 데이터를 모아 일반적인 분석 즉 저비용으로 최소한의 빅데이터 분석에만 사용하고 있어 기존 RDB의 상호보안적 관계에 있다고 보면 될 것"이라고 설명했다.

최근 기업들의 빅데이터 관심이 '구축'에서 '문제 해결'로 이동하고 있으며 빅데이터를 전략에 어떻게 적용하는지 여부가 기업의 명운에 중요한 역할을 하는 것으로 나타났다.

장성우 상무는 "기업들의 빅데이터는 구축에서 실제 문제 해결을 할 수 있는 영역으로 이동하고 있다"며 "시장 정보를 모으는 것에 그치는 것이 아니라 그 안에서 의미 있는 정보를 찾아내고 해결하는 부문에 집중하고 있다"고 말했다.

최근 급속도로 증가하고 있는 웹로그, 소셜 미디어, 이메일, 이미지, 동영상 등 비정형 데이터를 기존의 데이터 관리 아키텍처에서 활용하기는 어렵다. 따라서 기업들은 하둡, NoSQL, R 및 맵리듀스(MapReduce) 등 빅데이터가 떠오르면서 대두되고 있는 기술들에 주목하고 있다.

장 상무는 "하둡은 웹센서 및 로그 데이터에 적합하고 NoSQL은 SNS, 블로그, 텍스트 등 데이터에 적합하다"며 "계좌 정보, 고객 데이터 등 매우 중요한 비즈니스 데이터들은 데이터 크기에 상관없이 하둡과 NoSQL에 담는다는 것은 이치에 맞지 않는다"고 강조했다.

즉 오라클은 하둡이나 NoSQL이 적재적소에 쓰여야 제대로 된 빅데이터 분석을 위한 아키텍처를 마련할 수 있다고 보고 있다. 데이터 특성에 맞춰 적절한 아키텍처에 저장하는 것이 총소유비용(TCO) 절감의 출발점이라는 것이다.

장 상무는 "RDB는 다수 사용자에 대한 정합성과 안정성 및 즉시성이 보장되는 데이터에 적합하지만 고비용이라는 단점이 있고 NoSQL은 즉시성이 떨어지지만 페이스북과 같은 특화된 용도에 맞게 유연성과 효율성을 갖춰 RDB와 보안 관계를 갖는다"며 "또 하둡은 데이터 전 처리 및 집계에 적합하고 저비용이라는 장점이 있다"고 설명했다.

또한 그는 "고객들이 하둡으로 DB를 대체할 수 있느냐고 질문을 자주한다"며 "둘은 설계 사상이 다른 만큼 명확한 구분이 필요하다"고 말했다.

다시 말해 RDB, NoSQL, 하둡 간에는 특성에 따른 장단점이 존재함으로 기업들은 데이터의 용도와 환경에 맞게 올바른 선택을 해야 한다는 것이다.

장 상무는 "실제 페이스북은 하둡 기반 NoSQL인 HBase를 사용 중인데,페이스북의 경우 어떤 글에 '좋아요'를 눌렀을 경우 실시간으로 동시에 좋아요를 반영할 필요 없이 결과적으로 좋아요만 반영되면 되는 환경"이라며 "이에 굳이 고비용의 RDB를 쓸 필요가 없는 것"이라고 밝혔다.

그는 또 "다만 은행 계좌 정보의 경우 누군가 내게 1000만원을 입금했을 경우 정확한 금액과 함께 곧장 반영되지 않는다면 입금한 1000만원을 출금할 수 없는 상황이 벌어진다"며 " 이에 은행 계좌는 NoSQL과 하둡이 아닌 RDB를 써야 한다"고 강조하며 빅데이터 도입시 아키텍처 접근보다 새로운 접근 방식이 필요하다고 조언했다.

장성우 상무는 "기존에 못 풀었던 문제에 대해 먼저 풀어야할 비즈니스 문제를 정의하는 것이 가장 첫 시작이고 이를 풀 수 있는 분석 방법에 대해 정의→분석 모델 입력이 될 빅데이터 지정→선정된 빅데이터 특성에 맞는 적절한 인프라 선택 및 데이터 수집→빅데이터 처리를 위한 프로그램 작성→빅데이터를 이용한 분석 수행→숨겨진 규칙의 별견을 통한 가치 찾기 등의 순서를 통해 빅데이터를 기술이 아닌 문제에서 시작해 문제로 끝나야 한다"고 설명했다

한편 한국오라클은 빅데이터 분석을 위해 내놓은 '오라클 빅데이터 어플라이언스'를 우선 기존 오라클 엑사데이타 고객을 대상으로 소개한다는 전략이다. 오라클 빅데이터 어플라이언스는 DB가 포함돼있지 않은 만큼 엑사데이터를 통해 DB를 가지고 있는 고객에 가격 대비 효율적인 시스템을 제안할 계획이다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.