맵알, SQL로 하둡 분석하는 ‘아파치 드릴 0.5’ 출시
상태바
맵알, SQL로 하둡 분석하는 ‘아파치 드릴 0.5’ 출시
  • 온라인 뉴스팀
  • 승인 2014.09.26 10:16
  • 댓글 0
이 기사를 공유합니다

맵알테크놀러지스가 하둡을 포함하는 맵알 배포판의 ‘아파치 드릴(Apache Drill)0.5’를 출시했다고 밝혔다.

하둡에 표준 SQL(ANSI SQL)을 지원하는 아파치 드릴은 일반적인 애플리케이션을 포함한 여러 데이터 소스에서 즉각적인 셀프 서비스 데이터 탐색을 제공한다.

아파치 드릴은 스키마리스(schemaless) 데이터, 중첩 데이터 및 빠르게 진화 중인 스키마를 지닌 데이터 등 기본 포맷의 복잡한 데이터를 즉각적으로 쿼리해 유연성을 제공한다.

또 SQL 쿼리는 다양한 파일 포맷에서 직접 실행할 수 있기 때문에 라이브 데이터는 몇 주가 소요되는 스키마 준비 및 관리와 ETL 작업 설정 없이 들어오는 대로 실행이 가능하다.

이 외에도 아파치 드릴을 사용하는 기업은 ▲파킷(Parquet), JSON 파일 및 HBase 테이블과 같은 데이터를 포함한 자사의 기본 포맷 데이터의 고성능 분석 ▲하이브 메타스토어(Hive metastore) 내의 병렬·오버레이 스키마 정의 및 변경 없이 H베이스(Base) 테이블 상의 데이터 직접 쿼리 ▲몽고DB(MongoDB) 및 레스트 APIs(REST APIs) 등 노SQL 스토어의 데이터 같은 반정형·중첩 데이터와 함께 쿼리 및 작업에 직관적인 SQL 확장 ▲쿼리와 파일, H베이스 및 하이브 테이블 등 다른 하둡 데이터 소스의 동시 결합 등과 같은 혜택을 얻을 수 있다.

더불어 개발자와 애널리스트는 기존 SQL 스킬셋 및 BI 툴을 ▲익숙한 표준 SQL 신텍스(syntax)를 통해 전환 비용 및 사용자들의 학습 곡선을 최소화 ▲표준 ODBC(open database connectivity)·JDBC(Java database connectivity) 드라이버를 사용하는 엑셀, 태블로(Tableau) 및 다른 호스트와 같은 친숙한 BI 분석 툴을 계속 사용 ▲기존 하이브 상에서 임시(ad-hoc)·저지연(low-latency) 쿼리를 사용하며 활용할 수 있다.

피유시 바르가바 시스코시스템즈 IT 부문 최고 엔지니어는 “아파치 드릴은 최종 사용자가 데이터를 바로 탐색할 수 있도록 지원하고 자사가 지닌 하둡 아키텍처의 주요 격차를 해소해 준다”며 “다양한 데이터 타입으로 변경 없이 인터렉티브 SQL 쿼리를 지원하는 특수한 접근방식은 SQL의 친숙함과 하둡의 유연성을 모두 제공한다”고 말했다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.