히타치 밴타라, 비정형 데이터 분석 강화된 ‘펜타호 8.2’ 출시
상태바
히타치 밴타라, 비정형 데이터 분석 강화된 ‘펜타호 8.2’ 출시
  • 신동훈 기자
  • 승인 2018.12.05 10:47
  • 댓글 0
이 기사를 공유합니다

방대한 양의 정형 및 비정형 데이터에 대한 간편하고도 신속한 분석 지원

[CCTV뉴스=신동훈 기자] 효성인포메이션시스템은 히타치 그룹(Hitachi, Ltd, 이하 히타치)의 완전 자회사인 히타치 밴타라(Hitachi Vantara)가 자사의 데이터 통합 및 분석 플랫폼 소프트웨어 펜타호(Pentaho)의 최신 버전을 출시했다고 밝혔다.

이번에 출시된 펜타호 8.2버전은 히타치의 업계 선도적인 오브젝트 스토리지 플랫폼 HCP(Hitachi Content Platform) 및 다른 제품 포트폴리오와의 통합이 강화돼 주요 산업 분야 기업들이 비정형 데이터를 기반으로 다양한 활용사례들을 구현하도록 지원한다. 또한, 기업들이 하이브리드 클라우드 환경을 보다 효율적으로 관리하고, 한층 확장된 분석 에코시스템의 기능들을 활용하도록 한다.

펜타호는 100% GUI 기반의 간편한 환경에서 데이터 수집과 통합부터 머신러닝 모델 구축, 고급 분석, 모델 업데이트, 시각화 및 리포팅을 하나의 워크플로우로 구현해 기업의 빅데이터 처리 및 분석 효율성을 대폭 향상시키는 것이 강점이다. 뿐만 아니라, 병렬처리, 서버 클러스터링 및 AEL(Adaptive Execution Layer)를 통해 고속 빅데이터 처리를 지원한다.

이전 버전의 펜타호가 실시간 데이터 처리 및 컴퓨팅 리소스 최적화 기능이 향상됐다면, 이번 펜타호 8.2는 비정형 데이터 분석을 통해 규제 준수 및 비즈니스 가치 향상에 기여하는 인사이트 도출을 지원하는데 초점을 맞추고 있다.

분석을 위한 비정형 데이터 사용 지원

하버드 비즈니스 리뷰(Harvard Business Review)의 발표에 따르면, 기업들은 비즈니스 의사결정 시 자사의 데이터 중 50% 미만의 정형 데이터와 1% 미만의 비정형 데이터만을 활용하는 것으로 나타났다. 펜타호 8.2는 HCP와의 통합을 통해 기업들이 정형 데이터 소스뿐 아니라, 문자, 영상, 오디오, 이미지, 소셜 미디어, 클릭스트림(clickstreams) 및 로그 파일과 같은 비정형 데이터 소스를 포함하는 데이터 파이프라인을 구축하고, 인사이트를 도출해 비즈니스 가치를 높일 수 있도록 지원한다.

펜타호 8.2 버전 업데이트를 통해 각 산업 분야별 활용 사례들은 다음과 같다.

은행: 금융 서비스 기관은 무역 거래 데이터와 이메일 커뮤니케이션 데이터 간의 상관관계를 분석함으로써 컴플라이언스 요구사항을 보다 쉽게 충족시킬 수 있다.

헬스케어: 의학 연구자들은 환자와 약물 복용 관련한 데이터를 비정형화된 자기 공명 영상(MRI) 데이터와 통합해 신약 개발 과정에서 도움을 얻을 수 있다.

소매: 소매업자들은 가게 내부의 영상과 판매시점관리(point-of-sale, POS) 데이터를 결합 분석해 고객의 쇼핑 선호도 및 매장 내 개별 브랜드들의 고객 방문량 추세를 파악할 수 있다.

공공안전: 사법기관은 영상 기록과 범죄 보고서를 결합해 증거를 보다 빠르게 수집하고, 의사결정을 개선하면서 지속적으로 규제를 충족시킬 수 있다.

하이브리드 클라우드 환경의 데이터 관리 편의성 향상

NoSQL 데이터베이스, 마이크로소프트 애저(Microsoft Azure), 아마존(Amazon) 및 구글(Google) 퍼블릭 클라우드 서비스 및 온프레미스 환경의 오브젝트 스토리지가 데이터 레이크의 새로운 대안으로 떠오르면서, 기업들은 데이터 관리 및 규제 준수를 위한 데이터 거버넌스 분야의 최상의 투자 방안을 모색하고 있다. HCP와 통합된 펜타호 8.2는 데이터를 HCP로 이동시켜 데이터 레이크를 구축, 데이터 준비, 정제 및 표준화를 수행해 데이터 관리를 향상시킬 뿐만아니라, 클라우드 타깃에 적합한 데이터 유형을 결정하고 준비된 데이터를 클라우드 환경으로 전송함으로써 불필요한 데이터 전송량을 줄이고 비용을 보다 잘 관리할 수 있다.

분석 에코시스템 확장

펜타호 8.2는 써드파티 제품 및 기술들로 구성된 분석 에코시스템에 대한 지원을 확대해 기업들의 데이터 파이프라인 및 분석 프로젝트 최적화를 돕는다.

AMQP(Advanced Messaging Queuing Protocol) 지원: 기업들은 인기 있는 오픈소스 메시징 프로토콜인 AMQP(Advanced Messaging Queuing Protocol)를 통해 엣지 디바이스 상의 스트리밍 데이터를 새로운 IoT 활용사례 구현을 위한 클라우드 환경으로 읽기(read) 및 퍼블리시(publish)할 수 있다.

구글 클라우드(Google Cloud) 보안 향상: 고객관리 암호화 키(Customer Managed Encryption Key, CMEK)에 대한 지원을 통해 기업들은 구글 클라우드 스토리지(Google Cloud Storage) 및 구글 빅쿼리(Google BigQuery) 환경의 데이터에 접근하는 동시에, 데이터 암호화 키를 제어하고 데이터 보호를 강화할 수 있다.

파이썬 스텝(Python Step): 기업들은 파이썬으로 구축된 머신러닝 및 딥러닝 모델을 운영하고, API로 사이킷런(Scikit-learn) 및 텐서플로우(TensorFlow) 라이브러리에 연결할 수 있다.

오픈JDK(OpenJDK) 지원: 기업들은 상용화된 버전의 오픈JDK에서 오픈소스 무료 버전의 오픈JDK로 전환할 수 있다.

칼팩스 캐나다(CARFAX Canada)의 데이터 관리 담당 이사 앤드류 버프원(Andrew Buffone)은 “우리는 펜타호 8.2 및 HCP를 도입해 정형 및 비정형 데이터 활용을 위한 단일 플랫폼을 구축하고, 정제 및 준비된 데이터를 AWS 및 마이크로소프트 애저 환경으로 이동시킴으로써 20~30%의 컴퓨트 비용과 50~60%의 스토리지 비용을 절감할 것으로 기대한다”라며, “또한, 단일한 통합 환경에서 정형 및 비정형 데이터를 관리하고 데이터 거버넌스에 대한 요구사항을 보다 쉽게 충족시킴으로써, 내부의 비즈니스 및 데이터 과학 부서가 데이터를 보다 효과적으로 관리할 수 있도록 지원하고 있다.”라고 말했다.

451 리서치(451 Research)의 데이터, 인공지능(AI) 및 분석 연구 담당 부사장 맷 애슬렛(Matt Aslett)은 “기업들이 현대적인 데이터 분석 프로젝트를 추진하는 데 있어서는 다양한 소스의 정형 및 비정형 데이터를 빠른 속도로, 그리고 자동적으로 통합시키고 다양한 활용사례를 구현하는 민첩한 데이터 파이프라인 구축이 필수다”라며, “히타치 밴타라는 펜타호 8.2를 통해 기업들이 데이터 기반 조직으로 거듭나고 데이터 역량을 더욱 향상시키도록 지원하는 경쟁력을 보유하고 있다. 특히, 펜타호는 비정형 데이터 발생량이 많은 산업군에 효과적이다.”라고 말했다.

효성인포메이션시스템의 DATA사업팀 최태욱 부장은 “4차 산업혁명 시대에 기업들은 빅데이터 분석을 통해 성과를 도출하기 위해 데이터 수집, 통합, 정제, 분석모델 구축, 예측, 시각화 및 리포팅이라는 복잡한 단계들을 거쳐야 하는 도전과제에 직면해 있다. 펜타호는 이러한 빅데이터 분석 과정을 모두 자동화하며, 최신 데이터에 따라 기존의 모델을 민첩하게 업데이트하도록 지원함으로써 기업들의 빅데이터 분석 생산성을 높인다. 이미 효성인포메이션시스템은 데이터를 다루고 관리하는 분야에서 축적한 전문성 및 기술지원 능력을 바탕으로 국내 기업의 빅데이터 프로젝트 기획부터 구축 및 구현에 이르기까지 전 과정을 지원하고 있으며, 펜타호가 빅데이터 관련 문제를 해결하는 데 명쾌한 청사진을 제시할 것이다”라고 말했다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.