퀀텀코리아, 극지연구소에 빅데이터 공유·아카이빙 스토리지 공급
상태바
퀀텀코리아, 극지연구소에 빅데이터 공유·아카이빙 스토리지 공급
  • 이광재 기자
  • 승인 2013.10.21 09:22
  • 댓글 0
이 기사를 공유합니다

'스토어넥스트', 유전체 분석 데이터의 활용 극대화용

극지연구소가 유전체 분석 연구 데이터의 안정적인 관리 및 공유를 위해 퀀텀의 빅데이터 공유 및 아카이빙 스토리지인 '스토어넥스트(StorNext)'를 도입했다.

극지연구소는 극지생물의 기능 유전체 연구를 통한 극지 고유 생명 현상을 규명하고 극지생물의 오믹스(특정 세포 속에 들어 있는 생리현상과 관련된 대사에 대한 대량의 정보(전사체, 단백질체, 형질체 등)를 통합적으로 분석해 생명현상 규명) 연구에 나서고 있다. 이를 통해 극지생태계의 형성과 진화는 물론 극지생물의 고유 생명현상(극한환경 적응, 진화) 특성을 이해함으로써 지구생명의 탄생과 진화의 기원을 추정, 국제적으로도 극지유전체연구 분야를 선도하고 있다.

이러한 유전체 분석 작업은 불과 10년 전만해도 유전자의 염기서열을 분석하는 데에는 9~10년이 소요됐다. 하지만 차세대 유전자 염기서열 분석기술인 NGS(Next Generation Sequencing)가 지난 2004년에 상용화되면서 인간이나 작물과 같이 상대적으로 고등생물의 경우에도 몇 달이면 전체 유전체 해독이 가능할 정도로 이제는 훨씬 쉽고 빠르게 저비용으로 대용량의 시퀀싱(sequencing: 서열 분석)이 가능해졌다

하지만 이러한 시퀀싱을 통해 해독한 DNA의 염기서열 자체는 DNA를 구성하는 염기인 A, T, G, C가 어떤 순서로 배열됐는지 그 서열순서를 하나하나 밝혀낸 데이터로서 그 자체가 유용한 정보는 아니다. 예를 들어 인간의 유전체는 30억쌍의 염기서열로 구성돼 있으며 보통 이를 분석하기 위해 얻은 중간 데이터는 그 수십, 수백 배가 필요해 데이터양 자체가 매우 크다. 이 데이터들 중에 의미 있는 데이터를 추출해 인간의 유전적 특성이나 질병 등의 정보를 얻기 위는 컴퓨팅 작업이 필수적이다.

이에 극지연구소는 유전체 분석 데이터를 보다 안전하게 관리하고 데이터 활용도를 높이기 위해 기존 총 50TB 용량의 NAS(네트워크 스토리지) 3개에 분산·저장돼 있던 데이터들을 통합 관리하고 용량을 추가 증설하는 빅데이터 아카이빙(원본 데이터의 저장 및 관리) 시스템 구축 사업을 추진했다. 특히 유전체 분석이 전세계적으로 진행이 되면서 다양한 연구 성과인 R&D 데이터들을 보다 안정적으로 관리하고 활용하는 것이 절실했다.

극지연구소는 유전체 분석 자료 보관을 위한 스토리지 시스템을 144TB 규모로 구축하고 유전체 분석 빅데이터들을 안정적으로 보관하고 활용하기 위해 장기간 데이터 보관과 안정적인 운영이 가능한 테이프 방식의 백업 솔루션을 검토했다.

이에 극지연구소는 향후 스토리지 추가 증설이 용이한 높은 확장성을 제공하고 사용 편리성은 몰론 안정적이고 빠르게 데이터를 액세스하여 활용할 수 있도록 빠른 처리 속도, 가격 대비 성능 등 다양한 사항들을 종합적으로 고려해 최종적으로 퀀텀의 빅데이터 공유 및 아카이빙 스토리지인 스토어넥스트를 도입키로 결정했다.

특히 스토어넥스트 게이트웨이 서버(G302)를 통한 네트워크 기반의 고성능 데이터 엑세스를 보장하고 전용 메타데이터 컨트롤러 서버(MDC)와 QX-1200 디스크를 사용해 SAN 기반의 공유 스토리지의 성능과 확장성을 고려, 제품을 선정했다.

극지연구소는 스토어넥스트를 활용해 1년에 4개 이상의 유전체 분석 업무를 수행하고 있다. 실제로 1개 생물의 유전체 분석을 위해 기본 정보와 중간처리과정의 데이터 등의 수십TB의 분석 데이터를 스토리지에 안정적으로 저장하고 필요시에 시스템 부하 없이 빠르게 액세스해 사용하고 있다. 스토어넥스트는 총 144TB 용량을 제공해 다중 작업이나 복잡한 생물의 유전체 분석시에 생성되는 빅데이터들도 안정적으로 저장할 수 있도록 지원한다.

박현 극지연구소 책임연구원은 "지금까지 전세계적으로 유전체 정보가 분석된 고등생물은 실제로 50여종에 불과하다. 유전체 분석 기술의 발전은 극지 생물뿐만 아니라 지구의 수많은 생물들의 유전체 특성을 분석해 인류에게 의미 있는 정보를 제공하고 있다. 이러한 작업을 위해 도입된 퀀텀의 스토어낵스트를 통해 안정성, 높은 확장성, 용이한 대용량 데이터 관리로 연구효율성이 크게 향상될 것으로 기대한다"고 말했다.

극지연구소는 향후 유전체 분석 연구 데이터의 증가에 맞춰 추가적으로 빅데이터 아카이빙 스토리지를 추가로 도입할 계획이다. 또한 장기적으로는 데이터의 중요도를 고려해 원격지에 주요 데이터를 소산(분사 저장)하는 것도 계획하고 있다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.