[기고] 기업에 반드시 필요한 ‘재해 복구’ 계획

재해 복구(DR) 계획 수립과 기업 DR 가치 평가 수립 시 고려해야 할 사항

2020-07-20     최형주 기자

[글=레이첼 러(Rachel Ler) | 컴볼트 아시아태평양 지역 세일즈 부문 부사장]

기상 악화·지진과 같은 재해와 랜섬웨어 등 외부 요인으로 인한 비즈니스 중단은 기업에서 빈번히 발생한다. 일분 일초를 다투는 이같은 상황에서 기업이 소유한 모든 데이터를 한 눈에 확인하고, 신속하게 복구하는 것만큼 중요한 일은 없다. 그리고 이때 필요한 것이 바로 ‘재해 복구 계획’의 수립과 실행이다.

 

다양한 위협, 위기에 빠진 데이터

클라우드(SaaS) 기반 모니터링 솔루션 업체인 로직모니터(LogicMonitor)의 ‘IT 운영 중단의 영향 연구: IT 다운타임 및 비즈니스에 미치는 영향에 대한 분석’ 보고서에 따르면, 전 세계 IT 의사 결정자들 중 96%가 지난 3년간 최소 한 차례의 비즈니스 운영 중단 사고를 겪었다고 응답했다.

그러나 비즈니스 중단은 기업이 손쓸 수 없는 상황이 아니다. 확실한 재해 복구 계획을 수립했다면, 재해 발생 시에도 비즈니스 중단을 완벽히 대비할 수 있다. 성공적인 기업 데이터 복구를 위해선 신뢰할 수 있는 현대적인 데이터 복구 솔루션을 갖추는 것이 관건이다.

 

데이터 가용성을 위협하는 랜섬웨어

기업의 재해 복구 솔루션은 다양한 운영 중단 상황에서 비즈니스를 복구할 수 있는 능력이 요구된다. 오늘날 운영 중단을 일으키는 주요 원인은 사이버 범죄이며, 특히 랜섬웨어는 새로운 개념이 아니다.

랜섬웨어는 다양한 형태로 수십 년 동안 지속적으로 발생한 사이버 위협이며, 새로운 유형의 위협들과 함께 진화하고 있다. 이는 사이버 범죄에 활용되는 기술과 기본 코드가 다른 범죄자들과 공유되기 때문이다.

신종 멀웨어들은 하루가 다르게 기술적 진화를 이루고 있다. 랜섬웨어 감염 시 일차적인 공격이 발생하는 지점은 백업된 데이터다. 따라서 백업 소프트웨어 자체에 랜섬웨어로 인한 데이터 감염 방지 기능이 필수적이다.

 

다계층 복제를 통한 비용 효율적인 데이터 복구

실질적인 재해 복구에 대한 도전 과제는 복구 위치(site)로 데이터를 복제하는 일이다. 기업은 늘 새로운 데이터를 생성하는데, 새롭게 생성된 데이터의 생성 위치 운영이 중단될 경우를 대비해 다른 외부 위치(off-site)로 복제할 것을 권고한다.

이론적으로 기업의 데이터를 나노초(10억분의 1초)만에 재해 복구 사이트로 100% 복제하는 것이 최상의 복구 방법이다. 하지만 네트워크 용량이 제한적이라는 점을 고려한다면 ‘다계층 복제(multi-tiered replication)’ 전략이 가장 현실적인 방법이다. 기업들은 다계층 복제 전략을 통해 데이터의 중요도에 따라 우선 순위가 각기 다른 여러 가지 유형의 워크로드를 복원할 수 있다.

예를 들어, 애플리케이션의 중요도에 따라 계층(tier) 1의 주요 데이터베이스는 실시간 복제를 통해 분 단위로 업데이트되고, 계층 2 애플리케이션은 스냅샷을 통해 4시간마다 복제되며, 계층 3의 웹 서버는 백업을 통해 24시간 주기로 복제된다. 기업은 다계층 복제 기능을 통해 네트워크 연결 및 스토리지에 IT 관련 예산을 초과 지출하지 않고도 여러 계층의 애플리케이션 및 데이터베이스를 보호할 수 있게 된다.

 

복구 시점 목표(RPO)에 따른 재해 복구 비용

더 낮은 예산을 책정해 재해 복구를 구현하는 방식도 존재한다. 이는 원격 백업, 스냅샷, 중복 제거된 사본, 실시간 복제 같은 다중 복제 방식을 동시에 사용하는 방식이다. 노후화된 재해 복구 솔루션의 경우 대개 값비싼 하드웨어 및 네트워크 구성 요소를 수반한 한 가지 복제 방식을 사용하기 때문에 불필요한 비용이 추가적으로 발생하기 마련이다.

현대적인 재해 복구 계획은 전통적인 방식과는 다른 재해 복구 방식을 채택해야 한다. 컴볼트의 재해 복구 계획은 기업에게 다중 복제 방식을 제공해 애플리케이션 그룹을 보호하기 위한 적절한 복제 기술을 골라 선택할 수 있도록 한다.

다계층 복제의 경우 랜섬웨어 피해 복구를 지원하기도 한다. 기업은 전체 환경을 복원하기 위해 제어된 스냅샷이나 백업 복사본 같은 확장 가능한 방식을 강구해야 한다. 만약 기업에서 이에 대한 고려 없이 연속 복제 솔루션만을 사용하고 있다면 결과적으로 막대한 비용 지출을 초래할 수 있다. 세분화된 복원 데이터를 모두 보관하기 위해 더 많은 양의 스토리지를 도입해야 하기 때문이다.

 

대규모 재해 및 일상적인 작업도 처리 가능한 복구 유연성

데이터 센터 전체에 치명적인 피해를 입히는 재해가 빈번히발생하지는 않는다. 하지만 파일 복구 및 전체 서버 복원은 간혹 발생하며 일상적으로 염두에 두고 준비해야 하는 작업이기도 하다. 해당 복구 시나리오의 경우, 단일 사용자 인터페이스를 통해 온프레미스와 클라우드 스토리지 위치 전반에서 데이터와 워크로드를 관리할 수 있는 능력이 핵심이다.

컴볼트 컴플리트 백업&복구(Commvault Complete Backup & Recovery) 솔루션의 경우, 모든 데이터 관리 기능을 탑재한 간편한 관리자 콘솔을 제공해 전체 IT 환경 및 범위를 아우르는 데이터와 애플리케이션을 관리할 수 있도록 했다.

 

재해 복구 관리 자동화를 통한 IT 워크로드 절감

기업의 재해 복구 솔루션은 특히 관리가 용이해야 하며 재해가 발생했을 때 즉시 가동할 준비가 돼 있어야 한다. 이에 컴볼트는 컴플리트 백업 & 복구 솔루션에서 백업 및 재해 복구 활용 사례에 모두 일관된 프레임워크를 제공한다. 이를 통해 기업의 요구 사항에 맞게 재해 복구 계획을 직접 지정할 수 있게 했다.

단일 관리 콘솔인 컴볼트 커맨드 센터(Commvault Command Center)는 기업 데이터 보호 대상, 보호 위치, 데이터와 애플리케이션 보호 방식을 정의할 수 있도록 지원해 복구 계획을 단 한 번만 설정하면 된다.

하이퍼바이저, 가상머신(VM), 데이터베이스, 클라우드 등에 대한 보호 계획을 도입 첫날부터 바로 구현 가능할 수 있게 했고, 이후에는 자동으로 IT 환경을 보호하도록 설계했다. 또한 자동화, 오케스트레이션 기능과 수동 조작이 거의 필요 없는 반복 가능 프로세스를 지원한다.

재해가 발생했을 때 모든 IT 인력이 항시 상주하는 경우는 드물 것이다. 따라서 재해 복구 솔루션은 IT 관리자가 부재중이더라도 재해 복구 시스템 대체 작동(failover) 단계를 쉽게 실행할 수 있어야 한다.

컴볼트 컴플리트 백업 & 복구 솔루션은 다양한 유형의 재해에 대비해 여러 가지 방식으로 자동화된 재해 복구를 수행할 수 있도록 지원하며, 재해 발생 시 기업의 우선순위(예: 최신 데이터에 대한 우선적인 업데이트, 시스템 대체 작동을 최대한 빨리 실행 등)를 지정하고 단 한 번의 클릭으로 복구를 수행할 수 있도록 구축할 수 있다.

 

실질적인 운영 중단에 대응할 수 있는 재해 복구

기업 입장에서 온프레미스, 클라우드 및 가상 환경 전반의 데이터에 대한 포괄적인 재해 복구 체계를 갖추기 위해서는 재해 복구 솔루션 선택 시 다음의 6가지 사항을 고려해야 한다.

첫째는 기상 악화나 랜섬웨어 등 다양한 유형의 비즈니스 운영 중단으로부터 비즈니스를 보호하는 기능이다. 두 번째는 기업의 변화하는 인프라 요구 사항을 충족하는 유연한 재해 복구 옵션을 갖춰야 한다. 세 번째는 재해 복구뿐만 아니라 기타 복구 작업의 자동화 및 실행 기능이 탑재된 솔루션을 채택해야 한다.

네 번째로는 비용과 성능 간 균형을 맞출 수 있는 다양한 재해 복구 아키텍처 옵션을 지원하는지 여부를 파악해야 하며, 다섯 번째는 사용하기 간편하고 직관적인 관리 콘솔(Console)을 제공하는 것이 바람직하다. 마지막 여섯 번째는 재해 발생 시 복구 작업을 간소화할 수 있는 기능을 탑재한 솔루션을 선정해야 한다는 것이다.

체계적인 재해 복구 계획 수립을 통해 조직 내 핵심 데이터의 보안성을 확보하는 것은 조직의 규모와 종류를 막론하고 필수적인 일이다. 하지만 단순히 보안 체계를 갖추는 것만으로는 한계가 있으며, 반드시 백업과 복구 방안에 대한 대응책을 함께 마련해야 한다. 만약 백업 데이터를 랜섬웨어가 쉽게 침입할 수 있는 위치에 저장할 경우, 데이터는 쉽게 암호화되고 손상될 수 있다.

랜섬웨어 보호 기능을 제공하지 않는 백업 및 데이터 복구 시스템을 사용한다면, 해당 백업 계획은 안전하다고 보기 어렵다. 보안과 백업에 대한 관행에 세심한 주의를 기울어야 랜섬웨어 위험을 완화하는 동시에 주요 데이터의 안전을 지키고 비즈니스 연속성을 개선할 수 있다.

비상 상황 발생 시 비즈니스 운영 및 중단 여부는 기업이 어떤 재해 복구 솔루션을 선택했는지가 좌우한다. 오늘날 재해 복구 계획에는 물리적/가상 서버와 스토리지 어레이, 애플리케이션, 데이터베이스, 클라우드 환경, 컨테이너, 그리고 빅데이터 플랫폼까지 포함돼야 한다.

점차 많은 조직들이 다수의 툴을 단일 솔루션으로 대체해 일상적인 데이터 관리 업무를 처리하고, 전면적인 재해 시나리오에 대비하고 있다. 단일 솔루션을 사용할 경우, 일상 업무에서 복원 작업을 간소화할 뿐 아니라 일관된 프로세스를 보장하며, 직원들의 효율성과 대응력을 높일 수 있을 것이다.