[기고] AI 스토리지, 운영관리 자동화로 혁신 IT기술 활용에 집중하도록 지원

데이터센터에 서비스 중단 위험을 최소화하고 운영비용 절감에 기여

2019-07-12     석주원 기자

[효성인포메이션시스템 SA팀 권필주 수석컨설턴트]
물리 및 가상 리소스가 혼재된 현대의 IT 환경에서 기존의 스토리지는 수작업으로 성능을 분석해 이슈를 파악 및 해결해야 했다. 또한, 스토리지의 QoS(Quality of Service, 서비스 품질)를 관리하는데도 수작업으로 인한 많은 시간을 소모해야 했다. 이러한 도전과제를 해결 할 수 있는 IT 자동화 기능을 제공하는 AI 스토리지가 주목받고 있다. AI 스토리지는 내부 관리자의 실수를 줄이고, 외부의 보안 위협으로부터 인프라, 애플리케이션 및 데이터를 성공적으로 보호할 수 있다. 이런 기능을 활용해 기업은 자사의 혁신적인 비즈니스 및 IT 프로젝트를 보다 안정적으로 운영할 수 있다.


■ 기존 스토리지의 한계

기존 스토리지는 여러 물리ㆍ가상 리소스가 혼재된 환경에서 성능 병목점의 정확한 판단 및 SLA(Service Level Agreement, 서비스 수준 협약) 조건에 따라 성능 임계치의 동적 설정 어려움 등으로 인해 사전 이상 증상 탐지가 쉽지 않았다. 뿐만 아니라, 용량 증설이 필요한 스토리지와 시기를 수작업으로 파악해야 해서 시의적절한 신규 인프라 도입과 예산 계획 수립이 어렵고 신기술 대응이 느리다는 문제점이 있었다. 이로 인해 데이터센터 관리자들은 전략적 가치가 높은 IT 프로젝트보다 스토리지 프로비저닝, 성능 튜닝 등 반복적인 작업에 더 많은 시간을 투자해야 하는 비효율을 감수해야 했다.
그래서 폭증하는 데이터 및 애플리케이션으로 한층 복잡해지는 인프라 환경에 대응하고 성능 및 가용성을 간편하게 향상시켜 주기 위해, 예측 분석 및 진단을 거쳐 운영 관리를 자동화할 수 있는 AI 기술이 접목된 스토리지가 각광받고 있다.
AI 스토리지는 복잡한 IT 환경에서도 최상의 성능을 유지할 수 있도록 스토리지 문제를 자동으로 분석하고, 용량을 자동적으로 증설하 도록 돕는다. 이를 통해 스토리지 병목현상 및 중단을 사전에 예측하고 예방할 수 있으며, 인프라 환경의 다양한 애플리케이션을 보다 원활하게 지원할 수 있다. 특히, AI 스토리지는 스토리지 프로비저닝을 포함한 일상적인 스토리지 작업을 자동화하고 다양한 인프라 관리 툴을 통합 및 자동화함으로써 기존 IT 관리 인력의 업무 부 담을 대폭 줄여준다. 시장조사업체인 451 리서치의 분석에 따르면, 스토리지의 장애 원인 중 40%가 휴먼 에러로 인해 발생하기 때문에 완벽한 IT 자동화 환경을 지원하는 AI 스토리지는 인프라 가용성 및 안정성을 높이는 데 핵심적인 역할을 한다.


■ AI, 데이터센터의 민첩성과 효율성 강화

시중의 AI 스토리지 솔루션은 스토리지 제품에 별도의 AI 운영 소프트웨어를 통합하는 방식으로 이용 가능하다. 이러한 AI 소프트웨어는 우선 인프라 분석 및 모니터링 소프트웨어를 통해 문제를 사전에 예측하고 문제의 원인 해결을 위한 조치를 제안한다. 그 다음으로 IT 리소스 제공 및 관리 자동화 소프트웨어를 통해 문제 해결을 위한 조치를 자동 수행하는 방식으로 작동된다.
AI 기반 분석 및 모니터링 소프트웨어는 데이터센터의 서버, 네트워크, 스토리지 등의 IT인프라에서 수집한 현황 데이터를 머신러닝 기술 기반으로 분석해 성능 관련 인사이트를 도출해낼 수 있다. 간단한 클릭만으로 특정 가상머신 볼륨과 관련된 모든 리소스 현황을 한 눈에 파악할 수 있으며, 병목 현상에 대한 근본 원인 분석 기능을 통해 공유 리소스 및 병목에 영향 받는 리소스를 손쉽게 파악하도록 지원한다.
예를 들어, 동일한 스토리지 풀을 공유하는 A업무와 B업무 중, A업무로 인한 B업무의 I/O 성능이 제한되는 것을 밝혀낼 수 있다. 이러한 분석 결과를 기반으로 B업무의 최상의 성능을 보장하기 위해서 A업무에 해당하는 스토리지 볼륨의 I/O 상한선을 설정할 수 있다. 이렇듯, AI 기반 인프라 분석 결과를 자동화된 조치와 연결해 업무 중요도에 따라 스토리지 볼륨의 I/O 성능을 조정함으로써 피크 시간대에 중요 업무를 원활하게 지원할 수 있다.
AI 운영 소프트웨어는 서비스 품질을 자동으로 관리하도록 지원할 수 있을 뿐만 아니라, 용량이 부족한 볼륨을 한눈에 파악해 간단하게 증설하도록 돕는다. 다양한 데이터 스토어의 용량 사용 현황을 보여준 뒤, IT 자동화 소프트웨어와 연결해 용량이 부족한 스토리지 볼륨에 대해 원하는 만큼 용량을 증설할 수 있도록 지원한다.


■ 동적 임계치에 기반한 분석 모니터링

기존 스토리지에서는 담당자가 성능의 병목을 미리 인지해 대비하거나 데이터 보호 서비스 수준협약(SLA)에 따라 정적 임계치를 설정해 관리해왔다. 이와 달리, AI 스토리지는 머신러닝을 기반으로 인프라 환경의 다양한 변수를 반영해 성능을 분석하고 동적 임계치를 자동 설정한다. 이러한 AI 기술은 오랜 기간 보관된 성능 데이터를 분석해 정상적인 운영 범위를 결정하고, 결정된 운영 범위를 초과하는 성능에 대해 미리 경고 알람을 받도록 SLA를 설정할 수 있게 한다.
따라서, 다양한 물리 및 가상화 리소스가 존재해 임계치의 기준을 설정하기 어려운 클라우드 환경에서도 비정상적인 성능 사용량을 철저하게 모니터링하고 문제 발생 전에 조치를 효과적으로 취할 수 있다. 기존의 스토리지 환경에서 관리자의 판단 부족 또는 작업 실수로 인해 발생했던 문제들을 예방할 수 있게 된다.


■ 자가 치유를 통한 고가용성 향상 목표

앞으로 AI 스토리지는 데이터센터의 모든 IT 인프라 및 관련 시설을 완벽하게 분석해 제어하고, 데이터센터에 수집되는 디바이스 및 고객 관련 데이터를 민첩하게 분석하도록 지원하는 방향으로 발전할 것이다. 이를 통해 기업은 비즈니스 영역뿐 아니라 IT 서비스 관리 영역에 있어서도 앞으로의 인프라 계획 및 현재 구동 성능을 최적화하는 혜택을 얻을 수 있다. 또한, 데이터센터에서 시스템 중단이 발생할 경우 자동으로 복구를 실행하는 자가 치유(self-healing) 기술이 더욱 강화될 것이다.
기업들은 데이터센터에 AI, 머신러닝, 빅데이터 등 최신 기술을 도입해 보다 혁신적인 서비스로 고객 경험을 향상시키길 원하면서, 동시에 인프라의 높은 가용성 및 안정성을 보장하고자 한다. AI 기반의 자가 치유 기능은 기업의 이런 혁신적인 서비스들을 중단 없이 운영 가능한 환경으로 만들어 줌으로써, 안정적이고 민첩한 비즈니스 대응을 통해 리스크를 줄이고 비용을 효율적으로 통제할 수 있도록 도와준다.
AI 운영 소프트웨어는 보다 많은 써드파티 IT 관리 툴들이 상호연동 가능한 자동화 환경으로 통합되도록 지원해준다. 이를 통해 멀티 및 하이브리드 클라우드 환경을 활용하는 기업은 서로 다른 클라우드 환경의 IT 관리 툴들을 통합 자동화 환경에 결합함으로써 인프라 문제를 보다 신속하게 해결하고 성능을 최적화할 수 있다.
특히, AI 운영 소프트웨어는 디바이스의 랜섬웨어 감염 등 데이터 훼손 상황에서도 효과적인 데이터 보호 및 복구 자동화를 수립할 수 있기 때문에 예상치 못한 보안 사고에도 리스크를 최소화할 수 있도록 지원한다. 이는 데이터센터에서 보다 많은 리소스를 활용할 것이 요구되는 현대 IT 환경에서 고객의 개인 정보 및 기업 내부의 핵심적인 정보를 더욱 안전하게 보호해줄 것이다.