이 시각 주요 뉴스

여백

AI 딥 러닝, 영상보안 기술 한계 극복할 수 있을까?

딥 러닝 목표물 감지와 트래킹, 인식 등 지능형 영상 적용에 깊은 영향 미치고 있어 신동훈 기자l승인2017.05.30 09:20:51l수정2017.05.30 09:29

크게

작게

메일

인쇄

신고

[CCTV뉴스=신동훈 기자] 보안 업계 데이터 스토리지 장치는 방대한 양의 로우(Raw) 데이터를 정기적으로 처리해야 한다. 다양한 규모의 안전도시 프로젝트가 진행됨에 따라 감시 노드의 수는 수백 만대에 달했다. 또한 고화질 CCTV의 광범위한 사용과 모니터링으로, 영상 감시와 관련된 데이터 양이 단기간 급격하게 증가했다. 데이터의 효율적인 수집, 분석, 애플리케이션의 지능적 활용 등이 점점 더 중요하게 대두되고 있다. 따라서, 지능형 영상 기능을 개선하는 것은 피할 수 없는 업계 전반의 목표가 되고 있다. 

보안 담당자는 신제품에 대한 투자가 단순히 이벤트 알림 후 객체 추적 혹은 특정인 추적 외에 훨씬 더 많은 혜택이 있기를 바란다. 몇 가지 예를 든다면, 일정 채널 당 필요한 CCTV 모니터링 요원을 대체하고 비정상적인 상황을 감지하며 사건 발생시 보다 효율적인 추적 혹은 미리 사전 경보를 해주는 것 등이다. 이러한 요구 사항을 충족하기 위해서는 새로운 기술이 필요하다. 지난 수 년간, 다양한 지능형 영상 감시 시스템이 출시됐지만, 보안 담당자들이 원하는 이상적인 결과를 가져오진 못했다. 딥 러닝의 출현은 이러한 요구들이 현실화하는데 도움을 줄 것이다.

전통적인 지능형 알고리즘의 재해석

전통적인 지능형 영상 보안 감시 기능은 씬(Scene)에 대한 엄격한 요구 사항을 충족한다. 이 같은 이유는 유사한 시나리오에서 지능형 인식과 분석의 정확도는 일관성이 없기 때문인데 이는 기존 지능형 영상 분석 알고리즘이 여전히 많은 단점을 갖고 있어서이다. 얼굴 인식과 같은 지능형 인식과 분석 과정에서는 두 가지 핵심 단계가 필요하다. 첫 번째가 특징 추출(Features are extracted), 두 번째가 분류 학습(Classification Learning)이다. 

첫 번째 단계의 정확도는 알고리즘의 정확도를 직접적으로 결정한다. 실제 대부분 시스템 산출과 테스트 워크 로드는 이 부분에서 소비된다. 전통적인 지능형 알고리즘의 특징은 인간에 의해 설계됐고 항상 주관적이었다. 더 추상적인 특징들은 인간이 이해하거나 묘사하는데 어려움을 겪기 때문에 불가피하게 놓치고 있다. 각도에 따른 변화와 조명 세기, 특히 샘플 크기가 방대할 경우 많은 기능이 감지하기 어렵게 된다. 그렇기 때문에 전통적인 지능형 알고리즘은 샘플룸 등 특정한 환경에서 잘 수행되는 반면, 다변화된 환경(이미지 화질, 환경 변화 등)에서는 정확도에 상당한 영향을 미친다.

두 번째 단계인 분류 학습은 주로 표적 탐지와 행동 인식을 포함하고 있다. 분류에 이용되는 범주가 증가함에 따라 난이도는 더욱 높아진다. 따라서, 전통적인 지능형 분석 기술은 차량 분석에서 매우 정확하지만 인간과 사물 분석에서는 정확도가 떨어진다. 예를 들어 차량 감지 시 차와 차가 아닌 물체와 구별이 이뤄지므로 분류가 간단하고 난이도가 낮다. 차량 특성을 인식하려면 다양한 차량 디자인, 로고 등을 인식해야 한다. 하지만 분류해야 할 것들이 상대적으로 적어 일반적으로 분류 결과가 정확하게 나타난다. 반면 얼굴 인식은 각각의 사람들 그 자체를 분류해야 하고 그에 상응하는 범주는 매우 높은 난이도로 이어질 수 있다.

전통적인 지능형 알고리즘은 일반적으로 복잡한 분류에서 많은 양의 데이터를 처리하는 상황을 다루기 위해 얕은(Shallow) 학습 모델을 사용한다. 분석 결과는 가장 알맞은 결과값과 거리가 멀다. 이런 결과는 지능형 애플리케이션의 심층적이고 폭 넓은 개발을 제한한다. 따라서, 보안 업계에서 빅데이터에 대한 인텔리전스의 ‘심층(Depth)’을 증가시킬 필요성이 대두되고 있다.

딥 러닝과 그 알고리즘이 가진 장점 

전통적인 지능형 알고리즘은 인간에 의해 설계됐다. 그들이 디자인한 것이든 아니든, 결과는 경험과 심지어 운에 달려 있다. 또한 이 과정은 많은 시간이 소요된다. 그렇다면, 기계가 자동적으로 기능들을 배우도록 하는 것은 어떨까? 그렇다! 이것이 실제 인공 지능의 목표이다.

딥 러닝에 대한 영감은 인간의 뇌 신경(Neural) 네트워크에서 나온다. 우리의 뇌는 매우 복잡한 딥 러닝 모델을 상상해 볼 수 있다. 뇌 신경 네트워크는 수십억 개의 서로 연결된 뉴런(Neurons, 신경 세포)들로 이뤄져 있다. 딥 러닝은 이 구조를 시뮬레이션한다. 이러한 다층(Multi layer) 네트워크는 정보를 수집하고 해당 작업을 수행할 수 있다. 또한, 객체 추론(Object abstraction)과 재현(Recreation)이 가능하다. 
딥 러닝은 심층적으로 다른 알고리즘과는 다르다. 전통적인 알고리즘의 부족함을 해결하는 방법은 다음과 같은 측면에 포함된다.

○ 얕은 곳에서 깊은 곳까지

딥 러닝을 위한 알고리즘 모델은 전통적인 알고리즘의 두 개의 하위 구조보다 훨씬 더 깊은 구조를 가지고 있다. 때로는, 계층 수가 100여개에 달할 수 있어 복잡한 분류에서도 대량의 데이터 처리가 가능하다. 딥 러닝은 휴먼 러닝과 그 과정이 매우 유사하며, 인간의 학습 과정을 가지고 있다. 각 레이어는 서로 다른 ‘가중치’를 가지며, 이 가중치는 영상의 ‘구성 요소’에 대해 학습된 내용을 반영한다. 인간의 뇌를 시뮬레이션했을 시, 딥 러닝의 오리지널 신호는 처리계층을 통과한다. 이 때, 우리 뇌는 부분적인 이해(얕은 단계)를 지나 전체적인 추론(깊은 단계)을 통해 사물을 인지한다.

○ 인공 기능에서 기능 학습까지

딥 러닝은 수 작업이 필요하진 않지만, 컴퓨터에 의존해 기능을 추출하는데 필요하다. 이렇게 하면 목표를 달성하기 어려운 추상적 기능을 비롯해 가능한 많은 기능을 추출할 수 있다. 더 많은 기능이 있을수록 인식과 분류가 더욱 정확해진다. 딥 러닝 알고리즘의 가장 직접적인 이점은 비교적 성취도가 높다는 것이다. 이 외에도, 인간 패턴 인식의 정확도를 높일 수 있고 간섭제거(Anti-interference) 기능을 강화하거나, 수천 개의 특징을 분류하고 인식할 수 있는 능력을 포함한다.

딥 러닝의 주요 특징

최근 딥 러닝이 이전과 다르게 점점 인기를 얻고 있는 데는 세가지 이유가 있다. 바로 데이터의 규모, 컴퓨팅 성능 그리고 네트워크의 구조이다. 데이터 기반의 알고리즘 성능의 향상은 단기간 내에 다양한 지능형 애플리케이션에서 가속화돼 왔다. 
특히 데이터 규모가 커짐에 따라, 알고리즘 성능이 향상됐다. 따라서 사용자의 경험이 향상됐고 더 많은 사용자가 참여하므로 더 큰 규모의 데이터를 더욱 쉽게 사용할 수 있게 됐다. 영상 보안 감시 데이터는 빅데이터의 60%를 차지하며 매년 20%씩 증가했다. 이 성과의 속도와 규모는 영상 보안 감시의 고화질의 보급에 기인한다. HD 1080p영상이 점점 보급화되고 있고 많은 중요한 애플리케이션에서 4K 또는 더 높은 고해상도까지 점차 적용되고 있다.

하이크비전은 다년간 자체 연구와 개발 능력으로 보안 업계에서 활동해 왔으며 많은 양의 실제 영상과 이미지 데이터를 교육 샘플로 사용했다. 많은 양질의 데이터와 100명이 넘는 팀원이 영상 이미지에 라벨을 지정하고 수 백만 가지 범주의 샘플 데이터를 축적했으며, 이 데이터를 통해 인체, 차량과 객체 패턴 인식은 영상 보안 감시 용도로 점점 더 정확해지고 있다. 

또한, 고성능 하드웨어 플랫폼은 더 높은 계산 능력을 가능하게 한다. 딥 러닝 모델은 많은 양의 샘플을 필요로 하므로 많은 양의 계산이 불가피하다. 과거에는 하드웨어 장치가 100개가 넘는 레이어로 복잡한 딥 러닝 모델을 처리 할 수 없었다. 2011년, 구글의 딥마인드(DeepMind)는 약 1 억 개의 뉴런으로 구성된 신경망을 실험하기 위해 1만 6000개의 CPU가 있는 1000개의 장치를 사용했는데 오늘날에는 몇 개의 GPU를 가지고 빠른 반복을 통해 동일한 종류의 계산 능력을 얻을 수 있다. GPU, 슈퍼 컴퓨터, 클라우드 컴퓨팅과 기타 고성능 하드웨어 플랫폼의 신속한 개발이 딥 러닝의 능력을 향상시키고 있다.

마지막으로, 네트워크 구조가 딥 러닝을 발전시키는 역할을 수행한다. 딥 러닝 알고리즘의 지속적인 최적화 과정을 통해 더 나은 대상 객체 인식을 달성 할 수 있다. 예를 들어 다른 빛, 각도, 자세, 표현, 액세서리, 해상도 등을 통해 얼굴 인식이나 시나리오와 같은 복잡한 응용 프로그램의 경우 네트워크 구조가 인식 정확도에 영향을 미친다. 즉, 딥 러닝 알고리즘의 레이어가 많을수록 더 나은 성과를 얻을 수 있다.

2016년 하이크비전은 이미지넷 대용량 이미지 인식 대회 2016(ImageNet Large Scale Visual Recognition Challenge 2016)에서 장면 분류 범주 1위를 차지했다. 하이크비전 연구소의 교육과 테스트를 위한 실험에 따르면, 초기 스타일의 네트워크와 그리 다르지 않은 잔여 네트워크를 사용해 교육 시간이 크게 단축됐다. 
게다가 OCR(Optical Character Recognition) 기술은 딥 러닝을 기반으로 연구소가 주도해ICDAR 2016 로버스트 리딩 대회(Robust Reading Competition)에서 1위를 차지했다. 

하이크비전은 디지털 포맷 이미지(Born-digital images), 집중 화면 텍스트(Focused scene text)와 부수적 화면 텍스트(Incidental scene text) 등 세 분야 문자인식 부문에서 경쟁사를 능가하며 문자인식 기술이 세계최고 수준임을 증명했다.

딥 러닝 제품의 적용

지난 2년 동안 딥 러닝 기술은 음성 인식, 컴퓨터 비전, 음성 번역 등에서 뛰어난 기능을 보여줬다. 얼굴 검증과 이미지 분류 분야에서 인간의 능력을 훨씬 뛰어 넘었고 보안 업계의 영상 감시 분야에서 높은 평가를 받았다.

딥 러닝의 비상은 지능형 영상을 적용함에 있어 목표물 감지, 트래킹 그리고 인식 부분에 깊은 영향을 미치고 있다. 딥 러닝의 영향이 있는 부분은 얼굴 감지, 차량 감지, 비전동기 차량 감지, 얼굴 인식, 차량 브랜드 인식, 보행자 감지, 인체 특징점 감지, 비정상적인 얼굴 감지, 군중 행동 분석, 멀티 타깃 트래킹 등이다. 

이런 지능형 기능은 일련의 프론트 엔드 감시 카메라, 백엔드 서버 그리고 딥 러닝 알고리즘을 지원하는 기타 제품을 필요로 한다. 소규모 응용 프로그램에서 프론트 엔드 카메라는 구조화된 사람과 차량의 특징 추출을 직접 조작할 수 있으며 수만 개의 사람 얼굴 이미지를 프론트 엔드 장치에 저장해 직접 얼굴 비교를 구현함으로써 서버를 통해 의사 소통 비용을 절감할 수 있다.

대규모 응용 프로그램에서 프런트 엔드 카메라는 백 엔드 서버에서 작동할 수 있다. 특히 구조화된 영상 작업은 프런트 엔드 장치에서 처리되므로 백 엔드 장치의 작업 부하를 줄이고 매칭과 검색의 효율성을 높인다.

하이크비전은 딥 러닝 기술을 가지고 인간, 차량과 객체의 특징과 행동을 정확하게 감지, 인식해 분석하고 실내외에서 널리 사용할 수 있는 딥인뷰(DeepInview) 시리즈 카메라 제품을 올해 선보일 예정이다. 주목할 만한 다른 제품은 고급 딥 러닝 알고리즘을 통합하고 인간의 사고와 기억을 모방한 딥인마인드(DeepInmind) NVR 시리즈이다. 딥인마인드 제품은 혁신적인 NVR + GPU 모드를 특징으로 하여 기존의 NVR와 추가적인 구조화 된 영상 분석 기능의 장점을 함께 보유하고 있어 영상 가치를 크게 향상시킬 수 있다.

딥 러닝은 AI 개발의 다음 단계이다. 지시된 분류의 특징과 패턴이 알고리즘으로 설정되는 기계 학습을 뛰어 넘을 것이다. 다시 말해 딥 러닝은 감독자가 없거나 ‘자기 학습’ 원리를 포함한다. 하이크비전은 자체 분석 알고리즘을 컨셉으로 개발하고 있다. 높은 정확도는 멀티 레이어 학습과 광범위한 데이터 수집의 결과이다. 이 알고리즘을 얼굴 인식, 차량 인식, 사람 인식 또는 기타 플랫폼에 적용하면 분석 성능이 크게 향상될 것이다.

소스: 하이크비전 디지털 테크놀로지팀

신동훈 기자  sharksin@cctvnews.co.kr
<저작권자 © CCTV뉴스, 무단 전재 및 재배포 금지>

신동훈 기자의 다른기사 보기
여백
여백
여백
여백
여백
여백
여백
여백
여백
매체소개공지사항보안자료실기사제보광고문의불편신고개인정보취급방침청소년보호정책이메일무단수집거부    [기사ㆍ기고 문의 : desk@cctvnews.co.kr]
(주)테크월드 08507 서울특별시 금천구 가산디지털1로 168, 1012-1호 (가산동, 우림라이온스밸리 C동)  |  제호: 씨씨티브이뉴스  |  발행일: 2009년 2월 19일
대표전화 : 02)2026-5700  |  팩스 : 02)2026-5701  |  이메일 : webmaster@techworld.co.kr  |  청소년보호책임자 : 박지성
통신판매업신고번호 : 제 2008-서울금천-0415 호  |  발행·편집인 : 박한식  |  인터넷신문등록번호 : 서울, 아 00607  |  등록일 : 2008.06.27
Copyright © 2017 CCTV뉴스. All rights reserved .