AI 민주화, 구글 클라우드 플랫폼(GCP)이 선두주자되겠다

AI 퍼스트 정책으로 클라우드 시장 공략…AI 서비스 누구나 쉽게 개발·사용하는 환경 만들 것

2017-09-13     신동훈 기자

[CCTV뉴스=신동훈 기자] 검색에서 시작한 구글 회사는 지메일, 유튜브, 안드로이드, G맵, 크롬, 구글 플레이 등 다양한 서비스를 제공하는 회사로 성장했다. 사용자도 10억 명이 넘는다. 구글은 이런 다양한 서비스를 구글 클라우드 플랫폼(이하 GCP)를 통해 제공하고 있다.

GCP는 아마존웹서비스(AWS), 마이크로소프트 애저와 같은 클라우드와는 다른 방법으로 시장을 공략하고 있다. AWS와 애저가 인프라를 통해 외연의 확장에 초점에 맞춰 있다면 GCP는 그 안에 활용될 다양한 서비스들을 이용할 수 있는 API에 초점을 맞추고 있는 것. 이 API 서비스로 AI와 데이터 분석 기술을 제공하고 있다. 타사는 따라하지 못할 구글만의 강점으로 클라우드 시장을 공략하고 있는 것.

현재 GCP는 다양한 AI 관련 API 서비스를 제공하며 AI 민주화에 앞장서고 있다. 머신러닝 지식이 전혀 없어도 사용할 수 있는 사전 훈련된 머신러닝 모델(Pre-trained ML modes)는 물론 직접 머신러닝 모델을 만들고 훈련시킬 수 있는 클라우드 머신러닝 플랫폼까지 제공하고 있다.

구글코리아는 GCP에 대한 설명과 함께 AI 서비스를 제공하는 API 모델을 소개하는 자리를 지난 9월 12일 가졌다. 구글은 클라우드 퍼스트가 아닌 AI 퍼스트로서 구글의 GCP 인프라와 기술을 활용해 누구나 쉽게 AI를 개발할 수 있는 미래를 꿈꾸고 있다.

지아 리(Jia Li) 구글 클라우드 AI 및 머신러닝 R&D 총괄은 “AI를 활용해 기업에게 새로운 기회를 창출하고 있으며 AI 혜택도 놀라운 속도로 커지고 있다”고 말했다. 이어 “현재는 AI가 금융과 교육, 제조 등 산업군에서 주로 활용되고 있지만, 언젠가는 일반인들도 피부에 와닿도록 AI가 일상화되는 AI 민주화가 이뤄질 것으로 예상되고 있다”고도 덧붙였다.

지아 리 총괄은 “값비싼 자원을 모든 사람이 혜택을 받을 수 있도록 하는 것은 의미 있는 일이 될 것이고 AI를 모두에게 제공하는 민주화 작업의 첫 걸음을 떼는 것이 중요하다”며 “AI 진입장벽을 낮춰 모든 사람들이 AI 혜택을 얻을 수 있도록 매진하겠다”고 강조했다.

구글은 텐서플로(TensorFlow)와 같은 머신러닝과 딥러닝을 위한 라이브러리와 API 서비스들을 통해 기업들이 쉽게 AI 서비스를 구축하도록 하는데 돕고 있다. 다양한 API 서비스를 제공하는 가운데 지아 리 총괄은 그 중 4가지를 소개했다.

비전 API

비전 API는 이미지를 빠르게 분석해 카테고리(요트, 탑 등)로 분류하고 이미지 내용을 이해하게 한다. 라벨 감지, 폭력물 등 콘텐츠 감지, 제품 로고 감지 등이 가능하다.

에어버스 디펜스&스페이스(Airbus Defence&Space)는 위성 이미지를 탐지하는데 비전 API를 활용하고 있다. 어떤 곳에서 구름이 생성되는지 패턴을 통해 자동으로 탐지해 정확성과 신속성을 높였다. 이 외에 작물 수확량 예측, 산림지 모니터링, 특정 부지 관리 등 위성 사진 활용이 필요한 곳에 비전 API는 다양하게 활용하고 있다.

국내 기업에서는 티몬이 비전 API를 활용하고 있다. 건강기능식품 같은 경우 복용, 효과 등의 단어는 광고에 들어가면 안 되는 ‘금칙어’이다. 티몬은 매일 3~4만장의 광고 이미지를 봐야 하는데 사람이 보는 이상 실수가 일어날 수 밖에 없다. 이에 비전 API를 활용해 금칙어 단어를 찾아 키워드를 분류하고 필터링 작업에 활용하고 있다.

이승배 티몬 CTO는 “머신 러닝 기술이 고퀄리티 작업에는 아직까지 사람보단 떨어지나 대신 엄청나게 빠른 속도로 할 수 있는 장점이 있다”며 “비전 API를 활용한 카테고리 분류 작업을 통해 모니터링 자원을 절약할 수 있었고 이 자원을 다른 곳에 활용할 수 있었다”고 전했다.

번역 API

기존 룰 베이스에 신경망 베이스 번역으로 넘어간 구글 번역은 번역 품질이 크게 개선됐다. 지금도 지속적으로 업데이트되며 번역을 개선하고 새로운 언어와 언어 조합을 추가하고 있다.

VICE라는 회사는 해외 다양한 매체의 수 백개 기사들을 보고 의미 있는 기사를 자국 시장에 내보내고 있다. 일본어와 에스파냐어, 독일어 등 다양한 언어의 헤드라인을 일일이 번역해야 하는 문제가 있어 일부분의 콘텐츠만 봤었다. 지금은 번역API를 활용해 모든 기사 헤드라인을 영어로 볼 수 있게 됐고 이 중 의미 있는 기사를 골라 번역해 시장에 내보내고 있다.

ELEX라는 ‘Clash of Kings’를 서비스하는 게임 회사는 게임 내 존재하는 다양한 국가의 유저들이 한 곳에서 커뮤니티를 진행하도록 하기 위해 커뮤니티 게시판에 번역 API를 활용해 모든 사용자들이 자신들의 언어로 볼 수 있도록 바꿨다.

음성인식 API

API에 신경망 모델을 적용해 음성을 문자로 변환할 수 있다. 110개가 넘는 언어와 그 변형을 인식할 수 있다. 딜레이 없이 자연스럽게 다른 언어지만 대화가 가능하다.

한국 IT 기업인 하이퍼커넥트(Hyperconnect)는 아자르(Azar)라는 전 세계 유저들이 인스턴트 비디오 채팅이 가능한 애플리케이션을 서비스중이다. 이를 위해 하이퍼커넥트는 음성인식 API와 번역 API 두 개를 동시에 활용했다.

음성인식 API가 사용자의 음성을 텍스트로 변환해 번역 API로 전송하고 번역 API는 곧바로 스트림을 번역한다. 그리고 구글 클라우드 Messaging 서비스를 통해 아자르에 말풍선이 표시된다. 딜레이 없는 즉각적인 번역과 변환으로 대화 흐름이 자연스럽게 이어진다.

자연어처리 API

텍스트가 어떤 감정을 가지고 있는지 언급된 사람과 장소, 이벤트는 무엇인지 정보를 추출할 수 있는 API이다. 콜센터 또는 메시지 프로그램에서 발생하는 고객 대화를 통해 고객의 상태와 감정, 원하는 바가 무엇인지 등을 분석할 수 있다.

오카도(Ocado)라는 기업은 이메일로 오는 고객 불만사항을 매뉴얼대로 분류하는데 수동으로 하다보니 시간이 지연되고 자연스레 고객만족도가 하락하게 됐다.

자연어처리 API를 도입한 오카도는 이메일과 콜 등을 자동태깅해 담당 에이전트에게 바로 태깅할 수 있도록 구조를 바꿨다. 이를 통해 긴급메일은 4배 더 빠르게 회신할 수 있게 됐고 전체적으로 3배 더 빠른 처리가 가능해졌다.

비디오 인텔리전스 API

지아 리 총괄이 오늘 언급은 하지 않았지만, 구글은 지난 3월 비디오 인텔리전스 API를 공개한 바 있다.(아직 베타 버전이다)

비전 API가 사진을 검색한다면 비디오 인텔리전스 API는 한 단계 더 나아가 영상을 검색하는 것으로, 정적인 이미지에서 동적인 이미지까지 검색이 가능해진 것을 의미한다. 모든 영상의 주요 장면과 명사들을 식별하고 특정 이벤트를 태깅할 수 있다. 동영상 내 다양한 소리 중 잡음과 신호를 분리해 포착할 수도 있다.

이처럼 비디오 인텔리전스 API는 영상 파일에서 중요한 인사이트를 도출할 수 있다. 가장 먼저 적용되고 테스트하는 것은 유튜브와 같은 영상 콘텐츠 분야겠지만, CCTV와 같은 보안 카메라에서도 조만간 테스트될 것으로 보이고 향후 영상감시분야에서 중요한 역할을 할 것으로 예상된다.

비디오 인텔리전스 API를 탑재한 CCTV는 CCTV 하나하나가 도시를 안전하게 감시하는 똑똑한 AI CCTV가 될 것이고 클라우드 통합관제센터를 통해 신속하고 빠른 대처, 통합된 운영을 통해 더 안전한 도시감시체계가 구축될 것으로 예상된다.