인공신경망 번역 기술 확보 경쟁은 지금부터!(2)
상태바
인공신경망 번역 기술 확보 경쟁은 지금부터!(2)
  • 이나리 기자
  • 승인 2017.04.25 15:49
  • 댓글 0
이 기사를 공유합니다

구글, 마이크로소프트 선두, 네이버, 한컴은 한국어 특화된 알고리즘 개발

[CCTV뉴스=이나리 기자] 2007년 구글이 웹 기반 자동번역기를 무료로 공개했을 때, 사람들은 클릭 한번으로 여러 문장들이 순식간에 번역되는 기능을 보고 놀라움을 금치 못했었다. 하지만 예전의 번역기는 동음이의어와 다의어를 구별 못하거나 어순과 표현이 많이 어색해 마치 외래어처럼 번역되는 경우가 많았다. 이처럼 번역기는 번역 결과가 만족스럽지 않았음에도 불구하고 모든 문장을 사람이 직접 번역하는 것보다 시간을 절약할 수 있었기 때문에 지금까지 유용하게 사용돼 왔다.

그러나 최근 번역기는 딥러닝과 신경망 기술이 적용된 신경망 기계번역(GNMT, Google’s Neural Machine Translation)으로 발전되면서 변역 결과물이 눈에 띄게 향상됐다. 예전보다 번역의 오류 가능성이 대폭 감소하고, 보다 자연스러운 번역이 가능해졌다.

더 나아가 번역 기술은 텍스트 뿐 아니라 음성 번역, 이미지 번역까지 가능해지면서 음성인식 기술도 함께 급부상하고 있다. 향후 통번역 서비스는 스마트폰, 스마트워치, HMD, 가정용 음성로봇 서비스 등 다양한 디바이스에 접목돼 국제회의, 여행, 교육 등 다양한 산업에서 활용될 것으로 기대된다. 신경망 번역 기술을 지원하기 위해서는 데이터베이스의 확보와 인공지능을 지원하는 알고리즘과 플랫폼 개발 등이 뒷받침돼야 한다.

기계 번역 시장과 국내‧외 기업별 번역기술 현황, 번역기술로 인해 파생되는 산업 전망에 대해 1, 2, 3회에 걸쳐 알아보겠다.

 ◇ 인공신경망 번역 기술 확보 경쟁은 지금부터!

신경망 기계번역 기술은 이제 막 걸음마를 땠다고 볼 수 있다. 구글은 2016년 9월 세계 최초로 신경망 번역 서비스를 8개 언어로 시작했고, 2016년 11월 한국어를 포함한 8개 언어(영어-프랑스어, 영어-독일어, 영어-스페인어, 영어-포르투갈어, 영어-중국어, 영어-일본어, 영어-한국어, 영어-터키어)를 추가하면서 현재 총 16개 언어 통역을 지원하고 있다.

지난 2월 9일 구글코리아에서 진행된 기자 간담회에서 구글의 신경망 기계번역 시스템을 개발한 마이크 슈스터(Mike Schuster) 구글 리서치 박사는 “과거 구글이 10년 동안 사용한 번역 시스템에서는 번역의 품질이 0.1만 향상돼도 새로운 버전 출시가 가능하다고 판단했다. 그러나 이번 새로운 신경망 번역 시스템에서는 언어별로 평균 0.5점 이상의 개선 결과 나타났고 일부 언어는 1점 이상으로 향상됐다”며 “일례로 한국어와 영어는 0.94점 개선됐으며, 중국어와 영어는 0.6점 개선됐다”고 설명했다.

구글은 신경망 번역기술 도입 후, 위키피디아와 뉴스 매체의 샘플 문장을 기준으로 주요 언어 조합을 평가했을 때 번역 오류가 기존의 구문기반 번역보다 55%~85% 가량 줄어들었다고 밝혔다. 그러나 신경망 번역 시스템의 품질 개선은 시작에 불과하다. 신경망 번역 시스템은 머신러닝을 통해 학습 내용을 축적해 시간이 갈수록 더 자연스러운 번역을 제공할 수 있기 때문이다.

구글은 더 다양한 언어에 신경망 기계번역 기술을 지원하기 위해 단일 시스템에서 여러 언어 간 번역이 가능하도록 하는 방식인 제로샷 번역(Zero-Shot Translation)을 개발했다. 이는 다중 언어 트레이닝을 통해 실제 테스트하지 않은 여러 언어 조합의 번역도 데이터를 활용해서 가능하게 하는 기술이다. 예를 들어 영어-한국어, 영어-일본어 간의 신경망 기계번역 지식을 통해 한국어-일본어 조합의 번역을 제공할 수 있다.

다중 언어 시스템이 그림에 파란색 실선으로 표시된 일본어-영어, 한국어-영어 사례를 학습한다고 가정했을 때, 구글의 신경망 기계번역 시스템과 동일한 규모의 구글 다중 언어 시스템은 매개변수를 공유해 4개의 언어 조합 간 번역을 진행한다. 이를 통해 특정 언어 조합에서 학습한 ‘번역 지식’은 다른 언어 조합으로 전이될 수 있다. 현재 구글의 다중 언어 시스템은 최근 추가된 16개 신경망 기계번역 언어 조합 중 10개를 지원하고 있다.

구글에 이어 2016년 11월 마이크로소프트도 자사의 인공지능 기술을 활용한 신경망 기계번역 시스템을 선보였다. 초기 마이크로소프트의 신경망 기계번역은 영어, 독일어, 아랍어, 중국어, 일본어 등 10가지 언어를 지원했으며 2017년 3월 11번째 언어로 한국어를 포함시켰다. 마이크로소프트의 신경망 기계 번역 기술은 마이크로소프트 트랜슬레이터(Microsoft Translator)와 채팅 애플리케이션인 스카이프(Skype)의 실시간 번역 기능을 통해 사용할 수 있다.

전체 기사를 보시려면 로그인 필요

로그인 또는 회원가입을 해주세요. (회원만 열람가능)

로그인 회원가입


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.