신경망 번역, 데이터베이스 확보와 오픈소스 플랫폼 경쟁 시작(3)
상태바
신경망 번역, 데이터베이스 확보와 오픈소스 플랫폼 경쟁 시작(3)
  • 이나리 기자
  • 승인 2017.04.25 15:54
  • 댓글 0
이 기사를 공유합니다

머신러닝 위한 GPU 각광, 구글 TPU 자체 개발, 네이버 플랫폼 개발 집중

[CCTV뉴스=이나리 기자] 2007년 구글이 웹 기반 자동번역기를 무료로 공개했을 때, 사람들은 클릭 한번으로 여러 문장들이 순식간에 번역되는 기능을 보고 놀라움을 금치 못했었다. 하지만 예전의 번역기는 동음이의어와 다의어를 구별 못하거나 어순과 표현이 많이 어색해 마치 외래어처럼 번역되는 경우가 많았다. 이처럼 번역기는 번역 결과가 만족스럽지 않았음에도 불구하고 모든 문장을 사람이 직접 번역하는 것보다 시간을 절약할 수 있었기 때문에 지금까지 유용하게 사용돼 왔다.

그러나 최근 번역기는 딥러닝과 신경망 기술이 적용된 신경망 기계번역(GNMT, Google’s Neural Machine Translation)으로 발전되면서 변역 결과물이 눈에 띄게 향상됐다. 예전보다 번역의 오류 가능성이 대폭 감소하고, 보다 자연스러운 번역이 가능해졌다.

더 나아가 번역 기술은 텍스트 뿐 아니라 음성 번역, 이미지 번역까지 가능해지면서 음성인식 기술도 함께 급부상하고 있다. 향후 통번역 서비스는 스마트폰, 스마트워치, HMD, 가정용 음성로봇 서비스 등 다양한 디바이스에 접목돼 국제회의, 여행, 교육 등 다양한 산업에서 활용될 것으로 기대된다. 신경망 번역 기술을 지원하기 위해서는 데이터베이스의 확보와 인공지능을 지원하는 알고리즘과 플랫폼 개발 등이 뒷받침돼야 한다.

기계 번역 시장과 국내‧외 기업별 번역기술 현황, 번역기술로 인해 파생되는 산업 전망에 대해 1, 2, 3회에 걸쳐 알아보겠다.

◇ 신경망 번역, 데이터베이스 확보와 오픈소스 플랫폼 경쟁 시작

인공 신경망 기계번역의 발전을 위해서는 데이터베이스 뿐 아니라 빠른 연산처리를 돕는 하드웨어 칩과 플랫폼 구축이 중요하다.

한글컴퓨터의 인공 신경망기계 번역 지니톡을 개발한 김무종 한컴인터프리 개발팀장은 “인공신경망 방식이 도입된 기계번역에서는 데이터를 얼마나 확보했는지가 경쟁력의 척도라는 것이 업계의 중론이다. 인공지능 기술은 모두에게 공개된 오픈 소스이기 때문에 큰 차이가 없고, 얼마나 많은 데이터를 축적했느냐가 기계번역의 품질을 결정하는 열쇠라는 뜻이다. 구글과 국내 최대 포털업체인 네이버가 유리한 점도 여기에 있다”고 설명했다. 즉, 자연스러운 번역을 위해서는 여러 예문들을 확보하고, 신경망을 학습시키기 위한 데이터 확보가 중요하다.

전체 기사를 보시려면 로그인 필요

로그인 또는 회원가입을 해주세요. (회원만 열람가능)

로그인 회원가입


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.