ETRI, 구글 기술력 버금가는 '대화형 AI' 개발
상태바
ETRI, 구글 기술력 버금가는 '대화형 AI' 개발
  • 곽중희 기자
  • 승인 2022.11.03 09:18
  • 댓글 0
이 기사를 공유합니다

한국전자통신연구원(ETRI)가 영어, 중국어, 일본어, 프랑스어, 스페인어, 러시아어 등 세계 주요 24개 언어를 인식할 수 있는 ‘대화형 인공지능(Conversational AI) 기술’을 개발했다.

디지털 전환의 시대, 음성 인식을 바탕으로 인공지능(AI) 비서, AI 튜터 등 다양한 AI 서비스 확산에 큰 도움이 될 전망이다.

ETRI가 개발한 음성 인식 기술의 성능은 구글 등 글로벌 업체와 비교해 한국어에서는 우위, 타 언어에서는 대등한 수준이다. 존 음성 인식 기술을 개발하기 위해서는 대규모 학습 데이터가 필요해 다국어 확장과 음성 인식 성능 확보가 쉽지 않았다.

연구진은 ▲자기 지도 학습 ▲의사 레이블 적용 ▲대용량 다국어 사전 학습 모델 ▲음성 데이터의 오디오 데이터 생성(TTS) 증강 기술 등을 통해 언어 확장의 어려움을 해결했다.

또한, 연구진은 기존에 흔히 활용되던 종단형(End-to-End) 음성 인식 기술의 단점을 개선해 활용성을 높였다. 린 응답 속도의 문제는 스트리밍 추론 기술을 개발, 실시간 처리가 가능하도록 개선했다. 

아울러, 의료와 법률, 과학기술 등 특정한 도메인에 대한 음성 인식 특화가 쉽도록 하이브리드 종단형 인식 기술도 개발해 적용했다.

ETRI는 지난 2020년 종단형 음성 인식 기술을 개발한 후, 30여 개의 국내·외 기업에 음성 인식 기술을 이전했다. 

이를 통해 기업들은 ▲회의록 작성 ▲자막 통역 ▲키오스크 ▲의료·교육 ▲AI 컨택센터 등 다양한 AI 서비스에 ETRI의 음성 인식 기술을 활용 중이다.

연구진은 이번 다국어 확대와 응답 속도 지연 해결 등 신기술 적용을 통해 음성 인식 기술 활용 범위를 확대, 사업화를 추진할 예정이라고 밝혔다.

특히, 올해 안으로 지원 언어를 30여 개로 확대하고, 국내·외 전시 참여와 기업체 설명회를 통해 동남아와 남미, 아랍권 등을 대상으로 사업화를 적극 추진할 예정이다.

ETRI 복합지능연구실 김상훈 책임연구원은 “국내 기술로 글로벌 선도 업체와 대등한 수준의 음성 인식 기술을 개발했다는 데 의의가 있다. 본 기술이 우리나라 인공지능 분야의 글로벌 경쟁력을 높이고 기술 자주권을 확보하는 데 큰 도움이 되길 바란다”고 말했다.
 



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.