라인-네이버, ICASSP서 논문 14편 채택 및 연구 우수성 입증
상태바
라인-네이버, ICASSP서 논문 14편 채택 및 연구 우수성 입증
  • 문혜진 기자
  • 승인 2021.02.26 17:41
  • 댓글 0
이 기사를 공유합니다

국제 음향∙음성∙신호처리 학술대회(ICASSP)에 라인 및 네이버의 논문 14편이 채택됐다.

ICASSP는 국제전기전자협회 신호처리학회(IEEE Signal Processing Society)가 주최하는 음향∙음성∙신호처리 분야 세계 최대 규모의 국제 학회다. 이번에 3600편 이상의 논문이 등록되었으며 이 중 약 1700편의 논문이 채택되어 21년 6월, 'ICASSP 2021'에서 발표된다.

이번 학회에서 라인과 네이버는 음성 합성 관련 생성적 대립 신경망을 이용해 비자기회귀형 음성 생성 모델 Parallel WaveGAN에서 유성음과 무성음 정보를 활용하고 식별기를 개량한 연구를 소개했다.

단일 식별기를 이용한 기존 Parallel WaveGAN은 식별기의 표현력과 학습을 제한해 여러 화자의 말뭉치에 적용할 경우 품질이 저하된다는 문제점이 있었다. 이번 연구에서는 유성음과 무성음의 음성 성질이 상이하다는 점에 착안, 각 음성의 성질에 맞는 식별기를 설계해 합성 음성의 품질을 개선했다. 또한, 총 4명의 남녀 화자를 대상으로 대규모 주관 평가 실험을 실시, 해당 접근법의 유효성을 검증한 것이 높은 평가를 받았다.

더불어, 심층 학습을 사용하지 않는 음원 분리 방식인 ISS(Iterative Source Steering)와 심층 학습을 이용한 음원 모델 추정 방식을 접목시킨 새로운 방식을 제안했다. 기존 ISS보다 음성 인식률을 크게 향상시킨 점, 해당 접근법이 음원 수에 의존하지 않아도 적용 가능한 프레임워크라는 점에서 우수성을 입증했다.

앞으로도 라인과 네이버는 적극적인 AI 기초 연구를 통해 기존 서비스의 품질을 더욱 높이고 새로운 기능과 서비스를 선보일 예정이다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.