미디어젠, 133억 규모 NIA ‘AI 학습용 데이터’ 구축 주관기관 선정
상태바
미디어젠, 133억 규모 NIA ‘AI 학습용 데이터’ 구축 주관기관 선정
  • 황민승 기자
  • 승인 2021.07.08 15:54
  • 댓글 0
이 기사를 공유합니다

화자 인식용 음성데이터, 아동 음성데이터, 다화자 음성합성데이터 등 구축

인공지능(AI) 전문기업 미디어젠은 한국지능정보사회진흥원(NIA)이 추진하는 ‘2021 인공지능 학습용 데이터 구축 사업’에서 △화자 인식용 음성 데이터 구축 △아동 음성 데이터 구축 △다화자 음성합성 데이터 구축 등 3개 사업의 주관 기관으로 선정됐다고 8일 밝혔다.

미디어젠은 지난해 AI 학습용 데이터 구축 1차·2차 사업에도 선정돼 성공리에 과제수행을 마친 바 있다.

미디어젠이 주관해 수행하는 첫 사업은 ‘화자 인식용 음성 데이터 구축’으로, 메트릭스리서치와 비디, 인천대학교가 참여한다. 이 사업을 통해 5000시간 분량의 화자 인식용 음성 데이터와 4500시간 분량의 가창 데이터를 구축할 계획이다. 이는 미디어젠의 신규 사업 분야인 음성 AI 엔진과 인공지능 가수(AI Singer)에 모두 활용될 수 있다는 점에서 관심을 모으고 있다.

미디어젠 윤종성 수석 연구원은 “앞으로 AI 기술 활성화에 주력하면서 다양한 영역에서 AI 서비스 구축과 신시장 진출을 확대할 방침”이라며, “이번 과제로 수집된 데이터를 모두 일반에 공개해 AI 산업 발전에 이바지할 예정”이라고 말했다.

두 번째 사업인 ‘아동 음성 데이터 구축’에는 미디어젠과 함께 메트릭스리서치, 비디, 아이포트폴리오, 방정환 재단이 힘을 모은다. 이 사업을 통해 2500명 이상 아동의 한국어 음성 5000시간 분량을 수집하고, 5000명 이상의 아동 영어 음성을 5000시간 분량 수집하게 된다.

미디어젠 윤성준 부사장은 “기존 음성 인식 데이터는 성인 위주여서 아동 음성 데이터가 부족한 현실”이라며, “그만큼 아동 음성 인식률이 크게 낮아 이번 사업을 통해 이의 개선이 가능해질 것으로 기대하고 있다”고 말했다.

향후 이 데이터는 국어 교육, 아동용 콘텐츠 생성, AI 로봇 등의 분야에 활용할 수 있을 전망이며, 아동 영어 데이터로 AI 영어 튜터를 개발할 경우 아동의 눈높이에 맞는 영어 학습에도 활용할 수 있다.

세 번째 사업인 ‘다화자 음성합성 데이터 구축’ 사업에는 애드사운드가 참여한다. 이 사업을 통해 4500명의 일반인 화자에 대해 1만 시간 분량의 음성을 수집하고, 12종류의 감성·스타일로 분류한 성우들의 음성 데이터를 구축한다.

미디어젠 송민규 상무는 “AI 기술 발전으로 서비스의 지능화 수준이 올라갈수록 자유 대화형 UI가 많아지는 만큼 앞으로 음성 합성 서비스를 활용할 분야도 늘어날 것”이라며 “음성 합성 서비스 개발을 촉진할 수 있도록 다화자 음성 합성 데이터와 감성·발화 스타일별 음성 합성 데이터를 구축하고 국내 음성 AI 기술의 발전을 도모할 계획”이라고 말했다.

미디어젠은 이번 인공지능 학습용 데이터 구축을 통해 방대한 AI 데이터를 수집·활용해 음성 AI 엔진의 성능을 고도화할 계획이다. 또한 AI 기술 활성화에 주요 산업별로 최적화된 온디맨드 AI 플랫폼을 제공해 관련시장을 선점해 나간다는 복안이다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.