비디, AI 학습용 음성데이터 수집·관리 시스템 오픈
상태바
비디, AI 학습용 음성데이터 수집·관리 시스템 오픈
  • 황민승 기자
  • 승인 2021.09.08 16:13
  • 댓글 0
이 기사를 공유합니다

‘인공지능 학습용 데이터 구축 사업’ 2년 연속 선정

ICT(정보통신기술) 서비스·플랫폼 개발 전문기업 비디가 인공지능(AI) 학습을 위한 음성 데이터의 체계적 구축 기반을 마련했다.

비디는 최근 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 주관하는 ‘AI 학습용 데이터 구축 사업’에 선정돼 음성 데이터의 효율적 수집·가공·관리를 위한 시스템을 오픈했다고 8일 밝혔다.

AI 학습용 데이터 구축 사업은 디지털 뉴딜 ‘데이터 댐’의 핵심 사업으로, 산업 전반에 걸친 지능화 혁신과 일자리 창출에 목적을 둔다. 비디는 2년 째 AI 학습용 데이터 구축 사업에 선정돼 참여하고 있으며, 올해는 화자 인식용 음성 데이터와 아동 음성 데이터 구축 과제에서 음성 데이터 수집·관리 시스템을 적용해 설계에 따라 편향 없이 데이터가 수집되도록 활용하고 있다.

구체적으로 이번 사업은 크라우드 소싱 방식으로 데이터를 수집·검수해 개인차에 따라 다를 수 있는 데이터 품질을 일정 수준으로 유지하고, 많은 양의 데이터를 짧은 기간에 구축하며 발생할 수 있는 휴먼 에러를 최소화하기 위해 시스템을 통한 공정 관리의 필요성이 대두되면서 추진됐다.

비디의 기술력과 지난해 2개 과제를 수행하면서 도출한 개선 사항을 반영해 음성 데이터 수집·관리 시스템을 구축, 과거 수동으로 처리했던 업무 대부분을 자동화해 업무량을 큰 폭으로 줄이고, 구축 시간을 줄이는 데 이바지할 것으로 기대된다.

비디의 음성 데이터 수집·관리 시스템은 크라우드 소싱 플랫폼 ‘메트웍스’와 연동해 참여자들에게 포인트 지급 등 보상 시스템을 제공한다. 아울러 대시보드를 통해 개인 진척 상황을 쉽게 확인하고, 미션 수행을 독려하기 위한 기능도 지원한다.

데이터 수집 시에는 대상과 녹음 환경이 설계에 따라 진행되는지 검증할 수 있는 녹음 적합도 테스트 기능이 제공되며, 수집된 데이터는 즉시 검수 담당자에게 배정돼 실시간 검수가 가능하도록 개발돼 필요 없는 대기 시간을 최소화했다.

독고세준 비디 대표는 “이번 음성 데이터 수집·관리 시스템을 통해 고품질의 데이터 구축에 이바지할 수 있기를 바란다”며, “앞으로 음성뿐만 아니라 이미지, 영상 등 여러 분야의 데이터 구축에도 수집·관리 시스템을 활용할 수 있도록 기능을 고도화해 나갈 계획”이라고 말했다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.