SKT-국립국어원, 한국어 AI 언어 모델 '끝판왕' 개발한다
상태바
SKT-국립국어원, 한국어 AI 언어 모델 '끝판왕' 개발한다
  • 황민승 기자
  • 승인 2021.04.08 10:24
  • 댓글 0
이 기사를 공유합니다

1,500억개 매개변수 가진 범용 모델로 구현
언어 문제풀이, 글짓기, 번역 등 한국어로도 수행 가능
<strong> SKT 데이비스 에릭 하트먼 Language Superintelligence Labs장(왼쪽)과 국립국어원 정희원 어문연구실장이 업무협약 체결 후 기념 촬영을 하고 있다. [사진=SK텔레콤]</strong><br>
 SKT 데이비스 에릭 하트먼 Language Superintelligence Labs장(왼쪽)과 국립국어원 정희원 어문연구실장이 업무협약 체결 후 기념 촬영을 하고 있다. [사진=SK텔레콤]

SK텔레콤이 국립국어원과 함께 한국어 인공지능(AI) 언어모델의 끝판왕 개발에 뛰어들었다. 국립국어원의 언어 정보를 활용해 사람과 유사한 수준의 자연스러운 언어 표현과 범용적 사용이 가능한 범용 언어 모델(GLM, General-Purpose Language Model) 개발이 궁극적 목표다. 

SKT와 국립국어원은 지난 7일 이 같은 내용을 골자로 한 업무 협약을 체결했다고 8일 밝혔다.

이번 차세대 AI 한국어 모델은 오픈AI가 개발한 영어기반 최신 AI 언어모델인 'GPT-3'에 버금가는 한국어 GLM을 지향한다. 개발이 완료되면 언어 관련 문제풀이와 글짓기, 번역, 그리고 주어진 문장에 따라 간단한 코딩을 수행하는 GPT-3의 기능을 한국어에서도 구현할 수 있게 된다.

GLM은 일상의 감성대화, 다양한 업종의 고객센터 대화 뿐 아니라 시사, 문학, 역사, 게임에 이르기까지 다양한 영역의 언어 활동에 적용될 수 있다. 새로운 산업 분야에 추가 활용될 가능성 역시 다분하다.

이를 위해 SKT는 1500억 개의 매개변수를 가진 거대 언어 모델로 GLM을 개발할 예정이다. GPT-3가 1750억 개의 매개변수를 지녀 이전 버전인 GPT-2보다 100배 이상 크고, 더 높은 정확도와 넓은 활용도를 갖고 있는 점을 감안할 때 GLM은 한국어 AI 언어 모델의 결정판이 될 수 있다는 게 SKT의 설명이다.

SKT는 올해 말까지 GLM 개발을 마치고 내부 서비스를 통해 모델 성능을 검증한 후 상용화를 진행할 계획이다. 아울러 다양한 서비스에 적용하는 동시에 한국어 언어모델 성능 평가 방법 개발, 한국어 데이터 품질 평가 연구도 추진할 방침이다.

SKT 데이비스 에릭 하트먼 Language Superintelligence Labs장은 “SKT는 한국어에 최적화된 AI 언어모델을 선제적으로 개발해 한국어의 정보화에 이바지하고 있다”며, "국립국어원과의 협력을 계기로 한국어의 과학화, 세계화에도 기여할 것”이라고 밝혔다.

국립국어원 정희원 어문연구실장도 “앞으로도 AI 개발에 필요한 언어 정보자원을 지속 발굴해 관련 산업계와 학계에서 유용하게 활용될 수 있도록 시스템을 구축해 나가겠다”라고 말했다.

SKT는 지난 2018년부터 AI 언어모델을 개발해 왔으며, 2019년 KoBERT를 개발해 챗봇 등에 활용하고 있다, 이후 지난해 4월 KoGPT-2를 개발 완료하여 챗봇의 대화를 한층 자연스럽게 발전시켰으며, 같은해 10월에는 뉴스나 문서를 고품질 요약문으로 만들어내는 능력 등 텍스트 처리 역량이 뛰어난 KoBART를 개발해 자연어 이해·처리 영역의 기술력을 강화했다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.