단어 입력하면 그림이 ‘뚝딱’...엔비디아, AI 페인팅 툴 ‘고갱2’ 공개
상태바
단어 입력하면 그림이 ‘뚝딱’...엔비디아, AI 페인팅 툴 ‘고갱2’ 공개
  • 황민승 기자
  • 승인 2021.11.24 16:54
  • 댓글 0
이 기사를 공유합니다

슈퍼컴퓨터 ‘셀린’ 이용해 1000만 개 풍경 이미지와 단어 딥러닝

그리고 싶은 내용을 간단한 단어로 표현하면 즉시 그림으로 만들어주는 강력한 디지털 도구가 개발됐다.

엔비디아는 24일 짧은 단어만으로 사실적 그림을 제작해주는 최신 버전의 인공지능(AI) 페인팅 툴 ‘고갱2(GauGAN2)’를 공개했다.

이번에 선보이는 고갱2의 딥러닝 모델은 아티스트는 물론 누구나 손쉽게 자신의 상상력을 사실적인 그림으로 변환할 수 있도록 도와준다. 일례로 ‘해변의 일몰’을 입력하면 AI가 실시간으로 해당장면을 생성한다. ‘바위가 많은 일몰의 해변’처럼 형용사를 추가하거나 일몰을 오후나 비오는 날로 바꾸면 고갱2가 적대적 생성 신경망(GAN)을 기반으로 즉시 그림을 수정한다.

사용자는 버튼을 눌러 장면에서 개체의 위치를 보여주는 상위 수준의 윤곽선인 세그멘테이션 맵을 생성할 수도 있다. 하늘, 나무, 바위, 강과 같은 레이블을 사용해 대략적 스케치로 장면을 조정하고, 그림으로 전환해 스마트 페인트 브러시가 이러한 낙서를 멋진 이미지로 구현할 수 있게 한다.

이 같은 고갱2의 텍스트-이미지 변환 기능은 엔비디아 리서치의 최신 엔비디아 AI 데모를 통해 체험할 수 있다. 다양한 텍스트 프롬프트와 스케치를 통해 고갱2는 사용자가 장면을 보다 세밀한 컨트롤과 빠른 장면 커스터마이징을 제공한다.

또한 고갱2는 세그멘테이션 맵, 인페인팅과 텍스트-이미지 생성을 단일 모델에 결합해 단어와 그림의 혼합을 사실적 예술로 바꾸는 강력한 도구다. 해당 데모는 최초로 단일 GAN 프레임워크 내에서 텍스트, 세멘틱 세그멘테이션, 스케치, 스타일과 같은 여러 양식을 하나로 통합한다. 이 기술은 아티스트의 비전을 고품질 AI 생성 이미지로 더 빠르고 쉽게 전환할 수 있도록 돕는다.

상상한 장면의 모든 요소를 그릴 필요 없이 사용자는 ‘눈 덮인 산맥’과 같은 짧은 문구를 입력해 이미지의 주요 특징과 테마를 빠르게 생성할 수 있다. 시작점은 스케치를 통해 특정 산을 더 높게 만들거나 전경에 몇 그루의 나무를 추가하거나 하늘에 구름을 추가하는 등 사용자 정의 또한 가능하다.

아티스트들은 고갱2를 사용해 현실기반의 이미지뿐만 아니라 다른 세상의 풍경도 묘사할 수 있다. 예를 들어 스타워즈 시리즈에 등장하는 두 개의 태양이 있는 행성 ‘타투인(Tatooine)’의 풍경을 재현하기 위해 필요한 것은 사막, 모래언덕, 해라는 텍스트만으로 시작점을 만들고, 이를 기반으로 사용자는 두 번째 태양을 스케치해 넣을 수 있다.

이를 위해 고갱2의 AI 모델은 세계 10대 슈퍼컴퓨터 중 하나인 엔비디아 DGX 슈퍼POD 기반 엔비디아 셀린(Selene)을 이용해 훈련됐다. 1000만 개의 고품질 풍경 이미지와 겨울, 안개, 무지개와 같이 단어와 단어가 해당하는 영상 간의 연결을 학습시키는 신경망이 사용됐다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.