엔비디아 ‘테슬라 P100’, HPC 애플리케이션 30배 가속
상태바
엔비디아 ‘테슬라 P100’, HPC 애플리케이션 30배 가속
  • 이나리 기자
  • 승인 2016.06.21 11:22
  • 댓글 0
이 기사를 공유합니다

엔비디아가 19일부터 23일까지 독일 프랑크푸르트에서 열리고 있는 ‘국제 슈퍼컴퓨팅 컨퍼런스(ISC) 2016’에서 인공지능, HPC(고성능컴퓨팅) 등 고도의 연산 처리를 요구하는 최신 데이터센터를 위한 PCIe 서버용 ‘테슬라(Tesla) P100’ GPU 가속기를 발표했다.

테슬라 P100은 엔비디아에서 올해 새롭게 발표한 파스칼(Pascal) GPU 아키텍처를 통해 CPU 기반 시스템 대비 큰 폭의 성능 개선 및 효율성 향상을 제공한다. 특히 32개 이상의 CPU 기반 노드에 준하는 처리량을 제공하는 ‘슈퍼 노드’를 구현해 자본 및 운영비용을 70% 이상 절감하는 것이 특징이다.

▲ 테슬라 P100은 엔비디아에서 올해 새롭게 발표한 파스칼(Pascal) GPU 아키텍처를 통해 CPU 기반 시스템 대비 큰 폭의 성능 개선 및 효율성 향상을 제공한다.

테슬라 P100은 표준 PCIe 폼팩터에서 사용할 수 있으며, 최신 GPU 가속 서버와도 호환 가능하다. 또 연산 집약적인 AI 및 HPC 데이터센터 애플리케이션에 최적화된 성능을 자랑한다.

가령 단일 테슬라 P100 기반 서버는 분자동역학 시뮬레이션 프로그램 ‘앰버(AMBER)’의 구동에 있어 50개의 CPU 전용 서버 노드보다 뛰어난 성능을 제공하며 오스트리아 비엔나 대학의 소재과학 애플리케이션 ‘VASP’ 실행에 있어서도 32개의 CPU 전용 노드보다 빠르다.

엔비디아 테슬라 가속 컴퓨팅 플랫폼의 최신 라인업인 테슬라 P100은 유럽에서 가장 빠른 슈퍼 컴퓨터인 스위스 국립 수퍼컴퓨팅센터의 ‘피즈 데인트(Piz Daint)’ 시스템의 업그레이드 버전에 연내 탑재될 예정이다.

테슬라 P100은 최대 4.7테라플롭스의 배정밀도, 9.3 테라플롭스의 단정밀도 성능을 제공하며 단일 파스칼 기반 테슬라 P100 노드의 성능은 32개 이상의 CPU 전용 서버와 동등한 수준이다.

또 테슬라 P100은 컴퓨팅 효율성을 극대화하기 위해 단일 패키지에 프로세서와 데이터를 통합했다. 혁신적인 메모리 디자인 방식인 CoWoS(chip on wafer on substrate) 기반의 HBM2 메모리 탑재를 통해 엔비디아 맥스웰(Maxwell) 아키텍처 대비 3배에 달하는 720GB/sec의 메모리 대역폭을 제공한다.

이와 함께 향상된 성능 제공 및 데이터 이동 관리를 위한 시스템 유지 보수 간소화, 그리고 가상 메모리 페이징 지원을 통해 GPU의 물리적 크기 이상으로 애플리케이션을 확장할 수 있다. 통합 메모리 기술은 개발자로 하여금 전체 노드를 위한 단일 메모리 공간을 볼 수 있도록 해 생산성을 극대화한다.

더불어 테슬라 플랫폼은 주요 HPC 애플리케이션 대부분을 포함한 410개의 GPU 가속 애플리케이션을 지원하는 업계 최고의 호환성을 자랑한다.

이안 벅 엔비디아 가속 컴퓨팅 부문 부사장은 “가속 컴퓨팅은 HPC 및 AI 슈퍼컴퓨팅에 대한 연구자들의 끊임없는 수요를 만족하기 위한 유일한 수단이라 할 수 있다”며 “다수의 범용 컴퓨팅 노드를 필요로 하는 CPU 전용 시스템에 비해 테슬라 P100 기반 노드는 성능 향상 대비 합리적인 비용으로 연산 처리에 효과적으로 집중할 수 있다”고 밝혔다.

한편 PCIe 기반 시스템을 위한 엔비디아 테슬라 P100 GPU 가속기는 2016년 4분기부터 이용 가능하다. 크레이(Cray), 델(Dell), HPE(Hewlett Packard Enterprise), IBM, SGI 등 엔비디아 리셀러 파트너 및 서버 제조업체를 통해 구입할 수 있다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.