엔비디아, 구글 클라우드와 파트너십 확대···새로운 AI 인프라와 소프트웨어 출시

도안구

2023년 8월 30일

[테크수다 기자 도안구 eyeball@techsuda.com] 젠슨 황 엔비디아 CEO는 "우리는 가속 컴퓨팅과 생성형 AI가 결합해 놀라운 속도로 혁신을 가속화하는 전환점에 서 있다. 구글 클라우드와의 파트너십 확대로 개발자는 에너지 효율을 높이고 비용을 절감하는 인프라, 소프트웨어와 서비스를 통해 작업을 가속화할 수 있다"고 말했다.

AI 컴퓨팅 기술 분야의 선두주자인 엔비디아(www.nvidia.co.kr, CEO 젠슨 황)가 구글 클라우드(Google Cloud)와 파트너십을 확대한다고 발표했다.

이 파트너십으로 고객을 위한 새로운 AI 인프라와 소프트웨어를 출시할 예정이다. 이는 생성형 AI를 위한 대규모 모델을 구축하고 배포해 데이터 사이언스 워크로드를 가속화한다.

구글 클라우드 넥스트(Google Cloud Next)에서 엔비디아(NVIDIA) 창립자 겸 CEO인 젠슨 황(Jensen Huang)과 구글 클라우드 CEO인 토마스 쿠리안(Thomas Kurian)의 노변 대담이 이뤄졌다. 이번 대담에서는 파트너십을 통해 세계 대규모 AI 고객들에게 엔드투엔드 머신 러닝 서비스를 제공하는 방법과 엔비디아 기술을 기반으로 구축된 구글 클라우드 제품으로 AI 슈퍼컴퓨터를 쉽게 실행할 수 있는 방법에 대해 논의했다.

새로운 하드웨어와 소프트웨어 통합은 지난 2년간 구글 딥마인드(DeepMind)와 구글 리서치 팀에서 사용한 것과 동일한 엔비디아 기술을 활용한다.

토마스 쿠리안은 "구글 클라우드는 고객을 위한 혁신을 촉진하고 가속화하기 위해 AI 분야에서 오랜 기간 기술을 혁신해 왔다. 구글의 많은 제품이 엔비디아 GPU를 기반으로 구축하고 제공되고 있으며, 많은 고객들이 생성형 AI를 발전시키기 위한 거대언어모델(LLM)의 효율적인 개발을 위해 엔비디아 가속 컴퓨팅을 찾고 있다”고 언급했다.

AI와 데이터 사이언스 개발 속도를 높이기 위한 엔비디아 통합

방대한 대규모 언어 모델(LLM)을 구축하기 위한 구글의 프레임워크인 PaxML은 이제 엔비디아 가속 컴퓨팅에 최적화됐다.

기존 PaxML은 여러 구글 TPU 가속기 조각에 걸쳐 구축됐다. 하지만 이제 개발자는 PaxML을 통해 엔비디아 H100와 A100 텐서 코어 GPU로 완벽하게 구성 가능한 고급 실험과 확장을 수행할 수 있다. GPU에 최적화된 PaxML 컨테이너는 엔비디아 NGC 소프트웨어 카탈로그에서 즉시 사용할 수 있다. 또한 PaxML은 OpenXLA 컴파일러를 통해 GPU에 최적화된 JAX에서 실행된다.

구글 딥마인드와 다른 구글 리서치 연구원들은 탐색적 연구를 위해 엔비디아 GPU와 함께 PaxML을 사용한 최초의 기업 중 하나이다.

PaxML에 최적화된 엔비디아 컨테이너는 엔비디아 NGC 컨테이너 레지스트리(container registry)에서 즉시 사용할 수 있다. 이 컨테이너는 차세대 AI 기반 애플리케이션을 구축하는 전 세계 연구자, 스타트업, 기업을 대상으로 한다.

아울러 양사는 구글의 데이터프록(Dataproc) 서비스를 통해 구글의 서버리스 스파크(Spark)와 엔비디아 GPU를 통합한다고 발표했다. 이를 통해 데이터 사이언티스트는 아파치 스파크(Apache Spark) 워크로드를 가속화해 AI 개발을 위한 데이터를 준비할 수 있다.

한편, 이번 새로운 통합은 엔비디아와 구글 파트너십 역사 중 가장 최근 발표이다. 올해 이뤄진 하드웨어와 소프트웨어 발표는 다음과 같다:

구글 클라우드, 엔비디아 H100 기반 A3 가상 머신 — 구글 클라우드는 엔비디아 H100 GPU로 구성된 전용 구글 클라우드 A3 가상 머신(VM)을 발표했다. 이를 통해 다양한 워크로드에서 엔비디아의 AI 플랫폼에 더 쉽게 액세스할 수 있다. A3 VM은 이전 세대에 비해 3배 빠른 훈련과 대폭 향상된 네트워킹 대역폭을 제공한다. 이는 다음 달에 공식 출시될 예정이다.
구글 클라우드 버텍스(Vertex) AI 플랫폼을 지원하는 엔비디아 H100 GPU — 향후 몇 주 내 버텍스AI에서 H100 GPU를 사용할 수 있을 것으로 예상된다. 이를 통해 고객은 셍성형 AI LLM을 빠르게 개발할 수 있다.
구글 클라우드, 엔비디아 DGX™ GH200에 액세스 권한 획득 — 구글 클라우드는 세계 최초로 엔비디아 DGX GH200 AI 슈퍼컴퓨터를 통해 생성형 AI 워크로드에 대한 성능을 탐색할 수 있는 기업이 될 예정이다. 엔비디아 DGX GH200은 엔비디아 그레이스 호퍼(Grace Hopper)™ 슈퍼칩을 기반으로 한다.
구글 클라우드에 출시되는 엔비디아 DGX 클라우드 — 고객은 웹 브라우저에서 직접 엔비디아 DGX 클라우드 AI 슈퍼컴퓨팅과 소프트웨어를 사용할 수 있다. 이로써 고객에게 고급 훈련 워크로드를 위한 속도와 확장성을 제공한다.
구글 클라우드 마켓플레이스(Marketplace)의 엔비디아 AI 엔터프라이즈 — 사용자는 엔비디아 AI 엔터프라이즈(Enterprise)에 액세스할 수 있다. 엔비디아 AI 엔터프라이즈는 엔터프라이즈용 애플리케이션 개발과 배포를 간소화하는 안전한 클라우드 네이티브 소프트웨어 플랫폼이다. 엔터프라이즈용 애플리케이션에는 생성형 AI, 음성 AI, 컴퓨터 비전 등이 포함된다.
구글 클라우드, 엔비디아 L4 GPU 최초 제공 — 올해 초, 구글 클라우드는 G2 VM을 출시하면서 엔비디아 L4 텐서 코어(Tensor Core) GPU를 제공하는 최초의 클라우드 제공업체가 됐다. 고객은 AI 비디오 워크로드를 위해 CPU에서 L4 GPU로 전환해 최대 120배 더 높은 성능과 99% 더 나은 효율성을 실현할 수 있다. L4 GPU는 이미지와 텍스트 생성, VDI, AI 가속 오디오와 비디오 트랜스코딩에 다양하게 사용된다.

[테크수다 기자 도안구 eyeball@techsuda.com]

Newsletter

디지털 시대, 새로운 정보를 받아보세요!

도안구

테크가 전 산업 영역에 스며드는 소식에 관심이 많다. 1999년 정보시대 PCWEEK 테크 전문지 기자로 입문한 후 월간 텔레닷컴, 인터넷 미디어 블로터닷넷 창간 멤버로 활동했다. 개발자 잡지 마이크로소프트웨어 편집장을 거쳐 테크수다를 창간해 지금까지 활동하고 있다. 태블릿을 가지고 얼굴이 꽉 찬 방송, 스마트폰을 활용한 현장 라이브를 한국 최초로 진행했다.

당신이 놓친 글