인텔, 슈퍼컴퓨팅 및 AI 워크로드용 인텔 맥스 시리즈 제품군 발표


[테크수다 기자 도안구 eyeball@techsuda.com] 인텔은 슈퍼컴퓨팅(HPC)과 인공지능(AI) 워크로드용 인텔제온 CPU 맥스 시리즈 (코드명 사파이어 래피즈HBM)와 인텔 데이터센터 GPU 맥스 시리즈 (코드명 폰테 베키오) 등 인텔 맥스 시리즈(Intel MAX Series) 신제품을 10일 공개했다.


더불어, 인텔은 신제품들이 미 아르곤 국립 연구소(Argonne National Laboratory)의 오로라(Aurora) 슈퍼컴퓨터에 탑재될 것이라고 밝혔다.


https://youtu.be/vdOWpCaUxHs


인텔 슈퍼컴퓨팅 그룹 총괄 제프 맥베이(Jeff McVeigh) 부사장은 “모든 슈퍼컴퓨팅 워크로드를 처리하기 위해선 대역폭, 컴퓨팅 및 개발자 생산성은 물론 궁극적으로 영향력을 극대화할 수 있는 솔루션이 필요하다”며 “인텔 맥스 시리즈 제품군은 oneAPI와 함께 더 넓은 시장에 고대역폭 메모리를 제공하며, CPU 및 GPU 간 코드를 쉽게 공유하고 전세계 난제들을 더 빨리 해결하도록 지원할 것이다”고 말했다.


인텔 제온 CPU 맥스 시리즈 제품은 고대역폭 메모리를 갖춘 최초이자 유일한 x86기반 프로세서로, 코드 변경 없이도 많은 슈퍼 컴퓨팅 워크로드를 신속하게 처리한다. 인텔 데이터센터 GPU 맥스 시리즈는 인텔 제품 중 가장 높은 집적도를 가진 프로세서로 최대 128GB의 고대역폭 메모리를 갖춘 47-타일 패키지에 1,000억개 이상의 트랜지스터를 탑재하고 있다. 더불어, oneAPI 오픈 소프트웨어 생태계는 신규 프로세서를 위한 단일 프로그래밍 환경을 제공한다. 인텔은 인텔 맥스 시리즈 신제품의 고급 기능을 구현하도록 최신 2023 oneAPI 및 AI 도구를  제공할 예정이다.


슈퍼컴퓨팅은 기술의 선봉장으로서 기후 변화의 영향을 완화하는 것에서부터 세계에서 가장 치명적인 질병을 치료하는 등 과학 및 사회 분야의 난제들을 해결하기 위해 가장 높은 수준의 혁신을 도입한다.


인텔 맥스 시리즈 제품군은 확장 가능하고 균형 잡힌 CPU 및 GPU로 업계의 요구를 충족하며, 메모리 대역폭 분야의 획기적인 돌파구를 제시한다. 더불어, 개방형 표준 기반 교차 아키텍처 프로그래밍 프레임워크인 oneAPI로 통합이 가능하다. 기업 및 연구진은 인텔 맥스 시리즈 제품군을 사용해 문제를 더욱 빠르고 지속가능한 방법으로 해결할 수 있다.


인텔 맥스 시리즈 제품군은 2023년 1월 정식 출시될 예정이다. 인텔은 고객과의 약속을 이행하기 위해 현재 인텔 맥스 시리즈 GPU 제품을 미 아르곤 국립 연구소가 운영하는 오로라 슈퍼컴퓨터에 공급하고 있다. 더불어 인텔 제온 CPU 맥스를 로스앨러모스 국립연구소(Los Alamos National Laboratory), 교토 대학교(Kyoto University) 및 기타 슈퍼컴퓨터 운영 기관에 공급할 예정이다.



인텔 제온 CPU 맥스는 인텔의 임베디드 멀티 다이 인터커넥트 브릿지(EMIB) 기술을 사용해 연결된 4개 타일로 구성된 최대 56개 퍼포먼스 코어를 350W 엔벨로프로 제공한다. 또한, 64GB 고대역폭 인패키지 메모리, PCIe 5.0 및 CXL 1.1 I/O를 포함한다. 더불어, 코어당 1GB 이상의 고대역폭 메모리 용량을 제공하며, 대부분의 일반적인 슈퍼컴퓨팅 워크로드에 적합하다. 실제 슈퍼컴퓨팅 워크로드 처리 시, 인텔® 제온® CPU 맥스는 경쟁제품 대비 최대 4.8배 향상된 성능을 제공한다.


  • AMD 밀란-X 클러스터 제품 대비 68% 낮은 전력으로 동일한 HPCG 성능 제공
  • AMX 익스텐션으로 AI 성능 대폭 향상하고INT32로 누적하는 INT8용 AVX-512 대비 8배 높은 쓰루풋 제공
  • 다양한 고대역폭 메모리(HBM) 및 DDR 메모리 구성에서 실행 가능한 유연성 제공
  • 워크로드 벤치마크:


  • 기후 모델링: AMD 밀란-X 대비 고대역폭 메모리만 활용하는 MPAS-A 워크로드에서 2.4배 빠른 속도 제공
  • 분자 역학: DDR 메모리를 사용하는 경쟁사 제품 대비 DeePMD 워크로드에서 2.8배 높은 성능 제공


인텔 맥스 시리즈 GPU는 가장 까다로운 컴퓨팅 워크로드를 위한 신규 아키텍처 기반인 최대 128개의 Xe-HPC 코어를 제공한다. 더불어, 인텔 맥스 시리즈 GPU는 다음과 같은 기능을 제공한다:


  • 성능 및 쓰루풋 확대를 위해 업계 최고 수준의 408MB L2캐시 및 64MB L1 캐시 지원
  • 네이티브 레이 트레이싱 가속을 갖춘 유일한 HPC/AI GPU로 과학적 시각화 및 애니메이션 속도 향상을 위한 설계
  • 워크로드 벤치마크:


  • 재무: 리스크퓨얼(Riskfuel) 크레딧 옵션 프라이싱에서 엔비디아 A100 대비 2.4배 향상된 성능 제공
  • 물리: NerkRS 가상 반응로 시뮬레이션에서 A100 대비 1.5배 향상된 성능 제공


인텔 맥스 시리즈 GPU는 다양한 고객 요구사항을 충족하기 위해 여러 폼팩터로 제공될 예정이다:


  • 인텔 맥스 시리즈 1100 GPU: 56개의 Xe 코어와 48GB의 HBM2e 메모리를 갖춘 300W 이중 폭 PCIe 카드. 인텔 Xe 링크 브릿지(Intel Xe Link Bridge)를 통해 여러 카드 연결 가능
  • 인텔 맥스 시리즈 1350 GPU: 112개의 Xe 코어와 96GB의 HBM을 갖춘 450W OAM 모듈
  • 인텔 맥스 시리즈 1550 GPU: 128개의 Xe 코어와 128GB의 HBM을 갖춘 인텔의 최대 성능 600W OAM 모듈


맥스 시리즈 1350GPU 외에도, 인텔은 다양한 시장 수요를 충족하기 위해 더 낮은 I/O 대역폭 버전의 제품을 제공할 계획이다.



인텔은 개별 카드 및 모듈 외에도, 4개의 GPU OAM 캐리어 보드와 인텔 Xe 링크를 갖춘 인텔 맥스 시리즈 GPU 서브시스템 내에서 고성능 멀티 GPU 통신이 가능하도록 지원할 예정이다.


현재 미 아르곤 국립 연구소에서 구축 중이며 2023년 운영 예정인 오로라 슈퍼컴퓨터는 역대 최초로 최고 2엑사플롭스(exaflops) 최고 이중정밀 연산 성능을 초과할 것으로 예상된다. 더불어, 오로라에는 인텔 맥스 시리즈 GPU 6개 및 인텔 제온 CPU 맥스 2개를 포함하는 1만개 이상의 블레이드가 탑재될 예정으로, 슈퍼컴퓨터 최초로 맥스 시리즈 CPU 및 GPU를 함께 활용할 예정이다.


인텔과 미 아르곤 국립 연구소는 오는 13일부터 개최하는 국제 슈퍼컴퓨팅 컨퍼런스 ‘SC22’에 앞서 128개의 프로덕션 블레이드로 구성된 오로라 슈퍼컴퓨터의 테스트 개발 시스템 ‘선스팟(Sunspot)’을 공개했다. 오로라 초기 과학 프로그램(Aurora Early Science Program) 연구진은 2022년말부터 해당 시스템을 활용할 수 있다.


인텔 맥스 시리즈 제품은 로스앨러모스 국립연구소의 크로스로드(Crossroads), 로렌스 리버모어 국립연구소 및 산디아 국립연구소의 CTS-2 시스템, 교토 대학교의 캄포3(Camphor 3) 시스템 등 국가 안보와 기초 연구에 중요한 슈퍼컴퓨팅 시스템에도 탑재될 예정이다.


인텔 및 고객사는 슈퍼컴퓨팅22(Supercomputing 22) 컨퍼런스에서 인텔 맥스 시리즈 제품을 사용하는 12곳의 OEM에서 선보일 40여개 디자인을 공개할 예정이다. 더불어 인텔은 2428번 부스에서 슈퍼컴퓨팅 및 인공지능 애플리케이션용 맥스 시리즈 성능 및 기능을 소개하는 데모를 시연하고 인텔 플랫폼 솔루션에 대한 인텔 아키텍트와 소비자 그리고 최종 사용자들의 의견을 공유할 예정이다.


인텔 데이터센터 MAX 시리즈 GPU (코드명 리알토 브릿지)는 인텔 맥스 시리즈 GPU의 후속 제품으로,  향상된 성능을 기반으로 2024년 출시될 예정이다. 이후 인텔은 슈퍼컴퓨팅 혁신을 가능하게 하는 차세대 주요 아키텍처 부문 혁신을 발표할 예정이다. 향후 출시될 XPU (코드명 팔콘 쇼어)는 Xe 와 x86코어를 하나의 패키지로 결합하며, IDM 2.0 모델 기반으로 제조된 인텔 및 고객의 신규 IP를 통합할 수 있도록 유연성을 제공할 계획이다.


[테크수다 기자 도안구 eyeball@techsuda.com]