인텔, 고성능 AI· 컴퓨팅을 위한 차세대 AI 솔루션 제온 6· 가우디 3 신제품 출시···나승주 상무 "비용·성능·고객선택권 모두 탁월"

[테크수다 기자 도안구 eyeball@techsuda.com] 거함 인텔이 AMD·엔비디아의 추격과 독주에 대응 카드를 마련하고 분주히 움직이기 시작했다.

인텔은 제온 6 P-코어(Xeon 6 with Performance-cores)와 가우디 3(Gaudi 3) AI 가속기를 출시하며, 최적의 와트(watt)당 성능과 더 낮은 총 소유 비용(TCO)을 제공해 강력한 AI 시스템을 지원하겠다고 밝혔다.

AI를 통한 업계 혁신이 계속되면서 기업들은 비용 효율적이면서도 빠르게 개발 및 배포할 수 있는 인프라를 필요로 하고 있다. 이러한 요구에 대응하기 위해서다.

저스틴 호타드(Justin Hotard) 인텔 데이터센터 및 AI 사업 총괄 수석부사장은 "AI에 대한 수요가 데이터센터의 대규모 변화를 이끌고 있으며, 업계는 하드웨어, 소프트웨어, 개발 도구에서 다양한 선택지를 원하고 있다"고 말하며, "제온 6 P-코어 프로세서 및 가우디 3 AI 가속기의 출시와 함께, 인텔은 고객들이 더 높은 성능, 효율성, 보안을 갖춘 워크로드를 구현할 수 있도록 개방형 생태계를 지원하고 있다"고 강조했다.

본사 발표에 대한 한국 미디어 대상 간담회도 마련했다. 인텔코리아는 9월 26일 서울 전경련회관에서 데이터센터용 신제품 출시 기자간담회를 갖고, 제온 6 P-코어와 가우디 3 신제품의 상세한 기술사항을 발표했다.

나승주 인텔 데이터센터 및 AI 사업부 한국 영업 총괄 상무는 “지난 6월 E코어 기반 제온 6를 출시한데 이어, 오늘 코어당 고성능 제품을 원하는 고객을 공략할 수 있는 P코어 제품을 출시하며 제온 6 라인업이 좀 더 풍성해졌다”며 “이뿐 아니라, AI 가속기 신제품인 가우디 3 제품을 출시함으로써, 국내 고객들에게 AI 인프라 구축에 폭넓은 선택지를 제공할 수 있게 되었다. 조만간 주요 OEM에서 오늘 출시한 인텔 제품을 탑재한 서버를 국내 출시할 계획인만큼 국내 고객들도 인텔 신제품의 강점을 빠른 시일안에 경험할 수 있을 것으로 예상한다”고 밝혔다.

이번 발표 전 인텔과 AWS는전략적 협력 확대 소식을 전한 바 있다. 두 회사는 미국 기반 칩 제조 발전 지원을 위해 AWS용 인텔 18A 기반 맞춤형 AI 패브릭 칩과 인텔 3 기반 맞춤형 제온 6 칩 생산, 다년간 수십억 달러 규모의 협력으로 오하이오주 칩 제조 개발을 가속화하겠다는 내용이었다.

Intel, AWS Expand Strategic Collaboration, Helping Advance U.S.-Based...
Intel to Produce Custom AI Fabric Chip on Intel 18A and Custom Xeon 6 Chip on Intel 3 for AWS; Multi-Year, Multi-Billion-Dollar Collaboration Accelerates Development of Chip Manufacturing in Ohio.

인텔과 AWS의 협력 소식과는 별개로 인텔은 구글 클라우드와의 협력 소식도 전했다. 마크 로메이어 구글 클라우드 컴퓨트 AI 인프라스트럭처 부문 총괄 사장은 "구글 클라우드는 인텔과의 전략적 파트너십을 통해 고객이 필요로 하는 성능과 유연성을 제공할 수 있게 되었다. 6세대 프로세서의 최신 이점을 갖춘 미래 솔루션을 제공할 수 있기를 기대한다"고 밝혔다.

가장 큰 고객인 클라우드 사업자와 협력은 당연하지만 이들과의 협력은 고객이 원하는 방식의 '커스텀칩' 생산에 인텔이 적극 대응하고 있어 주목된다. 표준화된 제품을 제공하지만 이런 대형 고객들에게는 그들이 원하는 특정 기능을 더욱 극대화해 제공할 수 있도록 제온 프로세서를 잘 활용하겠다는 것.

나승주 상무는 "이런 고객 요구를 수용하기 위해 구조를 잘 만들어 놓았다. 앞으로 할 일도 더 많겠지만 더욱 유연하게 움직일 수 있게 되었다"고 전했다.

인텔은 이런 대형 고객사들의 요구에 대응하기 위해 모듈형 SOC 아키틱처를 준비했다. 유연한 구성의 멀티 다이 아키텍처로 고객에게 폭넓은 컴퓨팅 선택권을 제공한다. 모놀리틱 메시, 코어, 캐시, 메모리 컨트롤로와 EMIB(Embedded Multi-die Interconnect Bridge) 가 컴퓨트 다이에 적용되어 있다.

클라우드 사업자들은 인텔 제온 6를 통해 이전 5세대 인텔 제온 CPU 대비 소켓당 코어수는 2배, 코어 당 평균 성능 개선은 1.2배, 전력 소비량 대비 평균 성능 증가는 1.6배, 비슷한 성능 수준의 평균 TCO 절감은 30%로 높여 컴퓨팅 비용 절감을 이뤘다고 강조했다.

이번 발표에서 또 주목할 만한 건 가우드 3 AI 가속기다. 이 제품은 엔비디아 H100 대응 제품이다.

인텔 가우드 3 AI 가속기는 64개의 텐서 프로세서 코어(TPC)와 8개의 행렬 곱셈 엔진(MME)을 통해 심층 신경망 연산을 가속화한다. 메모리의 경우 삼성전자, SK하이닉스, 마이크론 등 3사와 협력하고 있다는 입장을 전했다.

인텔코리아 측은 이번 제품 출시 전부터 테스트를 진행하고 있는 국내 고객들이 많이 있다고 전했다. 특히 이미 국내 제공하고 있는 가우드 2 생태계가 생각보다 빠르게 확산되고 있다고 강조했다. 고객들이 진짜 서비스를 제공하기 위해 인프라를 구축하려는 상황에서 경쟁사 제품의 가격 이슈가 너무나 크기 때문에 추론 파트에서 가우드 2가 가격 대비 성능에서 월등하다는 설명이다.

또 가우드3까지 시장에 출시되는 상황이기때문에 학습은 가우디3로 하고 추론 서비스는 가우드2로 해서 성능과 가격, 제품 선택권까지 모두 가져갈 수 있다고 강조했다.

특정 고객사를 밝히지는 않았지만 나승주 상무는 "생성형 AI 서비스를 오래 준비한 고객이 정작 서비스를 제공할 때는 비용 이슈에 발목이 잡혀 있었다. 가우드2와 가우드3를 테스트하고 적용하면서 만족스러운 상황"이라고 귀띔했다.

나승주 인텔코리아 상무

이번 제품 출시로 엔비디아의 독주와 AMD의 추격에 인텔이 추격과 반격을 위한 출발선에 선 건 확실해 보인다.

한편, 엔비디아의 경우 NV링크, 스마트NIC, DPU, 전용 스위치 등으로 생성형 AI 인프라 생태계를 독점하려는 상황이다. 엔비디아에 대항하는 나머지 진영이 UAlink 를 지원하기 위해 힘을 합친 상황이다. 이에 대해 인텔은 "UAlink에 우리도 가담하고 있다. 오픈된 이더넷 진영이 힘을 모으고 있다. 이번 제품에는 초기 UAlink를 지원하지 않지만 인텔은 이런 열린 상황에 더 기여를 할 것"이라고 밝혔다.

인텔이 다시 한번 시장 리더십을 가져갈 수 있을지 무척 기대되는 제품 출시다.


제온 6 P-코어 및 가우디 3 AI 가속기 소개

인텔은 데이터 센터 포트폴리오에 두 가지 주요 업데이트를 포함한 최신 AI 인프라스트럭처 지원사항에 대해 발표했다.

  • 인텔 제온 6(Intel® Xeon® 6) P-코어: 컴퓨팅 집약적인 워크로드를 탁월한 효율로 처리할 수 있도록 설계된 제온 6는 이전 세대 대비 2배 높은 성능을 제공한다2. 코어 수 증가, 메모리 대역폭 2배 증가, 모든 코어에 내장 AI 가속 기능을 갖춘 것이 특징이다. 이 프로세서는 엣지에서 데이터센터 및 클라우드 환경에 이르기까지 AI의 성능 요구를 충족하도록 설계되었다.
  • 인텔 가우디 3(Intel® Gaudi® 3) AI 가속기: 대규모 생성형 AI에 최적화된 가우디 3은 64개의 텐서 프로세서 코어(TPC)와 8개의 행렬 곱셈 엔진(MME)을 통해 심층 신경망 연산을 가속화한다. 가우디 3은 학습 및 추론 작업을 위한 128GB의 HBM2e 메모리와, 확장 가능한 네트워킹을 위한 24개의 200Gb 이더넷 포트를 갖추고 있다. 또한 파이토치(PyTorch) 프레임워크와 허깅페이스(Hugging Face)의 고급 트랜스포머 및 디퓨전 모델과의 완벽한 호환성을 제공한다. 인텔은 최근 IBM과 협력하여 IBM 클라우드에서 가우디 3 AI 가속기를 서비스 방식으로 배포한다고 발표한 바 있다. 이를 통해 인텔과 IBM은 AI를 활용하고 확장하는 데 있어 총 소유 비용을 줄이고 성능을 향상시킬 계획이다.

TCO 절감해 AI 시스템 향상

대규모 AI 배포를 위해서는 유연한 배포 옵션, 경쟁력 있는 가격 대비 성능, 접근 가능한 AI 기술 등을 고려해야 한다. 인텔의 강력한 x86 인프라와 광범위한 개방형 생태계는 기업들이 최적의 TCO와 성능 대 전력비를 갖춘 고부가가치 AI 시스템을 구축할 수 있도록 지원한다. 특히, GPU 가속 서버의 73%가 호스트 CPU로 인텔 제온을 사용하고 있다3.

인텔은 델 테크놀로지스(Dell Technologies), 슈퍼마이크로(Supermicro) 등 주요 OEM 파트너들과 협력하여 고객의 특정 요구에 맞춘 AI 배포 시스템을 공동 설계하고 있다. 델 테크놀로지스는 현재 가우디 3과 제온 6을 활용한 RAG 기반 솔루션을 공동 설계 중이다.

공동 엔지니어링으로 프로토타입에서 생산까지의 격차 해소

생성형 AI(Gen AI) 솔루션을 프로토타입에서 생산 준비가 완료된 시스템으로 전환하는 과정에는 실시간 모니터링, 오류 처리, 로깅, 보안, 확장성 등에 대한 과제가 포함된다. 인텔은 OEM 및 파트너들과의 공동 엔지니어링을 통해 이러한 문제를 해결하며, 생산 준비가 완료된 RAG 솔루션을 제공한다.

이 솔루션은 오픈 플랫폼 엔터프라이즈 AI(OPEA) 플랫폼을 기반으로 하며, OPEA 기반 마이크로서비스를 통합하여 확장 가능한 RAG 시스템을 구축하고, 제온 및 가우디 AI 시스템에 최적화되어 고객이 쿠버네티스(Kubernetes), 레드햇 오픈시프트 AI(Red Hat OpenShift AI) 및 레드햇 엔터프라이즈 리눅스 AI(Red Hat Enterprise Linux AI)에서 쉽게 애플리케이션을 통합할 수 있도록 설계되었다.

엔터프라이즈 AI 애플리케이션 접근성 확대

인텔의 타이버(Tiber) 포트폴리오는 AI, 클라우드, 엣지 환경 전반에서 접근성, 비용, 복잡성, 보안, 효율성 및 확장성 문제를 해결하는 비즈니스 솔루션을 제공한다. 인텔 타이버 개발자 클라우드(Intel® Tiber™ Developer Cloud)는 이제 기술 평가 및 테스트를 위한 인텔 제온 6의 미리보기 시스템을 제공한다. 또한, 선별된 고객들은 AI 모델 배포를 검증할 수 있는 인텔 가우디 3에 대한 조기 접근 권한을 이용할 수 있으며, 가우디 3 클러스터는 다음 분기부터 대규모 생산 배포를 위해 출시될 예정이다.

새로운 서비스 제공 사항에는 신뢰할 수 있는 AI 애플리케이션 개발을 위해 시커(Seekr)의 엔드투엔드 AI 플랫폼인 시커플로우(SeekrFlow)가 포함된다. 최신 업데이트에는 새로운 AI 가속 기능과 제온 6 프로세서 지원이 포함된 파이토치 2.4(PyTorch 2.4)와 인텔 oneAPI 및 AI 도구 2024.2가 탑재된 인텔 가우디 소프트웨어의 최신 버전과 주피터(Jupyter) 노트북이 지원된다.

[테크수다 기자 도안구 eyeball@techsuda.com]

Newsletter
디지털 시대, 새로운 정보를 받아보세요!