LG 엑사원, 퓨리오사AI 추론칩 '레니게이드' 도입…LLM과 추론칩의 만남

[테크수다 기자 도안구 eyeball@techsuda.com] 국내 대기업 개발진이 만들고 있는 LLM과 스타트업이 개발하는 추론칩이 만났다.

AI 반도체 기업 퓨리오사AI(대표 백준호)는 자사 2세대 AI 추론 가속기 ‘RNGD(레니게이드)’가 LG의 대규모 언어모델(LLM) ‘엑사원(EXAONE)’에 전면 도입됐다고 22일 밝혔다. 양사는 이번 협업을 토대로 레니게이드를 기반으로 한 기업용 엑사원 솔루션을 조만간 출시한다.

AI 추론 가속기 레니게이드(RNGD)[사진=퓨리오사AI]

전기정 LG AI연구원 프로덕트 유닛장은 “다양한 GPU와 NPU를 검토한 결과 레니게이드가 가장 적합하다고 판단해 이번 실증을 진행했다”면서 “레니게이드는 탁월한 절대 성능을 보여주면서도 인프라 총소유비용(TCO)을 획기적으로 절감하며, 모델 지원 과정이 매우 빠르고 용이하다는 점을 높이 평가한다”고 말했다.

앞서 퓨리오사AI와 LG AI연구원은 레니게이드를 엑사원 3.5 모델의 파일럿 환경에 적용해 약 8개월간 집중적으로 테스트를 진행한 바 있다. 그 결과 레니게이드 사용 시 LG 측의 고성능 조건을 충족시키는 동시에 기존 GPU 대비 전력당 성능이 2.25배 향상된다는 사실을 입증했다고 발표했다. 기존 GPU의 만성적 한계로 꼽히는 과도한 전력 소비 문제를 해결하면서도, 대규모 생성형 AI 서비스에 필요한 사양을 달성했다는 의미다.

이는 GPU 외 하드웨어가 대형 엔터프라이즈 LLM 추론 환경에서 도입된 기념비적 사례로 평가받는다. 퓨리오사AI는 이번 도입으로 자사 기술력을 증명하고 신뢰도를 확보해, 포춘 글로벌 500대 기업들이 자사 산업군에 도입 가능한 레퍼런스로 작용할 것을 기대하고 있다. 주요 기술 선도국들이 인공지능 주권을 위해 자체 소버린 AI 확보에 열중인 상황에서, GPU 의존도를 낮추고 자국 기술로 AI 인프라를 구축할 수 있다는 점에서도 전략적 가치가 높다.

기술 사양

TSMC 5nm 공정, HBM3 고대역폭 메모리 탑재
전력당 성능: 엔비디아 H100 대비 2.25~3배 높은 효율 (3배는 와트당 H100 대비, 2.25배는 LG 엑사원 성능 기준)

퓨리오사AI는 최근 출시된 엑사원 3.5의 후속 모델이자 글로벌 경쟁력을 갖춘 엑사원 4.0 모델 역시 지원을 준비하고 있다. 추론 최적화 기술과 소프트웨어 기능을 지속적으로 고도화해 기존 GPU 기반 엔터프라이즈 AI 생태계를 자사 NPU로 대체해 나간다는 구상이다. 더 나아가 조만간 레니게이드를 토대로 한 기업용 온프레미스 턴키 ‘엑사원 AI 솔루션’을 위한 협업을 진행할 예정이다.

이에 따라 레니게이드는 LG AI연구원의 엔터프라이즈 AI 에이전트 ‘챗엑사원(ChatEXAONE)’의 외부 고객 서비스를 포함하여, LG 내부적으로는 전자, 화학, 통신 등의 계열사의 AI 서비스에 활용될 전망이다.

백준호 퓨리오사AI 대표는 “엑사원은 한국의 국가 파운데이션 모델로 부상하고 있다”며, “지속적인 협력을 통해 고성능 국가 AI 인프라 구축에 기여하고자 한다”고 전했다. 또한, “이번 협업은 단순한 도입을 넘어, 주도적으로 AI 인프라를 설계, 운용하려는 전 세계 기업들에게 중요한 모델이 될 것”이라고 덧붙였다.

[테크수다 기자 도안구 eyeball@techsuda.com]