네이버클라우드, ‘클로바 스튜디오’에 튜닝 기능 추가・・・초대규모 AI 언어모델 성능 극대화
[테크수다 기자 도안구 eyeball@techsuda.com] 네이버클라우드(대표 박원기)는 노코드(No Code) AI 플랫폼 ‘클로바 스튜디오(CLOVA Studio)’에 튜닝 기능을 신규 추가, 하이퍼클로바의 언어모델의 가능성을 극대화해 사용자 목적에 맞는 최적화가 가능해졌다고 밝혔다.
클로바 스튜디오는 개발 관련 전문 지식이 없이도 AI의 적용 가능성을 탐색하고 실제 서비스에 적용해볼 수 있는 노코드 AI 플랫폼이다. ▲비개발자도 자유롭게 텍스트 기반으로 AI를 실험해볼 수 있는 ‘플레이그라운드’, ▲다른 사용자들이 작업한 AI를 둘러보고 활용할 수 있는 ’익스플로러’ ▲사용자들끼리 의견과 질의응답을 나누는 ’포럼’ 공간으로 구성되어 있다.
현재 클로즈드 베타 서비스로 제공중인 클로바 스튜디오는 출시 이후 기능을 지속적으로 업데이트하고 있다. 새롭게 추가된 튜닝 기능은 사용자 데이터를 학습한 후 하이퍼클로바 언어모델 매개변수(parameter) 일부를 과제 종류, 언어, 데이터 등에 맞게 최적화해 활용하는 방식이다. 자체 AI 기술 및 인력을 보유하지 않아도 규격화된 데이터셋을 일정량 이상 업로드하면 비개발자도 쉽고 간편하게 원하는 언어모델을 만들 수 있어 클로바 스튜디오는 AI 개발 역량이 부족한 스타트업 등에 더욱 유용한 도구로 거듭나게 됐다. 하이퍼클로바 언어모델은 네이버 데이터를 기반으로 사전 학습되었기에 사용자는 튜닝을 통해 네이버의 지식과 데이터를 활용하는 효과도 누릴 수 있다.
튜닝 기능은 하이퍼클로바 언어모델이 지닌 가능성을 극대화할 수 있다. 지금까지는 플레이그라운드에서 프롬프트를 통해 예시, 지시문 등을 입력문서로 받아 그 의미를 파악하고 요약, 분류, 창작 등 과제를 수행하는 인컨텍스트 러닝(in-context-learning)방식으로만 시도했다. 이 경우 프롬프트 구성 형태에 따라 언어모델의 생성 품질이 달라지고 프롬프트 글자수의 제한도 존재한다. 하지만 튜닝 기능을 사용하면 인컨텍스트 러닝 방식 대비 안정적이고 우수한 성능을 보이며 프롬프트 글자수 제한이나 프롬프트에 대한 의존도를 낮출 수 있는 장점이 있다. 또한 튜닝을 통해 모델이 사용자 의도에 적합하게 학습되었는지 간편하게 테스트해볼 수 있으며, 이를 응용프로그램 인터페이스(Application Program Interface, API)로 활용해 서비스에 실제 적용할 수도 있다.
비용 및 작업 시간도 효율적으로 절감할 수 있다. 대규모 언어모델 전체를 학습하는 것에 비해 적은 비용으로 다양한 NLP 과제에 쉽고 빠르게 하이퍼클로바 언어모델 적용이 가능하다. 성능은 몇 백에서 몇 천 건의 적은 데이터셋 학습만으로도 수만 건을 학습한 기존 대규모 언어모델 수준에 달한다. NLP분야 최고 AI 학회 'EMNLP(Empirical Methods in Natural Language Processing) 2021'에 채택된 하이퍼클로바 연구 논문[1]에 따르면 한국어 영화 댓글 2천 건으로 튜닝한 하이퍼클로바(파라미터 130억 개, 89.5점)가 긍/부정 정확도 면에서 15만 개 댓글을 학습한 BERT(파라미터 1.1억 개, 89.7점)와 비슷한 성능을 보인 바 있다.
현재 튜닝을 통해 문서 이중 및 다중 분류, 문장 요약, 문장 생성, 문장 교정, 문체 전환 등 6개 NLP 과제를 수행할 수 있다. 네이버 사내에서는 올해 6월부터 시범 운영을 거쳐 대화, 요약, 번역, 분류 등 NLP 과제에 폭넓게 활용하며 서비스 성능을 크게 향상했다. 대표적으로 AI 돌봄 전화 서비스인 클로바 케어콜(CLOVA CareCall)은 튜닝을 통해 데이터 검수율이 기존 30%에서 91%까지 대폭 개선됐다.
튜닝 기능은 한국어 모델만 제공 중이나 영어 등 다국어 모델도 추가될 예정이며, 수행 가능한 NLP 과제의 종류와 튜닝 기법도 계속 확장될 예정이다. 클로바 스튜디오는 네이버 클라우드 플랫폼(https://www.ncloud.com/)을 통해 이용 신청할 수 있다. [테크수다 Techsuda]