‘DB의 아버지‘ 앤디 멘델손 총괄부사장, "AI 시대에도 DB는 오라클"···MS 외 타 클라우드 기업에도 제공 예정

[테크수다 기자 도안구 eyeball@techsuda.com] 데이터 시대, 데이터를 저장하고 처리하는 걸 만드는 사람들을 만나는 건 무척 재밌고 흥미롭다. 특히나 그 분야 최고 전문가이면서 아주 오랫동안 관련 업계에서 일하는 '현역'라면 이런 흥미는 배가 된다. 데이터베이스하면 떠오르는 기업은 여전히 '오라클(Oracle)'이다. 앤디 멘델손(Andy Medelsohn) 오라클 DB 서버 기술개발사업부 총괄 부사장은 'DB의 아버지'라 불린다.

모처럼 한국을 찾은 그를 기자간담회에서 만났다. 오라클을 지난해 9월 오라클 DB 23c(Oracle Database 23c)를 선보였다. 클라우드에 먼저 적용하고 패키지 버전 제품은 그 후에 출시할 정도로 시대가 변했다.

그에게 패키지 제품의 미래에 대해 물었다. 그는 "아마도 20년 이내에 모든 데이터베이스 제품들은 클라우드 환경에서 구동될 겁니다. 오라클만 해도 매주 보안 패치와 새로운 기능들을 클라우드 기반 제품에 적용하고 있습니다"라고 말했다.

앤디 멘델손(Andy Medelsohn) 오라클 DB 서버 기술개발사업부 총괄 부사장

오라클 데이터베이스 비전

멘델손 부사장 발표에 따르면, 오라클이 지난 해 9월에 발표한 차세대 융합형 DB 오라클 DB 23c는 기존 관계형 모델과 JSON 및 그래프 모델 간의 통합을 구현하는 혁신을 이뤘다. 최근 앱은 관계형뿐만 아니라 JSON, 그래프 등 다양한 데이터 유형이 혼합 운영되는 가운데, 개발자는 오라클 DB 23c를 통해 세 유형 데이터 장점을 모두 활용하는 앱을 개발 운영하며 그 과정에서 데이터 일관성을 손쉽게 유지할 수 있다.

그는 "최근 JSON과 관계형 데이터베이스의 융합, 그래프(Graph)와 관계형 데이터베이스의 융합 그리고 AI와 관계형 데이터베이스의 융합이 있다"고 전하고 "오라클은 관계형 데이터베이스에서 이런 새로운 것들을 모두 지원해 개발과 생성을 쉽게하고 통합 운영을 가능케 지원하고 있다"고 말했다.

고객들에게 필요한 다양한 데이터베이스를 지속적으로 지원하고 오픈 진영과 협력해 통합해 제공하는데 중점을 두고 있다고 강조한다. 경쟁사들이 수많은 다양한 데이터베이스를 쏟아내고 있지만 오히려 너무 많은 데이터베이스를 인티그레이션(통합)해 관리하는데 어려움을 겪고 있다는 걸 지적했다.

그는 또 오라클 DB 비전과 관련해, 생성형 AI를 접목한 융합형 DB(converged database)와 이를 구동하는 자율운영 DB(Oracle Autonomous Database)를 통해 모던 앱 및 분석을 ‘생성’ 및 운영하는 작업을 간소화할 것이라고 강조했다. 이를 통해 융합 개방형 SQL DB가 기존 단일목적 상용 DB를 대체함으로써 기업 개발자와 IT 전문가들은 데이터 통합 시간을 줄이고 혁신에 더 집중하도록 돕는다는 전략이다.

멀티 클라우드

오라클의 또 다른 전략적 핵심은 멀티 클라우드 지원이다. 오라클과 마이크로소프트(MS)는 주로 애저(Azure) 클라우드 이용 약정 계약을 맺고 있으며, 애저 환경에서 자사의 앱 및 오라클 DB를 함께 운영하길 원하는 양사 고객들을 위해 ‘오라클 데이터베이스앳애저(Oracle Database@Azure)’를 발표했다. 해당 오퍼링은 물리적인 엑사데이터(Exadata) 하드웨어를 애저 클라우드 리전 안에 위치시켜 애저 클라우드 데이터 센터 안에서 바로 엑사데이터 기반 클라우드 서비스를 제공하는 변화를 선보였다.

이를 통해 양사 고객들은 기존 애저 클라우드 서비스에 대한 이용 약정 계약 금액만으로 애저 클라우드 및 오라클 데이터베이스 클라우드 서비스를 모두 사용할 수 있게 됐으며 이를 호평하고 있다. 향후 오라클은 마이크로소프트 외 타 클라우드 기업들과 파트너십 확대를 전략적 목표로 삼고 있으며, 올해 오라클 클라우드 월드에서 관련 발표를 진행할 예정이다.

최근 두 회사는 유럽을 비롯해 아시아와 중동 등 오라클 데이터베이스앳애저 리전과 지역을 확대하고 있다. 오라클이 마이크로소프트와 협력을 하면서 다른 클라우드 사업자들에게도 저 서비스를 제공할지 여부가 초미의 관심사였는데 올 가을에 두번째 협력이 있을 것이라고 미리 공개하면서 오라클은 다시 한번 클라우드 시대에도 데이터베이스 1위를 놓치지 않겠다는 걸 확인할 수 있었다.

차세대 융합형 DB 23c 핵심 기능

차세대 융합형 DB 23c 핵심 기능 3가지는 ‘JSON 듀얼리티 뷰(JSON과 관계형 DB 기술의 통합 지원)’, ‘프로퍼티 그래프 뷰(관계형 데이터 뷰를 지원)’ 및 ‘DB 23c에 접목되는 AI 기술’이다.

‘AI 및 DB 간 융합’ 관련해, 오라클은 ‘오라클 SQL DB’를 이해하는 사람이라면 누구나 조직 안에서 다양한 수준 높은 AI 기술을 수월하게 접목 및 바로 활용할 수 있도록 지원한다. 이와 관련한 구체적인 기능으로서 ‘LLM를 활용한 자연어 기반 데이터베이스와의 대화’, ‘영상, 이미지 등 비정형 데이터에 대한 고성능 시맨틱 검색’ 및 ‘시맨틱 검색과 LLM 모델 간 결합을 통한 효과적인 결과 도출 지원’을 제공한다.

오라클은 오라클 DB에 많은 양의 비즈니스 데이터를 보유한 기업들이 강력한 AI 기술 및 SQL을 매우 손쉽게 활용해 매우 간단한 방식으로 데이터를 검색하도록 지원한다. 이를 통해 기업은 내부 독점 데이터를 더 잘 활용하고 이해할 수 있다. 또한 이는 표준 SQL 기반으로 제공되는 AI 기술이기 때문에 컴퓨터 공학 부문 높은 학위가 없다고 하더라도 SQL을 이용할 수 있는 모든 데이터베이스관리자(DBA)가 활용할 수 있다.

오라클은 DB 23c를 오라클 클라우드 인프라스트럭처(OCI)에서 사용할 수 있도록 한 후 오라클 데이터베이스 온프레미스, 엑사데이타, 엑사데이타 데이터베이스 서비스, 엑사데이타 클라우드 앳 커스터머(ExaC@C), 자율운영 데이터베이스(ADB)에 대해 천천히 적용해 가고 있다.

다음은 기자들과 앤디 멘델손(Andy Medelsohn) 오라클 DB 서버 기술개발사업부 총괄 부사장과의 일문 일답

  1. 오라클 DB의 자연어 질문 및 답변 지원 기능과 관련해, 이를 일반적 챗GPT 와 비교 시, 기업 내 환경에서는 일반 사용자들이 경험하는 환각현상 같은 것들이 허용되지 않고 정확해야 하는데 이에 대한 관점은?

회사 내 데이터에 대해 LLM 기반 검색은 말씀하신 그런 LLM 모델로는 좋은 답을 제공할 수 없다. 말씀하신 모델은 인터넷에 공개된 방대한 데이터에 대해 훈련됐지만, 기업 보유의 프라이빗 데이터에 대해서는 전혀 알지 못하기 때문이다. 비즈니스적인 질문을 비즈니스 데이터에 대해 할 경우에 자연어로 질문을 할 때 LLM이 올바른 SQL 질문을 만들 수 있도록 도울 수 있는 데이터 강화가 필요하다. 그래서 사용자의 질문의 맥락에 따라서 가장 적절하다고 생각되는 데이터베이스 스키마를 생성 및 제공해야 한다.

이에 오라클은 LLM이 SQL 생성 후 적절한 오라클 데이터베이스에 있는 스키마만 참조할 수 있도록 하며, 인터넷 공개 데이터로 답변하지 않도록 한다. 애널리스트들이 자주 묻는 질문을 알고 있기 때문에, 이것을 기반으로 관계형 뷰를 만들어서 여기서 가장 자주 묻는 질문에 해당하는 스키마 생성 및 이를 LLM에 전송해서 기업 맥락에 맞는 답변할 수 있도록 보완한다.

또한 SQL 기능 중, 만들어진 관계형 뷰에 스키마 요소에 대한 의미를 자연어로 추가해 LLM이 질문의 비즈니스 목적을 더 잘 이해할 수 있다. LLM이 갖고 있는 기본적인 모델에 추가적인 정보, 맥락을 비즈니스에 맞춰 제공 및 강화할 수 있어 더 간단하고 쉽게 LLM 활용 가능한 동시에 더 정확한 답변 제공 및 환각현상 감소를 지원한다. 비즈니스를 잘 몰라도 SQL을 잘 다룰 수 있다면 생성된 SQL 수정 권한 제공 툴도 제공한다.

2. 자율운영 DB 개념과 다른 리전에서 고가용성 및 레지던스 확보를 지원하는 기능에 대해 설명 부탁한다.

글로벌 분산형 자율운영 DB는 전 세계적으로 각국 정부가 데이터 주권 규제 강화하고 있는 추세를 지원하고자 출시했다. 예를 들어 현대기아자동차 같이 글로벌하게 운영하는 기업은 전 세계 고객에 대한 DB 갖고 있다. 데이터 주권 규제로 인해 고객 DB를 국가별로 분산해서 나눠서 관리해야 하는 의무가 있다. 하나의 단일한 고객 DB를 통합해서 관리할 수 없고, 중국, EU 등으로 나눠서 관리해야 하며 이것을 데이터베이스 샤딩이라는 용어로 표현하고 있다. 그래서 23c에서 글로벌 샤딩을 쉽게 만드는 기술을 포함하고 있다. 또한 나라별로 DB를 분산해야 하는 케이스 말고도, 한 나라 내에서도 더 높은 성능 및 가용성을 위해 샤딩을 적용하는 활용사례들도 있다. 보도자료에 나온 부분은 샤딩 기술 기반에서 전 세계적으로 DB 분산할 수 있는 클라우드를 선보였다고 이야기할 수 있다. 자율운영 DB를 분산할 수 있도록 돕는 클라우드 서비스로, 자율운영 DB를 사용하는데 분산하는 방식으로 사용하는 것이다.

오라클의 데이터베이스 클라우드 서비스는 자율운영 DB와 엑사데이터 데이터베이스 DB로 나눌 수 있으며, 엑사데이터는 고성능 및 고가용성을 제공하는 하드웨어 기반 플랫폼이다. 오라클 클라우드 인프라스트럭처(OCI)에서 엑사데이터 하드웨어, 리눅스 OS 등 오라클이 관리하고 케어하지만, 엑사데이터 DB 서비스 사용하는 관점에서 DB는 여전히 고객이 관리해야 하는 영역이다. 그래서 DB 관리 역량 및 스킬이 없는 경우 엑사데이터 기반으로 그 위에 자율운영 DB 제공해서 오라클이 DB 관리까지 해주는 완전 관리형 DB 서비스를 제공한다. 이를 사용하는 고객은 오라클 가용성, 보안, 성능 같은 것도 최고 수준으로 자동화 관리 및 유지 지원을 받을 수 있고, 이를 통해 휴먼 에러 발생 가능성이 낮아진다.

비관계형 DB 시장 상황 및 오라클의 전략

오라클의 전략은 융합형 DB로 이미 몇 년 전부터 관계형 DB뿐 아니라 비관계형 DB도 제공해왔다. JSON위한 몽고DB, 빅쿼리 분석 SQL, 퀀텀 레저 블록체인 DB 등 사실 많은 벤더사들이 용도 특화된 DB를 내놓고 있다. 개발자들은 이런 여러 DB가 필요하다. 오라클은 동종 최고 DB를 모두 탑재했으며, 오픈 산업 표준을 통해 이런 모든 DB에 대한 기능 제공한다.

3.   RAG의 주석 기능을 통해 LLM 환각 기능을 막을 수 있는 기능에 대한 자세한 설명 부탁한다.

LLM의 메타데이터(데이터에 대한 의미 정보)를 더 많이 주입 및 강화할수록, 더 나은 SQL을 생성할 수 있다. 23c에는 고객이 LLM에 회사 데이터에 대한 의미를 추가할 수 있는 메타데이터를 추가해서 제공할 수 있는 많은 기능을 같이 선보이고 있는데, 주석 기능은 이러한 기능 중 하나다. 이 외에도 도메인 기능을 통해 숫자에 대한 통화, 급여를 표시할 수 있도록 지원한다. JSON 듀얼리티 뷰, 프로퍼티 그래프 뷰 또한 LLM에 메타데이터를 더 많이 제공해서 결과적으로 정확한 SQL 생성을 지원하는 기술이다. 오라클이 의도하는 바는 사람만큼 우수한 SQL 생성을 목표로 하고 있다. 그러나 사람처럼 LLM이 완벽하지 않고, 여러 장치로 보완된 LLM이 95% 정확도의 SQL을 도출해낸다고 하면 그 정도도 좋다고 한다.

4. 파운데이션 LLM 사업을 직접 하지 않는 이유와 최근에 등장하는 경쟁력 있는 MS 오픈 AI, 구글 제미나이 등 모델을 올리기 어려운 점에 대한 관점은?

챗GPT 같은 파운데이션 LLM 모델 개발 구축에 많은 비용이 들며, 시장의 무료 모델을 쓸 수 있기 때문이다. 또한 셀렉트 AI 등 오라클이 AI로 LLM 활용을 지원하는 기술들 중 좋은 API로 연결해 시중의 인기 있는 널리 사용되고 있는 LLM 모델과 잘 연동될 수 있도록 잘 지원할 수 있도록 기술을 고도화하고 있다. 오라클 클라우드 관점에서 오픈AI 등 LLM 벤더와 파트너십을 맺어서 오라클 클라우드를 사용하도록 움직이고 있다. 말하자면 프라이빗 LLM 만들 수 있도록 지원하는 것이다. 현재 AI 커뮤니티에서 굉장히 많은 개발 움직임이 있는데, 그 중 하나가 업무별로 특화된 LLM을 만드는 것이다. 이 경우 운영 비용이 굉장히 저렴해질텐데, 예를 들면 SQL 생성에 특화된 LLM 만든다고 했을 때, 이런 쪽과 협력을 해서 특화된 기술을 저렴한 비용으로 사용할 수 있도록 하는 협력을 진행하고 있다.

5. 오라클이 튜닝한 파운데이션 모델이 있는 것인지 만약 있다면 챗GPT, 라마와 같은 제품군이 있는지? 고객에게 선택지 주는 것인지? 주석, 메타데이터 기능으로 성능을 높이는 것이 파인튜닝인지 RAG인지?

고객이 원하는 LLM 모델은 어떤 것이든 해당 LLM 모델과 파트너십 통해 제공하는 것을 목표로 한다. 고객 선택지를 제약하는 움직임은 없다.

주석, 메타데이터 기능 관련 파인튜닝 또는 RAG라고 정의를 내리고 싶진 않다. 이를 어떻게 명명하는지는 중요하지 않다. 오라클 의도는 주석, 메타데이터 등 다양한 기능을 통해 고객이 선택한 LLM이 프라이빗 데이터 환경에서 더 잘 작동할 수 있도록 최대 메타데이터 제공해 원하는 데이터 의미, 기업이 원하는 의도를 더 잘 이해할 수 있도록 LLM을 더 잘 보완하는 것이 목표다. 다시 말해 일련의 기능들이 프롬프트 엔지니어링이라고 많이 이야기하고 있다. 사용자 자연어 질문에 대한 정보 추가뿐 아니라 전체적인 맥락과 데이터에 대한 더 많은 정보, 시맨틱 정보를 최대한 제공해 LLM을 더 잘 활용 및 이것이 더 정확한 결론을 도출하는 것을 목표로 한다.

6.  DB 버전업 되는 패키징 전략이 클라우드 시대에도 여전히 유효한가? 수많은 고객들의 요구사항을 버전업 시 어떻게 선택적으로 반영하는지 궁금하다. 23c 다음 DB로 무엇을 준비 중이십니까?

우선 20년 후를 내다본다면 온프레미스 DB가 모두 클라우드 전환을 마쳤을 것이다. 오라클은 고객이 클라우드에서 DB 사용이 최대한 수월하도록 지원하는 것을 목표로 할 것이다. 온프레미스 데이터베이스 운영 시 갖는 고충을 클라우드 및 자율운영 DB 사용 시 해결할 수 있도록 반영하려고 한다. 지금까지 온프레미스에서 DB 사용하면서 어려움을 겪었던 프로비저닝, 이슈 탐지, 패칭, 업그레이드 등 모든 고충을 클라우드에서 자동화해서 제공하는 방식으로 해소하고자 한다.

지금도 클라우드에서 오라클 DB가 주 단위로 버전이 릴리즈되고 있다. 버그 픽스, 기능 추가, 보안 관련 기능 개선 등 새로 릴리즈가 나오고 있다. 클라우드에서는 지금까지의 특정 기간을 둔 패키지 모델 같은 딜리버리 모델도 달라질 것이다. 궁극적으로는 버전이라는 개념도 사라질 것이라 전망한다. 자율운영 DB 사용 시 계속해서 무언가 바뀌고 새것이 나오지만 고객들은 향후 그러한 내용에 신경을 쓰지 않아도 된다. 오라클이 다 자동화해서 알아서 제공해 줄 것이기 때문에 걱정하지 않으며 DB를 사용하는 시대가 올 것이라고 보고 있다.

7. 융합형 DB 관련, 오라클 융합형 DB와 시중의 단일 목적 DB 결합 사용을 비교 시, 성능 및 비용 측면의 우위는?

가트너의 DB 평가에 따르면, DB 트랜잭션 운영 관점에서 오라클 융합형 DB가 압도적인 1위며 분석에서는 2위인데 1위가 테라데이터이기 때문에 큰 의미가 없다고 생각한다. 비용 관점에서는 개발 비용 및 시간에 대한 비용이 있는데 굉장히 복잡한 과정이 될 것이고 보안에 관련된 비용도 더 많다. 그래서 성능과 비용 두 관점에서 오라클 융합형 DB가 훨씬 더 나은 선택지다.

가격적으로도 니치 플레이어들이 너무나 저렴하게 제안한다고 했을 때, 오라클은 모든 DB들을 융합해서 사용하기에 부담이 되는 고객이 있다고 하면, 오라클에서는 자율운영 DB에서 JSON 기능만 이용할 수 있도록 하고 있다. 또 다른 장점은 JSON 만 쓰다가 나중에 분석에 특화된 DB 원한다고 했을 때 몽고DB 데이터를 레드시프트로 옮겨서 분석을 구동하던지 해야되는 데이터 이동 비용 및 보안 문제가 있는데, 오라클 DB에서는 버튼 몇 개만 누르면 데이터 이동, ETL 전혀 없이 바로 동일한 데이터에 애널리틱스 기능을 적용할 수 있게 된다.

8. 데이터 웨어하우스에서 데이터 레이크하우스쪽으로 왔는데 앞으로의 분석 환경은 어떻게 변화할 것인지 전망하나?

데이터 분석 환경의 미래는 오라클 융합형 DB에 있다. SQL, 그래프 분석 및 AI 기반 기능까지 융합해 제공한다. 요즘 AI 벡터 검색 많이 구현되고 있는데 해당 활용 사례는 실제로 분석 DB, 운영 DB가 별도로 있다. 이 두 개를 결합시켜서 별개의 DB에서 AI 벡터 검색을 해야하는데, 오라클에서는 운영 DB 그 자체에서 바로 분석을 할 수 있기 때문에 굉장한 장점이라고 생각한다.

[테크수다 기자 도안구 eyeball@techsuda.com]

Newsletter
디지털 시대, 새로운 정보를 받아보세요!
세미나