조성철 CTO가 전하는 티빙 고객 취향 파악하기 시즌1
[테크수다 기자 도안구 eyeball@techsuda.com] 조성철 티빙 최고 기술 책임자(CTO: Chief Technology Officer)와 인터뷰 약속을 잡은 시기에 넷플릭스의 오징어게임이 전세계를 강타하고 있었다. 물론 지금까지 그렇다.
오징어게임은 9월 17일 첫선을 보인 후 전세계 1억 1100만 넷플릭스 구독 가구가 시청했다. 총94개국에서 넷플릭스 '오늘의 톱 10' 1위에 올랐고 비 영어권 시리즈 중 최초로 21일 연속 1위를 기록중이다. OTT 서비스의 위력과 한국 콘텐츠의 가치를 동시에 느끼게 하는 일이 벌어지고 있다. 넷플릭스는 아마존웹서비스(AWS)를 통해 전세계 고객들을 만나고 있고 진출한 각 나라별 통신사나 인터넷 서비스 제공업체(ISP)에 해당 콘텐츠를 플레이할 수 있는 장비도 제공하면서 글로벌화에 성공한 대표적인 OTT 업체다.
오징어게임 열풍 속에 이제 만나는 이들마다 그걸 봤냐고 묻지만 실은 난 '갯마을차차차' 류의 콘텐츠를 더 좋아한다. 피튀기고 누군가 죽어나가는 게 웬지 끌리지 않는다. 취향의 문제다. 취향을 읽어내는 일은 OTT 서비스 회사들에게 영원한 숙제다.
서울 상암동에 있는 티빙은 국내 대표적인 OTT(Over The Top) 미디어 서비스 회사다. 특히 드라마, 예능 장르에서는 국내 최고의 콘텐츠를 제공하고 있다. 2020년 CJ ENM으로 부터 분사했고 지난 10월 1일 1주년을 맞았다. 거대 글로벌 OTT 업체들이 한국 콘텐츠에 주목하고 있는 와중에 국내 콘텐츠를 통해 관련 사업을 전개하고 있는 티빙의 데이터 분석 분야에 대해 엿볼 수 있는 기회를 얻었다.
"현업 담당자들이 티빙(Tving) 사용자분들의 취향과 성향을 빠르게 분석하고 대응할 수 있게 데이터 분석 플랫폼을 마련하고 진화시키고 있습니다. 현업 사용자들이 요구하는 걸 빠르게 제공하고 피드백을 받아 바로 수정하고 개선하는 구조를 통해 저희의 비즈니스 전체가 성공할 수 있도록 돕는데 방점을 두고 있습니다."
조성철 티빙 최고 기술 책임자(CTO)는 데이터 분석 플랫폼 마련 의미를 이렇게 밝혔다.
미디어와 엔터테인먼트 업계는 고화질 콘텐츠, 가령 8K 영상을 만들어 내면서 폭발적으로 늘어나는 데이터의 양, 특정 시점에 트래픽이 몰려오는 불규칙한 데이터 트래픽, 고객들이 쏟아내는 댓글을 포함한 데이터의 다양성, 이를 비용 효율적으로 처리해야 하는 문제, 혁신을 바로 원하는 시점에 대응해야 하는 타임투 마켓 이슈, 영상 데이터와 관련한 인공지능과 머신러닝(AI/ML)의 적용 등의 문제를 해결해야 한다.
이런 문제를 기술팀이 뒷받침해줘야 공들여 만든 다양한 콘텐츠들을 효율적으로 적시에 고객들에게 제공, 즐길 수 있고 이는 자연스럽게 경쟁력 향상으로 이어진다.
빅데이터 플랫폼과 인공지능과 머신러닝 관련 기술들에 대해 최근 들어 더 주목하는 이유기도 하지만 역으로 보면 이런 인프라를 어떻게 잘 마련해서 대응하느냐는 콘텐츠를 만드는 일 만큼이나 중요하다.
티빙이 만들고 있는 데이터 분석 플랫폼은 이런 문제 해결에 방점을 찍었다. 충분한 용량의 데이터 저장소와 컴퓨팅 자원, 분석 플랫폼의 탄력적 운영, 특성에 맞는 데이터 분석 도구, 자본 비용과 운영 비용의 효율적인 조정, 민첩성과 지속적인 실험, 전문성을 갖춘 환경을 위해 클라우드 서비스에 주목했고 이를 활용하면서 대응하는데 중점을 두고 있다.
티빙의 경우 2020년 5천만건의 트래픽이었다면 2021년 상반기에는 그 네배인 2억건을 넘었고 2021년 하반기에는 무려 10배가 늘어난 5억건 이상이 될 것으로 예상하고 있다. 데이터 소스들도 서드 파티 마케팅 툴을 통해 들어오는 데이터와 가입자들의 행동 데이터, 이미 보유한 미디어 콘텐츠와 새롭게 창작된 콘텐츠 등의 메타데이터까지 소스도 다양하다.
조성철 티빙 CTO는 클라우드를 활용하는 이유가 바로 이런 직면한 문제를 해결하고 향후 시장 변화에 유연하게 대응하기 위해서라고 강조한다.
그는 "초고해상도의 미디어 볼륨이 빠르게 커지면서 이를 처리하기 위한 컴퓨팅 파워, 특정 시점 몰리는 트래픽에 대한 유연한 처리와 대응, 365일 안정적으로 운영하기 위한 체계 등 미디어와 엔터테인먼트 업계 특성상 클라우드 사업자들이 제공하는 기술들을 빠르게 적용해 현업 사용자들이 바로 바로 대응할 수 있게 해줘야 합니다. 제가 종사하는 업종과 클라우드의 특징이 다른 그 어느 산업군보다 잘 어울리는 이유라고 생각합니다"라고 클라우드 여정 이유를 밝혔다.
미디어 업계들이 시장 변화에 대응하기 위해 클라우드 여정을 시작했듯이 티빙도 마찬가지다. 국내 탄탄한 환경을 만들면서 동시에 해외 진출도 염두에 두고 있다. 관련 인프라를 전세계에 운영하는 클라우드 사업자들과의 협력은 당연한 선택지 중 하나였다. 티빙도 국내 뿐아니라 일본과 대만 등에 진출하기 위해 노력중이다.
티빙이 선택한 방식은 기존 설치 운영되던 레거시를 한번에 들어내지 않고 필요한 것부터 개선하는 형태였다. 내부 기술 인력과 이런 인력들이 만든 인프라를 통해 제공한 데이터를 현업 사용자들이 손쉬게 다루고, 또 새로운 환경에서도 대응할 수 있도록 순차적으로 필요한 영역부터 하나씩 하나씩 옮겨가고 있다.
레거시 데이터 플랫폼을 클라우드 환경에 구현하면서 데이터 성격에 따라 저장소를 분리, 적재해 효율성 증가와 분산 DB를 사용해 부하 분산을 기대했다. 또 카프카 같은 기술을 사용해 서비스 간 장애 전파를 차단하고 클라우드 서비스로 전환해 가용성과 작업들을 단계별로 모듈화해 확장성 증가도 꾀했다.
조 CTO는 기존 DW(Data Warehouse) 시스템을 유지하면서 동시에 클라우드 환경에서도 데이터 분석 플랫폼을 만들어 가고 있다고 설명했다. 레거시를 한꺼번에 걷어내고 빅뱅 방식으로 모두 클라우드로 이전하는 방식보다는 필요한 것부터 하나하나 만들어가는 게 조직과 시스템 운영, 사용자들의 피드백에 따른 대응 측면에서 한결 수월하다고 강조했다.
그는 "소프트웨어 개발과 적용, 운영면에서도 이렇게 필요한 것부터 하나씩 변화시키는 게 훨씬 유리하다고 판단하고 있습니다. 내부 구성원들도 기술을 적용하고 안정적으로 운영하고 저희가 제공하는 데이터를 다루면서 고객 분석에 나서는 협업 사용자들도 갑자기 새로운 툴을 익히느라 고생하지 않고 이미 익숙한 툴도 다루고 또 새롭게 제공되는 것도 배울 시간이 필요합니다"라고 그 이유를 설명했다.
그는 또 "소프트웨어의 특징은 재활용과 특정 업무에 대한 자동화인데 순차적인 마이그레이션이 이 분야에서 훨씬 유리하다고 판단하고 있습니다. 클라우드 여정은 모든 걸 새롭게 하루 아침에 만드는 게 아니라고 보고 있습니다. 기술 파트는 실제 사용자들에게 진정한 가치를 전달할 때 의미가 있다고 보고 있습니다"라고 강조했다.
이렇게 하나씩 모두 클라우드로 순차적으로 이관이 되고 나서 모든 시스템들이 안전하게 클라우드에서 돌고 협업 사용자들도 부지불식간에 인프라가 바뀐 줄 모르는 상태에서 기존 레거시 시스템 운영을 멈출 계획이다.
이 방식이 앞서 밝힌대로 해외 진출에도 유리하다. 한국 리전에 마련한 시스템에 대해 내부 인력들이 모두 익숙해지는 게 아시아 시장 진출시 트래픽 처리와 데이터 분석 플랫폼을 활용에 훨씬 유리하고 빠르게 고객 대응에 나설 수 있다고 판단하고 있다. 초기에는 해당 리전에 모든 인프라를 만들어 놓기 보다는 인증 관련 게이트웨이들을 우선 제공하고, 성과를 보면서 특정 시점에 해당 리전에 동일 인프라를 복제해 적용하는 게 유리하고 유연할 수 있다는 입장이다.
해당 프로젝트를 진행하기에 앞서 티빙은 올해 인력들도 많이 보강했고 아웃소싱 영역들도 순차적으로 내부 인력들이 담당할 수 있게 바꾸고 있다. 개발자 몸값도 천정부지인 상황에서 개발자 채용도 쉽지 않았지만 미디어 엔터테인먼트 업계의 선두 서비스 업체고 콘텐츠를 사서 구현하지 않고 원천 소스를 가지고 필요한 것들을 제공할 수 있다는 측면을 선호한 이들도 많아서 좋은 인재들과 함께 일하고 있다고 자랑 아닌 자랑을 했다.
모집직무도 애플 iOS와 구글 안드로이드 앱 개발자, 데이터베이스관리자(DBA), 데이터 엔지니어, 데이터분석, 미디어 엔지니어, 백엔드 개발, 프론트엔드 개발, 프로덕트 매니저, 퍼블리셔, 클라우드 엔지니어, 정보보안, 스마트TV 개발을 비롯해 서비스 기획과 법무 등 미디어 업계 전반이었다.
조성철 CTO는 "티빙은 성장하는 회사고 OTT 분야에서 좋은 기술을 적용할 수 있어서 개발자들에게도 좋은 기회의 장이 아닐까 싶습니다"라고 말했다.
티빙의 이런 도전은 아마존웹서비스(AWS)와 함께하고 있다. 데이터 분석 플랫폼엔 아마존 S3, ECS, EKS, 파게이트, 오토스케일링, EMR, 레드시프트, 엘라스틱서치, 아마존세이지메이커(SageMaker) 같은 기술 서비스와 신곡한 인프라 구축과 개발 사이클, 일회용 인프라 등 다양한 기술들을 적용했다.
아마존은 13개의 컴퓨트와 컨테이너, 6개가 넘는 종류의 스토리지, 다양한 데이터 소스를 처리하기 위한 9개의 데이터베이스, 14가지의 데이터 분석, 24개의 머신러닝, 11개의 미디어 서비스 기술을 제공한다. 또 다양한 기업들의 구체적인 사례들도 함께 공유하면서 새로운 도전에 나서는 기업들의 문제 해결을 돕고 있다.
다양한 클라우드 사업자들 중 티빙이 AWS를 선택한 이유는 무엇일까.
그는 "우선 DW 구축할 때 데이터 파이프라인 구축과 설계에 필요한 솔루션의 제어나 확장성이 중요했었고, 기존 레거시 DB와 호환성, 다양한 B I도구 연결이 가능한지 등이었습니다. AWS의 EMR, Redshift 등은 이런 요구사항을 충분히 수용하고 있었습니다"라고 전하고 "아직은 고려하지 않고 있지만 미디어 처리를 위한 미디어컨버터, AI분석도구들의 연결성을 잘 제공해 준다고 생각합니다. 개인적으로 AWS는 학생으로 말하면 국영수나 특정 과목만 잘하는 친구보다 전 과목 골고루 성적이 좋은 친구에 가깝다고 생각합니다"라고 설명했다.
또한 앞서 밝힌대로 티빙 서비스가 국내에만 국한된 서비스가 아니기 때문에 글로벌 지역 커버리지도 중요했다.
수많은 기술과 개발환경과 데이터 시각화 도구들은 물론 실제 이전과 운영 혜택도 궁금했다. 조성철 CTO는 이전 직장에서 데이터 분석을 위한 플랫폼을 내부적으로 개발 구축 운영하면서 수많은 시스템 최적화는 물론 알고리즘에 대한 테스트와 적용 등에 많은 시간을 투자했는데 이젠 그런 인프라가 모두 서비스로 제공되기 때문에 전체 데이터 파이프라인에 대한 설계에 집중하고 현업 사용자들 지원에 더 많이 시간을 할애할 수 있는 걸 가장 큰 이점으로 꼽았다.
그는 "데이터 분석 플랫폼도 궁금적으로 현업 사용자들이 티빙 고객에 대해 분석하고 이용자분들에게 최적화된 맞춤 콘텐츠를 추천해 만족도를 높이기 위해 마련하는 건데 해당 인프라 마련에 몇년을 쓰지 않고 바로 설계하고 대응할 수 있고 저희 서비스 본질에 집중할 수 있는 게 가장 큰 소득이 아닐까 싶습니다"라고 전했다.
인터뷰 도중 그는 티빙에 합류한 개발자들과 관련 인프라 설계 후 적용하기 까지 3개월이 채 걸리지 않았다고 밝혔다. 물론 이런 시간은 조성철 CTO나 함께하는 엔지니어들이 다년간 시행착오는 물론 다양한 미디어 서비스를 진행하면서 쌓은 실력 때문이 아닐까 싶었다. 서비스 회사에서 축적한 경험이 클라우드 인프라와 개발 환경을 만나서 시너지를 내고 있는 사례로 볼 수 있었다.
티빙의 클라우드 여정과 데이터 분석 플랫폼의 진화는 앞으로도 계속된다. 어떤 것들을 더 보강하고 개선해 나가고 싶은지 궁금했다.
조성철 CTO는 "고객이 무엇을 얼마나 시청했는지 파악하는 단계를 넘어서 고객이 좋아하고 싫어하는 '취향'을 파악하기 위해서는 다양한 데이터들을 취합해 꾸준히 분석하고 필터링하고 적용해야 합니다. 관련 업무의 연속이죠. 콘텐츠 자체에 대한 메터데이터를 잘 구축하는 일도 계속 개선해 나가야 합니다. 이를 통해 고객이 가장 좋아할 콘텐츠를 제공해야죠. 이를 위해서 사용자와 콘텐츠 분석에 필요한 AI 기술에 투자할 예정입니다"라고 밝혔다.
인터뷰를 끝내고 집에 들어오니 바깥어른이 스마트폰을 통해 무언가를 보고 막 웃고 있었다. 뭐하나 물어봤더니 티빙 통해 갯마을 차차차 클립들을 보면서 행복해하고 있었다. 유료 아니냐고 했더니 이런 건 무료라고 알려줬다. 나도 한 때는 티빙의 고객이었는데.
갯마을차차차 남자 주인공은 내가 보기에도 잘생겼고 웃는게 너무 멋졌다. 물론 시나리오와 함께하는 배우들, 연출과 스탭들이 힘을 합쳐 만든 따뜻한 드라마라서 전반적으로 모두 좋다. 모처럼 취재도 하고 했는데 뭔가 좀 아쉽기는 했다.
여튼 글을 쓰고 관련 자료를 좀 찾아보려고 집 PC로 티빙 사이트에 접속했다. 모바일 사용자와 PC 사용자가 대략 6:4 정도라고 했던 말이 생각이 났다. 사이트에 접속했고 예전 아이디와 패스워드로 접속했더니 잘 된다. 첫 화면이 연간정기권 론칭 기념 얼리버드 41% 할인이다.
나도 모르게 월 1만 3900원의 프리미엄 이용권 연간 9만 9000원을 결제하고 말았다. [테크수다 Techsuda]
다음은 조성철 CTO와 일문 일답.
티빙에 대해 간단히 소개 부탁드립니다.
잘 아시다시피 국내 OTT 서비스로서 특히 드라마, 예능 장르에서는 국내 최고의 콘텐츠를 제공하는 서비스입니다. 2020년 CJ ENM으로 부터 분사를 했고요. 지난 10월 1일이 티빙 1주년이 되는 날이었습니다.
미디어 * 엔터테인먼트(M&E) 업계에서 왜 클라우드에 주목해야 할까요?
첫번째는 미디어 엔터테인먼트 산업의 특성 중 하나가 미디어 자체의 데이터 볼륨이 크다는 사실입니다. 대용량의 비디오와 오디오를 저장하고, 사용자에게 전달하는 일이 컴퓨팅과 네트워크 자원을 많이 필요로 합니다.
두번째로 콘텐츠를 소비하는 패턴이 일정하지 않은 특성이 있습니다. 인기 있는 드라마, 영화, 스포츠등의 순간적인 동시 접속자가 몰리는 경우가 많이 있죠. 이런 경우 안정적으로 서비스를 하려면 시스템의 안정성 뿐 아니라 확장성이 매우 중요합니다.
세번째는 새로운 기능과 기술에 대해서 가장 빠르게 반응하는 시장이라고 생각합니다. 콘텐츠를 소비하는데 몰입할 수 있는 비디오와 오디오 기술, 나에게 적합한 영상들을 잘 보여줄 수 있는 서비스를 만들려면 많은 데이터와 분석 작업이 필요합니다. 이런 몇 가지 특성으로 볼때 미디어와 엔터테인먼트 산업이 특히 클라우드에 잘 피팅된다고 생각합니다.
OTT 서비스 사업자 입장에서 클라우드 여정을 상당히 오래 전부터 진행해 오셨을텐데요. 어느 단계부터 진행하셨는지 궁금합니다.
앞에서 얘기한 산업의 특성들뿐만 아니라 치열한 OTT 경쟁에서 살아남기 위해선 잘 만들어진 우리의 콘텐츠와 서비스를 통해 국내 뿐 아니라 전 세계의 사용자를 우리의 고객으로 만드는 일이 무척 중요하다고 생각합니다.
국가별로 빠르게 서비스를 오픈하고 운영하려면 결국 클라우드가 가지고 있는 글로벌 인프라 네트워크를 활용할 필요성이 있었고 효율적으로 설계하고 구축하는 일도 중요합니다. 티빙도 일반 기업들과 마찮가지로 인터넷데이터센터(IDC)에 온프레미스 환경에서 구축이 되어었는데요. 클라우드 이전을 할때 기존의 서비스도 잘 운영하면서 이전을 하려면 구조적으로 IDC와 클라우드 두개의 시스템을 공존하도록 만들어야 하고 이 기간이 생각보다 길게 됩니다. 따라서 시스템간에 디펜던시가 적은 모듈들 부터 분리하면서 클라우드 이관을 하게 됩니다.
OTT 업계에서는 개인들의 ‘취향’을 분석하고 추천해주는 일이 중요하다고 하는데요. 이를 어떻게 해결하고 계신지 궁금합니다.
현재도 티빙에 추천 서비스를 제공하고 있지만 이용자가 만족할 수준은 아니라고 생각합니다. 저희 티빙에서는 개인화 추천을 위해서 우선 고객의 취향 정보를 모으고, 기존의 사용 패턴을 분석하는 작업을 하고 있습니다. 이런 기본적인 데이터를 기반으로 콜라보레이션, 딥러닝 기반 추천 모델을 연구해서 적용하고 있고요. 그 효과를 측정해서 개인에게 보다 적합한 모델이 피팅되게 만드는 전체 파이프라인을 구축하고 있습니다.
기존 데이터 플랫폼을 클라우드로 마이그레이션하고 진화시켜 나가기로 결정하신 배경은 무엇인가요?
대부분의 기업에서 데이터를 통한 의사 결정의 중요성을 인지하고 시스템의 구축에 많은 공을 들이고 있는데요. 의사결정에 필요한 인사이트를 얻으려면 먼저 대용량의 데이터를 수집하고 가공하고 적재하는 기본적인 ETL(추출, 전환, 적재) 파이프라인이 잘 동작해야 이를 통해 데이터 분석이 가능하게 됩니다.
그런데, 적은 인력으로 하둡등의 분산 스토리지나 분석 플랫폼을 유지보수하는 것 자체도 만만한 일이 아닙니다. 또 대량의 데이터를 정의하고 모으고 운영하는 일 자체도 작은 회사에겐 많은 도전이 필요한 부분이지요. 이 부분은 클라우드를 통해 빠르게 구축하고 안정적인 서비스를 받고 데이터 정제, 분석, 추천 등의 핵심 비지니스에 집중하기 위한 결정이라도 말씀드릴 수 있겠네요.
클라우드 사업자들의 빅데이터 플랫폼들 중 AWS를 특별히 선택한 이유는 무엇인가요?
우선 DW 구축시, 데이터 파이프라인 구축과 설계에 필요한 솔루션의 제어나 확장성이 중요했었고, 기존 레거시 DB와 호환성, 다양한 BI도구 연결이 가능한지 등이었습니다. AWS의 EMR, Redshift 등은 이런 요구사항을 충분히 수용하고 있었습니다.
아직은 고려하지 않고 있지만 미디어 처리를 위한 미디어컨버터, AI분석 도구들의 연결성을 잘 제공해 준다고 생각합니다. 개인적으로 AWS는 학생으로 말하면 국영수나 특정 과목만 잘하는 친구보다 전 과목 골고루 잘하는, 성적이 좋은 친구에 가깝다고 생각합니다.
실제 이전하고 운영하면서 얻은 혜택은 무엇인가요?
기존 온프래미스 기반의 방대한 데이터웨어하우스를 클라우드로 전환하는데 수 개월정도가 걸리느데 비해 매우 빠르게 구축했습니다. 무엇보다 많은 레거시 데이터들을 쉽게 통합하고 분석할 수 있었던 게 장점이고요.
앞으로 클라우드에서 제공되는 많은 분석, 시작화(비주얼라이제이션) 도구들을 통해 데이터를 들여다 볼수 있는 환경이 만들어져서 기대가 큽니다. 레드시프트에 BI툴로 타블로나 제플린/쥬피터를 활용해 노트북 등을 통해서 분석을 하게되는데요. 기본적으로 타겟 마케팅을 위해 다양한 방법으로 고객을 클러스터링 하거나, 고객의 행동을 분석해서 어떤 영상의 콘텐츠가 보다 효과적인지 등을 분석하는 업무를 하고 있습니다.
분석 분야에서 향후 꾸준히 개선하고 투자할 영역이 궁금합니다
우리가 제공하는 콘텐츠를 우리의 고객들이 어떻게 사용하고 평가 하는지 아는 게 중요하다고 생각합니다. 고객을 이해하려면 고객이 우리 서비스에서 보여주는 다양한 행동이나 여정을 기록하고 분석해야죠. 우리가 제공하는 콘텐츠를 이해하려면 콘텐츠가 갖는 자체 의미를 파악하고 또 메타 데이터를 구축하고 분석해야 합니다. 이를 통해 고객이 가장 좋아할 콘텐츠를 제공해야 합니다. 사용자와 콘텐츠 분석에 필요한 AI 기술 분야에 더 많은 투자를 진행할 예정입니다. [테크수다 Techsuda]