구글 알파고는 IBM 왓슨과 무엇이 다른걸까
< 도안구 테크수다 기자 eyeball@techsuda.com> 알파고(AlphaGo)라는 컴퓨터 프로그램(알고리즘)이 세계 최강 바둑 기사 중 한 명인 이세돌 9단에게 도전장을 던졌습니다. 오는 3월에 5번의 대국이 치뤄집니다. 이번 대국은 단순히 컴퓨터와 인간의 대결을 넘어 인류 역사에 무척 중요한 사건으로 기록될 것으로 보입니다. 인공지능을 향한 큰 사건으로 말입니다.
알파고는 구글이 2014년 1월 인수한 딥마인드(DeepMind)라는 회사에서 만들고 있는 컴퓨터 프로그램입니다. 인공지능(AI)를 향한 인류의 거대한 항해 중에 나온 하나의 알고리즘으로 이해하면 좀 쉬울 거 같습니다. 머신러닝(Machine Learning)과 딥러닝(Deep Learning) 등 최근 몇년 간 자주 들었던 내용들을 대표하는 하나의 기대작입니다.
이와 관련한 기술적인 배경들은 정말 복잡합니다. 관련 해서는 구글코리아에서 공개한 자료를 보시면 조금은 이해가 빠를 거라고 봅니다. 또 지디넷코리아 김익현 기자가 쓴 기사를 참고하시면 될 거 같습니다. 또 더기어(Thegear) 정보라 기자가 쓴 글도 재밌습니다.
- 딥마인드와 알파고에 대해 자주 묻는 질문들
- 구글 알파고는 어떻게 바둑경기 이겼나 (Zdnet 김익현 기자)
- 이세돌 9단과 싸울 구글 AI '알파고', 이렇게 준비했다 (더기어 정보라 기자)
이번 글은 기자간담회에서 나온 이야기 중 딥마인드에서 만들고 있는 '알파고'가 인공지능을 선도하고 있다고 이야기되고 있는 IBM의 '왓슨'과 어떻게 다른지에 대한 이야기입니다. 물론 이 글은 딥마인드 CEO의 일방적인 주장일 수 있습니다. 이걸 감안해서 읽어주셨으면 합니다. 옳고 그름이 아니라 어떻게 '다른가' 말입니다.
영국 런던에 거주하는 데미스 하사비스(Demis Hassabis) 구글 딥마인드(DeepMind) 공동 창업자 겸 CEO(왼쪽), 데이비드 실버(David Silver) 구글 딥마인드(DeepMind) 리서치 사이언티스트 - 강화 학습 연구 총괄(오른쪽)이 행아웃을 통해 기자들에게 설명했습니다.
데미스 하사비스 딥마인드 CEO는 '알파고는 범용 알고리즘'임을 수차례 강조했습니다. 어떤 용도로 특별히 만들어진 게 아니라는 것이죠. 이를 강조하기 위해 그는 IBM의 딥 블루와 왓슨(Watson) 이야기를 했습니다.
1996년 IBM은 처음으로 체스 게임에서 사람에게 한 판을 이겼습니다. 이 때 만들어진 컴퓨터의 이름이 딥 블루(Deep Blue)였습니다. 그 후 1997년 진화된 딥 블루(별명은 Deeper Blue)가 세계 체스 챔피언 그랜드마스터 가리 카스파로프를 시간 제한이 있는 정식 대국에서 최초로 이겼습니다.
그 후 IBM은 100주년 기념으로 퀴즈 쇼 제퍼디!에서 인간대 컴퓨터 대결을 펼칩니다. 2011년 2월 14일부터 16일까지 세 개의 제퍼디! 에피소드의 방송에서 왓슨은 제퍼디!의 금액 기준 사상 최대 우승자 브레드 러터, 가장 긴 챔피언십(74번 연속 승리)의 기록 보유자 켄 제닝스와 대결했습니다. 여기서 100만 달러를 거머쥐며 우승을 한 것이죠. 퀴즈 문제를 알아듣고 문제를 풀었다고 해서 더욱 주목을 받았습니다.
- 딥 블루(Deep Blue) : 위키피디아
- 왓슨(Watson) : 위키피디아
데미스 하사비스 딥마인드 CEO는 "딥 블루의 경우 중요한 룰들을 미리 집어 넣습니다. 체스 거장들의 모든 정보들을 사전에 입력해 놓습니다. 왓슨의 경우 특별한 사례를 미리 데이터베이스화 해 놓습니다. 질문이 나오면 주제에 한해서 검색해서 찾을 수 있습니다"라고 말합니다.
왓슨은 4테라바이트(TB)에 2억 건의 페이지의 구조화/비구조화된 콘텐츠를 입력해 놨습니다.
그에 비해 자신들의 알파고는 특정 관련 정보를 입력해 놓고 검색하는 방식이 아니라 일반적인 알고리즘을 만들어 놓고 특정 경우를 학습시켜서 그걸 알 수 있도록 한다고 차이점을 말했습니다. 그는 무작위 대입을 해놓고 탐색 트리를 활용해서 검색하면서 경우의 수를 찾는 것이라고 설명했습니다.
바둑에서는 다음 번에 어디에 돌을 놓을 지 위치를 선택하는 '정책망'과 수를 두었을 때 승자를 예측하는 '가치망'이 적용되었습니다. 이걸 구글은 심층 신경망(deep neural network)이라고 합니다. 여기에 고급 트리 탐색(Monte Carlo tree search)과 연계해 대국에 입하고 있다는 것이죠.
IBM은 특별한 경우에 필요한 특별한 장비나 알고리즘을 별도로 다 만들어야 하지만 자신들의 알파고는 바둑만을 위해 만들어진 게 아니라는 설명입니다.
구글은 알파고를 만들면서 지난 2015년 11월 공개한 텐서플로우(TensorFlow)를 활용했다고 밝혔습니다. 텐서플로우는 구글이 만들던 심층 학습 시스템입니다. 머신러닝을 위한 소프트웨어 라이브로리로 오픈소스로 공개했습니다.
당시 순다 피차이 구글 최고경영자(CEO)는 텐서플로우를 오픈소스로 공개하면서 "1세대 시스템보다 5배까지 신경망을 빨리 구축할 수 있게 해준다"고 말했습니다.
이걸 기술을 통해 구글은 알파고라는 범용의 알고리즘을 다양한 분야에 대응할 수 있도록 가르치고 있습니다.
그 예를 든 것이 유럽 여행입니다. 가령 여행자가 스마트폰을 활용해 여행을 위한 숙박 일정을 예약할 때 숙박과 항공편을 최적화해 제공해야 합니다. 또 알고리즘은 그 여행자의 선호도를 파악해야 합니다. 휴가를 갈 때 무엇을 좋아하는 지도 알아야 합니다. 박물관, 콘서트, 맛집 등 여행자의 패턴을 인식하는 것이죠.
또 단순히 숙박과 항공편 이외에도 일정 자체가 아주 알차도록 지원해야 합니다.
알파고는 이런 여행 서비스를 넘어서 의료 분야에도 적용 가능합니다. CT스캔과 영상 정보를 처리해서 어떤 것인지 미리 발견을 합니다. 그리고 가장 적절한 진단 계획도 수립합니다.
이런 접근법은 단순히 구글만 진행하는 건 아닙니다. 페이스북도 하고 있고, 마이크로소프트 또한 이 방식으로 진행중입니다. 이 회사들은 모두 강력한 클라우드 컴퓨팅 파워와 빅데이터 플랫폼을 가지고 있습니다. 이 위에 텐서플로우와 알파고 같은 알고리즘을 얹어놓고 꾸준히 그 성능을 개선해 나가면서 모든 사회적인 문제에 대응토록 하고 있습니다.
어쩌면 구글이나 IBM은 타깃이나 태생 자체가 달라 접근법 자체도 다른 게 아닐까라는 생각이 들었습니다. 기업간 거래(B2B: Business to Business)를 주 사업으로 하는 IBM의 경우 고객들의 데이터를 특정 하드웨어와 소프트웨어에 최적화시켜서 해결하도록 하는 반면 (물론 그들도 소프트레이어 인수 후 클라우드에 관련 기능들을 제공하고 있기는 합니다) B2C(Business to Customer) 겨냥했던 구글이나 페이스북, 마이크로소프트 등은 특화된 개별 알고리즘보다는 막대한 데이터를 활용해 좀더 범용적이지만 강력한 알고리즘을 원하는 게 아닐가 싶습니다.
IBM은 이런 주장에 대해 어떤 반론을 펼칠지 조만간 가서 설명을 들어봐야겠습니다. 만나 준다면 말입니다. <테크수다>