최근 MS가 Windows 10 이벤트를 개최하면서 이런저런 재미난 이야기들을 많이 풀어냈습니다. 차세대 OS라 불리는 Windows 10의 기능들과 플랫폼들의 통합, 그리고 홀로랜즈와 같은 Windows 10 기반의 디바이스들도 함께 소개가 되었죠. MS가 데스크탑, 태블릿PC, 스마트폰, IoT 등에서 사용하는 OS를 Windows 10으로 몽땅 통합시키면서 함께 제공되는 서비스들도 서로 연계하고 머신런닝 등의 기능을 포함시키면서 보완해나가는 모습을 보여주겠다고 했는데 그 중에 하나가 MS의 개인 비서 서비스인 코타나(Cortana)입니다. Windows Phone 8.1에 이미 탑재되어 있는 서비스이기는 하지만 이번에 Windows 10이 발표되면서 더 확장이 되었죠. 코타나의 발표를 보면서 최근 다시 주목을 받기 시작한 개인비서 서비스에 대해서 생각을 해보게 되었습니다.


스마트폰의 개인비서 서비스의 본격적인 시작, 애플의 시리


스마트폰의 개인비서 서비스를 얘기한다면 가장 먼저 떠오르는 단어가 아마도 애플의 시리(Siri)일 것입니다. 아이폰과 아이패드 등 iOS를 사용하는 애플의 스마트 디바이스에 탑재되어있는 음성인식 기반 개인비서 서비스입니다. 사용자가 음성으로 명령을 내리면 그 명령을 해석해서 아이폰, 혹은 아이패드에 설치되어있는 앱들을 이용하여 검색하여 그 결과를 보여주거나 앱을 실행하는 기능을 보여주는 것이 시리입니다. 밑에 소개할 구글 나우나 MS의 코타나 역시 시리의 존재로 인해 파생된 서비스라고 보면 됩니다.


시리의 특징은 음성인식 기반 검색 및 실행 서비스라는 점입니다. 명령이 내려지면 그 명령을 해석하여 거기에 맞는 검색을 하던지 앱을 실행시키던지 하는 액션을 취합니다. 과거 검색 솔루션의 화두가 자연어 검색이었는데 글로 이뤄진 자연어 검색을 음성으로 옮기고 검색만 하는 것이 아닌 앱 실행까지 합쳐놓은 것이 시리라고 보면 됩니다. 그래서 시리를 통해서 전화번호를 찾거나 찾은 전화번호로 전화를 걸고 문자를 보낼 수도 있는 것입니다. 페이스북이나 트위터에 말로 얘기해서 글을 쓸 수도 있습니다. 메일을 타이핑하지 않고 말로 해서 전달할 수도 있지요. 그리고 미리알림 등을 등록해두면 시간에 맞춰서 시리가 미리알림의 내용을 알려주기도 합니다. 이 부분은 음성인식 기반의 검색 부분이 아닌 알림 서비스에 가깝기는 하지만 개인비서 서비스의 역활로는 딱 맞는 부분이기도 합니다. 운전 중에는 네비게이션 조작을 손이 아닌 음성으로 할 수 있게 하기도 합니다. 즉, 시리는 음성 명령을 기반으로 그 명령을 실행하는 개인비서 역할을 아이폰이나 아이패드와 같은 스마트 디바이스에서 충실히 구현한 서비스라고 보면 됩니다.


사용자의 사용 패턴을 먼저 인지하고 먼저 정보를 알려준다, 구글 나우


시리의 존재로 인해 충격받은 구글이 내놓은 서비스가 바로 구글 나우(Google Now)입니다. 구글이 구글 나우를 발표하면서 2가지 방식의 개인비서 서비스 형태를 얘기했습니다. 구글 나우 자체의 방식과 구글 음성 인식 서비스와의 결합으로 음성 명령에 따른 개인비서 서비스를 함께 제공한다고 말입니다. 구글 나우 자체 서비스의 특징은 애플의 시리가 명령을 받은 다음에 그 명령에 대한 결과를 보여주는 방식과 달리 명령을 내리기도 전에 그 사용자가 어떻게 할 것이라는 것을 미리 파악한 다음에 예상되는 결과를 카드 형식으로 보여준다는 점입니다. 안드로이드나 iOS에 구글 나우를 설치해서 사용하다보면 내가 자주가는 음식점이나 회사, 집까지의 가는 방법(버스 노선도나 시간 등)을 알려준다던지 해외로 여행을 한다고 공항에 가는 도중에 보면 환율 정보가 보인다던지 하는 것들을 볼 수 있는데 이는 구글이 검색 패턴 및 위치 정보, 구글 서비스 사용 패턴과 동시에 안드로이드 앱 사용 패턴 등을 분석하여 미리 보여주는 방식이라고 생각하면 됩니다.


또 하나의 구글 나우를 이용한 개인비서 서비스가 구글 음성 인식 서비스와의 결합으로 인한 애플의 시리와 같은 음성 명령 기반의 개인비서 서비스입니다. 구글 음성 인식 기능을 통해서 명령을 받으면 그 결과를 구글 나우의 형태로 보여주는 것입니다. 검색 뿐만이 아니라 앱 실행, 전화번호 찾고 걸고 보내기 등의 애플 시리가 제공하는 기능들을 대부분 다 구현했다는 것이 특징입니다. 애플 시리와의 차이점은 농담에 대해서 애플 시리는 유연하게 잘 대처를 하는데 구글 나우는 그것을 검색할려고 한다는 점이 좀 다를 뿐입니다(그래서 인간미 없는 구글 나우라는 얘기를 종종 듣기고 합니다).


애플의 시리와 구글 나우의 차이점은 애플의 시리는 음성 명령을 기반으로 액션을 취하는 방식인데 비해 구글 나우는 사용자의 검색 패턴, 사용 패턴 등을 분석하여 미리 정보를 제공하는 방식으로 시리는 개인비서 역할에 충실하다면 구글 나우는 개인 컨설턴트 역할까지 함께 겸하고 있다고 보면 편할 수 있을 듯 합니다. 물론 시리 역시 미리알림 등에 등록되어있는 내용을 알려주기도 하지만 그것은 사용자가 미리 등록한 정보를 시간에 맞춰서 알려주는 기능으로 구글 나우가 보여주는 위치 정보 기반, 검색 및 사용 패턴 정보 기반의 정보 제공과는 조금 방향이 다르다고 할 수 있을 듯 합니다. 물론 아직까지 구글 음성 인식 기능과 구글 나우를 합해서 보여주는 개인비서 서비스의 퀄리티는 애플의 시리가 상대적으로 앞서있는 것으로 평가받고 있기는 합니다만 구글이 이번에 구글 나우에 구글 서비스 이외에 서드파티 서비스까지 함께 참여할 수 있도록 개방하겠다고 발표함으로 인해 구글 나우가 제공하는 서비스의 폭이 훨씬 넓어질 것으로 보여 어느 쪽이 더 유용한 개인비서 서비스가 될 것인지는 좀 더 지켜봐야 할 듯 싶습니다.


애플의 시리와 비슷하면서도 구글 나우의 장점을 가져온 MS의 개인비서 서비스, 코타나


여기에 MS가 끼어들었습니다. Windows Phone 8.1부터 탑재를 시작한 MS의 개인비서 서비스인 코타나(Cortana)가 그 주인공입니다. 처음 코타나가 발표 되었을 때에는 많은 사람들이 MS의 모바일 시장에서의 위치, Windows Phone의 위상 등을 생각하여 그렇게 많은 주목을 받지 못했습니다. 실제로 Windows Phone 8.1에 탑재된 이후에도 그닥 이슈를 가져오지 못했던 것이 사실입니다. 그런데 이번에 Windows 10이 발표되면서 코타나 적용이 확산되었습니다. 기존 모바일에만 적용되었던 코타나가 데스크탑까지 그 영역을 확장한 것입니다. 이는 구글이 구글 나우를 데스크탑용 크롬 웹브라우저까지 확대시킨 것에 대한 대응방안이라고 보여집니다. 아직 애플은 시리를 Mac OS X까지 확장시키지는 못했습니다(만 아마도 곧 확장시킬 것으로 보입니다).


MS의 코타나는 기본적으로 애플의 시리와 같은 컨셉입니다. 음성 명령을 받으면 그 명령을 해석하고 그 명령을 실행하는 방식으로 되어 있습니다. 물론 시리처럼 농담을 건네도 능숙하게 잘 받아서 대응(?)을 해줍니다. 코타나의 서비스적인 성격은 구글 나우보다는 애플의 시리와 비슷, 혹은 거의 동일하다고 보면 될 듯 싶습니다. 일단 애플의 시리가 검색할 때 사파리에서 제공하는 기본 검색엔진을 통해서 검색하는 것과 달리 코타나의 경우 MS의 검색엔진인 빙(Bing)을 통해서 검색을 진행합니다. 그리고 음성을 인식하고 해석하는 능력에 있어서는 나오는 자료에 따라서 평가가 다르기는 하지만 전체적으로는 코타나가 시리보다는 상대적으로 앞서있다고 합니다. 같은 명령을 내렸을 떄 코타나가 좀 더 자연스럽게 반응한다고 많은 언론들이 리뷰를 통해서 공개하고 있기 때문입니다. 이는 해석 엔진의 차이일 수도 있는데 MS는 자사의 클라우드 엔진인 에저를 통해서 수많은 음성 인식 데이터들을 보유하고 그것들을 분석하면서 좀 더 자연스럽게 해석하는 머신런닝 기능을 오래전부터 수행하고 있었고 그 결과가 코타나에 적용되어 차이를 보이고 있다고 보면 될 듯 싶습니다. 물론 애플 역시 자사의 방대한 음성인식 데이터베이스를 이용하겠지만 대용량 데이터의 처리 부분에 있어서 애플보다는 MS가 이 분야는 기술적으로 상대적 우위를 점할 수 있는 부분이기 때문에 차이가 있다고 보여집니다. 물론 구글도 이 분야에 있어서는 막강한 능력을 보유하고 있지만 컨셉을 좀 달리 가져가고 있어서 비교하기가 애매한 것이 사실입니다.


이번에 코타나가 Windows 10의 데스크탑 버전으로 들어가면서 검색의 범위가 확장되었습니다. 데스크탑 버전으로 확장한 이유는 간단합니다. 윈도 태블릿PC에 들어가는 Windows 버전이 Windows 10 데스크탑 버전이기 때문입니다. Windows 8부터 태블릿PC 시장에서 윈도 태블릿PC가 강세를 보이고 있는데 그 시장의 확장으로 Windows 10까지 생각한다면 당연한 수순이라고 생각이 듭니다. 앞서 구글이 구글 나우를 크롭 데스크탑 버전까지 확장시킨 것에 대한 대응방안이자 태블릿PC에 들어갈 Windows 10의 전체 검색을 다 담당하게 될 입장에서의 코타나로 기능 및 영역을 확대한 것입니다. 애플의 시리와 같은 컨셉이지만 구글 나우가 가고자 하는 길까지 함께 아우르려는 코타나의 행보는 앞으로 애플과 구글을 자극할 좋은 소재가 될 것으로 보입니다.


재미난 것은 이런 음성 인식 기반 개인비서 서비스는 국내에서 아주 오래전에 있었습니다. SK 하이닉스의 전신이라 불리는 현대전자에서 만든 걸리버에서 음성인식을 지원했습니다. 김혜수가 광고모델로 나와서 자동차 안에서 '우리집'이라고 얘기하면 집으로 전화를 걸어주는 기능을 보여줬었는데 지금의 기술로 보면 아주 초보적이고 웃길 수 있는 수준이지만 그 당시만 하더라도 획기적인 기술이었습니다. 그 기술을 지금까지 잘 발전시켰다면 위에서 얘기한 애플의 시리, 구글 나우, MS의 코타나 못잖은 국내의 음성인식 기반 개인비서 서비스가 나올 수 있지 않았을까 하는 생각도 잠시 해봤습니다.


이 글은 LG CNS 블로그에 기고했던 글의 원본입니다. 기고한 글은 [여기]에서 보실 수 있습니다.

블로그 이미지

스마트 학주니

학주니의 시선으로 본 IT 이슈와 사회 전반적인 이슈에 대한 블로그

댓글을 달아 주세요