-
애플의 시리를 통해서 본격적으로 시작된 음성 인식 서비스, 과연 무엇이 있으며 어디까지 발전할 수 있을까?Mobile topics 2012. 8. 23. 17:15반응형
최근의 모바일 시장에서 핫트랜드이자 기술적 우위를 가져갈 수 있는 핫아이템으로 손꼽는 것은 아마도 음성검색이 아닐까 싶다. 자연어를 인식해서 그것에 맞는 내용을 찾아주고, 또는 명령에 맞는 액션을 취해주는 음성검색, 혹은 개인비서 기능이 최근 스마트폰에 있어서 타사와의 핵심 차별포인트로 떠오르고 있는 것이 요즘에는 분명해 보이기 때문이다. 애플의 아이폰4S에서 본격적으로 선보인 개인비서 서비스인 Siri(시리)의 등장이 이를 촉발시켰다고는 하지만 이미 그 전부터 각 제조사들이나 플랫폼 개발사는 음성검색 기능을 준비하고 있었던 것으로 알려지고 있다. 세상에 본격적으로 알려진 것은 시리부터지만 말이다.
개인비서 서비스나 음성검색 서비스가 최근에 핫트랜드로 떠올랐다지만 기존에 없었던 것도 아니다. 과거
삼성의 애니콜(밑에 누가 LG꺼라고 하네요) 휴대폰 CF에서 김혜수가 나와서 '우리집~'이라고 말하면 자동으로 집으로 전화를 거는 그러한 기능을 지닌 휴대폰도 있었다. 물론 음성검색 기능이 아닌 음성인식 기능이며 최근에 사용하고 있는 음성인식과는 다른 약간은 저차원적인 기술이기는 하지만 이러한 시도는 과거에서부터 꾸준히 있어온 것은 분명하다. 휴대폰에 입력하는 다양한 입력방식들 중에서 터치로 입력하거나 펜으로 인력하는 것, 사진으로 찍는 것보다 말하는 것이 훨씬 쉬운 방식임은 분명하기 때문에 말이다.애플의 아이폰에서 시리를 통해서 음성인식이 세상에 본격적으로 알려진 것은 사실이지만 이보다 먼저 음성인식, 검색에 대해서 계속 플랫폼에 인식하고 노력해왔던 회사는 다름아닌 구글이다. 구글의 음성인식은 이미 안드로이드에서 먼저 선보였다. 안드로이드 2.2 프로요부터 인식하기 시작한 구글 한글키보드에는 한글 키보드 기능 외에 음성인식 및 검색 기능이 함께 포함되어 있었다. 실제로 구글은 구글 키보드를 단순히 키보드 역할을 하기 위해서 만든 것이 아닌 음성인식 및 검색 기능을 본격적으로 안드로이드에 장착하기 위한 발판으로 삼을려고 했다. 이후에 삼성이나 LG, HTC 등이 프로요를 본격적으로 지원하기 시작하면서 자체 키보드 기능에 음성인식 기능을 포함시킨다. 구글이 안드로이드 SDK에 음성검색 API를 같이 공개했기 때문이다. 이미 구글은 이런 부분에 있어서 검색이라는 쪽에서, 특히 모바일 분야에서는 음성검색이 앞으로 대세를 이룰 것임을 미리 예상하고 관련된 준비를 해온 것으로 보여지고 있다.
그렇다면 현재 모바일 시장에서 이른바 대세로 떠오르고 있는 음성인식 및 검색 기술에는 어떤 녀석들이 있는지 가볍게 살펴보도록 하자.
충실한 개인비서 서비스, 애플의 시리(Siri)
애플은 2010년 상반기에 음성검색 서비스인 시리를 인수한다. 지금의 시리 서비스는 이떄 인수한 시리를 애플이 개량한 것이다. 기존 시리 서비스는 음성을 인식해서 음식점을 찾아준다던지, 길을 찾아주는 서비스였다. 이것을 애플은 개인비서형 서비스로 개량해서 아이폰4S에 장착시킴으로 타 스마트폰과의 차별포인트로 삼아 대히트를 시킨다. iOS6에서부터는 아이폰4S 이후에 나오는 대부분의 애플 모바일 제품에서 다 지원함으로 본격적인 iOS 차별포인트로 삼으려고 하는 듯 싶다(iOS6 정식버전에서는 뉴 아이패드에서도 시리가 지원하는 것으로 알려져있다. 곧 나올 예정인 아이폰5에 기본으로 장착되는 것은 두말할나위 없는 소식이다).
시리는 내부적으로 지능형 검색엔진이라 불리는 울프람알파를 검색엔진으로 사용하는 것으로 알려져있다. 그래서 가끔은 좀 엉뚱한 대답이 나와서 많이 당황하게 만드는 경우가 있는데 어찌되었던 애플은 탈 구글 서비스를 위해 하나하나 점점 자체적인 서비스를 가져가려고 하는 듯 싶다. 아직까지는 지금까지 나온 음성인식 및 검색 기능들 중에서 타 서비스에 비해 기능적으로나 인터페이스적으로나 비교우위에 있음은 분명하다. 이번에 나온 iOS6 베타버전에 탑재된 시리는 한국어도 지원하기 때문에 국내 아이폰 사용자들이 더 기대를 하고 있는 듯 싶다.
최초의 한국형 음성검색 서비스, 베가의 스마트 보이스
최초의 한국형 음성검색 서비스라는 타이틀은 아무래도 스카이 베가 레이스2에 탑재된 스마트 보이스에게 넘어간 듯 싶다. 이미 CF를 통해서 많이 알려진 기능이기도 하다. 스마트 보이스의 경우 음성을 인식해서 그에 맞는 액션을 취하는 기능이다. 특히 스마트 보이스 기능을 잘 활용하는 것이 베가 레이서2의 카메라 기능인데 CF에서 봐서 알 수 있듯 '촬영'이라고 말하면 찍어주고 '업로드'라고 말하면 SNS에 올려준다. 물론 사전에 다 기능을 정의해야 하기는 하지만 기본으로 정의된 기능만으로도 충분히 재미나게 사용할 수 있다는 것이 장점이다.
시리와의 다른 점은 한국어 인식이 나름 뛰어다나는 점이다. 물론 iOS6에서 시리가 한국어를 지원하기 전에 먼저 나왔다는 점도 한몫하고 있기도 하다. 음성인식 기술은 블링고라는 기술을 사용하고 있으며 검색을 하는 경우에는 구글 검색을 이용하는 것으로 알려지고 있지만 한국어 인식 부분은 아무래도 자체 개발이 아닐까 싶다. 블링고는 해외 음성인식 엔진이기 때문에 커스터마이징 부분은 국내 업체들이 맡았을테니 말이다(참고로 밑에서도 설명할 삼성의 S보이스나 LG의 퀵보이스 역시 블링고 엔진을 사용하는 것으로 알려져있다). 밑에서 소개할 삼성의 S보이스보다 더 먼저 국내에 출시되어 한국어 인식 기능을 선보였기 때문에 국내 최초의 한국형 음성인식, 검색 서비스는 베가의 스마트 보이스에게 넘어간 듯 싶다.
한국에 맞는 한국형 개인비서 서비스, 삼성의 S보이스
갤럭시 S3에서 본격적으로 탑재된 것으로 알려지고 있는 삼성의 S보이스는 애플의 시리와 경쟁구도에 있는 녀석이라고 봐도 좋을 듯 싶다. 위에서 소개한 스마트 보이스의 경우 음성인식과 액션에 포커스가 맞춰져있는 듯 싶지만 S보이스의 경우 애플의 시리와 비슷한 인터페이스와 액션을 선보이기 때문이다. S보이스 역시 애플의 시리 한국어 지원 전에 선보였던지라 최초의 한국형 시리라는 말이 붙기는 했지만 스마트 보이스의 등장으로 최초라는 말은 빛바랜 듯 싶다. 하지만 인터페이스나 성능, 인식률 등은 스마트 보이스에 비해서 상대적으로 비교우위에 있는 듯 싶다.
S보이스는 액션과 검색 모두를 지원한다. 간혹 테스트를 해보면 내 발음이 워낙 개판이라서 그런지 인식을 잘 못하는 경우도 있지만(뭐 시리라고 잘 인식하는 것도 아니다 -.-) 쓰다보면 나름 재미난 경험을 할 수 있다. '사랑해'라고 말하면 '사랑해 주셔서 감사합니다'라는 반응이 나온다던지 말이다. 앞서 스마트 보이스처럼 S보이스 역시 블링고 엔진을 이용해서 음성인식을 하는 것으로 알려졌다. 물론 한국어 인식 부분이야 삼성에서 알아서 커스터마이징을 했겠지만 말이다. 검색은 내부적으로는 구글 검색과 네이버 검색을 이용하는 것으로 알려지고 있다(테스트해봤을 때 검색 OOO라고 했을 때 네이버, 구글의 검색엔진 중 선택하는 듯 보였기 때문이다). 아직까지 음성인식 부분에 있어서 명확한 화소분리 등이 잘 안되는 듯 보이지만 시간이 지나면 S보이스 역시 상당히 많이 발전하지 않을까 싶다.
우리도 뒤질 수 없다, LG의 지능형 음성인식 서비스인 큐보이스
이번에 LG의 옵티머스 뷰에 구글 안드로이드 4.0 아이스크림샌드위치(ICS)가 올라가면서 새로운 기능이 하나 추가가 되었다. 이제 옵티머스 뷰에도 베가레이서2와 갤럭시 S3처럼 음성인식 기능이 포함된 것이다. 큐보이스라는 이름의 음성인식 서비스가 본격적으로 옵티머스 뷰에서 등장했다. 아마도 앞으로 옵티머스 뷰 이후의 LG 스마트폰들은 기본으로 큐보이스가 지원되지 않겠는가 하는 생각이 든다.
큐보이스는 시기적으로는 시리, S보이스, 스마트 보이스에 이어 가장 마지막에 나온 음성인식 서비스라고 할 수 있다. 어찌보면 타사 제품들이 다 음성인식 서비스를 지원하는데 LG만 지원하지 못하면 안되니 급하게 만들어 내놓았다는 인상을 주기도 한다(안타깝게도 시기상 그렇게 비춰지는 것은 어쩔 수 없는 듯 싶다). 큐보이스 역시 블링고 엔진을 탑재했고 S보이스와 같이 음성 인식과 검색, 그리고 액션 기능이 지원된다는 것이다. 시리의 LG 버전이라고 보면 될 듯 싶다. 그런데 아직 시장에서 큐보이스에 대한 반응은 그렇게 뜨겁지는 못하다. LG에서 차별포인트로 본격적으로 밀어주고 있는 듯 하지도 않다. 큐보이스는 차기 버전부터 제대로 자기 색깔을 발휘할 수 있지 않을까 하는 개인적인 판단을 해본다.
덧붙임 1) 이 글을 쓸 당시에는 퀵보이스였으나 LG가 큐보이스로 서비스 이름을 바꿔서 큐보이스로 변경했음
덧붙임 2) 최근 뭐 언론기관에서 시리, S보이스, 큐보이스, 스마트보이스 등을 조사했는데 국내에서는 큐보이스가 가장 성능이 좋았다는 기사를 내보낸 적이 있다.
덧붙임 3) 큐보이스의 음성인식엔진이 자체 엔진이라고 밑에서 얘기하는거 같은데 아직 사실확인이 덜되어서 -.-
구글의 본격적인 음성인식 및 비서 서비스, 젤라빈에서 지원하는 구글 나우
구글은 최근 안드로이드 4.1 젤라빈을 선보이면서 시리에 대항할 수 있는 음성인식 및 검색 서비스를 내놓았는데 다름아닌 구글 나우가 그 주인공이다. 구글의 음성인식은 앞서 설명했던대로 안드로이드 2.2 프로요부터 구글 키보드를 통해서 본격적으로 지원하기 시작했으며 그동안 모은 수많은 음성 데이터를 바탕으로 적어도 인식부분에 있어서는 다른 서비스들보다 상대적 우위를 지니고 있음은 분명하다. 그렇게 축적된 데이터를 바탕으로 주변 검색 등 구글의 장점인 검색 기능을 극대화해서 나온 서비스가 구글 나우 서비스다.
구글은 구글 음성인식과 음성검색, 그리고 구글 나우를 통해서 애플의 시리에 완벽하게 대응할 수 있다고 생각하고 있는 듯 싶다. 그리고 이 서비스들의 무서움은 안드로이드의 기본 서비스로서 앞으로 나올 모든 안드로이드 스마트폰에 다 기본으로 장착된다는 점이다. 어찌보면 위에서 소개한 스마트 보이스, S보이스, 퀵보이스의 경쟁상대는 시리가 아니라 바로 구글 나우가 될 수도 있다는 얘기다. 뭐 나중에는 서로 보완하면서 시리에 대응하겠지만 말이다. 어찌되었던 이제는 구글이 플랫폼 차원에서 개인형 비서 서비스를 지원한다는 것은 참으로 주목할 만한 일이라고 보여진다.
이렇게 가볍게 최근에 나오고 있는 음성관련 서비스들을 살펴봤다. 시리로부터 시작해서 S보이스, 스마트보이스, 퀵보이스와 같은 국내 제조업체들의 음성관련 서비스들이 활성화되고 구글의 안드로이드 플랫폼에서 본격적으로 지원하기 시작하는 구글 나우와 같은 서비스가 활성화되면 본격적인 음성 인터페이스 시대가 열리지 않을까 하는 생각이 든다. 앞서 얘기했다시피 손으로 타이핑하는 것보다, 펜으로 쓰는 것보다 말로 입력하는 것이 더 쉽다는 인식이 자리잡고 있는 한 이런 서비스들의 도전은 계속되지 않을까 싶다.
이 글은 삼성SDI 블로그인 에코에너지 인사이트에 개제된 글입니다. 해당 글을 보시려면 [여기]를 참고하시면 됩니다.반응형댓글