말만 하면 다 되는 세상! AI 스피커의 진화

“한국의 인공지능(AI) 기업들은 다른 나라와 달리 ‘유스케이스(Use case, 사용사례)’가 많습니다.”
 
글로벌 리서치 회사 ‘캐널리스(Canalys)’에서 AI 스피커 시장을 담당하는 제이슨 로(Jason Low)는 한국의 AI 기업들에 대해 이렇게 말했습니다. ‘사용 사례가 많다’는 말은 AI 음성인식 기술 적용을 스피커에 한정 짓지 않고, 스마트폰 애플리케이션, IPTV 셋톱박스, 스마트 워치 등의 디바이스뿐만 아니라 편의점, 호텔 등 다방면으로 확장하고 있음을 의미합니다. 바꿔 말하면 한국 기업들은 어느 나라보다 AI 음성인식 기술을 생활 저변에 빠르게 확대하려고 노력한다는 뜻이기도 합니다.
 
 
IoT(사물인터넷)로 연결된 가정집 실내 모습
 
 
 

멀티태스킹 단말기의 시작, AI 스피커

 
‘TV나 책을 보면서 음성으로 가전제품을 제어하고, 스케줄을 확인하고, 생필품을 주문할 순 없을까?’
현대인들의 바쁜 일상을 채워줄 멀티태스킹에 대한 수요는 날이 갈수록 증가하고 있습니다. 동시에 정보통신기술(ICT) 기업들은 이용자들이 더 많은 데이터를 사용할 수 있도록 독려해야 하고, 포화 상태인 스마트폰 시장 외에 또 다른 단말기를 찾아야 하는 니즈가 있습니다. 이 수요와 공급의 접점에서 멀티태스킹이 가능한 단말기의 시장성은 태동하게 된 것으로 보입니다.
 
그렇다면 어떤 단말기가 가장 효과적일까? 핵심은 우리 주변에서 늘 ‘온(ON)’ 상태를 유지하고 있는 기기여야만 했습니다. 가장 손쉽게 떠올릴 수 있는 것이 바로 스마트폰일 겁니다. 사실 애플(Apple)의 시리와 같은 음성인식 기능을 이용할 수도 있었죠. 하지만 스마트폰 환경에서는 손가락에 비해서 음성이 효율적이지 못한 것이 사실입니다. 다음으로 TV, PC, 냉장고 등도 우리 곁을 지키고 있는 든든한 단말기였지만 덩치가 크고 무엇보다 ‘가격’ 측면에서 진입장벽이 컸습니다. 이 같은 고민이 버무려져 등장하게 된 AI 단말기가 바로 스피커 형태였습니다.
 
 
 

최초의 AI 스피커와 한국의 유스케이스

 
세계에서 처음 등장한 AI 스피커는 2014년 11월 모습을 드러낸 아마존의 ‘에코’였습니다. AI 스피커 하면 가장 먼저 떠오르는 원통형의 스피커 형태는 아마존이 가장 먼저 세상에 내놓은 모습이죠. 지금은 AI 스피커를 통해 다양한 서비스들을 많이 이용할 수 있게 됐지만, 당시만 해도 음성을 통한 음악 재생과 날씨 정보 확인, 알람 기능 등 기본적인 정보들을 제공했습니다.
 
 
아마존 AI스피커 에코의 하단
 
 
아마존 이후 다양한 업체들이 AI 스피커를 쏟아냈는데요. 아마존에 이어 구글(27.6%), 알리바바 (7%), 애플(5.9%) 등이 추격하고 있는 모양새이며, 최근에는 페이스북과 삼성전자까지 나서서 안방을 차지하기 위한 ‘AI 스피커 전쟁’에 나서고 있습니다. 이에 따라 AI 스피커 시장도 2018년 67억 달러에서 2023년 235억 달러 규모로 확장될 것으로 전망되는데요. 그야말로 ‘AI 스피커 전국시대’가 열리는 셈입니다.
 
국내의 경우 2016년 9월 SK텔레콤을 시작으로 가장 먼저 셋톱박스에 음성인식 기능을 넣은 KT의 ‘기가지니’, 국내와 일본에 함께 선보인 네이버의 ‘웨이브’, 캐릭터 디자인을 반영한 카카오의 ‘카카오미니’, 한글과 영어를 동시에 알아들을 수 있는 구글의 ‘구글 홈’ 등의 AI 스피커를 선보이기 시작했습니다. 출시된 지 불과 2년여 짧은 시간 내에 AI 개발업체 간 경쟁을 통해 상당한 유스케이스들을 만들어낸 셈인데요. 이는 AI 스피커를 앞서 출시한 미국과 비교했을 때도 유의미한 성과여서 주목됩니다.
 
 
 

편의점, 호텔로 들어간 AI 스피커

 
 
SK텔레콤에서 선보인 ‘누구 캔들’(왼쪽)과 ‘누구 미니’(오른쪽)

SK텔레콤에서 선보인 ‘누구 캔들’(왼쪽)과 ‘누구 미니’(오른쪽)

 
 
AI 스피커는 계속 진화했습니다. 처음 선보였던 원통형 스피커에서 절반 이상 크기가 줄어들고 이동성을 높인 ‘미니’ 시리즈(누구 미니, 기가지니 버디 등)의 등장에 이어, 유명 지식재산권(IP)을 디자인한 스피커(네이버 클로바 도라에몽, 미니언즈 에디션), 조명 기능이 추가된 스피커(누구 캔들)까지 나온 것이죠.
 
국내 ICT 기업들은 이제 AI 음성기술을 스피커뿐만 아니라 다양한 디바이스로 확장하고 있습니다. 일례로 SK텔레콤의 AI 운전비서 ‘T맵×누구’(2017년 9월), AI 셋톱박스 ‘B tv×누구’(2018년 1월) 등이 대표적입니다. 덕분에 운전 중 음성만으로 전화나 문자 주고받기가 가능해진 세상이 됐죠.
 
기업 대 기업(B2B) 간 비즈니스 차원에서도 음성인식 기술이 접목되고 있습니다. 지난 7월 구글은 현대·기아자동차, 카카오모빌리티와 손잡고 스마트폰과 자동차를 유선 연결해 음성으로 내비게이션, 음악 재생, 문자전송 등의 기능을 할 수 있는 ‘안드로이드 오토’ 서비스를 론칭했습니다. 11월에는 카카오가 스마트홈 플랫폼 ‘카카오홈’을 선보이면서 카카오톡, 카카오미니, 카카오내비 등 다양한 플랫폼에서 메시지, 음성 등으로 집안의 가전을 제어할 수 있는 서비스를 출시하기도 했습니다.
 
SK텔레콤은 올해 하반기(7~12월)부터 AI 스피커를 편의점 CU 계산대에 배치해 근무자가 편의점 운영 과정에서 궁금한 사안이 발생하면 음성으로 문의할 수 있도록 했습니다. 얼마 뒤에는 워커힐 서울 호텔, 파라다이스호텔 부산 객실에 AI 스피커를 두고 이용자들에게 컨시어지 서비스를 제공하고 있기도 합니다. 이 같은 ICT 기업들의 시도들 덕분에 AI 음성인식의 저변이 빠르게 확대되고 있는 분위기입니다.
 
 
 

오픈 플랫폼 전환으로 AI 외연 확장

 
한 걸음 더 나아가 오픈 플랫폼으로의 전환을 시도하는 사례도 늘고 있습니다. AI 음성인식 기술을 하드웨어에 바로 접목하는 것이 아니라, 하드웨어를 개발하고자 하는 업체가 직접 접목할 수 있게 한다는 뜻입니다.
 
네이버는 앞서 지난해 12월부터 외부 개발사 등을 대상으로 ‘클로바 익스텐션 키트(CEK)’를 제공해 클로바 인공지능 생태계에서 서비스를 만들어나갈 수 있는 길을 열어주었습니다. 2018년 9월 현재 LG전자, 샤오미 등 파트너사의 57개의 서비스가 CEK를 통해 클로바 이용자들을 대상으로 서비스되는 중이라고 합니다.
 
 
‘누구 디벨로퍼스’의 기술 및 활용법 등을 선보인 ‘누구 컨퍼런스 2018’ 현장

‘누구 디벨로퍼스’의 기술 및 활용법 등을 선보인 ‘누구 컨퍼런스 2018’ 현장 (출처: SKT Insight 제공)

 
 
SK텔레콤은 10월부터 ‘누구 디밸로퍼스(NUGU developers)’를 공개했는데요. 기업, 개인 개발자 등 누구나 AI 누구 서비스를 간편하게 개발할 수 있는 웹 사이트를 연 것입니다. 가장 큰 장점은 개발 툴이 그래픽 유저 인터페이스(GUI) 환경으로 되어 있다는 점입니다. 마우스와 키보드 조작만으로 서비스를 제작할 수 있다는 뜻이죠. 일례로 편의점 CU, 워커힐호텔 비스타 등과 협력을 통해 맞춤형 AI 서비스를 개발한 사례가 있습니다. 개발자들은 누구 디벨로퍼스에 가입한 뒤 개발 가능하며, 유해 서비스, 금칙어 포함 여부, 발화 테스트 등 심사를 거쳐 ‘누구’ 인프라에서 이용할 수 있게 될 예정입니다.
 
현재는 영어학습 서비스 ‘윤선생’, ‘파라다이스호텔 부산’, ‘한솔교육’ 등 약 40여 개 업체가 서비스를 개발하고 있습니다. 지금까지는 AI 음성인식 원천 기술을 개발한 기업들을 중심으로 AI 시장이 확대되었다면 이제는 ‘써드 파티(3rd Party)’의 참여로 더 다양한 디바이스에서 많은 서비스를 누리게 되는 셈입니다. 얼마 전에는 누구 디밸로퍼스를 알리기 위한 ‘누구 컨퍼런스’를 개최하기도 했습니다.
 
 
 

AI 음성인식 기술의 전망

 
 
AI스피커에 가상의 통신망이 연결된 모습을 표현한 사진
 
 
음성인식 기술은 비록 AI 스피커로 시작했지만, AI 기술 개발 기업들의 오픈 플랫폼 전략을 통해 다양한 제조, 서비스 업체들이 합세하면서 우리가 마주하는 모든 기기에서 음성을 인식하는 시대가 오게 될 것입니다. 이 같은 흐름 속에서 기업의 성패는 얼마나 빠르게 자신의 AI 음성인식 플랫폼을 많은 제품들에 접목시키고 다양한 서비스를 붙일 것인가에 달려있을 겁니다.
 
이른 시일 내에 아마존과 마이크로소프트(MS)의 사례에서도 보듯, 서로의 플랫폼에서 서로를 호출할 수 있는 AI 플랫폼 간 합종연횡도 활발하게 이뤄질 것으로 예측됩니다. 아마존 고객은 에코를 향해 ‘알렉사(아마존의 AI 호출 명령어), 코타나(MS의 AI 호출 명령어) 불러줘’라고, MS 고객은 ‘코타나, 알렉사 불러줘’라고 할 수 있게 됐다는 뜻인데요. 머지않아 SK텔레콤에서 네이버를, 네이버에서 카카오를 부를 수 있게 될지도 모른다는 이야기입니다. 어찌 됐든 음성인식 서비스는 이미 우리 삶의 일부가 되었고 피할 수 없는 대세가 되었습니다. 앞으로 나올 AI 음성인식 서비스들은 어떤 모습일지 기대가 됩니다.
 
 
 
 

 
 
 
 

페이스북 트위터 카카오스토리 더보기
밴드 url 더보기