• 검색

[스마트홈 세 화두]②'터치' 시대 가고..'음성' 시대 온다

  • 2014.10.08(수) 13:33

스마트홈 서비스 음성인식 기능 필수
완성도는 미흡..다음카카오 기술 앞서

LG유플러스는 얼마전 IPTV 리모컨에 음성인식 기능을 탑재한 '보이스 리모컨 TV'를 선보였다. '리모컨'이란 말만 외치면 리모컨에서 소리가 나 위치를 쉽게 찾을 수 있는 기능이다. 리모컨을 어디뒀는지 몰라 집안 구석구석 찾는 불편함을 해소시켰다. 이밖에도 리모컨 없이 '채널올려' '채널내려' 등 음성으로 채널이동은 물론이고 4채널 TV 실행 등 12가지의 중요한 음성 명령이 가능하다.

 

그런데 여기서 한 가지 궁금증이 생겼다. 왜 음성명령어를 12가지로 제한했을까. 정답은 음성인식률에 있다. 한국어 음성인식 기능이 아직 정상궤도에 오르지 못했기 때문이다.

 

삼성전자와 LG전자 등 제조사들은 지난달 가전전시회 IFA 2014에서 진화된 스마트홈 서비스를 선보였다. 위치인식 기능을 넣어 사용자가 집에 가까이 온 것을 자동으로 인지하고, 집에 들어오기 전 조명과 에어컨 등 가전 제품을 미리 켤 수 있도록 했다. 또 모바일 메신저를 통해서도 가전제품을 작동할 수 있다. 하지만 이들은 확장기능이다. 기본 기능은 음성인식이다. 스마트폰뿐만 아니라 웨어러블 기기에 음성명령을 내려 집안 기기들을 언제 어디서나 작동시켜야 한다. 스마트홈 서비스가 실생활에 접목되기 위해선 음성인식 기능이 필수인 셈이다.

 

▲ 삼성전자가 웨어러블 기기와 로봇청소기에 적용된 스마트홈 음성제어 기능을 시연해 보이고 있다. [사진=삼성전자]

 

◇"경상도 아줌마 발음도 잡아내라"

 

음성인식은 어떻게 보면 단순하고 보편적 기능으로 인식될 수 있다. 하지만 자연어 처리 능력을 보면 아직 완벽한 기술구현 단계에 와있지 못하다.

 

특히 집 밖에선 집 안 기기들을 컨트롤 할 경우 스마트 디바이스를 쓰는 것이 일반적이겠지만, 집 안에 있으면서 불과 수 미터 떨어진 기기들을 컨트롤 하는데 스마트 디바이스를 찾고 다시 명령버튼을 누른다면 비효율적일 수 있다. 때문에 음성인식이 필요한데, 만약 사용자가 정확한 발음 또는 단어를 구사하지 못해 음성인식이 안된다면 짜증날 수 밖에 없다.

 

예를들어 집 밖으로 나서면서 조명과 에어컨을 끄려면 '외출'과 같은 특정 단어를 말해야 하는데, 단어가 생각나지 않아 '나간다'로 말했다면 상황은 어떻게 될까. 또는 표준어를 잘 구사하지 못해 지방 사투리를 말했다면 스마트홈 서비스는 제대로 작동할까.

 

LG전자가 음성인식과 함께 모바일 메신저로 스마트홈 서비스 명령를 내리도록 구현한 것도 이와 연관성이 있다는 설명이다.

 

◇다음카카오 음성인식기술 '눈길가네'

 

지난해 8월 LG유플러스는 당시 다음커뮤니케이션과 음성인식 솔루션 제공을 위한 업무협약(MOU)을 체결했다. 이후 음성형 서비스 개발을 위한 다각적인 연구를 한 끝에 올 3월 음성인식으로 화면전환 없이 스마트폰에서 이용중인 서비스를 그대로 이용하면서 통화로 연결해주는 핸즈프리 서비스를 출시했다. 이는 또 문자나 카카오톡 메시지를 수신했을 때 음성으로 읽어주기도 한다.

 

KT도 지난해 9월 다음과 업무협약을 맺었다. 협약을 통해 다음은 모바일, 올레TV 및 스마트홈 등을 대상으로 한 음성인식 기술과 콘텐츠를 공유하게 됐고, KT는 이 같은 기술들을 활용해 관련 서비스를 고도화 할 수 있게 됐다. 여기까지는 음성인식 서비스 초기단계다.

 

LG유플러스 한 임원은 "다음카카오의 한국어 음성인식 기술이 국내에선 가장 앞선 것으로 판단된다"면서 "향후 스마트홈 서비스내 음성인식을 위한 기술개발도 진행하고 있다"고 말했다. 다음카카오의 음성인식 기술이 애플의 시리나 구글의 한국어 음성인식 기술보다 앞섰다는 평가다. 

 

음성 인식은 언어에 대한 이해와 구축된 데이터 규모에 의해 성능이 좌우된다. 따라서 대규모의 음성 및 텍스트 데이터를 축적하고, 이를 가공하는 방법이 기술의 승부를 가른다. 이런 점에서 다음카카오의 음성인식 기술은 한국어를 모국어로 사용하는 기업과 인력이 만들었기 때문에 외국 업체에 비해 상대적 우위에 있다고 평가 받는다.

 

다음카카오는 지난 2010년 6월 다음 모바일 앱을 통해 국내 포털 최초로 한국어가 지원되는 모바일 음성 검색을 출시했다. 이후 다음 지도 앱을 비롯해 다음 뮤직, 쇼핑하우 등에서 음성검색 기능을 제공하면서 노하우를 축적했다. 2012년 말에는 음성인식 전문기업 다이알로이드를 인수해 기술 노하우를 넓혔다. 다이알로이드는 문자를 말로 전송할 수 있는 음성인식 문자메시지 전송앱을 출시하는 등 한국어 음성인식에 대해 독보적 기술을 보유했던 벤처기업이다.

 

다음카카오 관계자는 "다음 검색으로 축적된 데이터를 활용해 가수 '2NE1', 'B1A4'의 이름과 같이 사전에 등록되지 않은 신조어도 '투애니원', '비원에이포'로 정확히 읽고, 'ㅋㅋㅋ'는 '크크크'로, 'You&I'와 같이 특수문자가 포함된 경우에는 '유앤아이'로 읽는 등 기술 유연성이 장점이다"고 설명했다. 그는 이어 "다음카카오 음성인식 기술의 궁극적 목표는 사람들이 별도의 학습이나 훈련 없이 평소 생각하고 사용하는 언어 그대로 자연스럽게 말하면서 다양한 정보와 도구에 접근할 수 있도록 도움을 주는 것"이라고 밝혔다. 스마트홈 서비스가 지향하는 목표인 셈이다.

naver daum
SNS 로그인
naver
facebook
google