"저장! 7월 28일 예천곤충축제" "알람이 저장되었습니다"
'사랑해'라고 말하자 스마트폰은 '사랑한다는 말은 그리 간단히 뱉을 수 있는 말이 아니랍니다'라는 차가운 대답이 돌아온다. 또 다른 스마트폰은 '에이 부끄럽게. 저도 사, 사, 사랑합니다'라는 귀여운 멘트를 한다. 스마트폰의 음성인식 서비스가 내놓은 답변들이다.
지난해 애플이 아이폰4S를 발표하면서 지능형 음성인식 서비스인 '시리'(Siri)를 선보인 이후 음성인식 기능에 대한 관심이 뜨겁다. 삼성전자, LG전자 등 국내 제조사들도 줄지어 음성인식 기능을 탑재한 스마트폰을 출시하고 있다. 최근에는 음성검색 비중이 늘면서 포털들도 음성인식 기술 개발에 힘쓰고 있다.
◆말하는 대로 실행하고, 애교 섞인 대답도
지능형 스마트폰 음성인식 서비스는 사용자의 말을 인식해 명령을 실행하거나 간단한 대화를 할 수 있는 기능이다. 음성인식은 운전을 하는 등 손을 쓰기 어려운 상황이나 지체 장애인 등이 스마트폰을 이용하기 쉽도록 돕는다.
사람의 말을 텍스트로 변환해 컴퓨터가 인식할 수 있는 질문으로 바꾼다. 이 질문은 기능 수행, 검색, 대화 등의 기능을 제공한다.
질문이 기능 실행에 관한 것이라는 해당 기능을 수행한다. "알람, 오전 7시, 저장"이라고 말하면 다음 날 오전 7시에 알람이 울리게 설정된다. "카메라 실행"을 외치면 카메라가 켜지고 "촬영"이라는 말에 사진이 촬영되는 등 음성으로 대부분의 스마트폰 기능을 실행할 수 있다.
간단한 대화의 경우 자체 데이터베이스(DB)를 통해 답한다. '사랑해, 안녕하세요, 너는 누구니' 등 기본적인 질문에 대한 답이 스마트폰 자체에 내장돼있어 질문을 분석한 뒤 저장된 답을 내놓는다. 음석인식 서비스에 따라 DB가 다르기 때문에 나오는 답변이 다르고 DB가 적은 경우 '질문을 알아들을 수 없다' 혹은 '죄송합니다'라고 응답하는 스마트폰도 있다. DB에 내장된 질문이 아니면 검색을 권유하거나 검색된 결과를 보여주기도 한다.
◆최신 스마트폰에 음성인식은 필수
최근 삼성전자의 스마트폰 신제품 '갤럭시 S3'는 'S보이스' 기능을 갖추고 출시됐다.
삼성전자의 S보이스는 스페인어(스페인/라틴아메리카)와 이탈리어, 한국어 등 8개 국가의 언어를 지원한다. 특히 단순한 음성인식부터 길 찾기, 페이스북 연동과 스마트폰 제어 등에 음성인식의 원조격인 시리와 비견될 정도로 뛰어나다는 평가다.
음악이나 벨소리 등 소리가 나는 중에도 사용자의 음성을 인식해 통화, 알람, 뮤직플레이어 등 스마트폰의 기능을 제어할 수 있다.
LG전자도 지난달부터 옵티머스 뷰의 밸류팩 업그레이드를 통해 '퀵보이스'를 제공하고 있다. 업계 최초로 독자적인 자연어 처리, 지식 검색 솔루션을 활용한 한국어 음성인식 서비스 등이 최고 수준이라는 것이 회사 측 설명이다.
퀵 보이스는 음성을 통해 음력 날짜를 확인하는 등 한국시장 맞춤형 서비스도 제공한다. "2012년 7월 17일은 음력 며칠이지?"라고 물으면 "2012년 5월 28일입니다"라고 알려준다.
지난해 10월 아이폰 4S를 공개하면서 내놓은 시리(siri)는 자연스러운 대화 방식을 적용해 이용자들 사이에 화제가 됐다. 당시 영어'프랑스'독일어 등 만을 지원하다가 지난달에는 iOS6를 통해 지원 언어를 한국어를 포함해 15개 국어로 늘렸다.
◆포털업체도 음성인식 기술 개발
모바일 검색 비중이 늘면서 포털업체들도 음성인식을 이용한 검색 기술에 신경을 쏟고 있다. 2008년 구글이 영어 음성 검색서비스를 시작한 이후 2010년 네이버와 다음도 음성 검색을 선보였다. 포털업체들의 음성인식 기술은 대화형인 제조업체들의 기술과는 달리 주로 검색기능에 집중돼 있다.
구글은 지난 최신 안드로이드 운영체제(OS) '젤리빈'에 지능형 음성인식 기능을 선보였다. 젤리빈의 음성 검색은 5억 건 이상의 인물'지역'사물 정보와 이들 사이의 관련성을 이용한 총 35억 건의 데이터를 활용한다. '대한민국 대통령 이름은'이라는 자연어로 질문하면 바로 답을 알려주는 정답형 검색방식을 채택했다. 하지만 한국어 지원은 하고 있지 않아 국내에서 이용하기까지는 시간이 걸릴 전망이다.
네이버를 운영하는 NHN도 구글 젤리빈과 같은 정답형 음성 검색 서비스를 준비 중이다. NHN은 컴퓨터가 대화형 질문 형태를 정확히 파악하는 인식률을 높이는 기술에 집중하고 있다.
다음커뮤니케이션도 소음 처리와 문장형 질문 인식에 대한 인식률을 높이는 등 모바일 음성 검색 기능을 업그레이드하고 있다.
SK커뮤니케이션즈는 삼성전자 스마트TV에 제공하는 싸이월드 사진첩 서비스에 음성 인식 기능을 적용했다. 2012년형 삼성 스마트TV에 탑재된 음성 인식 기능을 통해 사용자가 음성명령으로 싸이월드 사진첩을 이용할 수 있다.
김봄이기자 bom@msnet.co.kr
댓글 많은 뉴스
이재명 90% 득표율에 "완전히 이재명당 전락" 국힘 맹비난
권영세 "이재명 압도적 득표율, 독재국가 선거 떠올라"
이재명 "TK 2차전지·바이오 육성…신공항·울릉공항 조속 추진"
대법원, 이재명 '선거법 위반' 사건 전원합의체 회부…노태악 회피신청
국정원, 中 업체 매일신문 등 국내 언론사 도용 가짜 사이트 포착