Article at a Glance목소리를 분석하고 이를 통해 사람을 파악하는 음성기술 시장은 점점 커지고 있다. 미국 IT 전문 매체에 따르면 2029년에는 이 시장이 150억 달러에 이를 것이다. 현재 한국에서 음성 인식 스피커를 쓰는 사람들은 한정된 기능과 성능에 실망을 많이 했지만 미국에서는 훨씬 발전한 상태로 많은 이가 일상에서 스피커를 활용 중이다. 최근 구글에서 출시한 스마트폰 픽셀4와 페이스북이 발표한 인공지능 비서 ‘자비스’는 머지않은 미래에 진짜 영화 ‘아이언맨’에 나오는 인간보다 뛰어난 인공지능 비서와 함께 살게 될지도 모른다는 생각을 하게 만든다.
얼마 전 외할머니가 돌아가셨다. 인간과 컴퓨터의 상호작용(HCI)을 공부하는 손녀딸을 뒀지만 1934년생인 내 외할머니는 기계를 잘 다루지 못했다. 특히 휴대전화를 잘 못 써서 전화를 받지 못하는 일이 비일비재했다. 그래서 필자는 이번 가을에 스마트 스피커를 가져다 드리기로 결심을 했었다. 시니어 유저(사용자)의 특성을 고려해 다음과 같은 조건을 중심으로 상품을 탐색했다.
(1) 한국말을 잘 알아듣고, 잘 응답할 것(사투리도 알아들을 것)
(2) 가장 기본적인 기능(전화 연결, 음악 재생 정도) 에 충실할 것
(3) 유저의 목소리가 작아도 알아들을 것. 그러나 느닷없이 켜지는 일은 없어야 함
(4) 아마존 ‘에코닷’처럼 두세 개쯤 구입하면 거실, 방, 화장실에서 연동될 수 있을 것
시니어 음성 인식 기술을 연구하는 동료들 덕분에 완벽하지는 않지만 비교적 적합한 상품 한 개를 찾아냈고, 결제를 하려던 차에 외할머니가 세상을 떠나셨다는 소식을 들었다. 나는 조건의 맨 마지막에 다음을 추가하게 됐다.
(5) 기계가 못 알아들어도 좋다. 유언이든 얕은 숨소리든, 그의 마지막 언어 내지 신호를 남겨줄 것.
사람들은 기술을 잘 안다. 매일매일 뉴스도 쏟아진다. 하지만 생각보다 기술을 생활 속에 빠르게 들여놓지는 못한다. 필자가 시도하고자 했지만 결국 진행하지는 못한, 말로써 기술 그 자체와 소통하는 ‘음성 인식 기술’의 사례들을, 기술을 삶에 가까이 들이는 방법 중 하나로 꺼내어 보고자 한다.