Spotlight1_음성인식 재밌는 콘텐츠가 될 수 있다

상세페이지

  • HOME > 월별 특집 & 기획

Spotlight1_음성인식 재밌는 콘텐츠가 될 수 있다


<경계에 있는 우리들 HCI KOREA 2018>

지난 1월 31일~2월 2일, 하이원리조트 컨벤션센터에서 3일간 진행된 HCI KOREA 2018 학술대회. ‘Trans-Humanity 경계의 확장’이라는 주제로 막을 올린 이번 HCI KOREA는 사람과 기계의 경계가 모호해지며 나타나는 영향을 다각적으로 다루는 자리였다.
인간과 컴퓨터의 상호작용을 연구하는 HCI(Human-Computer Interaction). HCI KOREA(이하, HCI)는 그 이론과 응용방법을 함께 모여 연구하는 모임이다.
행사에서 공유하는 주제들은 현업 종사자조차도 낯선 이야기로 가득하지만 현재 기술발전의 위치를 알아보고 논의해보는 것만으로도 모두에게 유용한 자리다. 그만큼 기술발전에 인간이 대처해야 할 자세는 무엇일지 고민하고 연구하는 이들로 가득한 HCI 현장.
경계에 서있는 그들은 과연 이번 HCI에서는 어떤 고민을 나눴을지 살펴보자.

글. 디아이매거진 편집국 di@websmedia.co.kr

*일부 기사는 기자가 각색해 작성한 것으로 실제 발표 내용과 다를 수 있습니다.


영화 ‘HER’을 한 번쯤 봤다면 알 것이다. 주인공과 인공지능 ‘사만다’의 대화에 어떠한 어색함도 없었다는 것을. 말 그대로, ‘대화’를 나눈다. 사람과 기기 사이에서 오고가는 사랑이 끝내는 자연스러워질 정도로 말이다.
아직은 영화 속 이야기이지만 카카오 UX Lab은 ‘자연스러운 대화 흐름’을 VUX 구현에서 가장 중점적으로 고려했다. 이 과정에서 음성인식을 재밌는 요소로 활용한 사례를 살펴보자.

글. 김신혜 기자 ksh@websmedia.co.kr


한국소비자원이 국내 음성인식 스피커 사용자를 대상으로 인공지능 스피커 사용에 대한 불편을 조사한 결과에 따르면 ‘일상사용 환경에서 음성인식 미흡’(56.7%), ‘기기와 이용자 간의 자연스러운 연결형 대화가 곤란’(45.7%), ‘외부소음을 음성명령으로 인식해 작동오류가 발생’(37.0%) 등으로 나타났다.
이에 카카오 UX Lab 역시 가장 자연스러운 인터랙션이 가능한 VUX 구현에 중점을 뒀다. 예컨대, 사람의 대화구조(상대의 말이 끝나고 난 이후 대답하기), 인터페이스가 부재한 상황에서도 내 음성이 인식되고 있음을 시각적으로 드러내기, 명확한 피드백, 빠른 실행 등으로 자연스러운 대화 흐름을 만들고자 했다.
이 과정에서 음성인식 오류를 또다른 재미요소로 활용해볼 수 있지 않을까 하는 재밌는 실험을 하게 된다.
사실 음성인식 서비스를 재미요소로 활용하는 사례는 심심찮게 찾아볼 수 있다. ‘시리와 놀기’를 검색하면 나오는 수많은 포스트들이 그중 하나다. 카카오 UX Lab은 오류 역시 이처럼 재밌는 콘텐츠로 활용할 수 있을 것이라 봤다. 바로, 자막을 통한 시각화로 말이다.



▲응, 없던 걸로 하자


<자막과 함께 소비되는 동영상 콘텐츠>
예능을 보면 별거없는 장면에 ‘자막’으로 숨을 불어넣기도 한다. ‘약 빨았다’는 표현이 들려올 정도로 예능에서 자막은 감초 역할을 톡톡히 해내고 있다. 일반인들이 제작하는 동영상 콘텐츠나 사진에서도 자막은 감성을 더하거나 재미요소로 사용된다.
인스타그램의 해시태그 열풍도 이러한 현상 중에 하나가 아닐까 싶다. 단순히 사진 속 위치나 제품설명을 넘어 자신의 느낌이나 기분을 재밌게 표현하기도 한다.
동영상 콘텐츠에서 자막의 중요성은 페이스북 이용자의 과반수 이상인 약 85%가 소리 없이 음소거 상태로 동영상을 재생한다는 결과에서도 볼 수 있다.
영상의 분위기로 흐름을 예측하기도 하지만 자막과 이미지가 시청자의 이목을 잡을 수 있는 핵심 요소가 되어가고 있는 것으로 보여진다.



▲자막으로 불어넣는 새벽감성



▲#청소를 안하면 #새로운 우주가 보인다 #궁서체 #자막으로 재미요소 상승


<음성인식의 오류를 자막의 재미요소로>
말을 잘못 인식하는 게 어떻게 재미요소로 받아들여질 수 있는 건지 조금 이해가 어렵다면 말소리 자체를 문자로 옮기거나 외계어를 사용해 재밌는 마케팅을 선보인 ‘티몬 몬소리’를 참고하면 된다.
‘어흐발꼬랅꽊껴(신발 사이즈 미스인 상황)’, ‘옭시뚜까테또까아놝흐(똑같은 옷 입은 사람을 마주친 상황), ‘모델퓟보코옱콜랐는데망햁(모델이 다 한 상황)’, ‘살뛔는쉬운데환불할텐어렶(환불이 하늘의 별따기인 상황)’ 같은 카피로 소비일상을 재밌게 표현했다.
음성인식이 자막으로 옮겨지는 과정은 현재 서비스되고 있는 카카오 치즈를 통해 선보였다. 카카오 치즈의 마이크 버튼을 누르면 이용자 얼굴에 라이언 음성글라스 스티커가 적용된다. 이 상태에서 음성인식을 진행하면 자신만의 텍스트가 담긴 스티커가 완성된다.
보이지 않는 음성을 어떻게 시각화할 것인가의 과정에서 전개된 다양한 생각과 아이디어를 살펴볼 수 있는 세션이었다.

tags 디아이매거진 , 월간DI , HCI , HCI KOREA , 음성인식 , VUX , 동영상 , 자막

저작권자 © 웹스미디어 무단 전재-재배포 금지

뉴스콘텐츠는 저작권법 제7조 규정된 단서조항을 제외한 저작물로서 저작권법의 보호대상입니다.
본 기사를 개인블로그 및 홈페이지, 카페 등에 게재(링크)를 원하시는 분은
반드시 기사의 출처(로고)를 붙여주시기 바랍니다.
영리를 목적으로 하지 않더라도 출처 없이 본 기사를 재편집해 올린 해당 미디어에 대해서는 합법적인 절차(지적재산권법)에 따라
그 책임을 묻게 되며, 이에 따른 불이익은 책임지지 않습니다.

URL 복사 출력하기 목록보기 스크랩하기

관련기사

최신뉴스
리뷰 & 하우투
내 일상이 쓸고퀄 브이로그로 Vlogr
리뷰 & 하우투
콘텐츠 마케팅의 장기: 콘텐츠(자기다움의 표현)[03/06]
월별 특집 & 기획
Spotlight1_음성인식 재밌는 콘텐츠가 될 수 있다
월별 특집 & 기획
Spotlight3_일상을 날것 그대로 휘발성 콘텐츠
월별 특집 & 기획
Spotlight4_경계에서 디자인하는 이들에게 차세대 전문가들이 고하다

정기구독신청