JESK Journal of the Ergonomics Society of Korea

Effects of Voice and Appearance Personality of Smart Speakers on User Satisfaction

Huhn Kim , Jaeyeong Ko , Seungwan Kim , Hoyeon Hwang
10.5143/JESK.2019.38.6.527 Epub 2020 January 03

2: Cited By

Abstract

Objective: The aim of this study is to investigate the voice and appearance personality of representative smart speakers in Korea through emotional vocabularies, and is to identify the factors affecting the personal satisfaction of smart speakers.

Background: Recently, various kinds of smart speakers have been spreading. Such smart speakers have various appearances and voices, and conversational interactions have their own personalities. However, the study on what kind of personality users prefer is still insufficient. In addition, it is difficult to find out whether the congruence between design and voice personality affects user satisfaction.

Method: In this study, the voice and appearance personality of four smart speakers sold in Korea were separately evaluated using seven emotional vocabularies: funny-serious, casual-formal, respectful-irreverent, enthusiastic-matter of fact, warm-cold, talkative-silent, active-inactive. Then, the satisfaction of each speaker was evaluated.

Results: In the evaluation results of the emotional vocabularies on voice and appearance personality, there were significant differences between the four smart speakers. In addition, there were significant differences in the satisfaction of the four types of smart speakers. In particular, some smart speakers have shown a very large gap between voice and appearance personality.

Conclusion: The participants preferred a polite, friendly, and warm voice. On the other hand, too serious, formal and cynical voices could have a negative impact on satisfaction. Meanwhile, the congruence between voice and appearance does not have a big impact on user satisfaction.

Application: The results of this study can be used to design the personality of smart speakers.

Keywords

Smart speaker Voice UI Conversational design Voice personality Appearance personality

1. Introduction

인공지능(Artificial Intelligence, 이하 AI)의 지속적인 발전과 더불어 음성인식 기술이 발전함에 따라 이를 융합한 제품인 스마트스피커 시장이 지속적으로 성장하고 있다. 이에 따라, 제조사나 통신사들은 다양한 스마트스피커를 경쟁적으로 출시하고 있다. SKT의 누구(NUGU), 카카오의 미니C, 네이버의 클로바(Clova), 구글의 구글 홈(Google Home), 그리고 애플의 홈팟(Homepod) 등이 대표적이다. 가트너(Gartner)는 2020년까지 미국 내 가정의 75%가 스마트스피커를 보유할 것으로 전망했다(Kinsella, 2017). 그리고 국내 스마트스피커의 시장규모도 11조 1천억원에 달할 것으로 추정되고 있다(Yeoun et al., 2017). 특히, 현재의 스마트스피커 시장은 사용자들의 집과 사무실에 있는 전자 기기들(예. TV, 냉장고, 보일러 등)을 네트웍으로 연결하여 컨트롤 하는 중심 플랫폼이 될 것으로 기대되고 있어, 이를 선점하기 위한 경쟁이 치열한 상황이다(Kim et al., 2019). 또한 스마트스피커는 노인을 대상으로 한 실버산업 등의 시장에서 입지를 넓혀가고 있으며, 관련 연구 및 개발이 활발하게 진행됨에 따라 그 사용 용도와 범위는 점차 확대될 것으로 보인다(Hoy, 2018; Park et al., 2019).

스마트스피커는 음성을 활용한 보이스 에이전트(Voice agent)로서 기본적으로 음성을 기반으로 사용자와 커뮤니케이션 한다. 음성 인터랙션은 많은 서비스와 정보를 제공하더라도 다양한 연령대의 사용자에게 모두 매력적이기에는 한계가 있다. 따라서 VUI (Voice User Interface) 디자이너들은 타겟 사용자와 회사의 브랜드 이미지에 어울리는 페르소나(Persona)를 정하고, 그에 적합한 개성(Personality)의 심적 이미지를 사용자가 가질 수 있도록 스마트스피커를 디자인하려고 노력한다(Cohen et al. 2004). 이 때, 스마트스피커의 개성은 외형뿐만 아니라 성별, 목소리, 억양, 리듬, 단어 선택, 문장의 구조, 대화 또는 답변 선택의 전략 등에 의해 종합적으로 결정된다(Cohen et al., 2004). 따라서 VUI의 페르소나는 스마트스피커가 사용자에게 어떻게 질문할 것인지, 오류를 어떻게 다룰 것인지 그리고 어떻게 도움을 제공할 것인지 등을 디자인하는데 모두 영향을 미친다(Pearl, 2016).

Hong et al. (2017)은 스마트홈 대화형 인터페이스의 인간적 본성(Human Nature)은 감정적 대응, 대인 관계에 대한 따뜻함, 인지적 개방성, 독립적 능동성, 그리고 피드백의 깊이로 구성된다고 하였다. Chattaraman et al. (2019)은 가상 쇼핑 도우미의 잡담, 질문, 감탄사, 격려와 같은 비형식적인 회화체의 대화 스타일이 인터넷 사용 능력이 뛰어난 사용자에게 더 뛰어난 사회적 반응을 유도할 수 있음을 보였다. 에이전트의 생김새(인간같은 이미지, 표정, 제스처, 움직임), 대화 및 사회성(스토리텔링, 상호 인정, 사회적 의식, 공감, 유머 등)과 같은 에이전트의 인간성은 사용자로부터 보다 협조적인 행동을 이끌어내고 참여도를 높이며 긍정적인 반응을 이끌어낼 수 있다(Liao, 2016). 특히 사용자들은 그들 자신과 유사한 개성을 가진 에이전트를 더 선호한다고 한다(Dryer, 1999; Nass and Lee, 2012). 한편, Shiban et al. (2015)에 따르면, 남성 형태의 에이전트가 여성 형태보다 사용자에게 더 신뢰할만한 것으로 인지된다고 하였고, Park et al. (2015)은 사과의 진실성 관점에서 남성의 목소리가 더 진실되게 인식된다고 하였다. 또한 추천하기, 상기시키기, 학습시키기, 설득하기와 같은 에이전트의 적극적인 상호작용(Proactive interaction)에 대해, Liao et al. (2016)은 바쁘고 잦은 사회적 접촉을 가지는 사용자에게 있어 원치 않는 적극적 상호작용은 오히려 회피의 대상이 될 수 있다고 하였다.

이와 같이 기존 연구들에 따르면 스마트스피커의 보이스(본 연구에서 보이스는 목소리와 대화 내용을 포함한 의미로 사용함)나 외형 디자인의 다양한 속성들이 개성 인식에 영향을 미칠 수 있다. 하지만 구체적으로 어떤 유형의 개성을 가진 스마트스피커를 사용자들이 더 선호하는 지에 대한 연구는 없었다. 본 연구에서는 한국에서 유통되고 있는 대표적인 스마트스피커들의 보이스와 외형 디자인의 개성에 대한 사용자 인식을 조사하였다. 개성 인식은 대표적인 감성형용사를 이용해 평가되었으며, 어떤 개성이 스마트스피커의 만족도에 큰 영향을 미치는지를 분석하였다. 또한, 스마트스피커들의 보이스와 외형 디자인 사이의 개성 인식에 일치감이 있는지를 분석하였고, 그러한 일치감이 사용자 만족도에 어떤 영향을 미치는 지를 살펴보았다.

2. Method

2.1 Purpose

본 실험의 목적은 국내에 유통되고 있는 대표적인 스마트스피커의 보이스와 디자인의 개성을 감성형용사를 통하여 조사하는 것이다. 그를 통해 스마트스피커의 만족도에 영향을 미치는 개성적 요소를 파악하고자 하였다.

2.2 Emotional vocabulary

본 연구에서는 스마트스피커의 개성을 평가하는 도구로써 Table 1과 같이 7개의 감성형용사를 활용하였다. 일반적으로 감성형용사는 서로 상반된 의미를 가지는 어휘가 짝을 이루어 감성을 평가하는 척도로 사용된다(Soo, 2007). 본 연구에 활용된 7개의 감성형용사는 음성의 개성 평가에 많이 활용되는 Moran (2016)의 Tone of voice 4종에 여러 인간공학 관련 연구(Goldberg, 1992; Hyung, 1998; Jung and Nah, 2007)에서 많이 활용된 감성형용사 중 음성 또는 외형 디자인의 개성을 평가하는데 적절한 형용사 3종을 추가하여 구성하였다. Table 1에 대응되는 실제 실험에 사용된 한국어 감성형용사는 다음과 같았다: 재미있는-진지한, 캐주얼한-공식적인, 공손한-불손한, 열정적인-냉소적인, 따뜻한-차가운, 수다스러운-조용한, 적극적인-소극적인.

	Emotional vocabulary
Evaluation scale	1	2	3		4	5
Tone of voice (Moran, 2016)	Funny			Serious
	Casual			Formal
	Respectful			Irreverent
	Enthusiastic			Matter of fact
Three more adjectives (Goldberg, 1992; Hyung, 1998; Jung and Nah, 2007)	Warm			Cold
	Talkative			Silent
	Active			Inactive

Table 1. Emotional vocabularies used in this experiment

2.3 Experimental system and environment

조사의 대상으로는 국내에서 판매되고 있는 대표적인 스마트스피커 4종(SKT 누구, 카카오 미니C, 구글 홈, 네이버 클로바)으로 하였다(Figure 1). 각 스피커의 소프트웨어는 실험일(2019년 3월 20일) 기준의 버전을 사용하였다. 음성 설정은 디폴트로 하였는데, SKT 누구, 카카오 미니C, 그리고 네이버 클로바는 여성 목소리였으며, 구글 홈만 남성 목소리였다. 실험참여자가 스마트스피커에서 들리는 음성을 듣고 개성을 평가할 때는 스피커의 디자인이 영향을 주지 않도록 Figure 2의 왼쪽과 같이 스피커는 블라인드 처리하였다. 하지만 각 스피커의 디자인 개성을 평가할 때는 Figure 2의 오른쪽과 같이 디자인을 보면서 평가하였다.

Figure 1. Smart speakers in this experiment

Figure 2. Evaluation of voice personality with blinded smart speakers (left) and evaluation of appearance personality while looking at the speaker (right)

2.4 Participants

실험에는 20대 남녀 대학생 30명(남성 15명, 여성 15명; 평균 23.9세)이 참여하였다.

2.5 Task and procedure

실험은 목소리만을 듣고 개성을 평가하는 실험과 디자인만 보고 개성을 평가하는 실험 두 가지로 나누어 진행하였다. 먼저, 스마트스피커와의 사용경험이 전혀 없는 참여자를 위해 연습 발화를 진행하였다. 실험참여자는 스마트스피커의 호출명(예. 아리아)을 부른 뒤 스피커가 준비 상태가 되면 "안녕?" 이라고 발화하도록 하였다. 이를 통해 실험참여자가 스마트스피커와의 기본 인터랙션 방식을 인식하게 한 후에 본 실험을 진행하였다. 그 후, 실험참여자는 임의로 선택된 한 종류의 스마트스피커와 Table 2와 같은 10개의 발화를 하여 스피커와 대화하도록 하였다. Table 2의 발화 내용들은 스마트스피커의 대표기능(생활 편의기능/감성 대화/정보검색)이 모두 포함되게 선정된 것이었다. 이들 발화문은 한글로는 다음과 같았다: 나 외로워, 심심해, 알람 맞춰줘, 블루투스 꺼줘, 오늘 날씨 알려줘, 오늘 운세 알려줘, 토트넘 경기 일정 알려줘, 행복이 영어로 뭐야?, 이순신이 누구야?. 실험참여자는 10개의 발화 대화를 진행하면서 Table 1의 감성형용사 각각에 대해 5점 척도로 평가를 진행하였다. 그리고, 모든 대화가 종료되면, 1분 간 휴식을 취한 후에 임의로 선택된 다음 스피커와 동일한 발화를 진행하였다.

보이스만으로 4종의 스피커와 대화 후 개성을 평가하는 실험이 종료되면, 실험참여자는 약 1분 간의 휴식을 취한 후 임의의 순서로 보여지는 스마트스피커의 외형을 보고 감성형용사를 기준으로 디자인 개성을 평가하였다. 네 종류의 스피커 외형에 대한 개성 평가가 모두 끝나면, 실험참여자는 보이스와 외형 디자인에 대한 본인의 평가 결과를 종합하여 각 스피커에 대한 만족도 순위를 1~4위로 평가하고, 그 이유를 간략히 기술하였다.

Section	Question
Emotional conversation	I'm lonely
Emotional conversation	I’m bored
Convenience	Set alarm
	Turn off Bluetooth
	Turn on Bluetooth
	Tell me the weather today
	Tell me the fortune today
Information retrieval	Tell me the schedule for the Tottenham match
	What is happiness in English
	Who is Lee soon shin

Table 2. List of conversations with smart speakers

3. Results

3.1 Subjective satisfaction

최종 만족도 평가 결과, 네 종류의 스마트스피커 간 만족도 순위에 유의한 차이가 존재하였다(F(3, 112)=3.43, p=0.02). Figure 3의 그래프와 Turkey 사후분석 결과에서 보여주듯이 네이버 클로바의 만족도 순위가 가장 높았으며, 구글 홈의 만족도 순위가 가장 낮게 평가되었다. 그 이유와 개성과의 연관성은 다음 장들에서 설명될 것이다. 그리고 남녀 간의 만족도에는 유의한 차이가 없었으며(F(1,112)=0.00, p=1.00), 성별과 스피커 간에 교호작용도 존재하지 않았다(F(3,112)=0.46, p=0.712).

Figure 3. The mean and standard deviation of subjective satisfactions on smart speakers (The use of the same alphabetic characters indicates that there was no significant difference when α=0.05 according to Turkey test)

3.2 Differences among speakers in voice personality

각 스마트스피커의 보이스 및 대화를 통해 평가된 개성에 대한 감성형용사 평가 결과는 Figure 4와 같았다. '공손한-불손한'에만 유의한 차이가 없었고 나머지 모든 형용사에 대해서는 스마트스피커 간에 유의한 차이가 존재하였다. 즉, 모든 스피커들은 공통적으로 매우 공손한 목소리를 가지고 있었다. 또한, 대체로 구글 홈을 제외하고는 다소 캐주얼하다는 평가를 받았다. 그리고 거의 모든 스피커들은 다소 재미있고, 열정적이고, 따뜻하며, 수다스럽고, 적극적이라는 평가를 받았다. 특히, 카카오 미니C는 다른 스피커에 비해 더 재미있고 캐주얼하다는 평가를 받았다. 반면, 구글 홈은 다른 스피커들에 비해 가장 진지하며, 공식적이고, 냉소적이며, 차갑고, 조용하고, 소극적이라는 평가를 받았다. 한편, SKT 누구는 가장 열정적이고, 따뜻하고, 수다스럽고, 적극적이라는 평가를 받았다. 결과적으로, 보이스의 개성 평가 결과만 보면 실험참여자들은 SKT 누구와 구글 홈을 가장 상반되는 개성을 가진 것으로 평가했다.

Figure 4. The mean and summarized ANOVA results on voice personality of each speaker (*p<0.05, **p<0.01; The use of the same alphabetic characters indicates that there was no significant difference when α=0.05 according to Turkey test)

3.3 Differences among speakers in appearance personality

각 스마트스피커의 외형 디자인만을 보고 개성을 평가한 결과는 Figure 5와 같았다. 모든 감성형용사에 있어서 스마트스피커의 디자인 개성에 유의한 차이가 있었는데, 그 차이는 보이스 개성 간 차이에 비해 스피커 간 개성 차가 보다 뚜렷하였다. SKT 누구와 구글 홈은 진지하며, 공식적이고, 공손하며, 조용한 디자인으로 유사하게 평가되었다. 반면, 네이버 클로바와 카카오 미니C는 재미있고, 캐주얼하며, 다소 불손하고, 수다스러운 디자인이라는 평가를 받았다. 이는 카카오 미니C와 네이버 클로바는 캐릭터 디자인을 일부 또는 전체 디자인에 반영했기 때문으로 보인다. 특히, 네이버 클로바의 디자인은 카카오 미니C 보다도 더 재미있고, 캐주얼하고, 수다스럽고, 적극적이라는 평가를 받았다.

Figure 5. The mean and summarized ANOVA results on appearance personality of each speaker (*p<0.05, ** p<0.01; The use of the same alphabetic characters indicates that there was no significant difference when α=0.05 according to Turkey test)

3.4 Difference between voice and appearance personality

3.4.1 SKT NUGU

Figure 6는 SKT 누구의 보이스와 디자인 사이의 감성형용사 점수 간 차이를 보여준다. '공손한-불손한'을 제외한 모든 감성형용사에서 유의한 차이를 보였다. 이는 보이스와 디자인 개성 간에 불일치가 크다는 것을 말해준다. 주로 '캐주얼한-공식적인', '열정적인-냉소적인', '수다스러운-조용한', '적극적인-소극적인'에서 큰 차이를 보였다.

앞서 3.1절에서 설명한 최종 만족도 평가에서 SKT 누구는 4개 스피커 중 2위를 차지했었다. 그 이유에 대한 설문에서 참여자들은 '외관이 깔끔하다', '목소리가 다정하여 듣기에 편안하다', '사용자에게 가장 가깝게 다가오는 목소리이다' 등으로, 주로 디자인에 대한 평가보다는 목소리에 호감을 느꼈다는 의견들이 많았다. 디자인에 대해서는 무채색의 질감으로 차가운 감정이 느껴진다는 의견이 다수 있었으나, 반대로 스피커 하단부의 천 재질로 인해 따뜻한 감정이 느껴진다는 의견도 있었다. 하지만, 정보검색 시 제공하는 음성 정보량이 너무 많아 수다스럽게 느껴진다는 의견도 많았다.

Figure 6. The mean and summarized ANOVA results on voice and appearance personality of SKT NUGU (*p<0.05, **p<0.01)

3.4.2 Google Home

Figure 7은 구글 홈의 보이스와 디자인 사이의 감성형용사 점수 간 차이를 보여준다. 구글 홈의 보이스와 디자인은 둘다 공식적이며, 공손하고, 다소 적극적이라는 평가를 받았다. 반면, '재미있는-진지한', '열정적인-냉소적인', '수다스러운-조용한'에서는 보이스와 디자인 개성 간에 유의한 차이를 보였다.

구글 홈은 3.1절의 최종 만족도 평가에서 4개의 스피커 중 4위를 차지하였다. 구글 홈은 유일한 남성 목소리를 가진 스피커였다. 그래서인지, 다수의 참여자들은 구글 홈의 목소리가 간결하고 사무적인 말투로 느껴진다고 하였다. 한편, 구글 홈의 디자인은 무채색의 색상, 재미없는 디자인이라는 의견이 많았다. 결론적으로, 구글 홈은 보이스와 디자인 사이의 감성적 불일치는 가장 적었지만, 사무적인 말투와 더불어 과하게 간결한 답변과 무채색의 특징 없는 디자인으로 '재미없는' 느낌의 스피커로 평가되었다.

Figure 7. The mean and summarized ANOVA results on voice and appearance personality of Google Home (*p<0.05, **p<0.01)

3.4.3 Naver Clova

Figure 8은 네이버 클로바의 보이스와 디자인 사이의 감성형용사 점수 간 차이를 보여준다. '열정적인-냉소적인', '따뜻한-차가운'을 제외한 다른 감성형용사에서는 보이스와 디자인 개성 간에 유의한 차이를 보였다. 특히, 목소리와 대화 내용은 공손했으나 디자인은 불손하다는 평가를 받았다. 또한 보이스에 비해 디자인은 더 재미있고, 캐주얼하며, 수다스럽다는 평가를 받았다. 이는 클로바의 외형인 미니언즈 캐릭터가 강하게 작용하였기 때문으로 보인다. 결론적으로, 네이버 클로바의 보이스와 디자인 개성 사이에는 다소 큰 차이가 있었다.

하지만 3.1절에서 봤듯이 네이버 클로바는 최종 만족도 평가에서 1위를 차지하였다. 미니언즈의 이미지가 강하게 작용된 영향으로 디자인과 보이스 사이에 감성적 불일치가 크게 나타나긴 했으나, 실험참여자 대다수가 20대였기 때문에 캐릭터 자체에 대한 호감도가 매우 높았던 영향인 것으로 보인다.

Figure 8. The mean and summarized ANOVA results on voice and appearance personality of Naver Clova (*p<0.05, **p<0.01)

3.4.4 Kakao Mini C

Figure 9은 카카오 미니C의 보이스와 디자인 사이의 감성형용사 점수 간 차이를 보여준다. 미니C는 '공손한-불손한', '열정적인-냉소적인', '적극적인-소극적인'에서 보이스와 디자인 개성 간에 유의한 차이를 보이긴 했으나 다른 스피커에 비해서는 그 차이가 가장 적었다. 카카오 미니C는 유일하게 반말을 사용하고, 유머러스한 답변을 많이 했는데, 디자인도 카카오 프렌즈 캐릭터 '라이언'을 포인트로 사용했기 때문에 재미있고 캐주얼하다는 평가받았다.

하지만, 카카오 미니C는 최종 만족도 평가에서 3위에 위치했다. 무난한 정보량과 적당한 목소리 등으로 평가되었는데 부정적인 설문 결과는 거의 없었지만, 반대로 크게 긍정적인 설문 결과도 없어 가장 평범하다고 평가되었다.

Figure 9. The mean and summarized ANOVA results on voice and appearance personality of Kakao Mini C (*p<0.05, **p<0.01)

3.5 Correlation analysis

Figure 10은 모든 스마트스피커의 보이스와 디자인 감성형용사 평가 결과들 및 만족도 간의 상관관계를 분석한 결과이다. 보이스와 디자인은 별도로 평가되었기 때문에 감성형용사 간에 상관관계는 존재하지 않았다. 보이스에서는 재미있는-캐주얼한, 재미있는-열정적인, 열정적인-따뜻한, 열정적인-수다스러운, 열정적인-적극적인, 적극적인-따뜻한 형용사 간에 상관계수 0.4 이상의 약한 상관관계가 존재하였다. 디자인에 있어서는 감성형용사 간에 서로 많은 상관관계가 존재하였다. 특히, 재미있는-캐주얼한, 재미있는-수다스러운, 캐주얼한-수다스러운 간에 0.7에 가까운 높은 상관관계가 존재하였다.

Figure 10. Correlation analysis among emotional vocabularies and satisfaction for all speakers (it shows only correction coefficients greater than 0.4)

보이스와 디자인의 각 감성형용사 간 상관관계를 보면, '열정적인-냉소적인'이 공통적으로 '따뜻한-차가운', '수다스러운-조용한', '적극적인-소극적인'와 상관관계를 보이고 있다. 즉, '열정적인-냉소적인' 감성형용사 만으로도 '따뜻한-차가운', '수다스러운-조용한', '적극적인-소극적인'의 세 감성형용사를 대표할 수 있다는 것이다. 따라서, 향후 스마트스피커의 개성 평가 시에는 Table 1의 Tone of voice (Moran, 2016)에 해당하는 네 개 감성형용사만으로도 충분히 평가할 수 있을 것으로 보인다.

Figure 11은 각 스마트스피커의 만족도와 보이스 및 디자인 감성형용사 간의 상관관계 분석 결과이다. 주로 목소리와 대화 내용이 만족도에 영향을 많이 미쳤음을 알 수 있다. 구글 홈은 진지한, 공식적인, 냉소적인 목소리가, 네이버 클로바는 재미있고 수다스러운 목소리가, 그리고 카카오 미니C의 경우 재미있는 목소리가 만족도에 영향을 미친 것으로 보인다.

Figure 11. Correlation analysis between emotional vocabulary and satisfaction for each speaker (it shows only correction coefficients greater than 0.4)

4. Conclusion and Discussion

본 연구에서는 국내에 유통되고 있는 대표적인 스마트스피커의 보이스와 외형 디자인의 개성을 감성형용사를 통하여 조사하였고, 이를 통해 스마트스피커의 만족도에 영향을 미치는 개성 요소를 파악하였다.

목소리와 대화를 통한 개성 평가 결과를 보면, 조사 대상이었던 네 종의 스피커는 공통적으로 공손한 개성을 가진 것으로 평가되었다. 또한 감성형용사 중에서 '재미있는-진지한', '캐주얼한-공식적인', '수다스러운-조용한', '적극적인-소극적인'에서 스피커 간 보이스 개성에 차이가 있었다. 그 중에서도 보이스에 강한 개성을 가진 스피커는 구글 홈과 카카오 미니C로 평가되었다. 구글 홈은 공식적이고 냉소적이며, 차갑고 소극적인 개성의 보이스로, 카카오 미니C는 재미있고 캐주얼한 보이스로 평가되었다.

외형 디자인 개성에서는 SKT 누구와 구글 홈이 서로 비슷한 개성을 가진 것으로 평가되었다. SKT 누구와 구글 홈은 심플하면서 현대적인 외형으로 스마트스피커의 역할인 인공비서로서의 진지하고, 공식적이며, 조용한 이미지를 주었다. 반면, 네이버 클로바와 카카오 미니C는 디자인에 유명 캐릭터를 사용하여 재미있고, 캐주얼 하며, 수다스러운 이미지를 주었다.

SKT 누구와 네이버 클로바는 보이스와 디자인 사이의 개성에 큰 차이를 보였다. SKT 누구는 다소 냉소적이며 조용하고 소극적인 느낌의 디자인에 비해 보이스는 가장 열정적이고 따뜻하고 수다스러우며 적극적인 것으로 평가되었다. 네이버 클로바의 경우, 눈에 띄는 캐릭터 디자인에 비해 보이스는 평이한 것으로 평가되었다. 특히, 공손한 보이스에 반해 디자인은 불손한 느낌으로 평가되었다.

반면, 구글 홈은 보이스와 디자인 개성 간에 괴리감이 가장 적었다. 차가운 무채색의 디자인과 유사하게 목소리와 대화도 냉소적이고 공식적이라는 평가를 받았다. 추가로, SKT 누구와 구글 홈은 가장 상반된 보이스 개성을 가졌으나 디자인은 가장 유사하다는 평가를 받았다. 한편, 보이스와 디자인 개성 간의 감성적 불일치가 가장 컸던 네이버 클로바와 SKT 누구가 최종 만족도 평가에서 1위와 2위로 각각 평가된 것을 볼 때 보이스와 디자인 사이의 일체감이 만족도에 미치는 영향은 없는 것으로 보인다. 스마트스피커는 본래의 목적이 음성으로 커뮤니케이션하는 스피커이기 때문에, 디자인 보다는 보이스에 더 큰 영향을 받는 것으로 보인다.

감성형용사와 만족도 간의 상관관계 분석 결과를 보면, 적당한 재미와 적극적인 목소리나 대화 방식은 만족도에 긍정적인 영향을 끼친 것으로 파악되었다. 하지만 카카오 미니C 처럼 가끔 반말을 하는 등 지나친 재미 추구는 불손한 느낌을 주고 만족도를 떨어뜨릴 수 있다. 사용자는 공손하면서도 다정하고 따뜻한 느낌의 목소리를 선호하였다. 반면, 너무 진지하거나 공식적이고 냉소적인 목소리는 만족도에 부정적인 영향을 미칠 수 있는 것으로 분석되었다.

본 연구의 결과는 스마트스피커의 보이스와 디자인을 결정할 때 참고할 수 있다. 하지만 본 연구의 결과를 일반화하는 데는 다음과 같은 한계점이 있다. 첫째, 본 연구의 실험참여자들은 모두 20~30대였다는 점이다. 어린이, 중장년, 고령 사용자의 경우 다른 유형의 개성을 더 선호할 수도 있다. 둘째, 다른 스피커는 여성 목소리였으나 구글 홈만 남자 목소리였기 때문에 만족도가 가장 낮았을 수 있다. 실제 뒤이어 수행한 연구에 따르면 사용자의 성별에 무관하게 남성 목소리 보다 여성 목소리에 대한 선호도가 더 높았다. 셋째, 본 연구의 실험은 오랜 시간 동안의 대화 인터랙션이 아닌 간단한 명령 형태의 태스크 수행 후 개성을 평가한 것이었다. 따라서 각 스마트스피커의 대화 내용에 따른 사회성과 같은 개성은 정확하게 평가하기가 어려웠을 것으로 보인다. 향후 이러한 점에 대해서는 추가적인 연구가 필요하다.

References

1. Chattaraman, V., Kwon, W.S. Gilbert, J.E. and Ross, K., Should AI-Based, conversational digital assistants employ social-or task-oriented interaction style? A task-competency and reciprocity perspective for older adults. Computers in Human Behavior, 90, 315-330, 2019.
Google Scholar

2. Cohen, M.H., Cohen, M.H., Giangola, J.P. and Balogh, J., Voice user interface design. Addison-Wesley Professional, 2004.
Crossref Google Scholar

3. Dryer, D.C., Getting personal with computers: how to design personalities for agents. Applied Artificial Intelligence, 13(3), 273-295, 1999.
Google Scholar

4. Goldberg, L.R., The development of markers for the Big-Five factor structure. Psychological Assessment, 4(1), 26-42, 1992.
Crossref Google Scholar

5. Hong, E., Cho, K. and Choi, J., Effects of Anthropomorphic Conversational Interface for Smart Home: An Experimental Study on the Voice and Chatting Interactions. Journal of the HCI Society of Korea, 12(1), 15-23, 2017.
Google Scholar

6. Hoy, M.B., Alexa, Siri, Cortana, and more: an introduction to voice assistants. Medical Reference Services Quarterly, 37(1), 81-88, 2018.
Google Scholar

7. Hyung, L., Sensibility ergonomics: needs, concepts, methods and applications. Journal of the Ergonomics Society of Korea, 17(1), 91-102, 1998.
Crossref Google Scholar

8. Jung, H. and Nah, K., A study on the meaning of sensibility and vocabulary system for sensibility evaluation. Journal of Ergonomics Society of Korea, 26(3), 17-25, 2007.
Google Scholar

9. Kim, H., Park, H., Beak, M. and Lee, S., Proper length of voice information provided by encyclopedia in smart speakers. Fall Conference of the Ergonomics Society of Korea, 2019.

10. Kinsella, B., Gartner predicts 75% of US households will have smart speakers by 2020, https://voicebot.ai/2017/04/14/gartner-predicts-75-us-households-will-smart-speakers-2020/, 2017.

11. Liao, Q.V., Davis. M., Geyer, W., Muller, M. and Shami, N.S., What can you do?: Studying social-agent orientation and agent proactive interactions with an agent for employees. Proceedings of the 2016 ACM Conference on Designing Interactive Systems, 264-275, 2016.
Google Scholar

12. Moran, K., The four dimensions of tone of voice, Nielsen Norman Group, https://www.nngroup.com/articles/tone-of-voice-dimensions, 2016.
Crossref

13. Nass, C. and Lee, K.M., Does computer-generated speech manifest personality? An experimental test of similarity-attraction. Proceedings of CHI 2012, ACM Press, 329-336, 2012.
Google Scholar

14. Park, E.K., Lee, K.M. and Shin, D.H., Social Responses to Conversational TV VUI: Apology and Voice. International Journal of Technology and Human Interaction, 11(1), 17-32, 2015.
Google Scholar

15. Park, J., Shari, S. and Lee, E., Silver solution (SS): smart home automation system for the elderly living alone. Journal of The Korean Institute of Information Scientists and Engineers, 2019, 432-434.

16. Pearl, C., Designing Voice User Interfaces: Principles of Conversational Experiences. O'Reilly Media, Inc., 2016.
Crossref Google Scholar

17. Shiban, Y., Schelhorn, I., Jobst, V., Hörnlein, A., Puppe, F., Pauli, P. and Mühlberger, A., The appearance effect: Influences of virtual agent features on performance and motivation. Computers in Human Behavior, 49, 5-11, 2015.
Google Scholar

18. Soo, S., Design of an effective human sensibility ergonomic interior design analysis tool. Journal of the Korean Society of Interior Design, 16(2), 314-321, 2007.
Google Scholar

19. Yeoun, N., Yun, H. and Hwan, P., Classification of customer utility for voice interactive function of AI personal assistant services: based on KANO model. Design Mixed-Use Research, 16(4), 67-80, 2017

PIDS App ServiceClick here!

Download this article

Full text file: PDF
Citations
XML Download

Submit your research

Jump to: