본문바로가기

Analysis of Differences in Uncanny Valley Phenomenon by Languages Using Social Media Data

Abstract

Objective: The present study investigated different perceptions of the uncanny valley phenomenon according to linguistic and cultural differences and difference in user sentiment concerning android and artificial intelligence (AI).

Background: The uncanny valley phenomenon is recognized as an important design factor that must be considered in robots, androids, computer graphics, and animation production fields.

Method: English, Japanese, and Korean tweets on Android and AI were collected. Sentiment analysis and text analysis were performed on this social media data.

Results: The results showed that English users have higher rate of negative responses to androids that have appearances similar to humans compared to Japanese users; the English users use more negative expressions (adjectives).

Conclusion: This implies that uncanny valley phenomenon can vary according to linguistic and cultural differences in participants and that these linguistic and cultural differences must be considered when researching and applying the uncanny valley phenomenon.

Application: The results of this study could be used as empirical and quantitative data for developing design guidelines of human-friendly androids and CG contents that overcome uncanny valley phenomenon.



Keywords



Uncanny valley Social media data Sentiment analysis Robot design



1. Introduction

Uncanny Valley는 로봇 공학자 Masahiro Mori (Mori, 1970)가 주장한 가설로써, 로봇의 움직임이나 생김새가 인간의 모습에 근접하면 근접할수록 더 호감을 갖지만 인간과 너무 비슷하면 오히려 거부감이 생기는 현상을 지칭한다. 이러한 Mori의 주장은 인간과 상당히 비슷하여 부정적인 감성을 유발하게 되는 구간(Figure 1 A구간)과 로봇의 움직임과 생김새가 인간과 구별이 되지 않을 정도로 비슷해져서, 사람과 사람 상호간에 느껴지는 감성적 수준으로 회복되는 구간(Figure 1 B구간)으로 나누어 볼 수 있다.

Figure 1. The uncanny valley (Mori, 1970)

Uncanny valley에 관련된 지금까지 연구들은 거의 대부분 인간이 아닌 존재가 인간의 외모, 움직임과 비슷하지만 아직 인간에 미치지 못하는 A구간에서 유발될 수 있는 부정적 감성에 초점을 맞추어 왔다(Burleigh et al., 2013; Kim et al., 2016; Saygin et al., 2011; Steckenfinger and Ghazanfar, 2009). 이러한 연구결과들을 바탕으로 A구간에서의 부정적 감성을 회피하기 위한 다양한 가이드라인도 등장하고 있으며, 이와는 별도로 CGI, 영화 분야 로봇, 안드로이드 제작 분야에서는 인간과 동일한 외형과 움직임, 기능을 갖추기 위한 노력이 계속되고 있다(Jang et al., 2016). CGI 및 영화 분야에서는 관련 HW, SW의 발전 및 편집기술의 발전으로, 이러한 노력이 최근 꽤 성과를 거두고 있는 것으로 보인다. 영화 'TinTin: The Secret of the Unicorn (2011)'은 불쾌한 골짜기를 건넌(passed beyond the uncanny valley into the hyperreal) 애니메이션 영화로 평가받고 있으며(Stevens, 2011; Kelly, 2012), 영화 Avatar (2009)에서는 영화에 출연하는 실제 배우를 모사한 CG 캐릭터가 실사와 합성되어 종반부에 등장하지만, 실제 배우가 연기한 장면과 CG 인간 캐릭터가 등장한 종반부 장면을 구별해 알아차린 사람은 거의 없다.

영화와 관련된 CGI 분야에서의 이러한 성과는 인간의 외형과 움직임을 모사할 수 있는 기술적 수준이 Figure 1의 A구간을 지나 B구간에 이르렀음을 보여준다. 물론 로봇이나 안드로이드의 제작기술은 아직까지 A구간에 머물고 있지만, 안드로이드 제작기술이 고도화되고, 바이오닉스(bionics) 기술의 급격한 발전에 의해 인공피부, 의수, 의족 등 인공신체기관이 광범위하게 보급되어 인간과 안드로이드의 외형적 경계가 모호해 질 경우까지 상정할 때, 이제는 A구간 보다 B구간에 대한 연구가 더 중요성을 가진다고 판단된다.

지금까지 B구간에 초점을 맞춘 실증 연구는 거의 찾아보기 힘든데, uncanny valley에 관련된 기존 연구들에서는 로봇의 움직임과 생김새가 인간과 구별이 되지 않을 정도로 비슷해지면, 사람과 사람 상호간에 느껴지는 긍정적 감성적 수준을 가지게 된다는 모리의 가설을 대부분 비판 없이 받아들이고 있기 때문이다. 이와 함께 정교하고 사실적인 디자인을 통해 사실성에 상관없이 인간과 동일한 긍정적 정서를 이끌어 낼 수 있다는 주장도 있다(MacDorman, 2005). 하지만 인간과 동일한 외모와 움직임을 시뮬레이션하여 수행한 실증 연구(Jang, 2007)에서는 로봇이 인간과 동일한 수준의 외모와 행동을 갖추게 되더라도, 인간은 이러한 존재에 대해 '섬뜩함'과 같은 감성을 가지게 될 수 있음을 보여주었다. 즉, A구간과 B구간 모두, 외형에 대한 지각단서(완벽한 인간)와 미리 인지하고 있는 범주(안드로이드)와의 인지적 충돌(cognitive conflict) 뿐만 아니라, 인간 정체성에 대한 혼란, 문화적 종교적 관점의 차이 등 다양한 요인이 영향을 미칠 것으로 생각되며, 이러한 요인들을 고려한 연구가 진행되어야 할 것으로 생각된다.

2015년 2월 한국 창원에는 로봇청소기에 머리카락이 빨려 들어간 주부가 119 구조대에 의해 도움을 받은 사건이 발생하였다. 한국에서는 이 사건이 단순한 해프닝으로 취급되었지만, 가디언(guardian), 허핑턴포스트 등 여러 서양언론에서는 '인간에 대한 로봇의 반기'라고 표현하며, 심각하면서도 유머러스하게 다루었다(McCurry, 2015; Rundle, 2015). 이것은 로봇이나 안드로이드에 대한 동, 서양의 기본적인 인식 차이가 존재할 수 있음을 단적으로 보여주는 것으로써, uncanny valley 현상에 대한 연구와 활용에 있어 이러한 차이를 먼저 검증, 고려할 필요가 있다.

서양의 아브라함 계통 종교들(기독교, 유대교, 이슬람교)에서는 인간의 고유성(uniqueness)을 강조하는데, 이러한 관점에서 인간과 유사하게 보이는 안드로이드 등은 인간 정체성에 대한 위협으로 간주될 수 있다(MacDorman et al., 2009). 기독교와 유대교에서 인간이 인간과 비슷한 존재를 만드는 것은 신(하느님)의 인간 창조를 흉내 내는 일이며, 이것은 신에 대한 반역으로 간주된다. 하지만, 동양사상과 문화에 많은 영향을 미치고 있는 불교에서는 인간이 축생이나 미물로 태어날 수 있다는 순환적 윤회사상을 강조하고 있으며, 이러한 관점에서 인간과 비슷한 안드로이드에 대한 거부감과 두려움이 다른 문화권에 비해 낮을 것으로 추측된다.

Singer (2009)에 따르면 동, 서양의 로봇에 대한 문화적 인식에도 큰 차이를 보이는데, 서양의 SF (science fiction) 작품들에서 로봇은 뭔가 수상쩍은 존재이지만 아시아, 특히 일본에서는 반대로 악과 싸우는 영웅으로 묘사되며, 노인을 위한 동반자, 친구, 동료직원으로 인식한다. 일본의 로봇 공학자 이시구로 히로시교수는 자기 자신의 외모를 흉내 낸 제미노이드(geminoid)를 직접 제작하였으며(Ishiguro, 2016), uncanny valley 가설을 세운 모리 마사히로교수는 로봇이 부처와 같은 불성(佛性)을 가질 수 있으니, 인간은 로봇을 사람처럼 대해야 한다고 주장하였다(Masahiro, 1989). 이렇게 종교적, 문화적 관점에서 로봇과 안드로이드에 대한 동 · 서양은 시각 차를 보이고 있는 것으로 생각되며, 동양 중 특히 일본사람들은 로봇, 안드로이드에 대하여 다른 나라 사람들과는 다른 관점을 가지고 있을 가능성이 크다. Uncanny valley 현상을 포함하여 로봇, 안드로이드 디자인에 있어 이러한 인식과 감성 차이에 대한 고려가 이루어져야 할 것이지만, 아직 이에 대한 연구는 찾아보기 힘들다.

2. Method

2.1 Method of analysis

로봇, 안드로이드에 대한 동서양의 인식 차이를 살펴보기 위해서 본 연구에서는 최근 빅데이터 연구에 주로 이용되는 소셜 미디어 데이터(social media data)에 대한 감성분석(sentiment analysis) 방법을 적용하였다. 감성분석은 기존의 인간공학분야에서 많이 이용되어 왔던 감성평가(sentiment analysis, Jung, 2007; Choi et al., 2010)와 달리, 메시지와 문서를 작성한 사람의 감정을 추출, 분석하는 방법이다. SNS (Social Network Service)를 이용한 조사방법은 기존의 설문조사, 인터뷰, 감성평가와 비교하여 다양한 배경의 사용자들이 자발적으로 서술한 메시지를 바탕으로 비 정형적인 의견들을 수렴할 수 있으며, 대부분 오랜 기간 동안 더 많은 의견을 취합할 수 있다. 물론, 특정한 항목, 설문에 대한 세부적이고 체계적인 질문/응답은 불가능하지만, 연구자가 고려하지 못했던 사항들을 발견하고, 분석에 포함시킬 수 있다는 장점이 있다.

2.2 Subject of analysis

본 연구에서는 동양 국가 중 일본과 한국, 서양 국가 중 미국의 Twitter 메시지들을 분석함으로써 로봇, AI, 안드로이드에 대한 인식 차이를 살펴보고자 하였다. Twitter는 35개국 언어를 지원하여 2016년 기준 전세계 3억 1천만명이 이용하고 있으며, 140자 이내 단문으로 개인의 생각이나 의견을 공유하고 소통하는 대표적인 SNS이다(Statista Inc., 2016). 2016년 기준으로, SNS 중에서 Facebook과 Instagram의 이용자 수가 Twitter 이용자 수보다 더 많다. 하지만, Twitter는 Streaming API (Application Programming Interface: Twitter Inc., 2016) 등을 이용하여 외부 이용자가 손쉽게 대규모 데이터들을 검색, 수집할 수 있도록 개방성을 제공함으로써 SNS 분석, 연구에 많이 이용되고 있다.

2.3 Data collection

Twitter의 Streaming API는 R, Python, Peal 등 다양한 언어들과 연계되어 실시간으로 대량의 데이터 수집을 가능하게 하지만, 1년 이상의 과거 데이터 검색은 불가능하다. 따라서 본 연구에서는 단기적, 실시간으로 검색하는 경우에는 Twitter의 Streaming API를 이용하였으며, 과거 데이터를 검색하여야 하는 경우에는 검색 속도는 비교적 느리지만, R 언어의 RSelenium package (Harrison and Harrison, 2014)를 사용하여 Twitter의 Advanced Search 기능을 자동화함으로써 데이터를 취합하였다.

Twitter 메시지를 취합하는데 있어 본 연구에서는 Robot이나 Android, Humanoid 등과 같은 통칭(popular name)이 아닌 'Geminoid', 'Chihira Aico', 'AlphaGo' 등 특정한 Android나 AI를 지칭하는 고유명사를 영어, 일본어, 한국어로 표기하여 검색하였다. 이는 Robot이나 Android, Humanoid 등과 같은 통칭이 SNS 상에서 광범위하고 다양하게 사용되어, 검색 키워드로 이용하기에는 부적절한 것으로 판단되었기 때문이다. 예를 들어 Android 키워드로 검색할 경우, 검색된 결과는 스마트폰 OS를 의미하는 메시지가 대부분이며, Humanoid는 독일 락밴드가 발표한 음반의 이름으로 이용되는 등, 연구의 목적에 맞는, 즉 'Robot, Android'에 대한 인식과 감성을 드러내는 메시지는 찾아보기 힘들다.

Geminoid는 일본의 로봇 공학자 Hiroshi Ishiguro가 본인을 포함한 실제 인물과 동일한 외모로 제작한 Android인데, Toshiba사가 개발한 Chihira Aico와 함께 인간과 흡사한 외형으로 인해 일본뿐만 아니라 전세계적으로 Uncanny Valley에 관련된 논의를 불러 일으키고 있다(Figure 2). AlphaGo는 인간의 고유영역이라 알려져 있던 바둑에서 인간을 넘어서는 기량을 보여줌으로써, 인공지능(AI)의 시대가 도래하고 있음을 보여준 구글의 기계학습 시스템으로써, 2016년 3월 이후, 다양한 매체의 주목을 받고 있다.

이러한 고유한 키워드 이외에 임의의 키워드(영어, 일본어, 한국어)가 포함된 tweet을 동일한 기간 동안 취합하여 긍정/부정 평가를 시행하였다. Kim and Jang (2016)의 연구에 따르면, SNS에 표현된 감성(긍정/부정)은 언어권에 따라 1년 이상의 오랜 기간에 걸쳐 유의한 차이를 보이는 것으로 나타났으며, 따라서 본 연구에서 취합 평가한 tweet의 감성 차이가 언어권에 따른 기본적인 차이인지, 그 대상(Android)에서 기인한 것인지를 검증할 필요가 있다.

Figure 2. Geminoid (Aaron, 2011), Chihira Aico (BRIC Plus, 2015) and AlphaGo vs Lee Sedol (David, 2016)

2.4 Sentiment analysis

최근 Bigdata와 관련된 social media 분석 및 감성평가에서는 자동화된 소프트웨어를 이용한 평가가 많이 이용되고 있다. 영어의 경우에는 분석결과의 정확도(인간의 감성평가와 일치도)가 받아들일 만한 일정 수준에 도달하여, 상업용 SW 뿐만 아니라 SentiStrength와 같은 Open source 기반의 시스템들도 다양한 연구에 활용된다(SentiStrength, 2016). 하지만, 일본어와 한국어 감성분석의 경우에는 인간의 감성평가와 일치도가 높은 것으로 널리 인정된 시스템은 아직까지 찾아 보기 힘들다. 본 연구에서 취합된 메시지들을 대상으로, 일본어와 한국어 상업용 및 Open source 기반의 감성분석 시스템 2~3가지를 테스트해 본 결과, 인간의 감성평가와 일치하는 비율이 모두 60% 미만인 것으로 나타났다. 메시지에 대한 감성을 평가하는 것이므로, 정답이 정해진 것이 아니며, 사람에 따라 메시지를 보고 느끼는 감성이 다를 수 있지만, 테스트 결과, 이러한 감성분석 시스템들은 본 연구에 활용하기에는 부적합한 것으로 판단하였다.

본 연구에서 취합된 메시지는 개수는 각 언어당 1만개 미만인 것으로 파악되어, SW 시스템이 아닌 인간평가자에 의해서도 분석이 가능할 것으로 생각되었으며, 이에 따라 모든 메시지를 세 명의 인간평가자가 나누어 평가하도록 하였다. 평가 전에 평가 가이드라인을 평가자들에게 제시하여, 동일한 기준에서 평가가 이루어지도록 하였으며, 취합된 메시지 중 일부를 추출, 세 명의 평가자로 하여금 평가하도록 하고, 일치도를 분석하여, 평가자들 간 신뢰성을 확인하였다.

3. Results

3.1 Inter-rater reliability

세 명의 평가자가 메시지 긍정/부정 평가 시, 어느 정도 일치되는 평가를 내리는 지를 파악하기 위하여, 취합된 트위터 메시지 중 200개를 임의로 추출하고 평가자들에게 평가하도록 하였다. 메시지는 긍정/부정 또는 중립(해당사항 없음) 세 가지 범주로 구분하도록 하였으며, 평가자 간 신뢰성(Inter-rater reliability)은 Fleiss' κ 통계치로 측정하였다. 통계치 계산에는 R의 irr package (Gamer et al., 2012)를 이용하였으며, 계산된 Fleiss' κ 값은 0.752인 것으로 나타났다. Fleiss' κ이 어느 정도이어야 한다는 통일된 기준은 아직 존재하지 않는 것을 알려져 있지만, Landis and Koch (1977)의 기준(Table 1)에 의하면 세 명의 평가자 간에 실질적 일치(substantial agreement)가 이루어 지는 것으로 판단된다.

< 0

Poor agreement

0.01 ~ 0.20

Slight agreement

0.21 ~ 0.40

Fair agreement

0.41 ~ 0.60

Moderate agreement

0.61 ~ 0.80

Substantial agreement

0.81 ~ 1.00

Almost perfect agreement

Table 1. Interpretation of Fleiss' κ value (Landis and Koch, 1977)

3.2 Collection and analysis of tweets

키워드 별로 수집된 tweet의 개수와 인간평가자에 의해 평가된 tweet 개수는 Table 2와 같다. 'Geminoid'와 'Chihira Aico'는 매스컴에 소개되기 시작한 2008년 6월과 2015년 1월부터 2015년 9월까지 각 키워드(영어, 일본어, 한국어)가 포함된 tweet을 검색, 수집하였다. AlphaGo 관련 tweet은 한국의 프로기사 이세돌 9단과 대국(Google DeepMind Challenge Match)이 이루어진 2016년 3월 9일~19일까지 tweeter streaming API를 이용하여 155,991개를 취합하였다. 그리고 취합된 tweet 중 영어, 일본어, 한국어 별로 각각 3,000개를 임의로 추출하여 긍정/부정 및 중립(해당사항 없을 경우 포함) 중 하나로 평가하도록 하였다. 이러한 세 개 키워드 이외에 2008년 3월부터 2016년 3월까지 임의의 트윗을 영어, 일본어, 한국어 별로 총 124,469개를 취합하고, 기간내 일별로 2개의 tweet을 임의로 선택, 인간평가자들로 하여금 평가하도록 하였다.

3.3 Results of sentiment analysis

감성평가된 트윗들 중 감성(긍정, 부정)이 포함된 트윗으로 분류된 비율은 Table 2와 같으며, 키워드와 언어에 따라 차이가 있지만, 평균 29.7%인 것으로 나타났다. 특정 키워드를 포함한 tweet이라도, 광고, 스팸(spam) 및 URL에 대한 정보만을 전달하는 tweet 등 중립으로 분류되는 tweet들의 수가 시기와 경우에 따라 변동이 크기 때문에, 이 비율만으로 특정한 언어와 키워드에 대한 감성적, 감정적인 반응 비율이 '높다', '낮다'고 단정 짓기는 어렵다. 하지만, 감성이 포함된 트윗 내의 긍정과 부정 비율을 비교하면, 특정 키워드 대상에 대한 언어별 긍정적/부정적 정서의 상대적 비교는 가능하다. Figure 3은 각 언어별로 Geminoid, Chihira Aico, AlphaGo 및 임의의 tweet에 대 한 긍정과 부정평가의 비율을 나타낸 것이다. Table 3는 각 키워드 및 언어 간 차이를 비교하기 위해 실시한 Pearson's Chi-squared test 및 Fisher's exact test 결과 p-value 값들을 나타낸 것이며, Figure 3에도 일부 결과(각 평가대상 내의 언어권 별 비교)를 표시하였다.

Keyword

Geminoid

Chihira Aico

AlphaGo

random

Period

Jun-08 ~ Sep-15

Jan-15 ~ Sep-15

9-Mar-16 ~ 19-Mar-16

Mar-08 ~ Mar-16

Language

English

Japanese

Korean

English

Japanese

English

Japanese

Korean

English

Japanese

Korean

Number of
tweets collected

2,250

3,979

31

78

161

87,486

38,180

30,325

69,094

27,721

27,553

Number of
tweets tested

2,250

3,979

31

78

161

3,000

3,000

3,000

2,928

2,928

2,920

Number of tweets
with sentiment

758

965

10

22

128

864

746

281

1,276

1,079

1,080

Ratio of tweets
with sentiment

33.7%

24.3%

32.3%

28.2%

79.5%

28.8%

24.9%

9.4%

43.6%

36.9%

37.0%

Table 2. Number of tweets collected and tested

Figure 3에서 볼 수 있는 것처럼, Geminoid에 대해 영어권 twitter 사용자들은 일본어 사용자들에 비해 유의수준 0.001에서 통계적으로 더 부정적인 표현을 많이(부정 55.9%) 사용한 것으로 나타났다. 임의의 tweet에 대한 긍정/부정 비율과 비교했을 때에도, 영어 사용자는 임의의 일반적(평균적)인 대상에 비해 Geminoid를 더 부정적으로, 일본어 사용자는 더 긍정적(긍정 65.7%)으로 표현하였다(p<0.01). 한국어 사용자의 경우에는 긍정적/부정적 표현 비율이 다른 언어권과 임의의 tweet에 대한 비율에 비해 통계적으로 유의한 차이를 보이지는 않았다.

Figure 3. The negative and positive ratio of tweets with keywords Geminoid, Chihira Aico, AlphaGo and randomly collected. *** extremely significant at p < .001; NS - not significant at p ≥ .05

Chihira Aico의 경우에 영어권 사용자들의 부정적인 반응이 더 두드러지는 것으로 관찰된다. 즉, 부정적 tweet의 비율이 임의의 tweet (48.4%)에 비해 유의수준 0.001에서 더 통계적으로 더 높은(95.5%) 것으로 나타났다. 일본어 사용자의 경우에는 Geminoid에 비해서는 통계적으로 긍정적인 반응이 적은(긍정 51.6%) 것으로 나타났으나, 임의의 tweet에 대한 긍정적 반응과 통계적으로 유의한 차이는 관찰되지 않았다. AlphaGo에 대해 영어권 사용자들은 Geminoid, Chihira Aico와는 달리 긍정적인 표현이 많은(긍정 60.8%) 것으로 나타났는데, 임의의 대상에 대한 긍정적 표현(긍정 51.6%)보다 통계적으로 유의하게(p<.001) 많은 것으로 조사되었다. 반대로, 일본어 사용자의 경우에는 Geminoid와 임의의 tweet에 비해 부정적 비율이 높은(부정 57.4%) 것으로 나타났다(p<.001). 한국어 이용자는 Geminoid 및 임의의 tweet에 대한 긍정 비율과 비교하여 통계적으로 유의한 차이는 없는 것으로 나타났다.

 

 

Geminoid

Chihira Aico

AlphaGo

Random

Japanese

Korean

English

Japanese

English

Japanese

Korean

English

Japanese

Korean

Geminoid

English

0.000***

0.756

0.000***

0.000***

0.001**

Japanese

 

0.326

0.002**

0.000***

0.000***

Korean

1.000

0.750

Chihira
Aico

English

0.000***

0.000***

0.000***

Japanese

 

0.074

1.000

0.938

AlphaGo

English

0.000***

0.000***

0.000***

Japanese

 

0.382

0.000***

Korean

0.225

Random

English

0.760

0.000***

Japanese

 

0.000***

Table 3. The results of Pearson's Chi-squared test and Fisher's exact test (p-value) *** extremely significant at p < .001; ** very significant at p < .01

3.4 Results of text analysis

감성평가된 tweet을 대상으로 text mining 기법을 적용하여, 각 검색 키워드(Geminoid, Chihira Aico, AlphaGo)와 함께 많이 언급된 형용사(adjective)를 빈도 순으로 나타내면 Table 4와 같다. Text 분석에는 Open source 기반의 KH Coder를 이용하였으며, 자주 사용된 상위 10개 형용사를 취합하였다. Geminoid에 대해 영어로 작성된 tweet에서는 'realistic', 'human', 'lifelike'와 같은 긍정 표현과 'creepy', 'uncanny', 'scary' 등과 같은 부정 표현이 자주 이용되었다. 이렇게 긍정/부정 표현에는 형용사가 주로 이용되는데, Geminoid 관련 영어 tweet에서는 'most', 'just', 'very'와 같은 일반적인 부사 이외에 'uncomfortably'라는 부사가 높은 빈도(2번째, 46회)로 언급되었다. 일본어 tweet에서는 주로 'human', 'mobile', 'amazing', 'interesting' 등과 같은 긍정적 표현이 'scary', 'uncanny' 등의 부정적 표현보다 자주 이용된 것으로 나타났다.

Chihira Aico에 대한 영어 트윗의 경우, 취합 평가된 tweet 수는 많지 않지만(n=22), 절반이 넘는 트윗 메시지에 'spooky'라는 표현이 이용되었으며, 'creepy', 'scary' 등과 같은 부정적인 표현이 자주 사용되었다. 이와는 달리, 일본어 트윗에서는 'human', 'real', 'human-like'와 같은 긍정적인 표현이 많이 언급된 것으로 나타났다. AlphaGo가 언급된 tweet들에서는 언어에 상관없이 'human', 'amazing', 'good', 'strong' 등 긍정적으로 평가될 수 있는 형용사들이 주로 사용된 것으로 나타났다

Geminoid

Chihira Aico

AlphaGo

English (n=758)

Japanese (n=965)

English (n=22)

Japanese (n=128)

English (n=864)

Japanese (n=746)

Korean (n=281)

Adjective

Freq
(%)

Adjective

Freq
(%)

Adjective

Freq
(%)

Adjective

Freq
(%)

Adjective

Freq
(%)

Adjective

Freq
(%)

Adjective

Freq
(%)

Realistic

106
(14.0)

Human

145
(15.0)

Spooky

12
(54.5)

Human

55
(43.0)

Human

64
(7.4)

Human

119
(16)

Artificial

48
(17.1)

Creepy

93
(12.3)

Mobile

100
(10.4)

Robotic

8
(36.4)

Real

35
(27.3)

Artificial

28
(3.2)

Artificial

47
(6.3)

Human

43
(15.3)

Human

56
(7.4)

Scary

59
(6.1)

Creepy

3
(13.6)

Human-like

23
(18)

Amazing

25
(2.9)

Good

43
(5.8)

Great

16
(5.7)

Lifelike

42
(5.5)

Amazing

58
(6.0)

Scary

2
(9.1)

Capable

13
(10.2)

Big

23
(2.7)

Strong

37
(5.0)

New

10
(3.6)

Uncanny

36
(4.7)

Interesting

58
(6.0)

Hot

2
(9.1)

Main

13
(10.2)

Interesting

20
(2.3)

Professional

28
(3.8)

Real

10
(3.6)

Real

26
(3.4)

Good

45
(4.7)

Human

2
(9.1)

Realistic

13
(10.2)

Last

19
(2.2)

Different

23
(3.1)

Scary

10
(3.6)

Cool

23
(3.0)

Realistic

44
(4.6)

Lifelike

2
(9.1)

Digital

12
(9.4)

Unusual

17
(2)

Interesting

20
(2.7)

Professional

9
(3.2)

Amazing

17
(2.2)

Active

37
(3.8)

Effective

1
(4.5)

Facial

11
(8.6)

Perfect

16
(1.9)

Last

20
(2.7)

Economic

7
(2.5)

Scary

16
(2.1)

Real

35
(3.6)

Realistic

1
(4.5)

Robotic

8
(6.3)

Divine

14
(1.6)

Top

19
(2.7)

Korean

7
(2.5)

Freaky

14
(1.8)

Uncanny

35
(3.6)

New

1
(4.5)

Female

8
(6.3)

First

14
(1.6)

Bad

18
(2.5)

Same

7
(2.5)

Table 4. The list of adjectives and frequencies (ratio) related with Geminoid, Chihira Aico and AlphaGo
4. Discussion and Conclusion

본 연구에서는 로봇과 Android, 인공지능(AI)에 대해 언어, 문화권 간 인식 차이가 있는지, uncanny valley 현상의 양상이 언어, 문화권에 따라 다르게 나타나는 지를 검증하기 위하여 Geminoid와 Chihira Aico, AlphaGo에 대한 Social data 분석을 실시하였다. Geminoid와 Chihira Aico의 경우, 영어 사용자와 일본어 사용자 간에 유의수준 0.01에서 통계적으로 유의한 차이가 있는 것으로 나타났다. 영어 사용자의 경우 일본어 사용자에 비해 부정적인 표현 비율이 높았으며, 임의의 tweet에 대한 부정 표현 비율보다 높은 것으로 조사되었다. 또한 uncanny valley 현상에서 자주 언급되는 'creepy', 'uncanny', 'scary', 'spooky' 등과 같은 부정적 의미의 형용사와 'uncomfortably'라는 부사가 많이 이용된 것으로 나타났다. 일본어 사용자의 경우에는 영어 사용자와는 달리, 긍정적 반응이 더 많았으며, 임의의 대상에 비해 긍정적인 반응 비율이 더 높은 것으로 나타났다. 감성형용사도 'scary', 'uncanny' 보다 'human', 'amazing', 'good', 'realistic' 등과 같은 긍정적 감성의 형용사가 많이 이용되었다. 즉, 영어권 사용자들은 Geminoid와 Chihira Aico에 대해 일본어 사용자들보다 uncanny valley 현상을 겪는 비율이 더 높은 것으로 생각된다. 이러한 결과는 uncanny valley 현상이 언어, 문화권에 따라 다르게 나타날 수 있으며, uncanny valley 현상의 연구 및 활용에 있어 이러한 언어권 간, 문화권 간 차이를 고려하여야 한다는 것을 보여준다.

AlphaGo에 대한 tweeter 감성 표현은 Geminoid, Chihira Aico에 대한 분석결과와는 다른 양상을 보여준다. 즉, 영어 사용자들의 경우 한국어와 일본어 사용자에 비해 더 긍정적 반응 비율이 높은 것으로 나타났으며, 임의의 tweet 긍정 표현 비율보다 높은 것으로 조사되었다(p<0.01). 일본어 사용자들 또한 Geminoid, Chihira Aico에 대한 반응과 달리, 부정적 표현이 긍정적 표현보다 많았으며, 임의의 tweet 부정 표현 비율보다 높은 것으로 나타났다(p<0.001). 또한 모든 언어에서 부정적인 형용사 어휘보다는 긍정적 형용사 어휘들이 주로 이용된 것으로 관찰되었다. 이는 AlphaGo가 인공지능 시스템으로, Geminoid, Chihira Aico와는 달리 시각적으로 인지할 수 있는 실체가 명확하지 않기 때문에 uncanny valley 현상과 같은 즉각적인 반응 표현이 많지 않았기 때문인 것으로 사료된다. Tweet의 내용들도 Geminoid나 Chihira Aico에 대한 tweet 처럼 감성적, 감정적으로 평가 가능한 경우는 찾아보기 쉽지 않으며, 주로 AlphaGo를 응원, 지지하거나 승패에 관련된 내용이 긍정/부정 평가의 상당부분을 차지하고 있다. 특히 Geminoid나 Chihira Aico와는 달리 tweet 메시지 취합이 이세돌 9단과의 대국이 이루어지는 단기간에 이루어 졌으며, 서양 대 동양, 인간고수 대 인공지능, 첨단기술 대 전통 등 다양한 대결구도로 이루어진 게임에서 AlphaGo가 승리함에 따라 이에 대한 반응들이 tweeter에 주로 표출된 것으로 보인다. 따라서, AlphaGo 관련 tweet에 나타난 긍정/부정 감성은 인공지능이나 기계학습에 대한 기본적 인식의 차이 뿐만 아니라 이슈화된 게임의 승패에 따른 감성, 감정 표현이 복합된 것이라고 보는 것이 타당할 것이다. 추후, tweeter를 포함, 다양한 SNS를 대상으로, 장기간에 걸쳐 social data를 취합 분석한다면 인공지능 및 기계학습에 대한 기본적인 인식의 차이가 좀더 명확하게 검증 가능할 것으로 생각된다.



References


1. Aaron, S., Robot Replicants Gather with Their Originals In World's Creepiest Reunion (video), SingularityHUB, 2011, http:// singularityhub.com/2011/04/06/robot-replicants-g7ather-with-their-originals-in-worlds-creepiest-reunion-video/ (retrieved June 19, 2016).
Crossref 

2. BRIC Plus, Meet Chihira Aico: The World's First Female Humanoid, BRIC+, 2015, http://www.bricplusnews.com/affairs/meet-chihira-aico-the-humanoid/ (retrieved June 19, 2016).
Crossref 

3. Burleigh, T.J., Schoenherr, J.R. and Lacroix, G.L., Does the uncanny valley exist? An empirical test of the relationship between eeriness and the human likeness of digitally created faces. Computers in Human Behavior, 29(3), 759-771, 2013.
Crossref  Google Scholar 

4. Choi, C.H., Jang, P.S. and Seo, M.S., Digital Design Process of Marine Leisure Boat Using Human Sensibility Evaluation, Journal of the Ergonomic Society of Korea, 29(4), 693-699, 2010.
Crossref  Google Scholar 

5. David, S., Deep Reinforcement Learning, Google Deep Mind Official Blog, 2016, https://deepmind.com/blog (retrieved June 19, 2016).
Crossref 

6. Gamer, M., Lemon, J., Fellows, I. and Singh, P., irr: Various coefficients of interrater reliability and agreement. R package version 0.84, 2012.
Crossref 

7. Harrison, J. and Harrison, M.J., Package 'RSelenium', 2014, http://johndharrison.github.io/RSOCRUG/#1 (retrieved June 19, 2016).
Crossref 

8. Ishiguro, H., ATR Homepage, http://www.geminoid.jp/en/index.html (retrieved June 19, 2016).
Crossref 

9. Jang, P.S., An Experimental Approach to Uncanny Valley Hypothesis. Journal of the Ergonomics Society of Korea, 26(1), 47-53, 2007.
Crossref  Google Scholar 

10. Jung, K.T., Sensibility and Preference Evaluation for Character Design, Journal of the Ergonomics Society of Korea, 26(1), 63-69, 2007.
Crossref  Google Scholar 

11. Jang, P.S., Jung, W.H. and Hyun, J.S., Effect of Abstraction and Realism on Uncanny Valley in 3D Character Model. The Journal of Digital Convergence, 14(10), 277-285, 2016.
Crossref 

12. Kelly, K., Beyond the Uncanny Valley, The Technium, 2012, http://kk.org/thetechnium/archives/2012/01/beyond_the_unca.php (retrieved June 19, 2016).
Crossref 

13. Kim, D.G., Kim, H.Y., Kim, G.Y, Jang, P.S., Jung, W.H. and Hyun, J.S., Exploratory Understanding of the Uncanny Valley Phenomena Based on Event-Related Potential Measurement, Korean Journal of the Science of Emotion and Sensibility, 19(1), 95-110, 2016.
Crossref 

14. Kim, H.H. and Jang, P.S., Differences in Sentiment on SNS: Comparison among Six Languages. Journal of Digital Convergence, 14(3), 165-170, 2016.
Crossref  Google Scholar 

15. Landis, J.R. and Koch, G.G., The measurement of observer agreement for categorical data. Biometrics, 159-174, 1977.
Crossref  Google Scholar  PubMed 

16. Masahiro, M., The Buddha in the Robot: A Robot Engineer's Thoughts on Science and Religion, 1989.
Crossref 

17. MacDorman, K.F., Androids as an experimental apparatus: Why is there an uncanny valley and can we exploit it. In CogSci-2005 Workshop: Toward Social Mechanisms of Android Science (pp. 106-118), 2005.
Crossref  Google Scholar 

18. MacDorman, K.F., Vasudevan, S.K. and Ho, C.C., Does Japan really have robot mania? Comparing attitudes by implicit and explicit measures. AI & Society, 23(4), 485-510, 2009.
Crossref  Google Scholar 

19. McCurry, J., South Korean woman's hair 'eaten' by robot vacuum cleaner as she slept. The Guardian, 2015, https:// www.theguardian.com/world/2015/feb/09/south-korean-womans-hair-eaten-by-robot-vacuum-cleaner-as-she-slept (retrieved June 19, 2016).
Crossref 

20. Mori, M., Bukimi no tani [The uncanny valley]. Energy, 7(4), 33-35, 1970. (Translated by Karl F. MacDorman and Takashi Minato in 2005) within Appendix B for the paper Androids as an Experimental Apparatus: Why is there an uncanny and can we exploit it?. In Proceedings of the CogSci-2005 Workshop: Toward Social Mechanisms of Android Science (pp. 106-118), 2005.
Crossref 

21. Rundle, M., South Korean Woman's Hair 'Eaten' By Robot Vacuum Cleaner. Huffpost Tech, 2015, http://www.huffingtonpost.co.uk /2015/02/09/robot-vacuum-cleaner-hair_n_6643640.html (retrieved June 19, 2016).
Crossref 

22. Saygin, A.P., Chaminade, T., Ishiguro, H., Driver, J. and Frith, C., The thing that should not be: predictive coding and the uncanny valley in perceiving human and humanoid robot actions. Social Cognitive and Affective Neuroscience (2011): nsr025.
Crossref  Google Scholar 

23. SentiStrength Homepage, About SentiStrength, 2016, http://sentistrength.wlv.ac.uk/#About (retrieved June 19, 2016).
Crossref 

24. Singer, P.W., Wired for war: The robotics revolution and conflict in the 21st century. Penguin, 2009.
Crossref  Google Scholar 

25. Statista Inc., Number of monthly active Twitter users worldwide from 1st quarter 2010 to 1st quarter 2016 (in millions), Statista, http://www.statista.com/statistics/282087/number-of-monthly-active-twitter-users/ (retrieved June 19, 2016).
Crossref 

26. Steckenfinger, S.A. and Ghazanfar, A.A., Monkey visual behavior falls into the uncanny valley. Proceedings of the National Academy of Sciences, 106(43), 18362-18366, 2009.
Crossref  Google Scholar 

27. Stevens, D., Tintin, So So. Slate, 2011, http://www.slate.com/articles/arts/movies/2011/12/adventures_of_tintin_review_spielberg_s_- motion_capture_adventure_has_its_charms_but_it_s_no_raiders_.html (retrieved June 19, 2016).
Crossref 

28. Twitter, Inc., The Streaming APIs Overview, 2016, https://dev.twitter.com/streaming/overview (retrieved June 19, 2016).
Crossref 

PIDS App ServiceClick here!

Download this article