[ Article ]

Journal of Digital Contents Society - Vol. 27, No. 3, pp.715-724

ISSN: 1598-2009 (Print) 2287-738X (Online)

Print publication date 31 Mar 2026

Received 13 Jan 2026 Revised 02 Feb 2026 Accepted 06 Feb 2026

DOI: https://doi.org/10.9728/dcs.2026.27.3.715

버추얼 휴먼 상호작용에서 침묵의 사회적 해석에 관한 연구: 침묵의 길이와 의도성 신호의 효과를 중심으로

강지영^*

이화여자대학교 커뮤니케이션·미디어학부 교수

A Study on the Social Interpretation of Silence in Virtual Human Interaction: Focusing on the Effects of Silence Duration and Intentionality Cues

Jiyoung Kang^*

Professor, Division of Communication & Media, Ewha Womans University, Seoul 03760, Korea

Correspondence to: ^*Jiyoung Kang Tel: +82-2-3277-2266 E-mail: kangjiyoung@ewha.ac.kr

Copyright ⓒ 2026 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

초록

본 연구는 버추얼 휴먼과의 상호작용에서 침묵이 언제 의미 있는 요소로 작용하는지를 규명하기 위해, 침묵의 길이와 의도성 신호가 사용자 경험에 미치는 영향을 실험적으로 분석하였다. 2×2 집단 간 실험 설계(N=146)를 적용하여 침묵의 길이(짧은 침묵: 3초vs. 긴 침묵: 7초)와 침묵 이전에 제공되는 의도성 신호의 유무를 조작하였다. 분석 결과, 긴 침묵은 사용자의 불안과 사회적 긴장을 유의하게 증가시킨 반면, 의도성 신호는 인간다움 지각과 몰입을 유의하게 향상시키는 효과를 보였다. 또한 긴 침묵 조건에서 의도성 신호가 제공될 경우, 부정적 정서 반응이 완화되고 사용자 인식이 긍정적으로 전환되는 상호작용 효과가 확인되었다. 이러한 결과는 버추얼 휴먼 상호작용에서 침묵을 단순한 기술적 지연이 아닌, 맥락에 따라 해석되는 상호작용 요소로 이해할 필요성을 제시하며, 버추얼 휴먼 인터랙션을 과정 중심적으로 설계해야 할 중요성을 시사한다.

Abstract

This study investigates the conditions under which silence becomes meaningful in interactions with virtual humans by examining the effects of silence duration, silence length, and intentionality cues on user experience. Using a 2 × 2 between-subjects experimental design (N = 146), the study manipulated silence duration (short: 3 seconds vs. long: 7 seconds) and the intentionality cue presented prior to the silence. The results show that longer silence significantly increased users’ anxiety and social tension, while the presence of an intentionality cue enhanced perceived humanness and immersion. Moreover, a significant interaction effect was observed: under long silence conditions, intentionality cues mitigated negative emotional responses and improved user perceptions. These findings suggest that silence in virtual human interactions should not be treated merely as a technical delay, but as an interpretable interactional element whose meaning depends on contextual framing. By conceptualizing silence as a socially interpreted unit rather than a system error, this study contributes to a process-oriented understanding of virtual human interaction design.

Keywords:

Virtual Human, Silence, Intentionality Cue, Expectancy Violation, Immersion

키워드:

디지털 휴먼, 침묵, 의도성 신호, 기대 위반, 몰입

Ⅰ. 서 론

생성형 인공지능과 실감미디어 기술의 발전으로 버추얼 휴먼(virtual human)은 더 이상 단순한 시각적 캐릭터나 정보 전달 도구에 머물지 않고, 사용자와 사회적·정서적 상호작용을 수행하는 커뮤니케이션 주체로 자리 잡고 있다. 최근 연구들은 버추얼 휴먼이 세계관 서사와 정서적 설정을 매개로 팬덤 형성 및 관계적 수용을 유도할 수 있음을 보여주며, 이를 허구적 세계관 수용과 팬 경험의 관점에서 설명해 왔다[1],[2]. 이러한 논의의 이론적 토대에는 미디어 수용자가 매체 속 존재를 실제 사회적 타자처럼 인식하고 관계를 형성한다는 의사사회적 상호작용(parasocial interaction) 개념이 자리하고 있다[3]. 이후 의사사회적 상호작용은 소셜미디어 환경으로 확장되어, 반복적 노출과 친밀한 커뮤니케이션을 통해 관계적 유대와 몰입을 강화하는 메커니즘으로 논의되어 왔다[4].

사용자 경험 연구에서는 몰입(immersion)이 디지털 콘텐츠 수용의 핵심 결과 변수로 자리해 왔으며, 주의 집중과 정서적 관여를 설명하는 개념으로 체계화되었다[5]. 디지털 팬덤 연구 역시 감정 표현과 몰입 메커니즘을 중심으로, 사용자가 콘텐츠와 정서적으로 연결되는 과정을 분석해 왔다[6].

이러한 흐름 속에서 최근 연구들은 버추얼 휴먼이나 대화형 에이전트가 인간과 유사한 언어 스타일과 개인화된 상호작용을 제공할 때, 사용자와의 관계 인식과 친밀감이 강화될 수 있음을 보고하였다[7]. 또한 의사사회적 상호작용에 대한 종합적 검토 연구는, 이러한 관계가 단순한 노출 효과를 넘어 지속적 상호작용과 정서적 유대를 통해 형성된다는 점을 강조한다[8]. 나아가 게임 및 인터랙티브 미디어 맥락에서 몰입 경험은 사용자가 매개 환경에 깊이 관여하는 상태를 설명하는 핵심 개념으로 발전해 왔으며[9], 메타버스 및 아바타 연구에서도 아바타의 인간 유사성이 사용자–아바타 관계 형성과 정서적 몰입에 유의미한 영향을 미치는 요인으로 보고되었다[10].

그러나 이러한 선행연구들은 공통적으로 버추얼 휴먼이 “무엇을 어떻게 말하는가”에 분석의 초점을 두는 경향을 보인다. 즉, 발화 내용의 적절성, 언어적 인간다움, 감정 표현의 풍부함은 활발히 논의되어 왔으나, 발화와 발화 사이에 발생하는 시간적 공백, 다시 말해 “언제 말하지 않는가”에 대한 논의는 상대적으로 부족하였다. 이는 버추얼 휴먼 상호작용을 여전히 언어 중심의 정보 전달 과정으로 이해해 온 기존 접근의 한계를 보여준다.

하지만 인간 커뮤니케이션에서 의미는 발화 그 자체에만 존재하지 않는다. 대화의 흐름 속에서 타이밍, 머뭇거림, 침묵과 같은 시간적 단서는 상대의 의도와 관계적 태도를 해석하는 중요한 사회적 신호로 기능한다. 짧은 침묵은 사고 과정이나 사려 깊은 숙고로 해석될 수 있는 반면, 상대적으로 긴 침묵은 무시, 회피, 관계적 긴장, 혹은 상호작용 실패로 인식될 가능성을 내포한다. 즉, 침묵은 발화의 부재가 아니라 해석을 요구하는 커뮤니케이션 요소라고 할 수 있다.

버추얼 휴먼과의 상호작용에서도 사용자들은 인간 대화에서 형성된 이러한 기대와 규범을 그대로 적용한다. 동일한 침묵이라 하더라도 사용자는 이를 사려 깊은 반응으로 해석할 수도 있고, 기술적 오류나 시스템 지연의 결과로 해석할 수도 있다. 특히 버추얼 휴먼은 인간과 기계의 경계에 위치한 존재이기 때문에, 침묵은 더욱 쉽게 사회적 의미와 기술적 결함 사이에서 모호하게 해석될 가능성이 높다. 그럼에도 불구하고 기존 버추얼 휴먼 및 대화형 에이전트 연구에서 침묵이나 응답 지연은 주로 시스템 성능, 처리 속도, 혹은 상호작용 효율성의 관점에서 다루어져 왔다[11],[12]. 다수의 연구는 응답 지연을 통제해야 할 기술적 변수로 설정하거나, 지연의 유무가 사용자 만족도나 사용성 평가에 미치는 영향을 부차적으로 검토하는 데 그쳤다. 이러한 접근에서는 침묵이 사용자의 해석 대상이 되는 사회적 신호로 기능할 가능성보다는, 상호작용의 원활성을 저해하는 결함 변수로 간주되는 경향이 강했다.

이에 본 연구는 버추얼 휴먼 상호작용에서 발생하는 침묵을 기술적 지연이 아닌 사회적 신호로 재개념화하고자 한다. 구체적으로 침묵의 길이(짧은 침묵vs. 긴 침묵)와 침묵 이전에 제공되는 의도성 신호를 조작하여, 사용자가 침묵을 어떻게 해석하는지, 그리고 이러한 해석이 불안, 사회적 긴장, 인간다움 지각, 몰입에 어떠한 차이를 유발하는지를 실험적으로 검증하고자 한다는 점에서 기존 연구와 분석적 접근을 달리한다.

본 연구는 버추얼 휴먼 연구를 외형·언어 중심 접근에서 벗어나 타이밍과 공백의 커뮤니케이션 기능으로 확장함으로써, 사용자 수용 메커니즘을 보다 과정 중심적으로 설명하고, 침묵을 오류가 아닌 의미화 가능한 설계 요소로 재해석하는 데 그 의의가 있다.

Ⅱ. 이론적 배경

2-1 버추얼 휴먼과 사회적 단서

버추얼 휴먼은 인간의 외형과 언어적 특성을 기반으로 사용자와 상호작용하는 디지털 존재로서, 단순한 정보 제공 도구를 넘어 사회적 단서를 해석하게 만드는 커뮤니케이션 대상으로 인식될 수 있다. 미디어 수용자가 컴퓨터나 디지털 매개체를 실제 사회적 존재처럼 대하는 현상은, 사람들이 매체를 현실의 사람이나 장소와 유사하게 인식한다는 미디어 방정식(media equation) 논의를 통해서도 설명될 수 있다[13].

이러한 관점은 초기 인터랙티브 버추얼 휴먼 연구에서도 확인되는데, 가상 인간의 외형, 언어, 행동 요소가 결합될 때 사용자는 이를 단순한 시스템이 아닌 상호작용적 사회 행위자로 인식하게 된다고 보고되었다[14]. 즉, 버추얼 휴먼은 개별 요소의 집합이 아니라, 다양한 사회적 신호가 통합적으로 작동하는 상호작용 주체로 이해될 수 있다.

최근 생성형 인공지능과 대화형 에이전트 연구의 확산은 이러한 논의를 더욱 확장시키며, 버추얼 휴먼을 고정된 특성의 집합이 아닌 상호작용 과정 속에서 사회적 의미가 구성되는 존재로 재개념화하고 있다. 2020년대 이후 인간–컴퓨터 상호작용(HCI) 연구들은 사용자가 외형이나 언어 표현뿐 아니라, 응답의 리듬, 반응 속도, 대화의 흐름과 같은 시간적 단서를 통해서도 상대를 사회적 행위자로 해석한다는 점을 강조하고 있다[15],[16].

선행연구들은 나아가 버추얼 휴먼이나 대화형 에이전트가 인간과 유사한 외형, 언어적 표현, 정서적 반응을 제공할 경우, 사용자가 사회적 존재감을 지각하고 상호작용에 대한 몰입을 경험할 가능성이 높아진다고 보고해 왔다[4],[7],[10],[17]. 이러한 결과는 버추얼 휴먼 상호작용이 단순한 정보 교환을 넘어, 사회적 신호를 해석하고 관계적 의미를 구성하는 커뮤니케이션 과정임을 시사한다.

그러나 기존 연구에서 사회적 단서는 주로 외형, 발화 내용, 표현 방식과 같은 가시적·언어적 요소에 집중되어 왔으며, 대화의 흐름 속에서 드러나는 시간적 단서—예컨대 반응의 타이밍이나 공백—에 대한 체계적 논의는 상대적으로 제한적이었다. 그 결과, 버추얼 휴먼 상호작용을 구성하는 핵심 요소 중 하나인 반응의 타이밍과 대화의 공백은 충분히 연구되지 못한 채 남아 있다.

2-2 침묵과 타이밍의 커뮤니케이션 기능

인간 커뮤니케이션에서 의미는 발화 내용에만 국한되지 않는다. 대화의 흐름 속에서 타이밍, 머뭇거림, 침묵과 같은 시간적 요소는 상대의 의도와 태도를 해석하는 중요한 단서로 기능한다. 대화분석 연구에 따르면 발화 교대(turn-taking)는 정교한 시간적 규범에 의해 조직되며, 침묵의 길이와 발생 위치는 상호작용이 원활하게 진행되고 있는지, 혹은 긴장이 형성되고 있는지를 판단하는 기준으로 작용한다[18],[19].

일반적으로 짧은 침묵은 발화 준비나 사고 과정으로 해석될 수 있는 반면, 상대적으로 긴 침묵은 대화 규범의 위반으로 인식되어 어색함이나 불안을 유발할 가능성이 높다. 이처럼 침묵은 단순한 발화의 부재가 아니라, 상황 맥락과 상호작용 기대에 따라 서로 다른 의미로 해석되는 사회적 사건이라 할 수 있다.

이러한 논의는 디지털 매개 환경에서도 유사하게 적용될 수 있다. 특히 최근 생성형 AI와 대화형 에이전트가 일상적 커뮤니케이션 주체로 등장하면서, 응답의 즉시성보다는 인간 대화에서 관찰되는 시간적 리듬의 재현이 상호작용 품질에 중요한 설계 요소로 주목받고 있다. 최근 인간–컴퓨터 상호작용 연구들은 응답 지연이 항상 부정적인 결과를 초래하는 것은 아니며, 인간적인 리듬을 반영한 반응 지연은 오히려 상호작용의 자연스러움과 신뢰를 높일 수 있음을 보고하고 있다[20]. 이는 침묵이나 대화의 공백이 제거해야 할 결함이 아니라, 설계 방식에 따라 의미를 획득할 수 있는 상호작용 자원으로 기능할 가능성을 시사한다.

그러나 이러한 연구들은 주로 챗봇이나 인터페이스 중심의 맥락에 한정되어 있으며, 인간과 유사한 정체성과 사회적 기대를 동반하는 버추얼 휴먼 상호작용에서 침묵이 어떻게 해석되는지에 대한 실증적 논의는 아직 충분히 이루어지지 않았다. 특히 동일한 침묵이라 하더라도, 사용자가 이를 사려 깊은 반응으로 해석하는지 혹은 상호작용 실패로 인식하는지는 사용자가 형성한 기대와 그 기대를 조정하는 단서에 따라 달라질 가능성이 있다.

2-3 기대 위반과 의도성 신호

상호작용 상황에서 사용자는 상대의 반응 방식과 타이밍에 대해 일정한 기대를 형성한다. 기대 위반 이론(expectancy violation theory)에 따르면, 이러한 기대가 충족되지 않을 경우 사용자는 해당 행동을 재해석하고 평가하게 되며, 그 결과는 제공되는 맥락과 해석 단서에 따라 긍정적 또는 부정적으로 나타날 수 있다[21]. 이때 기대 위반은 그 자체로 부정적 반응을 유발하기도 하지만, 동시에 의미 재구성의 계기로 작용할 수 있다. 특히 인간과 유사한 대상일수록 상호작용 기대 수준이 높아지기 때문에, 기대가 위반될 경우 불안이나 거부감과 같은 정서적 반응이 더욱 증폭될 가능성이 크다[10],[22].

버추얼 휴먼과의 상호작용에서도 사용자는 인간 대화에서 학습된 응답 타이밍과 반응성을 그대로 기대하며, 이러한 기대가 충족되지 않을 경우 침묵이나 반응 지연을 부정적으로 해석할 가능성이 있다. 그러나 침묵 이전이나 도중에 의도성 신호(intentionality cue)가 제공될 경우, 사용자는 동일한 침묵을 무시나 기술적 오류가 아닌 사려 깊은 숙고의 결과로 재해석할 가능성이 높아진다. 이는 상대의 행동을 의도된 사회적 행위로 이해하도록 돕는 해석 프레임으로 작용하며, 사용자 정서 반응의 방향을 전환시키는 역할을 한다[7],[23].

이러한 관점에서 침묵의 효과는 침묵의 길이 그 자체에 의해 자동적으로 결정되기보다는, 사용자가 해당 침묵을 어떠한 의도와 맥락 속에서 이해하는지에 따라 달라질 수 있다. 즉, 침묵은 기대 위반을 유발하는 단서가 될 수도 있지만, 동시에 적절한 해석 단서가 제공될 경우 기대를 재조정하는 계기로 기능할 수 있다. 이처럼 침묵의 사회적 의미는 침묵의 길이와 이를 해석하도록 유도하는 의도성 신호의 결합 속에서 형성된다.

2-4 침묵의 재개념화

앞선 논의에서 살펴본 바와 같이, 선행연구들은 버추얼 휴먼을 사회적 단서에 기반해 해석되는 커뮤니케이션 대상으로 이해해 왔으며, 인간 커뮤니케이션에서 침묵과 타이밍이 상호작용의 의미를 구성하는 중요한 요소임을 제시해 왔다. 또한 기대 위반 이론은 상호작용 과정에서 형성된 기대가 위반될 경우, 사용자가 제공된 단서와 맥락을 바탕으로 상황을 재해석한다는 점을 강조한다.

그러나 버추얼 휴먼 상호작용을 대상으로 한 기존 연구에서는 침묵을 주로 기술적 지연이나 시스템 성능의 문제로 다루어 왔으며, 침묵이 어떠한 조건에서 사회적 의미를 획득하는지에 대한 경험적 검증은 제한적이었다. 특히 침묵의 길이와 침묵에 대한 해석을 유도하는 단서를 결합하여 사용자 반응을 분석한 실험적 접근은 충분히 연구되지 않았다. 그 결과, 침묵은 상호작용의 의미를 구성하는 요소라기보다 통제되어야 할 변수로 처리되는 경향을 보여 왔다.

이에 본 연구는 버추얼 휴먼 상호작용에서 발생하는 침묵을 기술적 결함이 아닌 사회적 해석의 대상으로 재개념화하고, 침묵의 길이와 침묵 이전에 제공되는 의도성 신호를 ‘침묵 해석을 조정하는 메커니즘’으로 개념화하여 사용자 반응을 검증하고자 한다. 기존 연구에서 의도성 단서가 주로 행위자의 마음이나 의도를 귀속시키는 신호로 논의되어 왔다면, 본 연구에서의 의도성 신호는 기대 위반 상황에서 발생한 침묵이라는 모호한 사건의 의미를 재구성하도록 유도하는 해석 프레임으로 기능한다는 점에서 기존 논의를 확장한다. 즉, 본 연구는 의도성 신호를 독립적인 사회적 단서로 가정하기보다는, 침묵이 어떻게 이해되는지를 매개하는 중간 수준의 상호작용 메커니즘으로 설정한다

구체적으로 본 연구는 침묵의 길이가 동일하더라도, 의도성 신호가 제공될 경우 사용자가 이를 무시나 상호작용 실패가 아닌 사려 깊은 숙고의 결과로 재해석할 가능성이 높아진다는 점에 주목한다. 이는 침묵의 효과가 시간적 길이에 의해 자동적으로 결정되는 것이 아니라, 침묵을 둘러싼 해석 맥락과 기대 조정 신호에 의해 그 의미 방향이 전환될 수 있음을 전제한다. 아울러 본 연구는 이러한 메커니즘이 모든 상호작용 상황에서 동일하게 작동한다고 가정하기보다, 침묵으로 인해 해석의 불확실성이 증폭되는 기대 위반 조건에서 특히 두드러진다는 적용 범위를 전제한다.

이러한 접근은 버추얼 휴먼 연구를 외형과 언어 중심의 논의에서 나아가, 타이밍과 공백을 포함한 상호작용 과정 중심의 커뮤니케이션 연구로 확장한다는 점에서 의의를 지닌다. 나아가 이는 향후 버추얼 휴먼 설계 및 인터랙션 디자인에서 침묵을 제거해야 할 오류가 아니라, 의도적으로 설계되어 사용자 해석을 유도할 수 있는 상호작용 자원으로 고려할 필요성을 제기한다.

Ⅲ. 연구문제 및 가설 설정

앞선 이론적 논의는 버추얼 휴먼 상호작용에서 침묵이 기술적 지연이 아니라 사회적 해석의 대상이 될 수 있으며, 그 효과가 침묵의 길이와 해석을 유도하는 단서에 따라 달라질 수 있음을 시사한다. 이에 본 연구는 버추얼 휴먼과의 상호작용 상황에서 발생하는 침묵을 중심으로, 사용자의 정서적·인지적 반응 차이를 경험적으로 검증하고자 한다.

본 연구의 초점은 침묵 그 자체의 긍·부정 여부를 판단하는 데 있지 않다. 오히려 침묵이 어떤 조건에서 문제로 인식되고, 어떤 조건에서 의미 있는 상호작용으로 해석되는지를 구분하는 데 있다. 이를 위해 본 연구는 침묵의 길이와 침묵 이전에 제공되는 의도성 신호를 핵심 조작 변인으로 설정하였다.

3-1 연구문제

본 연구는 다음의 연구문제를 통해 버추얼 휴먼 상호작용에서 침묵의 해석과 그 효과를 체계적으로 살펴보고자 한다.

RQ1. 버추얼 휴먼과의 상호작용에서 침묵의 길이에 따라 사용자가 지각하는 불안과 사회적 긴장에는 차이가 나타나는가?

RQ2. 침묵 이전에 의도성 신호가 제공되는지 여부에 따라 버추얼 휴먼의 인간다움 지각과 몰입 수준에는 차이가 나타나는가?

RQ3. 침묵의 길이와 의도성 신호는 결합되어, 긴 침묵 상황에서 사용자 반응에 상호작용 효과를 나타내는가?

3-2 가설 설정

연구문제를 실증적으로 검증하기 위해, 본 연구는 침묵의 길이와 의도성 신호를 독립변인으로 설정하고, 사용자의 불안, 사회적 긴장, 인간다움 지각, 몰입을 종속변인으로 설정하여 다음과 같은 가설을 도출하였다. 가설에서는 침묵을 ‘짧은 침묵’과 ‘긴 침묵’이라는 개념적 수준에서 구분한다.

H1. 버추얼 휴먼과의 상호작용에서 긴 침묵은 짧은 침묵에 비해 사용자의 불안과 사회적 긴장을 더 높게 지각하게 할 것이다.

H2. 침묵 이전에 의도성 신호가 제공될 경우, 그렇지 않은 경우보다 버추얼 휴먼의 인간다움 지각과 몰입 수준이 더 높게 나타날 것이다.

H3. 긴 침묵상황에서 의도성 신호가 제공될 경우, 의도성 신호가 제공되지 않은 경우에 비해 (1)사용자의 불안과 사회적 긴장은 낮아지고, (2)버추얼 휴먼의 인간다움 지각과 몰입은 높아질 것이다.

본 연구의 연구문제와 가설은 침묵을 상호작용 실패의 지표로 전제하지 않고, 해석 가능성이 열려 있는 상호작용 단서로 접근한다는 점에서 기존 연구와 차별된다. 특히 침묵의 길이와 의도성 신호를 결합한 분석을 통해, 버추얼 휴먼 상호작용에서 침묵이 어떠한 조건에서 부정적으로 인식되고, 어떠한 조건에서 의미 있는 사회적 행위로 해석되는지를 검증하고자 한다.

Ⅳ. 연구방법

4-1 실험 설계

본 연구는 2×2 집단 간 실험 설계(between-subjects design)를 적용하여 총 146명(N = 146)을 대상으로 실험을 진행하였다. 참여자는 네 가지 실험 조건에 무작위로 배정되었으며, 조건별 표본 수는 약 36–37명 수준으로 균형 있게 구성되었다. 이는 집단 간 평균 차이와 상호작용 효과를 검증하기에 필요한 최소 표본 기준을 충족하는 수준이다.

표본 수의 적절성을 검토하기 위해, 선행연구에서 일반적으로 가정되는 중간 수준의 효과 크기(medium effect size, f = .25)를 기준으로 통계적 검정력을 고려하였다. 유의수준 α = .05, 검정력(power) = .80을 가정할 경우, 2×2 집단 간 분산분석에서 요구되는 최소 표본 수는 약 128명 수준으로 제시된다. 이에 비추어 볼 때, 본 연구에서 확보한 146명의 표본 수는 주효과 및 상호작용 효과를 검증하기에 통계적으로 적절한 수준이라 할 수 있다. 특히 본 연구의 핵심 가설인 침묵 길이와 의도성 신호 간 상호작용 효과(H3)를 검증하는 데 있어서도, 각 조건당 30명 이상이 확보됨으로써 표본 부족으로 인한 검정력 저하 문제를 일정 수준 완화할 수 있다.

4-2 실험 자극 및 조작

1) 버추얼 휴먼 자극

본 연구에서 사용된 버추얼 휴먼은 AI STUDIO PERSO를 활용하여 제작하였다. AI STUDIO PERSO는 텍스트 기반 대화 시나리오를 입력하면 일관된 외형과 언어 스타일을 유지한 버추얼 휴먼 영상을 생성할 수 있는 AI 기반 제작 도구이다. 본 연구의 목적은 버추얼 휴먼의 언어 스타일 차이가 수용자의 인식과 반응에 미치는 영향을 검증하는 데 있으므로, 외형적 단서나 음성 특성과 같은 비언어적 요인의 영향을 최대한 통제하는 것이 중요하였다. AI STUDIO PERSO는 동일한 캐릭터 모델과 음성 설정을 유지한 채 텍스트 시나리오만을 조작할 수 있어, 실험 조건 간 자극의 일관성을 확보하는 데 적합한 도구였다.

Fig. 1.

A virtual human created using AI Studio Perso

또한 실사 배우 영상이나 수작업 기반 3D 캐릭터 제작 방식과 달리, 본 도구는 제작자 개입에 따른 미세한 비언어적 변이를 최소화하고 자극의 재현성을 확보할 수 있다는 점에서, 실험 연구의 자극 통제 요구에 부합한다.

버추얼 휴먼의 외형, 표정, 시선 방향, 음성 톤은 모든 실험 조건에서 동일하게 유지되었으며, 침묵의 길이와 의도성 신호를 제외한 언어적 내용 또한 동일한 스크립트를 사용하였다. 대화 내용은 정서적·관계적 해석을 최소화하기 위해 중립적인 날씨 정보로 구성되었고, 이를 통해 침묵의 길이와 의도성 신호 외의 요인이 사용자 반응에 영향을 미치지 않도록 통제하였다. 이러한 통제를 통해 버추얼 휴먼의 시각적·언어적 특성 차이로 인한 효과를 최소화하고, 본 연구의 핵심 조작 변인인 침묵의 길이와 의도성 신호 제공 여부의 영향을 보다 명확하게 검증하고자 하였다.

2) 침묵 길이 조작

침묵의 길이는 3초(짧은 침묵)와 7초(긴 침묵)의 두 수준으로 조작되었다. 짧은 침묵 조건에서는 사용자의 질문 이후 3초의 반응 공백이 제시되었으며, 긴 침묵 조건에서는 7초의 반응 공백이 제시되었다. 각 조건에서 제시되는 최종 응답 내용은 동일하게 유지되었고, 반응 공백의 시간적 길이만이 조작되도록 설계하였다.

이러한 시간 설정은 인간 커뮤니케이션에서 발화 교대(turn-taking)가 작동하는 시간적 규범에 대한 선행 논의에 근거하였다. 대화분석 연구에 따르면 약 2–3초 이내의 침묵은 발화 준비나 사고 과정으로 자연스럽게 해석될 가능성이 높은 반면, 이 범위를 초과하는 침묵은 대화 규범의 위반으로 인식되어 어색함이나 불안을 유발할 가능성이 증가한다[18],[19]. 특히 약 6–7초 이상의 침묵은 일상적 대화에서 드물게 나타나는 시간 범위로, 상호작용의 중단이나 반응 실패로 해석될 소지가 큰 규범 이탈적 침묵으로 지각될 가능성이 높다[18],[19].

이에 본 연구에서는 사회적으로 허용 가능한 침묵과 규범 이탈적 침묵을 대비시키기 위한 대표적 시간 기준으로 3초와 7초를 각각 짧은 침묵과 긴 침묵의 조작 기준으로 설정하였다.

3) 의도성 신호 조작

의도성 신호는 침묵이 발생하는 상황에서 사용자가 해당 침묵을 사고나 숙고의 과정으로 인식하도록 유도하는 단서로 정의하였다. 본 연구에서는 침묵이 시작되기 직전에, 버추얼 휴먼이 자신의 반응이 사고 과정에 있음을 암시하는 짧은 문장을 제시하는 방식으로 의도성 신호를 조작하였다. 예를 들어, “잠깐 생각해볼게요”와 같은 표현이 제시된 후 침묵이 이어지도록 구성하였다.

반면, 의도성 신호 미제공 조건에서는 이러한 문장이 제시되지 않았으며, 사용자는 별도의 설명 없이 침묵을 경험하도록 하였다. 이때 침묵 이후에 제공되는 최종 응답 내용은 모든 조건에서 동일하게 유지하여, 의도성 신호 제공 여부만이 사용자 해석에 영향을 미치도록 통제하였다. 이러한 조작은 침묵에 대한 사용자 해석이 제공되는 맥락 단서에 따라 달라질 수 있다는 기존 논의를 바탕으로 설계되었다[21].

4) 프리 테스트(Pretest)

침묵 길이(3초 vs. 7초)와 의도성 신호 조작이 참여자에게 의도한 바와 같이 지각되는지를 검증하기 위해, 본 실험에 앞서 프리테스트를 실시하였다. 프리테스트에는 총 20명(N = 20)이 참여하였으며, 본 실험과 동일한 구조의 대화 시나리오를 제시한 후 침묵 길이와 의도성 신호에 대한 지각을 평가하도록 하였다.

프리테스트에서는 침묵에 대한 지각을 측정하기 위해 “자연스럽게 느껴졌다”, “어색하게 느껴졌다”, “불안하게 느껴졌다”, “사고 과정으로 느껴졌다”, “오류나 문제로 느껴졌다”와 같은 문항을 사용하였으며, 모든 문항은 리커트 5점 척도로 측정되었다.

분석 결과, 3초 침묵은 자연스러운 반응 공백으로 지각되는 경향이 높았으며(M = 3.82, SD = 0.64), 어색함(M = 2.18, SD = 0.70)과 불안(M = 2.05, SD = 0.68) 수준은 상대적으로 낮게 나타났다. 반면, 7초 침묵 조건에서는 자연스러움 지각이 유의하게 감소하였고(M = 2.31, SD = 0.73), 어색함(M = 3.67, SD = 0.75)과 불안(M = 3.54, SD = 0.79) 수준이 모두 증가하였다. 두 조건 간 차이를 검증한 독립표본 t-검정 결과, 자연스러움(t(18) = −4.26, p < .001), 어색함(t(18) = 4.11, p < .001), 불안(t(18) = 3.94, p = .001) 모두에서 통계적으로 유의한 차이가 확인되었다.

의도성 신호 조작에 대한 분석 결과, 의도성 신호 제공 조건에서는 침묵이 사고 과정으로 해석되는 정도가 유의하게 높게 나타났으며(M = 3.91, SD = 0.62), 침묵을 오류로 인식하는 경향은 낮게 나타났다(M = 2.12, SD = 0.69). 반면, 의도성 신호 미제공 조건에서는 침묵을 오류로 인식하는 경향이 증가하였고(M = 3.44, SD = 0.77), 침묵의 의도성 지각은 낮게 나타났다(M = 2.36, SD = 0.71). 두 조건 간 차이는 침묵의 의도성 지각(t(18) = 4.08, p < .001)과 오류 인식(t(18) = −3.76, p = .001) 모두에서 통계적으로 유의하였다.

이러한 프리테스트 결과를 바탕으로, 본 연구에서는 침묵의 길이와 의도성 신호 조작이 사용자 지각 수준에서 명확히 구분됨을 확인하였으며, 이를 본 실험의 최종 조작 기준으로 확정하였다.

4-3 실험 절차

본 실험은 온라인 설문 플랫폼인 구글 폼(Google Forms)을 활용하여 비대면 방식으로 진행되었다. 참여자는 실험 시작 전에 연구의 목적과 절차, 개인정보 보호 및 익명성 보장에 대한 설명을 제공받았으며, 이에 대한 사전 동의 절차를 완료한 후 실험에 참여하였다.

실험 절차는 다음과 같다. 먼저 참여자는 버추얼 휴먼과의 상호작용 상황을 가정한 간단한 시나리오를 읽었다. 해당 시나리오는 참여자가 버추얼 휴먼의 반응을 자연스럽게 기대할 수 있도록 일상적인 질문–응답 맥락으로 구성되었다. 이후 참여자는 제시된 대화 화면을 통해 버추얼 휴먼의 반응을 경험하였으며, 이 과정에서 침묵의 길이(3초 vs. 7초)와 의도성 신호 제공 여부에 따라 조작된 자극 중 하나에 노출되었다.

자극 노출이 완료된 후, 참여자는 자신이 경험한 상호작용에 대해 설문 문항에 응답하였다. 설문은 종속변수 측정을 위한 문항으로 구성되었으며, 이어서 침묵의 길이와 의도성 신호가 의도한 바와 같이 지각되었는지를 확인하기 위한 조작점검 문항이 포함되었다. 모든 참여자는 단일 조건의 자극만을 경험하였으며, 실험 전반에 걸쳐 조건 간 비교가 가능하도록 무작위 할당(random assignment)이 이루어졌다.

4-4 측정 변인

본 연구의 종속변인은 불안, 사회적 긴장, 인간다움 지각, 몰입의 네 가지로 구성되었다. 모든 측정 문항은 리커트 5점 척도(1 = 전혀 그렇지 않다, 5 = 매우 그렇다)를 사용하여 측정하였다.

불안과 사회적 긴장은 버추얼 휴먼과의 상호작용 과정에서 지각된 정서적 불편감과 관계적 어색함을 측정하기 위해, 기대 위반 상황에서의 정서 반응을 다룬 선행연구를 바탕으로 문항을 구성하였다[19]. 인간다움 지각은 사용자가 버추얼 휴먼을 인간과 유사한 사회적 존재로 인식하는 정도를 측정하기 위해 아바타 및 버추얼 에이전트 연구에서 사용된 척도를 참고하였다[10]. 몰입은 상호작용 경험에 대한 주의 집중과 관여 수준을 측정하기 위해 인터랙티브 미디어 연구에서 제시된 몰입 척도를 바탕으로 구성하였다[9]. 각 척도는 본 연구의 맥락에 맞게 수정·보완하여 사용하였다.

Ⅴ. 연구결과

5-1 기술통계 및 신뢰도 검증

본 연구에 사용된 주요 변인의 기술통계량과 신뢰도를 확인하였다. 분석에 앞서 각 측정 문항의 내적 일관성을 검증한 결과, 불안(α = .87), 사회적 긴장(α = .84), 인간다움 지각(α = .88), 몰입(α = .86)으로 모든 척도의 Cronbach’s α 값이 .80 이상으로 나타나 측정 도구의 신뢰도가 확보된 것으로 확인되었다.

각 변인의 평균과 표준편차는 전반적으로 중간값 이상을 나타내어, 참여자들이 버추얼 휴먼과의 상호작용에서 다양한 수준의 정서적·인지적 반응을 보였음을 확인하였다. 구체적인 기술통계 결과는 Table 1에 제시하였다.

Table 1.

Descriptive statistics and reliability of key variables(N = 146)

본 실험 자료를 대상으로, 침묵 길이(3초vs. 7초)와 의도성 신호 제공 여부가 참여자에게 의도한 바와 같이 지각되었는지를 확인하기 위해 조작점검 분석을 실시하였다. 먼저 침묵 길이에 대한 조작점검 문항(“버추얼 휴먼의 반응이 지연되었다고 느꼈다”)을 분석한 결과, 7초 침묵 조건(M= 3.84, SD= 0.81)이 3초 침묵 조건(M= 2.41, SD= 0.77)보다 지각된 반응 지연 수준이 유의하게 높게 나타났다(t(144) = 10.96, p < .001).

의도성 신호 조작에 대한 분석에서는, 의도성 신호 제공 조건(M= 3.79, SD= 0.74)이 의도성 신호 미제공 조건(M= 2.52, SD= 0.83)보다 침묵을 사고 과정으로 지각하는 정도가 유의하게 높게 나타났다(t(144) = 9.42, p < .001). 또한 침묵을 기술적 오류로 인식하는 정도는 의도성 신호 제공 조건(M= 2.31, SD= 0.86)에서 미제공 조건(M= 3.47, SD= 0.79)보다 유의하게 낮게 나타났다(t(144) = −8.21, p < .001).

이러한 결과를 통해, 본 실험에서 설정한 침묵 길이와 의도성 신호 조작은 참여자 지각 수준에서 명확히 구분되었으며, 두 조작 모두 의도한 방향으로 적절히 작동했음이 확인되었다.

5-2 침묵 길이와 의도성 신호의 주효과

침묵의 길이(짧은 침묵vs. 긴 침묵)와 의도성 신호 제공 여부(제공vs. 미제공)가 사용자 반응에 미치는 영향을 검증하기 위해 이원분산분석(two-way ANOVA)을 실시하였다. 분석 결과, 침묵의 길이는 불안과 사회적 긴장에 대해 유의한 주효과를 나타냈다. 구체적으로 긴 침묵 조건에서 참여자들은 짧은 침묵 조건에 비해 더 높은 불안 수준을 보고하였으며(F(1, 142) = 11.28, p= .001, ηp² = .07), 사회적 긴장 또한 유의하게 높게 나타났다(F(1, 142) = 9.64, p= .002, ηp² = .06).

의도성 신호 제공 여부는 인간다움 지각과 몰입에 대해 유의한 주효과를 보였다. 의도성 신호가 제공된 조건에서 참여자들은 제공되지 않은 조건에 비해 인간다움 지각이 더 높게 나타났으며(F(1, 142) = 8.97, p = .003, ηp² = .06), 몰입 수준 또한 유의하게 높게 보고되었다(F(1, 142) = 10.21, p = .002, ηp² = .07).

5-3 침묵 길이와 의도성 신호의 상호작용 효과

침묵의 길이와 의도성 신호 간의 상호작용 효과를 검증한 결과, 두 변인은 불안, 사회적 긴장, 인간다움 지각, 몰입 모두에서 통계적으로 유의한 상호작용 효과를 나타냈다.

먼저 불안과 사회적 긴장의 경우, 긴 침묵 조건에서 의도성 신호가 제공되지 않았을 때 가장 높은 수준이 관찰되었으며, 동일한 침묵 조건에서도 의도성 신호가 제공된 경우에는 해당 수준이 유의하게 감소하는 양상을 보였다(불안: F(1, 142) = 7.88, p = .006, ηp² = .05; 사회적 긴장: F(1, 142) = 7.14, p = .008, ηp² = .05). 반면, 짧은 침묵 조건에서는 의도성 신호 제공 여부에 따른 차이가 통계적으로 두드러지지 않았다.

인간다움 지각과 몰입에서도 유사한 상호작용 패턴이 확인되었다. 긴 침묵 조건에서 의도성 신호가 제공된 경우, 인간다움 지각과 몰입 수준이 유의하게 높게 나타났으며, 의도성 신호가 제공되지 않은 경우에는 상대적으로 낮은 수준을 보였다(인간다움 지각: F(1, 142) = 8.65, p = .004, ηp² = .06; 몰입: F(1, 142) = 9.72, p = .002, ηp² = .06). 반면, 짧은 침묵 조건에서는 의도성 신호 제공 여부에 따른 차이가 제한적으로 나타났다. 이러한 상호작용 효과의 구체적인 양상은 Fig. 2와 같다.

Fig. 2.

Interaction effect of silence length and intentionality cue on anxiety

5-4 가설 검증 요약

본 연구에서 설정한 가설을 검증한 결과는 다음과 같다. 침묵의 길이에 따라 불안과 사회적 긴장이 증가할 것이라는 가설 1(H1)은 통계적으로 유의한 결과를 통해 지지되었다. 또한 침묵 이전에 의도성 신호가 제공될 경우 버추얼 휴먼의 인간다움 지각과 몰입 수준이 증가할 것이라는 가설 2(H2) 역시 지지되었다. 나아가 긴 침묵 조건에서 의도성 신호가 제공될 경우 침묵으로 인한 부정적 반응이 완화될 것이라는 가설 3(H3)도 상호작용 효과 분석을 통해 지지되었다. 이러한 결과는 버추얼 휴먼 상호작용에서 침묵의 길이와 의도성 신호가 사용자 반응을 형성하는 핵심 요인으로 작용할 수 있음을 보여준다. 효과 크기는 중간 수준으로 나타났으며, 이는 단일 상호작용 상황을 기반으로 한 실험 맥락을 고려할 때 침묵과 의도성 신호가 사용자 경험의 해석 방향을 의미 있게 조정하는 역할을 수행함을 보여주는 결과로 해석할 수 있다.

Ⅵ. 논 의

본 연구는 버추얼 휴먼과의 상호작용에서 침묵이 단순한 기술적 지연이 아니라, 사용자의 기대와 해석에 따라 상이한 경험으로 지각될 수 있음을 실증적으로 검증하였다. 이는 버추얼 휴먼을 사회적 단서에 기반해 해석되는 커뮤니케이션 대상으로 이해해 온 선행연구의 관점과 맥락을 같이한다[3],[7]. 특히 침묵의 길이와 의도성 신호를 결합한 실험 설계를 통해, 침묵이 언제 부정적인 정서 반응을 유발하고 언제 상대적으로 수용 가능한 상호작용으로 해석되는지를 구분하여 제시하였다는 점에서 의의를 가진다.

연구 결과, 침묵의 길이는 사용자의 불안과 사회적 긴장에 유의한 영향을 미쳤다. 짧은 침묵에 비해 긴 침묵 조건에서 부정적 정서 반응이 증가한 결과는, 상호작용 상황에서 반응의 타이밍이 사용자 경험에 중요한 영향을 미칠 수 있음을 보여준다. 이는 인간 커뮤니케이션에서 발화 교대 규범과 반응 타이밍이 상호작용의 자연스러움을 판단하는 기준으로 작용한다는 대화분석 연구의 논의와 정합적인 패턴을 보인다[16],[17]. 이러한 결과는 버추얼 휴먼 상호작용에서도 인간 대화에서 형성된 응답 기대와 상호작용 규범이 그대로 적용되고 있음을 시사한다.

또한 의도성 신호 제공 여부는 인간다움 지각과 몰입 수준에 유의한 차이를 가져왔다. 침묵 이전에 간단한 의도성 신호가 제시된 경우, 사용자는 버추얼 휴먼의 반응을 보다 인간적인 행위로 인식하고 상호작용에 더 집중하는 경향을 보였다. 이는 버추얼 휴먼의 사회적 인식이 외형적 인간 유사성이나 언어 표현에 의해서만 형성되는 것이 아니라, 상호작용 과정에서 제공되는 맥락적 단서에 의해서도 달라질 수 있음을 보고한 선행연구의 논의와 일관된다[7],[10].

특히 본 연구의 핵심적인 차별성은 침묵의 길이와 의도성 신호 간의 상호작용 효과를 실증적으로 제시했다는 점에 있다. 긴 침묵 조건에서 의도성 신호가 제공되지 않은 경우 부정적 정서 반응이 가장 높게 나타난 반면, 동일한 침묵 조건에서도 의도성 신호가 제공되었을 때는 불안과 사회적 긴장이 완화되고 인간다움 지각과 몰입이 증가하였다. 이는 동일한 행동이라 하더라도 제공되는 단서에 따라 해석과 평가가 달라질 수 있다는 기대 위반 이론의 기본 전제와 부합하는 결과이다[19].

이러한 결과는 버추얼 휴먼 연구에서 주로 외형적 인간 유사성이나 언어적 표현에 초점을 맞추어 왔던 기존 접근을 보완한다. 본 연구는 상호작용 과정에서 발생하는 발화 사이의 공백, 즉 침묵 자체를 분석 대상으로 설정함으로써, 그동안 통제 변수나 노이즈로 취급되어 온 요소가 사용자 경험 형성에 실질적인 영향을 미칠 수 있음을 제시하였다. 이 점에서 본 연구는 버추얼 휴먼 상호작용을 결과 중심이 아니라 과정 중심적으로 이해할 필요성을 제기한다.

종합하면, 본 연구의 의의는 선행연구와 다른 결론을 도출했다기보다, 선행연구가 상대적으로 주목하지 않았던 침묵이라는 상호작용 단위를 연구 대상으로 삼고, 그 효과가 조건에 따라 달라질 수 있음을 실증적으로 보여주었다는 데 있다. 이는 버추얼 휴먼 상호작용에서 침묵을 일괄적으로 제거해야 할 결함이 아니라, 해석 가능성이 열려 있는 커뮤니케이션 요소로 재고할 필요성을 시사한다.

Ⅶ. 결 론

본 연구는 버추얼 휴먼과의 상호작용에서 침묵의 길이와 의도성 신호가 사용자 경험에 미치는 영향을 실험적으로 검증하였다. 침묵을 단순한 기술적 지연이 아닌, 사용자의 해석이 개입되는 상호작용 요소로 설정하고, 침묵의 길이와 맥락 단서의 결합 효과를 분석하였다.

연구 결과, 침묵의 길이는 사용자의 불안과 사회적 긴장에 유의한 영향을 미쳤으며, 의도성 신호 제공 여부는 인간다움 지각과 몰입 수준에 차이를 가져왔다. 또한 긴 침묵 조건에서는 의도성 신호가 제공될 경우 침묵으로 인한 부정적 반응이 완화되는 상호작용 효과가 확인되었다. 이는 버추얼 휴먼 상호작용에서 반응의 타이밍과 맥락 단서가 사용자 경험 형성에 중요한 요소로 작용할 수 있음을 보여준다.

본 연구의 의의는 선행연구와 다른 결론을 도출했다기보다, 기존 연구에서 상대적으로 주목받지 않았던 침묵이라는 상호작용 단위를 분석 대상으로 설정하고, 그 효과가 조건에 따라 달라질 수 있음을 실증적으로 제시했다는 점에 있다. 이를 통해 버추얼 휴먼 상호작용을 외형이나 언어 표현 중심이 아닌, 상호작용 과정 전반에서 이해할 필요성을 제기하였다.

본 연구의 결과는 버추얼 휴먼 설계 및 인터랙션 디자인에 실천적 시사점을 제공한다. 모든 침묵이 사용자 경험을 저해하는 것은 아니며, 상호작용 맥락과 사용자 기대가 안정적으로 형성된 상황에서는 일정 수준의 침묵이 사려 깊은 반응이나 숙고의 신호로 해석될 수 있다. 특히 즉각적인 응답이 필수적이지 않은 상호작용 맥락에서는 침묵을 일괄적으로 제거하기보다 제한적으로 허용하는 설계가 가능할 것이다.

한편 침묵의 길이가 길어질 경우에는 그 침묵이 발생한 의도를 간단히 안내하는 의도성 신호의 제공이 사용자 해석을 전환하는 핵심 요인으로 작용할 수 있다. 이는 침묵의 길이와 의도성 신호를 함께 고려하는 설계 전략이 사용자의 불안과 사회적 긴장을 완화하고 상호작용의 자연스러움을 유지하는 데 기여할 수 있음을 시사한다.

다만 본 연구는 몇 가지 한계를 지닌다. 첫째, 특정 상호작용 시나리오와 텍스트 기반 버추얼 휴먼 자극에 한정되어 수행되었기 때문에, 결과의 일반화에는 주의가 필요하다. 둘째, 침묵의 길이를 두 수준(3초, 7초)으로만 조작하여 보다 세분화된 시간 구간에서의 지각 차이를 충분히 탐색하지는 못하였다. 셋째, 단회성 상호작용을 전제로 분석을 수행하였기 때문에, 반복적 상호작용이나 장기적 관계 형성 맥락은 고려하지 못하였다.

향후 연구에서는 다양한 상호작용 맥락(예: 상담, 교육, 고객 서비스)과 매체 환경(음성 기반, 몰입형 인터페이스 등)을 포함하여 침묵의 해석이 어떻게 달라지는지를 검증할 필요가 있다. 또한 침묵과 함께 제시되는 의도성 신호의 표현 방식이나 강도를 다양화함으로써, 사용자 해석에 미치는 영향을 보다 정교하게 분석할 수 있을 것이다.

References

N. Kim, “A Study on K-Pop Fans’ Acceptance of Fictional Worldview: Focusing on the Worldview of the Girl Group Aespa,” Journal of Trans-, Vol. 12, pp. 173-222, 2022. [https://doi.org/10.23086/trans.2022.12.07]
W. Kungwanjerdsuk and C. Rhoades, “Aespa’s Kwangya as a New Representative Space for Fans: Building Fandom in the Era of COVID-19,” Journal of Korean Cultural Studies, No. 43, pp. 115-144, 2022. [https://doi.org/10.17792/kcs.2022.43..115]
D. Horton and R. R. Wohl, “Mass Communication and Para-Social Interaction,” Psychiatry, Vol. 19, No. 3, pp. 215-229, 1956. [https://doi.org/10.1080/00332747.1956.11023049]
S. Chung and H. Cho, “Fostering Parasocial Relationships with Celebrities on Social Media: Implications for Celebrity Endorsement,” Psychology & Marketing, Vol. 34, No. 4, pp. 481-495, 2017. [https://doi.org/10.1002/mar.21001]
M. Csikszentmihalyi, Flow: The Psychology of Optimal Experience, New York, NY: Harper & Row, 1990.
S. Yoon and H. Kang, “A Study on Emotional Expression and Immersion Mechanisms in Digital Fandom,” Journal of Media and Cultural Studies, Vol. 34, No. 2, pp. 55-78, 2020.
T. Araujo and N. Bol, “From Speaking Like a Person to Being Personal: The Effects of Personalized, Regular Interactions with Conversational Agents,” Computers in Human Behavior: Artificial Humans, Vol. 2, No. 1, 100030, 2023. [https://doi.org/10.1016/j.chbah.2023.100030]
D. C. Giles, “Parasocial Interaction: A Review of the Literature and a Model for Future Research,” Media Psychology, Vol. 4, No. 3, pp. 279-305, 2002. [https://doi.org/10.1207/S1532785XMEP0403_04]
C. Jennett, A. L. Cox, P. Cairns, S. Dhoparee, A. Epps, T. Tijs, and A. Walton, “Measuring and Defining the Experience of Immersion in Games,” International Journal of Human-Computer Studies, Vol. 66, No. 9, pp. 641-661, September 2008. [https://doi.org/10.1016/j.ijhcs.2008.04.004]
D. Y. Kim, H. K. Lee, and K. Chung, “Avatar-Mediated Experience in the Metaverse: The Impact of Avatar Realism on User-Avatar Relationship,” Journal of Retailing and Consumer Services, Vol. 73, 103382, 2023. [https://doi.org/10.1016/j.jretconser.2023.103382]
J. Seering, M. Luria, G. Kaufman, and J. Hammer, “Beyond Dyadic Interactions: Considering Chatbots as Community Members,” in Proceedings of the 2019 CHI Conference on Human Factors in Computing Systems (CHI ’19), Glasgow: Scotland, pp. 1-13, 2019. [https://doi.org/10.1145/3290605.3300680]
M. Funk, C. Cunningham, D. Kanver, C. Saikalis, and R. Pansare, “Usable and Acceptable Response Delays of Conversational Agents in Automotive User Interfaces,” in Proceedings of the 12th International Conference on Automotive User Interfaces and Interactive Vehicular Applications (AutomotiveUI ’20), pp. 262-269, 2020. [https://doi.org/10.1145/3409120.3410651]
B. Reeves and C. Nass, The Media Equation: How People Treat Computers, Television, and New Media Like Real People and Places, Cambridge, UK: Cambridge University Press, 1996.
J. Gratch, J. Rickel, E. André, J. Cassell, E. Petajan, and N. Badler, “Creating Interactive Virtual Humans: Some Assembly Required,” IEEE Intelligent Systems, Vol. 17, No. 4, pp. 54-63, 2002. [https://doi.org/10.1109/MIS.2002.1024753]
S. Amershi, D. Weld, M. Vorvoreanu, A. Fourney, B. Nushi, P. Collisson, ... and Eric Horvitz, “Guidelines for Human-AI Interaction,” in Proceedings of the 2019 CHI Conference on Human Factors in Computing Systems, pp. 1-13, Glasgow: Scotland, 2019. [https://doi.org/10.1145/3290605.3300233]
Q. V. Liao, D. Gruen, and S. Miller, “Questioning the AI: Informing Design Practices for Explainable AI User Experiences,” in Proceedings of the 2020 CHI Conference on Human Factors in Computing Systems, pp. 1-15, 2020. [https://doi.org/10.1145/3313831.3376590]
Y. Lee, S. Hwang, and I. Kim, “The Effects of Visual Representation Levels of Digital Humans on Social Presence in VR Interaction,” Journal of Digital Contents Society, Vol. 21, No. 6, pp. 1113-1122, 2020. [https://doi.org/10.9728/dcs.2020.21.6.1113]
H. Sacks, E. A. Schegloff, and G. Jefferson, “A Simplest Systematics for the Organization of Turn-Taking for Conversation,” Language, Vol. 50, No. 4, pp. 696-735, 1974. [https://doi.org/10.2307/412243]
S. C. Levinson, “Turn-Taking in Human Communication,” Trends in Cognitive Sciences, Vol. 20, No. 1, January 2016. [https://doi.org/10.1016/j.tics.2015.10.010]
U. Gnewuch, S. Morana, M. Adam, and A. Maedche, “Faster Is Not Always Better: Understanding the Effect of Dynamic Response Delays in Human-Chatbot Interaction,” in Proceedings of the 26th European Conference on Information Systems (ECIS), Portsmouth, UK, 2018.
J. K. Burgoon, “Interpersonal Expectations, Expectancy Violations, and Emotional Communication,” Journal of Language and Social Psychology, Vol. 12, No. 1-2, pp. 30-48, 1993. [https://doi.org/10.1177/0261927X93121003]
A. P. Saygin, T. Chaminade, H. Ishiguro, J. Driver, and C. Frith, “The Thing That Should Not Be: Predictive Coding and the Uncanny Valley in Perceiving Human and Humanoid Robot Actions,” Social Cognitive and Affective Neuroscience, Vol. 7, No. 4, pp. 413-422, 2012. [https://doi.org/10.1093/scan/nsr025]
T. Tsumura and S. Yamada, “Influence of Agent’s Self-Disclosure on Human Empathy,” arXiv:2106.09906, , 2021. https://arxiv.org/abs/2106.09906

저자소개

강지영(Jiyoung Kang)

2004년：Pratt Institute 컴퓨터 그래픽스 (학사)

2006년：New York University, 인터랙티브 텔레커뮤니케이션 (석사)

2013년：한국과학기술원(공학박사-인터랙션 디자인)

2022년～현 재: 이화여자대학교 커뮤니케이션·미디어학부 교수

※관심분야：가상현실(VR), 증강현실(AR), 인터랙션 디자인 등

Variable	No. of Items	Mean (M)	Standard deviation (SD)	Cronbach’s α
Note. All items were measured on a 5-point Likert scale (1 = strongly disagree, 5 = strongly agree).
Anxiety	4	2.91	0.84	.87
Social Tension	4	2.78	0.81	.84
Humanness Perception	4	3.42	0.76	.88
Immersion	4	3.36	0.79	.86