Korea Digital Contents Society
[ Article ]
Journal of Digital Contents Society - Vol. 26, No. 7, pp.1905-1921
ISSN: 1598-2009 (Print) 2287-738X (Online)
Print publication date 31 Jul 2025
Received 26 Jun 2025 Revised 16 Jul 2025 Accepted 23 Jul 2025
DOI: https://doi.org/10.9728/dcs.2025.26.7.1905

대규모 언어모델(GPT) 기반 입력 모달리티 유형에 따른 사용자 자기개방과 소통 깊이 분석: 텍스트 vs. 음성

배현영1 ; 김민재2, *
1서강대학교 메타버스전문대학원 박사과정
2한국공학대학교 교수
User Self-Disclosure and Communication Depth Across Input Modality Types in GPT-Based Large Language Models: Text vs. Voice
Hyun-Young Bae1 ; Min-Jae Kimm2, *
1Ph.D. Course, Graduate School of Metaverse, Sogang University, Seoul 04107, Korea
2Professor, Tech University of Korea, Siheung 15073, Korea

Correspondence to: *Min-Jae Kimm E-mail: alexthedesign@naver.com

Copyright ⓒ 2025 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

초록

본 연구는 대규모 언어모델(GPT) 기반 입력 모달리티(텍스트 및 음성)가 사용자 자기개방과 소통 깊이에 미치는 영향을 분석하고자, 설명적 순차 혼합연구 설계를 적용하였다. 1단계에서 20명의 참여자가 GPT-4와 텍스트 및 음성 입력을 모두 경험한 후 설문에 응답하였고, 2단계에서는 반응 특성이 뚜렷한 일부 참여자를 대상으로 심층 인터뷰와 대화 로그 분석을 수행하였다. 정량 분석에서는 입력 모달리티의 주효과는 유의하지 않았지만, 연령과 사전 선호도와의 상호작용은 유의하거나 유의 경향성을 보였다. 질적 분석에서는 감정 표현, 즉시성, 표현 통제, 몰입감 측면에서 모달리티 간 뚜렷한 차이가 나타났다. 고연령층은 음성 입력에서 더 높은 몰입을, 저연령층은 텍스트 입력에서 더 깊은 자기개방과 소통을 경험하였다. 본 연구는 사용자 특성을 반영한 GPT 인터페이스 설계 방향을 제시하며, HCI 및 감성 컴퓨팅에 시사점을 제공한다.

Abstract

In this study, we adopted an explanatory sequential mixed-methods design to explore the influence of GPT-based input modalities—text and voice—on users’ self-disclosure and communication depth. In Phase 1, 20 participants interacted with GPT-4 using both modalities and completed a related survey. In Phase 2, selected participants with notable response patterns were interviewed, and their interaction logs were thematically analyzed. While no significant main effect was found for input modality, interaction effects with age and prior preference were statistically or marginally significant. Thematic analysis revealed modality-specific differences in emotional expression, immediacy, expression control, and immersion. Older users preferred voice input and reported greater emotional engagement, whereas younger users favored text input and exhibited deeper self-disclosure and communication. These findings highlight the importance of designing personalized GPT interfaces tailored to user characteristics, offering implications for human-computer interaction and affective computing.

Keywords:

Large Language Model (GPT), Self-Disclosure, Communication Depth, Input Modality, HCI

키워드:

대규모 언어모델(GPT), 자기개방, 소통 깊이, 입력 모달리티, 인간-컴퓨터 상호작용

Ⅰ. 서 론

최근 ChatGPT와 같은 대규모 언어모델(Large Language Model, LLM)을 기반으로 한 생성형 인공지능(Generative AI)의 확산은 인간-컴퓨터 상호작용(Human-Computer Interaction, HCI)의 방식에 중대한 변화를 가져오고 있다[1],[2]. 이들 모델은 단순한 정보 제공을 넘어, 텍스트와 음성 입력을 통한 자연스러운 언어 상호작용을 가능하게 하며, 사용자에게 더욱 몰입적이고 정서적인 상호작용 경험을 제공한다[3],[4].

GPT(Generative Pre-trained Transformer)는 다양한 입력 모달리티(Input Modality)를 지원하는 대표적인 언어모델로, 단순 정보 전달을 넘어 사용자의 감정과 사고를 반영하는 정서적·심리적 상호작용의 매개체로 주목받고 있다[5],[6]. 특히 텍스트 입력과 음성 입력이라는 방식의 차이는 상호작용 방식과 사용자 반응에 실질적인 영향을 미치며, 이는 인터페이스 설계와 사용자 경험 향상을 위한 주요 요인이 된다[7],[8].

그러나 현재까지의 연구는 대부분 챗봇 기반 환경에서 특정 입력 방식과 반응 변인(예: 자기개방, 감정 표현, 몰입 등)을 개별적으로 분석한 데 그치고 있다[6],[8],[9],[10]. 예를 들어, 텍스트와 음성 입력에 따른 자기개방 반응을 비교한 일부 연구는 GPT가 아닌 환경에서 수행되었으며[9], 사용자 특성에 대한 고려도 부족하다. 음성 기반 인터페이스의 몰입 효과를 분석한 연구[10] 또한 텍스트 입력과의 직접적인 비교 구조를 포함하지 않는다. 특히 GPT 기반 환경에서 입력 모달리티와 사용자 특성(연령, 선호도 등)의 상호작용까지 통합적으로 고찰한 탐색적 실증연구는 국내외를 막론하고 매우 제한적이다.

이에 본 연구는 GPT-4 기반 인터페이스를 활용하여 입력 방식(텍스트 입력 vs. 음성 입력)에 따른 사용자 정서 반응, 특히 자기개방과 소통 깊이의 차이를 탐색적으로 비교하고자 한다. 또한, 사용자 특성 중 연령과 사전 입력 선호도가 이러한 정서 반응에 미치는 조절 효과를 분석함으로써 GPT 기반 상호작용의 심리적 특성을 입체적으로 이해하고자 한다.

본 연구는 설명적 순차 혼합연구(Explanatory Sequential Mixed Methods Design)에 따라 설계되었으며, 1단계에서는 구조화된 척도를 통해 응답 경향을 분석하고, 2단계에서는 인터뷰 및 대화 로그를 기반으로 질적 해석을 수행하였다. 자기개방은 개인의 감정과 경험을 자발적으로 드러내는 정도, 소통 깊이는 대화의 정서적 몰입 및 의미 수준으로 정의하였다.

본 연구는 일반화를 목적으로 하기보다는 GPT 인터페이스의 입력 방식에 따른 사용자 반응을 초기 수준에서 탐색하고, 후속 대규모 연구 및 맞춤형 인터페이스 설계의 기초자료를 제공하는 데 목적이 있다. 이는 HCI 및 감성 컴퓨팅(Affective Computing) 분야에서 GPT 기반 상호작용에 대한 이해를 확장하는 데 학술적 기여를 할 수 있다.

이를 바탕으로 다음의 연구문제를 설정하였다.

RQ1. GPT 기반 인터페이스에서 텍스트 입력과 음성 입력은 사용자 자기개방 및 소통 깊이에 차이를 유발하는가?

RQ2. 사용자 연령과 사전 입력 선호도는 입력 모달리티와 심리적 반응 간의 관계에 조절적 영향을 미치는가?


Ⅱ. 선행 연구

2-1 GPT 기반 입력 모달리티와 인간-컴퓨터 상호작용 특성

GPT를 중심으로 한 대규모 언어모델(Large Language Model, LLM)의 발전은 인간-컴퓨터 상호작용(Human-Computer Interaction, HCI)의 양식에 본질적인 변화를 가져왔다. 생성형 인공지능으로서 GPT는 사용자의 질의 맥락을 기억하고, 이전 대화 내용을 반영해 일관된 응답을 생성함으로써 자연스러운 대화 흐름을 제공한다. 특히 트랜스포머 기반의 Self-Attention 구조를 활용하여, 입력 문맥을 지속적으로 참조하고 상황에 맞는 반응을 생성함으로써 인간과 유사한 상호작용 경험을 제공한다[11],[12].

GPT 기반 인터페이스의 입력 모달리티는 상호작용 방식과 사용자 반응에 실질적인 차이를 유발한다. 대표적인 입력 방식인 텍스트와 음성은 인지적·정서적 특성이 상이하며, 서로 다른 표현 전략과 감정 반응을 유도한다. 텍스트 입력은 사고의 정제와 반복적 검토 과정을 동반하여 자기검열을 촉진하고, 보다 신중하고 숙고된 표현을 유도하는 경향이 있다[13],[14]. 반면, 음성 입력은 억양, 속도, 리듬 등 비언어적 신호를 포함하여 즉흥적이고 감정적인 표현을 자연스럽게 촉진하며, 사용자는 보다 몰입적이고 솔직한 상호작용을 경험하는 것으로 보고된다[15],[16].

음성 기반 GPT 인터페이스는 감정 표현의 생동감과 전달력 측면에서 높은 평가를 받고 있으며, 실재감(Presence), 사회적 존재감(Social Presence), 진정성(Authenticity)과 같은 심리적 반응을 유도하는 것으로 나타났다[17]. 또한 음성 입력은 텍스트보다 약 3배 빠른 입력 속도와 높은 자유도를 제공하여, 상호작용의 몰입감과 효율성을 향상시키는 데 기여한다는 연구 결과도 있다[18].

HCI 이론에 따르면, 입력 모달리티는 단순한 기술 구성 요소를 넘어, 사용자의 몰입도, 인지 부하, 감정 반응에 영향을 미치는 핵심 요인이다. 입력 방식은 감정적 반응성, 대화 흐름 제어, 표현 전략의 선택 등에 영향을 미치며, 이는 궁극적으로 사용자 경험의 질적 차이로 이어진다[15],[19].

최근 연구들 또한 입력 방식에 따른 사용자 반응의 차이에 주목하고 있으나, 대부분 특정 인터페이스의 기능적 특성에 집중하거나, 사용자 특성(연령, 선호도 등)에 따른 반응 차이를 통합적으로 고려한 실증적 분석은 드문 실정이다[20],[21].

이에 본 연구는 GPT 기반 인터페이스에서 입력 모달리티(텍스트 vs. 음성)에 따라 사용자 자기개방 및 소통 깊이에 어떠한 정서적 차이가 나타나는지를 탐색적으로 검토하고자 한다. 또한, 연령 및 사전 입력 선호도와 같은 사용자 특성이 이 관계에 미치는 조절 효과를 함께 분석함으로써, 기존 연구의 한계를 보완하고 이론적·실용적 시사점을 제시하고자 한다.

2-2 자기개방과 소통 깊이의 개념적 고찰

자기개방(Self-disclosure)은 개인이 자신의 감정, 생각, 경험, 가치관 등을 타인에게 자발적으로 드러내는 의사소통 행위로, 대인관계의 형성과 심화에 핵심적인 역할을 한다[22]. 사회관계침투이론(Social Penetration Theory, SPT)[23]에 따르면, 인간관계는 초기에는 일반적이고 비위험적인 정보 공유로 시작해 시간이 지남에 따라 점차 감정적이고 민감한 내용을 포함하는 깊은 단계로 발전한다. 이는 자기개방이 단순히 정보량의 증가가 아닌, 정서적 민감성과 진정성의 심화를 동반한다는 점을 시사한다.

이러한 자기개방은 GPT 기반 대화형 인공지능과의 상호작용이라는 디지털 환경에서 새로운 양상으로 전개된다. 사용자는 인간과의 대화보다 평가받을 위험이 낮다고 인식하여, 보다 솔직하고 즉흥적인 감정 표현이나 민감한 정보의 개방에 적극적인 경향을 보인다[24]. 반복적인 GPT 사용은 자기개방의 정서적 깊이를 확장시키며, 감정, 고민, 내면적 경험 등 정서 중심의 발화로 이어지는 양상이 나타난다[6]. 또한, 챗봇의 입력 방식이 자기개방의 민감도 및 감정 표현 수준에 영향을 미친다는 선행연구도 존재한다[25].

자기개방 수준은 다양한 요인의 영향을 받는다. 특히 입력 모달리티, 인공지능의 감정 표현 여부, 데이터 비저장 안내는 사용자의 정보 개방 수준과 자기검열에 직결되는 요소다. 예컨대, 감정을 수반한 GPT의 응답은 사용자의 정서적 자기개방을 촉진하며, 데이터가 저장되지 않는다는 안내는 개방 수준을 더욱 높이는 요인으로 작용한다는 실증 결과도 보고되었다[8],[9].

소통 깊이(Communication Depth)는 단순한 정보 교환을 넘어, 개인의 감정, 신념, 가치관 등 내면의 정서적 영역에 얼마나 도달했는지를 의미한다[4]. GPT 기반 상호작용에서는 인공지능이 공감적 언어를 사용하거나 감정을 반영할 경우, 사용자가 더 깊은 정서 표현으로 응답하는 경향이 관찰된다. 실제 인간 간 상호작용에서도 공감적 피드백이 정서적 자기개방을 유도한다는 점[26]에서, 이러한 기제가 인공지능과의 대화에서도 유사하게 작용할 가능성이 있다.

본 연구에서는 이러한 이론적 배경을 바탕으로, 자기개방과 소통 깊이를 각각 ‘개인 정보의 정서적 표현 수준’과 ‘대화의 몰입 및 의미성’이라는 두 축으로 개념화하였다. 이를 기반으로 GPT 상호작용 이후 사용자의 정서 반응을 구조화된 문항을 통해 측정하였다. 자기개방 항목은 ‘평소 말하지 않는 이야기의 공유 여부’, ‘감정의 솔직한 표현’ 등 사회관계침투이론 기반 문항으로 구성되었고, 소통 깊이 항목은 ‘대화의 정서적 의미’, ‘개인적으로 중요한 주제 여부’ 등을 포함하였다. 모든 문항은 5점 Likert 척도로 구성되었으며, 신뢰도와 타당도가 확보된 기존 척도를 바탕으로 수정·보완하였다.

이처럼 자기개방과 소통 깊이는 GPT 기반 인터페이스 상호작용에서 나타나는 주요 정서 반응으로, 본 연구는 이 두 변인이 입력 모달리티(텍스트/음성)에 따라 어떻게 달라지는지를 탐색적으로 분석하고자 한다. 특히 입력 방식에 따른 정서적 반응의 차이, 조절 요인의 영향, 대화 흐름 속 자기표현 양상을 설명적 순차 혼합연구 설계를 통해 정량적·정성적으로 통합 분석함으로써, 이론과 실제 간의 연결을 시도하였다.

2-3 사용자 특성과 조절변인의 역할

GPT 기반 상호작용에서의 사용자 경험은 단순히 시스템 성능이나 인터페이스 디자인에 의해 결정되지 않으며, 사용자 개개인의 특성에 따라 정서 반응, 자기개방 수준, 몰입도 등 다양한 상호작용 결과가 달라질 수 있다.

이러한 사용자 특성에는 연령, 성별, 기술 친숙도, 디지털 리터러시, 자기개방 성향, 기술 수용 태도 등이 포함되며, 인간-컴퓨터 상호작용(HCI) 연구에서는 이들을 주요 조절변인으로 간주해 왔다.

기존 연구에 따르면, 연령이 높을수록 챗봇을 통한 자기개방 수준이 낮아지는 경향이 있으며, 기술 친숙도가 낮은 사용자일수록 인공지능과의 상호작용에서 감정 표현에 제약을 받는 것으로 나타났다[27]. 또한 외상 경험자의 경우, 대인관계에서는 높은 자기개방을 보이지만, 인공지능과의 상호작용에서는 정보 개방을 회피하는 경향을 보여, 사용자 심리 상태가 상호작용 반응에 영향을 미치는 조절 요인으로 작용할 수 있음을 시사한다[28].

국내 실험 연구에서도 사용자의 자기개방 성향과 얼굴 노출에 대한 부담감이 AI 기반 대화 시스템에 대한 몰입도 및 감정 표현 방식에 영향을 미치는 것으로 보고되었다. 예를 들어, 자기개방 수준이 낮고 얼굴 노출에 민감한 사용자는 오히려 익명성과 비대면성이 보장된 챗봇 환경에서 더 높은 몰입도와 솔직한 감정 표현을 나타냈다[29].

이러한 사용자 특성은 GPT 기반 서비스의 수용 의도 및 지속 이용 의도와도 밀접하게 관련된다. 자아 일치성이나 기능적 기대가 사용자의 심리적 정체성과 부합할 경우, GPT에 대한 신뢰와 만족도는 높아지며, 이러한 관계는 개인의 기술 혁신 수용 성향(혁신성)에 따라 달라질 수 있다[30]. 즉, GPT가 제공하는 기능이 객관적으로 우수하더라도, 사용자가 신기술 수용에 보수적일 경우 실제 수용 의도는 낮아질 수 있다.

이처럼 GPT 기반 상호작용에서 사용자 개인의 심리적·사회적 특성과 경험은 단순한 배경 변수를 넘어, 상호작용의 결과를 매개하거나 조절하는 핵심 요인으로 작용한다. 따라서 사용자 특성은 GPT 인터페이스 설계와 사용자 반응 해석에 있어 반드시 고려되어야 할 요소이다.

표 1은 GPT 기반 상호작용에서 사용자 특성이 조절변인으로 작용한 주요 선행연구들을 정리한 것으로, 본 연구에서 연령과 사전 입력 방식 선호도를 조절변인으로 설정한 이론적 근거를 뒷받침한다. 본 연구는 특히 이 두 변인이 입력 모달리티(텍스트/음성)와 자기개방 및 소통 깊이 간 관계에서 어떠한 조절 효과를 나타내는지를 실증적으로 분석하고자 한다.

Major previous studies on the moderating effects of user characteristics in GPT-based interaction


Ⅲ. 연구모형 및 연구문제

1) 연구모형

본 연구는 입력 모달리티 유형(텍스트 입력, 음성 입력)이 사용자 자기개방 수준과 소통 깊이에 미치는 영향을 중심으로, 연령 및 사전 입력 방식 선호도의 조절 효과를 통합적으로 고려한 연구모형을 설정하였다. 이를 통해 입력 방식의 차이가 사용자 정서 반응에 미치는 영향을 실증적으로 규명하고, 사용자 특성에 따른 상호작용 반응의 차이를 설명하고자 한다. 본 연구의 연구모형은 그림 1과 같다.

Fig. 1.

Research model

2) 연구문제

본 연구는 GPT 기반 입력 모달리티(텍스트 입력, 음성 입력)가 사용자 자기개방과 소통 깊이에 미치는 영향을 분석하고, 이 관계에서 연령 및 사전 입력 선호도가 조절변인으로 작용하는지를 검토하고자 한다. 아울러 각 입력 방식에서 나타나는 감정 표현과 소통 경험을 정성적으로 탐색하여, 정서적 반응의 해석을 보다 입체적으로 이해하고자 한다.

  • 연구문제 1: GPT 기반 입력 인터페이스 유형(텍스트 입력 vs. 음성 입력)에 따라 사용자 자기개방 수준과 소통 깊이에 유의미한 차이가 존재하는가?
  • 연구문제 2: 사용자 연령과 사전 입력 방식 선호도는 입력 모달리티와 자기개방 및 소통 깊이 간의 관계를 조절하는가?
  • 연구문제 3: 텍스트 및 음성 입력 모달리티 사용 시, 사용자는 어떠한 감정 표현과 소통 경험을 보고하는가?

Ⅳ. 실증분석

4-1 연구설계

본 연구는 GPT 기반 입력 모달리티(텍스트 입력, 음성 입력)가 사용자 경험에 미치는 영향을 탐색적으로 분석하기 위해, 설명적 순차 혼합연구 설계를 적용하였다[31].

이 설계는 1단계에서 소규모 실험을 통해 입력 방식에 따른 사용자 반응을 구조화된 척도로 수집하고, 2단계에서는 해당 실험 중 생성된 대화 로그 및 심층 인터뷰 자료를 바탕으로 자기개방 및 정서 표현 양상을 심층적으로 해석하고자 하였다.

이러한 단계적 접근은 초기 정량 탐색 결과에 대한 맥락적 보완을 가능케 하며, 사용자의 상호작용 경험에 내재된 심리적 의미와 감정적 흐름을 보다 풍부하게 이해하는 데 목적이 있다.

본 연구의 전체 설계 절차는 그림 2와 같다.

Fig. 2.

Modified explanatory sequential mixed methods design

4-2 연구대상

본 연구의 참여자는 연구자의 접근 용이성과 모집의 실현 가능성을 고려하여 편의표집(Convenience Sampling) 방식으로 선정하였다. 탐색적 혼합연구의 목적에 부합하도록, 20대 초반부터 60대 중반까지 폭넓은 연령대를 포함시켜 결과 해석의 다양성과 외적 타당성을 확보하고자 하였다.

총 20명이 참여하였으며, 연령은 최소 21세에서 최대 65세로 분포하였고, 평균 연령은 39.6세(SD = 16.30)였다. 연령대별 구성은 20대 6명(30.0%), 30대 1명(5.0%), 40대 3명(15.0%), 50대 0명(0.0%), 60대 6명(30.0%)으로, 특히 청년층과 고령층의 비교 가능성이 확보되었다.

GPT 사용 빈도는 ‘자주 사용(주 3회 이상)’이 13명(65.0%)으로 가장 많았으며, ‘가끔 사용(월 2~3회)’은 2명(10.0%), ‘전혀 사용하지 않음’은 5명(25.0%)으로 나타났다. AI 서비스에 대한 익숙도는 ‘매우 익숙함’ 9명(45.0%), ‘익숙함’ 2명(10.0%), ‘보통’ 4명(20.0%), ‘익숙하지 않음’ 1명(5.0%), ‘전혀 익숙하지 않음’ 4명(20.0%)으로 분포되었다.

사전 입력 모달리티 선호도는 ‘텍스트 입력 선호’와 ‘음성 입력 선호’가 각각 50.0%로 균형 있게 나타나, 본 연구의 조절변인 설정에 이론적 기반을 제공하였다.

참여자 중 일부는 1단계 설문에만 응답하였고, 일부는 2단계 심층 인터뷰 및 대화 로그 제공에도 참여하였다. 이들은 실제 인터페이스 상호작용을 기반으로 생성된 텍스트 및 음성 데이터를 제공함으로써, 정성 분석의 신뢰성과 심층 해석의 기반을 마련하는 데 기여하였다.

참여자의 인구통계학 및 기술 사용 관련 세부 특성은 표 2에 제시하였다.

Demographic and technology use characteristics of participants

4-3 연구절차

본 연구는 설명적 순차 혼합연구 설계(Explanatory Sequential Mixed Methods Design)에 따라, 실험 기반 정량 탐색과 정성 분석을 단계적으로 연계하여 수행되었다. 1단계에서는 GPT 기반 입력 모달리티(텍스트 입력, 음성 입력)를 모두 경험하도록 구성된 실험을 통해 자기개방 및 소통 깊이 수준에 관한 응답을 수집하였고, 2단계에서는 반응의 정서적 특성을 보다 심층적으로 이해하기 위해 인터뷰 및 대화 로그 분석을 병행하였다.

실험은 연구자의 개인 노트북(GPT-4 Pro 계정 사용)을 활용하여 조용하고 통제된 실내 환경에서 개별적으로 진행되었다. 모든 참여자는 동일한 장비 및 설정(GPT 음성 인터페이스 포함) 하에서 실험에 참여하였으며, 유료/무료 계정 차이, 네트워크 속도, 장치 성능 등의 외부 변인을 통제하고자 하였다.

텍스트 입력 조건에서는 참여자가 키보드를 통해 GPT에게 질문을 입력하고, GPT의 응답은 화면에 텍스트로 출력되었다. 해당 대화 내용은 자동 저장된 텍스트 로그를 기반으로 수집되었다.

음성 입력 조건에서는 참여자가 마이크를 통해 GPT와 실시간으로 음성 대화를 진행하였고, GPT 역시 음성으로 응답하였다. 이를 위해 GPT-4의 voice 기능이 활성화된 상태에서 Whisper 기반 음성 인식 및 음성 합성 기능이 활용되었다. 해당 대화는 전 과정이 오디오로 녹음되었으며, 참여자의 발화와 GPT 응답은 네이버 클로바노트(Speech-to-Text)를 활용해 텍스트로 전사한 후 질적 분석 자료로 활용되었다.

실험에 사용된 질문지는 자기개방과 감정 표현을 유도할 수 있는 동일한 주제로 구성되었으며, 참여자는 두 조건을 모두 경험하였다. 실험 순서는 참여자의 희망에 따라 텍스트 또는 음성 중 원하는 순서로 진행되었으며, 이는 보다 자연스러운 반응 유도와 몰입도 향상을 위한 조치였다. 대화 중 참여자는 제시된 질문 외에도 자유롭게 질문을 확장하거나 응답을 덧붙일 수 있도록 하여 상호작용의 유연성을 확보하였다.

실험 도중 발생할 수 있는 음성 인식 오류, GPT 응답 지연, 시스템 비정상 응답 등의 기술적 문제는 연구자가 실시간으로 모니터링하였으며, 분석이 어려운 일부 대화는 사전 기준에 따라 제외 처리되었다. 이러한 과정을 통해 결과의 신뢰도와 재현 가능성을 높이고자 하였다.

실험 종료 후, 참여자들은 각 조건별 자기개방 및 소통 깊이에 대한 인식을 구조화된 문항(5점 Likert 척도)을 통해 평가하였다. 1단계 분석 결과를 바탕으로 반응 양상이 뚜렷한 일부 참여자를 목적 표집하여 반구조화된 심층 인터뷰를 실시하였으며, 인터뷰 내용은 모두 녹음 및 전사되어 질적 자료로 축적되었다.

최종적으로, 수집된 인터뷰 전사본과 대화 로그는 MAXQDA 소프트웨어를 활용하여 주제 분석(Thematic Content Analysis)을 수행하였다. 이를 통해 입력 모달리티 유형에 따른 자기개방 및 감정 표현의 정서적 특성을 통합적으로 해석하고, 초기 정량 탐색 결과에 대한 보완적 이해를 도출하고자 하였다.

4-4 연구도구

1) 정량적 측정 도구: 자기개방 및 소통 깊이 척도

본 연구에서는 GPT 기반 입력 모달리티(텍스트 입력, 음성 입력)에 따른 자기개방과 소통 깊이를 탐색적으로 측정하기 위해, 구조화된 응답 척도를 활용하였다.

자기개방 척도는 Wheeless와 Grotz의 이론적 틀에 기반하여, 감정 표현, 자발성, 민감한 정보 공유 등 GPT 상호작용 상황에 적합한 하위 요인을 중심으로 구성되었다. 문항은 국내외 선행연구 [7],[8],[27]의 문항을 참조·재구성하였으며, 총 8문항으로 이루어졌다. 응답은 5점 Likert 척도(1 = 전혀 그렇지 않다, 5 = 매우 그렇다)를 사용하였고, 예시 문항은 “나는 GPT와의 대화에서 평소 말하지 않는 개인적인 이야기를 하게 되었다”, “나는 GPT에게 내 감정이나 기분에 대해 솔직하게 표현할 수 있었다” 등이다. 전체 문항은 부록 A에 제시하였다. 자기개방 척도의 내적 신뢰도는 텍스트 조건에서 Cronbach's α = .89, 음성 조건에서 .94로, 두 조건 모두 양호한 수준을 보였다.

소통 깊이 척도는 [8],[23],[26]이론에 기반하여, 대화의 정서적 몰입, 주제의 중요성, 공감 반응 등의 항목으로 구성되었다. 총 7문항으로, 동일한 5점 Likert 척도를 사용하였다. 예시 문항으로는 “이 인터페이스와의 대화는 단순한 정보 교환을 넘어 감정적으로 의미 있는 경험이었다”, “대화 중 다루어진 주제는 나에게 개인적으로 중요한 내용이었다” 등이 있으며, 전체 문항은 부록 A에 수록되어 있다. 소통 깊이 척도의 내적 신뢰도는 텍스트 조건에서 Cronbach's α = .95, 음성 조건에서 .97로, 높은 수준의 일관성을 보였다.

일반적으로 Cronbach’s α 값이 .70 이상일 경우 신뢰도가 양호한 것으로 간주되며[32], 본 연구에서 활용한 모든 척도는 신뢰도 측면에서 적절한 수준으로 판단된다. 각 척도의 신뢰도 분석 결과는 표 3에 제시하였다.

Reliability Analysis of Measurement Instruments

2) 질적 자료 수집 및 분석 방법

본 연구의 정성 분석은 GPT 기반 입력 모달리티(텍스트, 음성) 사용 과정에서 생성된 대화 로그와 반구조화된 개별 심층 인터뷰를 중심으로 이루어졌다. 이는 1단계 실험 결과를 맥락적으로 해석하고, 사용자의 정서 표현 및 자기개방 양상을 심층적으로 탐색하기 위함이다.

인터뷰는 각 입력 방식 사용 시 참여자들이 어떻게 감정을 표현했는지, 어느 방식에서 더 몰입을 느꼈는지를 중심으로 구성되었다. 대표 질문에는 “어떤 입력 방식에서 감정을 더 솔직하게 표현할 수 있었는가?”, “어떤 방식이 실제 사람과의 대화처럼 느껴졌는가?” 등이 포함되며, 질문지는 HCI 및 상담심리 전공 교수 2인의 사전 검토와 예비 면담을 거쳐 내용 타당성을 확보하였다.

인터뷰 참여자는 1단계 자기개방 및 소통 깊이 점수 분포를 고려하여 목적 표집되었으며, 반응 특성의 다양성을 확보하기 위해 이질적 표집 전략(Purposive & Heterogeneous Sampling)을 병행하였다. 이를 통해 다양한 연령, 선호도, 입력 반응을 반영한 질적 탐색이 가능하도록 설계하였다.

또한, 실제 상호작용 과정에서 생성된 텍스트 및 음성 기반 대화 내용은 모두 전사하여 질적 분석 자료로 활용하였다. 분석은 MAXQDA 소프트웨어를 활용하여 개방 코딩(Open Coding)을 통해 주요 의미 단위를 도출하고, 주제 분석을 통해 자기개방 및 소통 깊이에 관련된 정서적 특성과 표현 양상을 범주화하였다.

이러한 절차는 정량 분석 결과에 대한 해석적 타당성을 보완하고, GPT 기반 상호작용에서 입력 모달리티에 따른 심리적 반응 차이를 다면적으로 이해하는 데 기여하였다.


Ⅴ. 연구결과

5-1 기술통계 및 정규성 검토

본 연구에서는 GPT 기반 입력 모달리티(텍스트 입력, 음성 입력)에 따른 자기개방 및 소통 깊이의 정서적 반응 차이를 탐색적으로 검토하기 위해, 1단계 실험에서 수집된 데이터를 기반으로 주요 변수의 분포 특성 및 정규성 가정을 검토하였다.

먼저, 성별, GPT 사용 경험, AI 서비스 익숙도, 사전 입력 모달리티 선호도와 같은 범주형 변수에 대해서는 빈도(n)와 백분율(%)을 산출하였으며, 관련 결과는 표 4에 제시하였다.

Frequency analysis of demographic and categorical variables

한편, 연령, 자기개방(텍스트/음성), 소통 깊이(텍스트/음성)과 같은 연속형 변수에 대해서는 평균(M), 표준편차(SD), 왜도(skewness), 첨도(kurtosis)를 산출하였으며, 해당 결과는 표 5에 정리하였다. 정규성 검토는 기존 연구에서 제시된 기준(왜도 절댓값 ≤ 2, 첨도 절댓값 ≤ 7)에 근거하였으며[33], 모든 변수는 해당 기준을 충족하여 정규성이 확보된 것으로 판단된다.

Descriptive statistics of key variables(n = 20)

보완적으로 Shapiro–Wilk 검정을 통해 정규성 여부를 보완적으로 검토하였으며, 그 결과는 다음 절에서 기술하였다.

정량 설문 문항은 모두 5점 Likert 척도(1 = 전혀 그렇지 않다 ~ 5 = 매우 그렇다)로 구성되었으며, 자기개방과 소통 깊이 변수는 각 문항 점수의 평균으로 산출하였다. 응답 누락이 있는 사례는 제외하고, 모든 문항에 완전히 응답한 사례만 분석에 포함하였다.

본 연구는 탐색적 목적과 소규모 표본의 특성을 고려하여, 정규성 가정에 따라 우선적으로 비모수 검정을 사용하였다. 또한 조건 간 효과를 보다 정밀히 확인하기 위해 혼합설계 분산분석을 병행 적용하였다.

집단 간 효과 크기는 partial η² 값으로 산출하였으며, 해석은 Cohen의 기준에 따라 .01 이상은 작은 효과, .06 이상은 중간 효과, .14 이상은 큰 효과로 간주하였다. 해당 기준은 해석의 객관성을 확보하고 결과의 신뢰도를 높이는 데 활용되었다.

5-2 정규성 검정 결과

1) Shapiro-Wilk 정규성 검정

변수의 정규성 가정을 보다 엄밀히 검토하기 위해 Shapiro–Wilk 검정을 실시하였으며, 그 결과는 표 6에 제시하였다.

Shapiro-Wilk normality test results for key variables(n = 20)

검정 결과, 자기개방(텍스트 입력)과 소통 깊이(텍스트 및 음성 입력)의 p 값이 모두 .05 미만으로 나타나, 이들 변수는 정규성 가정을 충족하지 않는 것으로 나타났다. 반면, 자기개방(음성 입력)은 p = .06으로 유의수준 .05를 초과하여 정규성을 만족하는 것으로 판단되었다.

이에 따라 본 연구는 정규성을 충족하지 않는 일부 변수의 특성을 고려하여, 모수적 검정(t-검정) 대신 비모수 검정인 Wilcoxon 부호순위 검정(Wilcoxon Signed-Rank Test)을 적용하였다.

이러한 접근은 소규모 탐색적 연구 설계에서 정규성 위반에 따른 분석 왜곡 가능성을 최소화하고, 결과의 해석 타당성을 확보하기 위한 조치이다.

2) 입력 모달리티 간 차이 분석(Wilcoxon 부호순위 검정)

앞서 Shapiro–Wilk 정규성 검정 결과 일부 변수에서 정규성 가정이 충족되지 않아, 본 절에서는 텍스트 입력과 음성 입력 간 자기개방 및 소통 깊이의 차이를 비교하기 위해 비모수 검정인 Wilcoxon 부호순위 검정을 적용하였다.

분석 결과, 자기개방 수준은 텍스트 입력 조건(M = 3.96, SD = 0.79)과 음성 입력 조건(M = 3.89, SD = 0.93) 간의 차이가 Z = –0.52, p = .60으로 나타나, 통계적으로 유의미하지 않았다.

마찬가지로, 소통 깊이 역시 텍스트 입력(M = 3.84, SD = 1.01)과 음성 입력(M = 3.73, SD = 1.10) 간의 차이는 Z = –0.85, p = .40으로 유의한 차이가 확인되지 않았다. 해당 결과는 표 7에 정리하였다.

Differences in self-disclosure and communication depth by input modality (Wilcoxon signed-rank test)

이러한 평균 차이의 유의미하지 않은 결과는, 참여자의 연령대별 입력 모달리티 선호 차이가 영향을 미쳤을 가능성을 시사한다. 실제로 본 연구에서는 고연령층일수록 음성 입력을, 저연령층일수록 텍스트 입력을 선호하는 경향이 관찰되었으며, 이로 인해 전체 데이터를 단일 집단으로 분석할 경우 평균 효과가 상쇄되는 현상이 발생할 수 있다.

다만, 이 해석은 통계적으로 직접 검증된 결과가 아닌 탐색적 수준의 관찰이므로 해석에 주의가 필요하다. 해당 가설은 후속 절의 혼합설계 분산분석을 통해 입력 모달리티와 연령 간 상호작용 효과를 분석함으로써 보다 정밀하게 검토하고자 한다.

5-3 입력 모달리티가 자기개방과 소통 깊이에 미치는 영향에 대한 연령의 조절 효과 분석

입력 모달리티(텍스트 vs. 음성)와 연령 집단(저연령 vs. 고연령)에 따른 자기개방 및 소통 깊이의 차이와 상호작용을 검토하기 위해 혼합설계 분산분석을 실시하였다. 연령 집단은 전체 연령 분포의 중앙값 기준으로 이분화하였다.

자기개방 분석 결과, 입력 모달리티의 주효과는 F(1, 18) = 0.37, p = .55, partial η² = .02로 유의하지 않았다. 연령 집단의 주효과는 F(1, 18) = 5.43, p = .03, partial η² = .23로 유의하였으며, 모달리티 × 연령 간 상호작용은 F(1, 18) = 3.57, p = .08, partial η² = .17로 유의 경향성을 보였다.

소통 깊이에서는 입력 모달리티의 주효과가 F(1, 18) = 0.02, p = .89, partial η² = .00으로 유의하지 않았고, 연령 집단의 주효과는 F(1, 18) = 8.52, p = .01, partial η² = .32로 유의하였다. 입력 모달리티 × 연령 간 상호작용 효과는 F(1, 18) = 9.04, p = .01, partial η² = .33으로 통계적으로 유의한 상호작용이 확인되었다.

고연령 집단은 음성 입력에서, 저연령 집단은 텍스트 입력에서 각각 더 높은 소통 깊이를 보고하였다. 이는 앞서 Wilcoxon 검정에서 모달리티 간 유의한 차이가 나타나지 않았던 결과를 보완적으로 해석할 수 있는 근거로 작용한다. 관련 결과는 표 8에 제시하였다.

Mixed ANOVA results for self-disclosure and communication depth by input modality and age group(n = 20)

다만, 본 분석은 일부 변수에서 정규성 가정이 완전히 충족되지 않은 상태에서 수행된 것으로, 해당 결과는 탐색적 수준에서의 비교와 해석에 의의를 두어야 하며, 통계적 일반화에는 제한이 따른다. 향후 연구에서는 보다 충분한 표본 수와 정규성 충족 여부를 기반으로 한 추가 검증이 필요하다.

5-4 입력 모달리티와 사전 선호 일치 여부에 따른 자기개방 및 소통 깊이 분석

본 절에서는 입력 모달리티(텍스트 입력 vs. 음성 입력)와 사전 입력 모달리티 선호도(텍스트 선호 vs. 음성 선호)가 자기개방 및 소통 깊이에 미치는 영향을 살펴보고자, 혼합설계 분산분석을 실시하였다.

먼저, GPT 사용 경험과 입력 모달리티 간 상호작용을 살펴본 결과(표 9), 자기개방에서 GPT 사용 경험의 주효과는 유의하게 나타났으며, F(1, 18) = 5.43, p = .03, partial η² = .23이었다. 소통 깊이에서도 GPT 사용 경험의 주효과는 F(1, 18) = 8.52, p = .01, partial η² = .32로 유의하였다. 특히, 소통 깊이에 대한 입력 모달리티 × GPT 사용 경험 간 상호작용 효과는 F(1, 18) = 4.08, p = .04, partial η² = .34로 유의하게 나타나, GPT 사용 숙련도가 상호작용의 질에 영향을 미칠 수 있음을 시사한다.

Mixed ANOVA results for self-disclosure and communication depth by input modality and GPT usage experience(n = 20)

다음으로, 사전 입력 선호도와 실제 제공된 입력 방식 간 일치 여부를 중심으로 한 분석 결과(표 10), 자기개방에서 입력 모달리티의 주효과는 유의하지 않았으나(F = 1.66, p = .22), 사전 선호도의 주효과는 유의하였으며(F = 5.43, p = .03, partial η² = .23), 두 변수 간 상호작용은 유의 경향성(F = 3.57, p = .08, partial η² = .17)을 보였다.

Means, standard errors, and 95% confidence intervals of self-disclosure and communication depth by input modality and preference match(n = 20)

소통 깊이에 대해서는, 입력 모달리티의 주효과는 F = 2.09, p = .17로 유의하지 않았고, 사전 선호도의 주효과는 F = 8.52, p = .01, partial η² = .32로 유의하였다. 특히 입력 모달리티 × 선호도 간 상호작용 효과는 F = 9.04, p = .01, partial η² = .33으로 유의하여, 선호 일치 여부가 소통 깊이에 실질적인 영향을 미침을 확인하였다.

표 10에 제시된 평균 비교 결과에 따르면, 텍스트 입력을 선호하는 참여자는 텍스트 조건에서 자기개방(M = 3.64) 및 소통 깊이(M = 3.36)가 더 높았고, 음성 입력을 선호하는 참여자는 음성 조건에서 자기개방(M = 4.45), 소통 깊이(M = 4.41)가 가장 높게 나타났다.

이러한 결과는 사전 입력 모달리티 선호도와 실제 입력 방식의 일치 여부가 사용자 경험의 정서적 반응에 영향을 미치는 중요한 조절 요인임을 시사한다. 특히 선호 모달리티와의 일치가 자기개방 수준, 몰입, 소통 깊이를 향상시킬 수 있다는 점에서, 향후 맞춤형 GPT 인터페이스 설계의 실증적 근거로 활용될 수 있다.

이러한 결과는 소규모 탐색적 연구 설계에서 도출된 것으로, 결과 해석에는 신중함이 요구되며, 입력 선호와의 상호작용에 대한 경향성은 후속 연구에서 반복적으로 검증될 필요가 있다.

5-5 심층 인터뷰 분석 결과

본 연구는 GPT 기반 입력 모달리티(텍스트 입력, 음성 입력)에 따른 자기개방 및 소통 깊이의 차이를 보다 정교하게 탐색하기 위해 질적 분석을 수행하였다. 정량 분석 결과에서 자기개방 및 소통 깊이 점수가 높거나 낮게 나타난 참여자를 중심으로 목적 표집을 실시하였으며, 연령, 입력 모달리티 선호도, AI 서비스 익숙도 등의 이질성을 고려하여 참여자 구성을 다양화하였다. 최종 인터뷰 참여자의 인구통계학적 정보는 표 11에 제시하였다.

Demographic characteristics of in-depth interview participants

인터뷰는 반구조화된 질문지를 기반으로 진행되었으며, 각 참여자가 두 가지 입력 방식 모두를 경험한 뒤 느낀 감정 표현 방식, 몰입도, 자연스러움 등에 대한 인식을 탐색하였다. 대표 질문에는 “어떤 입력 방식에서 감정을 더 솔직하게 표현할 수 있었는가?”, “실제 사람과 대화하는 듯한 느낌을 더 많이 받은 방식은 무엇인가?” 등이 포함되었다. 질문지는 HCI 및 상담심리 전공 전문가 2인의 검토를 거쳐 내용 타당성을 확보하였다.

또한, 실험 중 생성된 대화 로그(텍스트 및 음성)는 모두 전사되어 인터뷰 자료와 함께 정성 분석에 활용되었다. 분석은 MAXQDA 소프트웨어를 활용하여 수행되었으며, 개방 코딩을 통해 주요 의미 단위를 도출하고, 주제 분석을 통해 자기개방 및 소통 깊이 관련 정서적 표현 양상을 범주화하였다. 분석의 신뢰도와 해석 타당성을 높이기 위해 연구자 삼각검증과 참여자 검증을 병행하였다.

이상의 절차를 통해 최종적으로 다섯 가지 핵심 주제가 도출되었으며, 각 주제는 입력 모달리티에 따라 드러나는 감정 표현, 몰입 양상, 표현 통제 방식의 차이를 중심으로 제시된다.

1) 표현 통제와 자기검열

텍스트 입력 모달리티는 내용을 입력하는 과정에서 반복적인 사고와 수정을 유도하여 자기검열 수준을 높이고, 보다 조심스럽고 신중한 표현을 유발하는 경향을 보였다. 반면, 음성 입력 모달리티는 즉각적인 반응을 요구하므로 비교적 솔직하고 즉흥적인 표현을 촉진하는 특성이 나타났다.

예를 들어, 한 참여자는 “텍스트는 여러 번 생각하고 고치다 보니 더 조심스러운 표현을 하게 되었어요”라고 응답하여 텍스트 입력이 신중한 표현을 유도함을 시사하였다(참여자 A). 반면, 또 다른 참여자는 “말로 하는 것은 생각을 걸러낼 틈 없이 즉각적인 반응이 나오다 보니 진심을 더 많이 표현할 수 있었어요”라고 진술하며 음성 입력이 진정성 있는 감정 표현을 가능하게 했다고 응답하였다(참여자 G).

이러한 결과는 표현 매체에 따라 감정의 필터링 정도와 자기표현 방식이 달라질 수 있음을 보여주며, 사용자들이 텍스트 입력 시에는 자기검열을, 음성 입력 시에는 감정의 직접적 표출을 더 많이 경험하는 경향을 반영한다. 이는 사회관계침투이론(SPT)에서 제시하는 자기개방의 ‘표면적 단계’가 입력 방식에 따라 어떻게 나타나는지를 설명해준다. 텍스트 입력은 보다 얕은 수준의 감정 공유에 머무르게 할 수 있으며, 음성 입력은 감정의 심층적 표현을 유도함으로써 자기개방의 심화 가능성을 높인다.

또한, 이러한 입력 방식의 차이는 사용자 맞춤형 인터페이스 설계에 시사점을 제공한다. 예를 들어, 감정 표현이 민감하거나 자기검열이 필요한 업무 환경(예: 법률 상담, 금융 서비스 등)에서는 텍스트 기반 인터페이스가 더 적합할 수 있고, 반대로 감정 이입과 공감이 중요한 서비스(예: 심리 상담, 치매 케어 AI 등)에서는 음성 인터페이스의 효과성이 높을 수 있다.

해당 인용 내용과 주제는 표 12에 질적 코딩 예시로 정리하였다.

Examples of qualitative coding for the theme 'expression control and self-censorship'

2) 감정 표현 방식과 표현의 정교성

텍스트 인터페이스는 감정을 시각적으로 구조화할 수 있으며, 이모티콘 활용이나 문장 수정 과정을 통해 보다 정교하고 명확한 감정 전달이 가능하였다. 반면, 음성 인터페이스는 억양, 속도, 리듬 등의 비언어적 특성을 통해 감정의 뉘앙스를 효과적으로 전달하며, 자연스럽고 몰입적인 정서 교환을 유도하였다.

“텍스트로 표현하면 내용을 눈으로 직접 확인할 수 있어 메시지의 의미가 더욱 명확해졌어요.” (참여자 D)
“말의 속도나 억양, 한숨 등 다양한 표현이 가능해서 인간적인 느낌을 더욱 강하게 받을 수 있었어요.” (참여자 F)
3) 사용 편의성과 접근성

음성 인터페이스는 손을 사용하지 않아도 된다는 점에서 직관적이고 빠른 소통이 가능하였으며, 멀티태스킹 상황이나 타이핑에 익숙하지 않은 사용자에게 특히 유리하게 작용하였다.

“음성 인터페이스는 다른 일을 하면서도 대화할 수 있어 매우 편리했어요.” (참여자 H)
“글로 쓰는 것보다 말로 하는 게 훨씬 빠르고 쉬워서 음성이 더 좋았어요.” (참여자 I)
4) 연령에 따른 인터페이스 선호 차이

고연령 참여자들은 음성 인터페이스의 직관성과 편의성을 강조하였으며, 텍스트 입력에 대한 신체적·인지적 부담감을 표현하였다. 반면, 저연령 참여자들은 텍스트 입력 방식에 익숙함을 보였으며, 감정 조절 및 자기표현 통제가 용이하다는 점에서 텍스트 선호 경향을 나타냈다.

“키보드를 사용하는 것이 어렵게 느껴져서 말로 하는 게 훨씬 편했어요.” (참여자 G)
“텍스트로는 충분한 생각을 할 수 있어서 내 감정과 생각을 더 깊이 있게 표현할 수 있었어요.” (참여자 H)

이러한 연령 기반 선호 차이는 UTAUT(통합기술수용이론)에서 제시하는 연령과 기술 친숙도의 영향력과도 일치하며, 사용자 특성에 따른 상호작용 선호의 분화를 설명한다. 고연령층은 복잡한 입력보다 음성과 같은 직관적이고 자연스러운 인터페이스를 선호하고, 저연령층은 표현의 통제성과 익숙함을 중시하는 경향을 보인다.

이러한 결과는 연령 집단별 사용자 맞춤형 인터페이스 설계 필요성을 시사한다. 예를 들어, 고령층을 대상으로 한 공공 민원 응답 시스템, 노인 돌봄 AI 서비스 등에서는 음성 중심의 상호작용이 효과적일 수 있으며, 학습자나 전문가 대상의 정보 정리형 시스템에는 텍스트 기반 인터페이스가 적합할 수 있다.

5) 인간적 상호작용에 대한 인식

음성 인터페이스는 실제 사람과 대화하는 듯한 감정적 몰입감과 공감적 상호작용을 제공한다는 인식이 강하게 나타났다.

“음성 인터페이스를 사용할 때는 마치 실제 사람과 대화하는 듯한 느낌이 들어 좋았어요.” (참여자 E)
“상대의 감정이나 뉘앙스를 느낄 수 있어 실제 사람과 소통하는 느낌을 받았어요.” (참여자 I)

이러한 질적 분석 결과는 양적 분석에서 평균 차이가 유의하지 않았던 결과를 보완해주며, 입력 모달리티와 사용자 특성(특히 연령)에 따라 상호작용 경험과 감정 표현 방식이 어떻게 달라지는지를 정교하게 설명해준다. 특히, 음성 인터페이스는 고연령층의 몰입과 자연스러운 소통에 효과적이었으며, 텍스트 인터페이스는 자기표현의 통제성과 명확성을 중시하는 사용자에게 적합한 방식임을 시사한다.

5-6 입력 모달리티 유형별 질적 코드 요약 및 분석

본 절에서는 텍스트 입력과 음성 입력이라는 두 가지 입력 모달리티에 따른 사용자 경험의 특성을 질적으로 요약하고 해석하였다. 앞서 도출된 다섯 가지 주제(표현 통제, 감정 표현, 사용 편의성, 연령별 선호도, 인간적 상호작용 경험)를 중심으로 인터페이스별 주요 반응 코드를 정리한 결과는 표 13에 제시하였다.

Summary of qualitative codes and user experiences by interface type

표 13은 각 인터페이스 유형에 따라 사용자가 경험한 정서적 반응, 표현 전략, 몰입 양상의 차이를 비교 정리한 것이다. 텍스트 인터페이스는 자기검열이 높고 표현이 신중하며, 이모티콘이나 문장 수정 등을 통해 정제된 감정 표현이 가능하다는 점에서 주로 젊은층 사용자에게 선호되는 경향을 보였다. 반면, 음성 인터페이스는 즉흥적이고 직접적인 감정 표현을 유도하며, 실제 사람과의 대화와 유사한 정서적 몰입 경험을 제공한다는 점에서 고연령층에게 더 직관적이고 효과적으로 작용하였다.

이러한 질적 분석 결과는 정량 분석에서 유의미한 차이가 관찰되지 않았던 부분을 해석적으로 보완하며, 입력 모달리티와 사용자 특성(특히 연령) 간의 상호작용이 감정 표현 방식과 상호작용 경험에 유의한 차이를 발생시킬 수 있음을 시사한다.

특히, 음성 인터페이스는 고연령층의 정서적 몰입을 강화하고, 텍스트 인터페이스는 자기표현의 정교성과 시각적 명확성을 중시하는 사용자에게 보다 적합하다는 점에서, 향후 인터페이스 설계 시 사용자 특성 기반의 맞춤형 접근이 필요함을 시사하는 실증적 근거로 기능할 수 있다.

1) GPT 인터페이스 사용 대화 자료 내용 분석 결과

본 연구는 텍스트 기반과 음성 기반 GPT 인터페이스를 활용한 실제 상호작용 대화 자료를 질적으로 분석하여, 사용자들이 자기개방과 감정 표현을 어떻게 실현하는지를 고찰하였다. 분석은 MAXQDA 소프트웨어를 활용하여 인터뷰 및 대화 로그를 전사한 후, 개방 코딩과 주제 분석을 통해 수행되었다.

그 결과, 총 5개의 상위 범주(자기개방, 감정 표현, 내면 독백, 표현 통제, 관계 지향성)와 이에 대응하는 25개의 하위 코드가 도출되었다. 분석 체계는 표 14에, 입력 모달리티 유형별 출현 빈도 비교는 표 15에 각각 제시하였다.

Coding framework for the qualitative analysis of GPT interface usage

Frequency comparison of superordinate and subordinate codes by interface type

‘자기개방’ 범주에서는 ‘감정적 진술’(텍스트 18회, 음성 15회)과 ‘고민’(텍스트 11회, 음성 20회)의 빈도가 높게 나타났다. 특히 음성 인터페이스에서는 보다 즉흥적이고 정서적인 방식으로 고민을 표현하는 경향이 도드라졌으며, 반면 ‘고백’은 텍스트 조건에서 14회, 음성 조건에서 3회로 나타나, 텍스트 기반 상호작용이 보다 숙고된 자기표현을 유도함을 보여주었다.

‘감정 표현’ 범주에서는 ‘불안’(텍스트 13회, 음성 15회), ‘감사’(3회, 8회), ‘애정’(5회, 5회), ‘희망’(5회, 4회), ‘외로움’(7회, 5회) 등이 관찰되었다. 음성 인터페이스는 억양, 속도, 리듬 등 비언어적 신호를 통해 감정을 보다 자연스럽게 표현하는 데 유리한 특성을 보였으며, 특히 ‘감사’와 ‘불안’은 음성 조건에서 더 자주 등장하였다.

‘내면 독백’ 범주에서는 ‘자기 상태 분석’(텍스트 7회, 음성 10회), ‘자기 다짐’(각 10회), ‘자기 회의’(각 4회), ‘자기 위로’(텍스트 4회, 음성 3회)가 확인되었다. 텍스트 기반 표현은 인지적 정리에 초점을 두는 반면, 음성 기반 표현은 감정적 반응과 자기 성찰이 동시에 발화되는 경향이 나타났다.

‘표현 통제’에서는 ‘신중함’이 텍스트 조건에서 27회, 음성 조건에서 18회로 가장 높은 빈도를 보였다. 이는 텍스트 입력이 표현을 보다 통제하고 조절하는 경향을 유도함을 시사한다. 반면 ‘즉흥성’은 양 조건 모두 6회로 동일한 출현 빈도를 보였지만, 텍스트에서는 반복어, 생략 부호 등의 형식적 표현이 주를 이루었고, 음성에서는 더 진솔하고 감정 중심적인 표현이 두드러졌다.

‘관계 지향성’ 범주에서는 ‘자신’, ‘가족’, ‘부모’, ‘자녀’, ‘배우자’, ‘친구’, ‘공동체’ 등 모든 하위 항목이 텍스트와 음성 조건 모두에서 유사한 빈도로 나타났다. 이는 인터페이스 유형과 무관하게 타인과의 정서적 유대 및 소속감을 표현하려는 경향이 일관되게 존재함을 시사한다.

이상의 분석 결과는 GPT 기반 상호작용에서 사용자 표현 양상이 입력 모달리티에 따라 질적으로 상이하게 나타남을 보여준다. 텍스트 인터페이스는 보다 숙고된 자기표현과 감정 조절을 유도하는 반면, 음성 인터페이스는 즉흥적이고 감정 밀도가 높은 표현을 촉진하며 정서적 몰입을 강화하는 특성이 있다. 이러한 질적 분석은 정량 분석 결과와 결합되어, GPT 기반 인터페이스의 설계와 적용에 있어 사용자 경험의 맥락적 다양성을 이해하는 데 중요한 시사점을 제공한다.


Ⅵ. 결론 및 논의

본 연구는 GPT 기반 입력 모달리티(텍스트 입력, 음성 입력)가 사용자 자기개방 및 소통 깊이에 미치는 영향을 분석하고, 이 관계에서 연령 및 사전 입력 선호도의 조절 효과를 탐색적으로 검토하였다. 이를 위해 설명적 순차 혼합연구 설계를 적용하였으며, 정량 분석과 정성 분석을 병행하였다.

정량 분석 결과, 입력 모달리티 자체는 자기개방과 소통 깊이에 대해 통계적으로 유의미한 차이를 보이지 않았다(p = .60 및 p = .40). 즉, 텍스트 입력과 음성 입력 간에 평균 차이는 존재하였으나 통계적으로 유의한 차이는 확인되지 않아 연구문제 1은 기각되었다. 반면, 연령과 사전 입력 선호도는 일부 항목에서 통계적으로 유의하거나(p = .01), 유의 경향성(p = .08)을 보여 조절 가능성을 시사하였다. 특히 연령과 입력 모달리티 간 상호작용은 자기개방과 소통 깊이 모두에서 일정한 영향을 미치는 것으로 나타나, 사용자 특성에 따라 GPT 기반 상호작용 경험이 상이하게 나타날 수 있음을 보여준다.

정성 분석에서는 정량 분석에서 포착되지 않았던 다양한 사용자 반응이 탐색적으로 확인되었다. 텍스트 입력은 사고의 정제와 반복 수정을 유도하여 자기검열 수준이 높고 표현이 신중해지는 경향이 있었으며, 음성 입력은 즉흥적이고 감정적인 표현을 촉진하는 특성이 나타났다. 이러한 경향은 반복적이고 안전한 상호작용 환경이 감정 중심의 자기개방으로 점진적으로 발전한다는 사회관계침투이론(SPT)의 구조와 일치한다[23].

또한, 텍스트 기반 인터페이스에서는 자기표현이 더 신중하고 통제된다는 경향이 보고되었으며[9], 음성 기반 인터페이스는 정서적 몰입감을 높인다는 선행연구 결과와도 일치한다[10]. 본 연구에서도 텍스트 입력 조건에서는 자기검열과 숙고된 표현이, 음성 입력 조건에서는 몰입과 감정 표현이 강조되어 기존 연구와의 정합성을 보였다. 특히 고연령 참여자는 음성 입력에서 몰입과 사용 편의성을, 저연령 참여자는 텍스트 입력에서 표현의 정교함과 익숙함을 보고하였다. 이는 연령에 따른 기술 수용성과 선호도 차이를 다룬 기존 연구 결과와도 일치한다[27],[30].

기존 연구들은 챗봇 상호작용에서의 자기개방[6],[8]이나 입력 방식에 따른 감정 표현의 차이[15],[16]를 분절적으로 다뤄온 반면, 본 연구는 동일 GPT-4 환경에서 텍스트와 음성이라는 입력 모달리티 유형을 통합적으로 비교하고, 사용자 특성(연령, 선호도, GPT 사용 경험 등)의 조절 효과를 함께 분석하였다는 점에서 차별성을 지닌다. 특히 정량·정성 분석을 결합하여 자기개방과 소통 깊이의 정서적 양상을 복합적으로 해석하였다는 점에서 학문적 의의를 갖는다.

다만, 혼합설계 분산분석 결과에서 나타난 상호작용 효과는 일부 통계적으로 유의하거나 유의 경향성을 보였지만, 일부 변수에서 정규성 가정이 완전히 충족되지 않은 상태에서 수행된 분석이었기 때문에 해석에는 신중함이 필요하다. 본 연구는 설명적 혼합설계를 기반으로 한 소규모 탐색 연구로서, 이러한 결과는 가설 생성적 관찰로 이해되어야 하며, 통계적 일반화보다는 후속 정밀 연구를 위한 기초자료로서 의미를 지닌다.

또한 본 연구 결과는 텍스트에서의 자기검열, 음성에서의 몰입과 감정 표현 등의 경향을 보여주었으며, 이는 GPT 환경에서도 기존 HCI 및 커뮤니케이션 연구의 연장선에서 관찰될 수 있는 반응 특성임을 확인한 수준에 해당한다. 따라서 본 연구의 이론적 기여는 GPT 기반 상호작용에서 기존 이론 구조의 반복 확인이라는 점에 그치며, GPT 고유의 상호작용 특성에 기반한 새로운 이론 개발에는 제한이 있음을 인식해야 한다.

한계점으로는 첫째, 본 연구는 탐색적 목적의 소규모 실험으로 진행되었기 때문에 정량 분석 결과의 일반화에는 분명한 제한이 있다. 특히 연령 집단을 중앙값 기준으로 이분화하여 분석함에 따라, 연속형 변수로서의 정보가 일부 손실되었고 각 집단 내 표본 수가 제한적이었기 때문에, 그룹 간 비교의 통계적 검정력 또한 저하되었을 가능성이 있다. 효과 크기의 해석은 보조적 참고 수준에 머물러야 하며, 연령에 따른 경향성 해석은 제한적으로 이루어져야 한다.

둘째, 입력 모달리티 조건의 실험 순서는 참여자의 자율적 선택에 따라 유연하게 구성되었으나, 무작위화되지 않았기 때문에 순서에 따른 반응 차이를 체계적으로 통제하지는 못했다. 결과 해석에 있어 잠재적인 순서 효과의 영향을 완전히 배제하기 어렵다.

셋째, 정성 분석은 반응 양상이 뚜렷한 참여자를 목적 표집하여 진행되었으며, 다양한 연령과 선호도를 고려한 이질적 구성 전략을 적용하였으나, 정성 분석 결과 역시 전체 집단을 대표하기에는 본질적 제약이 있다.

향후 연구에서는 조건 순서의 무작위화, 표본 수의 확대, 정성 분석의 반복적 구조화를 통해 GPT 기반 인터페이스 상호작용에서의 심리적 반응 메커니즘을 보다 정밀하게 규명할 필요가 있다. 이러한 제한에도 불구하고, 본 연구는 GPT 기반 상호작용에서 입력 방식과 사용자 특성 간 관계를 정서적 반응 수준에서 통합적으로 탐색한 초기 실증연구로서의 기초적 의의를 지닌다.


Ⅶ. 제 언

본 연구의 결과는 다음과 같은 실무적·학술적 시사점을 제공한다.

실무적으로는 사용자 집단별 맞춤형 인터페이스 설계의 필요성이 제기된다. 예를 들어, 고연령층, 키보드 조작이 어려운 사용자, 직관적 상호작용을 선호하는 사용자에게는 음성 입력 기반 인터페이스가, 자기표현을 통제하고 신중한 커뮤니케이션을 선호하는 사용자에게는 텍스트 입력 방식이 보다 적합할 수 있다. 이러한 사용자 특성 기반 인터페이스 전략은 공공 민원 시스템, 디지털 심리상담 챗봇, AI 기반 교육 플랫폼 등에서 실질적으로 활용될 수 있다. 다만, 본 연구 결과는 소규모 탐색적 분석에 기반하고 있으므로, 제시된 실무적 시사점은 후속 대규모 연구를 통해 반복 검증될 필요가 있으며, 실제 구현에는 제한적으로 적용되어야 한다.

실무적으로는 사용자 집단별 맞춤형 인터페이스 설계의 필요성이 제기된다. 예를 들어, 고연령층, 키보드 조작이 어려운 사용자, 직관적 상호작용을 선호하는 사용자에게는 음성 입력 기반 인터페이스가, 자기표현을 통제하고 신중한 커뮤니케이션을 선호하는 사용자에게는 텍스트 입력 방식이 보다 적합할 수 있다. 이러한 사용자 특성 기반 인터페이스 전략은 공공 민원 시스템, 디지털 심리상담 챗봇, AI 기반 교육 플랫폼 등에서 실질적으로 활용될 수 있다. 다만, 본 연구 결과는 소규모 탐색적 분석에 기반하고 있으므로, 제시된 실무적 시사점은 후속 대규모 연구를 통해 반복 검증될 필요가 있으며, 실제 구현에는 제한적으로 적용되어야 한다.

후속 연구에서는 다음과 같은 방향이 요구된다.

첫째, 대규모 표본을 바탕으로 한 모수적 검정이 가능하도록 설계하여 통계적 검정력을 확보해야 한다. 둘째, 실험 조건의 무작위화 또는 교차 설계를 통해 조건 순서에 따른 반응 차이를 정교하게 통제할 필요가 있다. 셋째, 정성 분석 참여자 선정 기준을 보다 체계화하고, 대표성과 다양성을 확보할 수 있는 표집 전략을 갖추는 것이 중요하다. 넷째, 심박수, 안구 추적 등의 생리적 반응 지표를 병행 수집함으로써 감정 반응의 객관적 해석을 도울 수 있다. 다섯째, 입력 모달리티별 감정 표현을 측정하는 척도의 타당도와 민감도 향상을 위한 도구 개발과 검증이 필요하다.

이러한 보완을 통해 GPT 기반 인터페이스의 입력 방식에 따른 심리적 반응 메커니즘을 보다 정밀하게 규명할 수 있으며, 이는 HCI, 감성 컴퓨팅, AI 인터페이스 설계 등 다양한 분야에서의 학술적 및 실무적 기여로 이어질 수 있다.

References

  • S. Bubeck, V. Chandrasekaran, R. Eldan, J. Gehrke, E. Horvitz, E. Kamar, ... and Y. Zhang, “Sparks of Artificial General Intelligence: Early Experiments with GPT-4,” arXiv:2303.12712, , 2023. [https://doi.org/10.48550/arXiv.2303.12712]
  • J. Liu, “ChatGPT: Perspectives from Human-Computer Interaction and Psychology,” Frontiers in Artificial Intelligence, Vol. 7, 1418869, 2024. [https://doi.org/10.3389/frai.2024.1418869]
  • OpenAI. Introducing Voice and Image Capabilities in ChatGPT [Internet]. Available: https://openai.com/blog/chatgpt-can-now-see-hear-and-speak
  • C. M. Fang, A. R. Liu, V. Danry, E. Lee, S. W. T. Chan, P. Pataranutaporn, P. Maes, J. Phang, ... and S. Agarwal, “How AI and Human Behaviors Shape Psychosocial Effects of Chatbot Use: A Longitudinal Randomized Controlled Study,” arXiv:2503.17473, , 2025.
  • C. Nass and Y. Moon, “Machines and Mindlessness: Social Responses to Computers,” Journal of Social Issues, Vol. 56, No. 1, pp. 81-103, 2000. [https://doi.org/10.1111/0022-4537.00153]
  • M. Skjuve, A. Følstad, and P. B. Brandtzæg, “A Longitudinal Study of Self-Disclosure in Human–Chatbot Relationships,” Interacting with Computers, Vol. 35, No. 1, pp. 24-39, 2023. [https://doi.org/10.1093/iwc/iwad022]
  • A. Luger and A. Sellen, “Like Having a Really Bad PA: The Gulf between User Expectation and Experience of Conversational Agents,” in Proceedings of the 2016 CHI Conference on Human Factors in Computing Systems, San Jose: CA, pp. 5286-5297, May 2016. [https://doi.org/10.1145/2858036.2858288]
  • H. Papneja and N. Yadav, “Self-Disclosure to Conversational AI: A Literature Review, Emergent Framework and Directions for Future Research,” Personal and Ubiquitous Computing, Vol. 29, pp. 119-151, 2025. [https://doi.org/10.1007/s00779-024-01823-7]
  • B. Kim, The Effects of Chatbot Usage Motivation and Multimodal Interaction on Trust, Intimacy, and Intention to Use: Focusing on Text and Voice Modes, Master’s Thesis, Sogang University, Seoul, 2023.
  • S. Jeong, A Study on Visualization for Information Delivery in Voice Interface (VUI): Focusing on Display-Type AI Speakers, Master’s Thesis, Ewha Womans University, Seoul, 2023.
  • A. Vaswani, N. Shazeer, N. Parmar, J. Uszkoreit, L. Jones, A. N. Gomez ... and I. Polosukhin, “Attention Is All You Need,” Advances in Neural Information Processing Systems, Vol. 30, pp. 5998-6008, 2017.
  • J. Liu, “ChatGPT: Perspectives from Human-Computer Interaction and Psychology,” Frontiers in Artificial Interaction, Vol. 7, 2024. [https://doi.org/10.3389/frai.2024.1418869]
  • Y. Kim, Implementation and Usability Evaluation of a Text-Based Interface: Focused on a Computer Animation Production Environment, Master’s Thesis, Yonsei University, Seoul, 2013.
  • J. A. Berger, M. D. Rocklage, and G. M. Packard, “Expression Modalities: How Speaking versus Writing Shapes Word-of-Mouth Communication,” Journal of Consumer Research, Vol. 49, No. 3, pp. 389-408, 2022. [https://doi.org/10.1093/jcr/ucab076]
  • D. Norman, The Design of Everyday Things, New York, NY: Basic Books, 2013.
  • B. Shneiderman, “Human-Centered Artificial Intelligence: Reliable, Safe & Trustworthy,” International Journal of Human–Computer Interaction, Vol. 36, No. 6, pp. 495-504, 2021. [https://doi.org/10.1080/10447318.2020.1741118]
  • M. Lombard and T. Ditton, “At the Heart of It All: The Concept of Presence,” Journal of Computer-Mediated Communication, Vol. 3, No. 2, 1997. [https://doi.org/10.1111/j.1083-6101.1997.tb00072.x]
  • S. Oviatt, “Ten Myths of Multimodal Interaction,” Communications of the ACM, Vol. 42, No. 11, pp. 74-81, 1999. [https://doi.org/10.1145/319382.319398]
  • R. W. Picard, Affective Computing, Cambridge, MA: MIT Press, 1997. [https://doi.org/10.7551/mitpress/1140.001.0001]
  • G. Stollnberger, A. Weiss, and M. Tscheligi, The Effect of Input Modalities, Different Levels of Task Complexity and Feedback Perception in a Human-Robot Collaboration Task, Master’s Thesis, University of Salzburg, Salzburg, Austria, 2014.
  • Y. Kim, “Effects of Text-Based and Voice-Based Interaction Methods on User Experience,” Journal of Digital Design, Vol. 13, No. 4, pp. 563-572, 2013.
  • V. J. Derlega and A. L. Chaikin, “Privacy and Selfdisclosure in Social Relationships,” Journal of Social Issues, Vol. 33, No. 3, pp. 102-115, 1977. [https://doi.org/10.1111/j.1540-4560.1977.tb01885.x]
  • I. Altman and D. A. Taylor, Social Penetration: The Development of Interpersonal Relationships, Evanston, IL: Holt McDougal, 1973.
  • S. H. Nam, “A Longitudinal Study on the Relationship between Personality, Attachment, Online Self-Disclosure, Family Intimacy, and Quality of Online Friendships among Adolescents,” Korean Journal of Developmental Psychology, Vol. 28, No. 4, pp. 1-32, 2015.
  • C. W. Jang, The Process of Change in the Experience of Self-Disclosure Usage According to the Professional Development of Experienced Counselors, Ph.D. Dissertation, Ewha Womans University, Seoul, 2025.
  • K.-H. Liang, W. Shi, Y. Oh, H.-C. Wang, J. Zhang, and Z. Yu, “Dialoging Resonance: How Users Perceive, Reciprocate and React to Chatbot’s Self-Disclosure in Conversational Recommendations,” Proceedings of the ACM on Human‑Computer Interaction, Vol. 8, No. CSCW1, 200, 2024. [https://doi.org/10.1145/3653691]
  • R. Choi, The Effect of Social Use of AI Chatbots on Voice Mode Usage: Focusing on the Moderating Effect of Locus of Control, Master’s Thesis, Hanyang University, Seoul, 2025.
  • H. Lee, Factors Influencing the Self-Disclosure Intention of Users with Trauma: Focusing on Interaction with Chatbots, Master’s Thesis, Keimyung University, Daegu, 2024.
  • Y. J. Lee, Exploring Psychological Responses to Facial Identity through Deepfake Tools: Moderating Effects of Selfdisclosure Tendency and Facial Exposure Avoidance, Master’s Thesis, Yonsei University, Seoul, 2021.
  • M. C. Kwon, A Study on the Impact of OTT Radio and Podcast on Terrestrial Radio Listening: Focusing on the Moderating Effect of Innovativeness, Master’s Thesis, Chung-Ang University, Seoul, 2017.
  • M. Kim, The Effect of High-Interactivity Prompt Engineering on Academic Achievement and Self-Efficacy: Focusing on ChatGPT, Ph.D. Dissertation, Ewha Womans University, Seoul, 2025.
  • J. C. Nunnally and I. H. Bernstein, Psychometric Theory, 3rd ed. New York, NY: McGraw-Hill, 1994.
  • J. C. Nunnally and I. H. Bernstein, Psychometric Theory, 2nd ed. New York, NY: McGraw-Hill, 1978.
  • J. Kim, The Relationship between College Students’ Selfdisclosure on SNS and Interpersonal Problems: The Mediating Effect of Empathy, Master’s Thesis, Daegu Catholic University, Daegu, 2021.
  • E. H. Kim, The Effects of Loneliness and Self-Disclosure on SNS Addiction: Focusing on College Students, Master’s Thesis, Daegu Catholic University, Daegu, 2019.
  • S. G. Woo, The Effects of Empathy and Self-Disclosure on Teachers’ Relationships with Students, Parents, and Peer Teachers, Master’s Thesis, Yonsei University, Seoul, 2016.
  • S. Y. Lee, The Effects of Adolescents’ Self-Disclosure, Social Support, and Ego-Identity on Peer Relationships, Master’s Thesis, Chung-Ang University, Seoul, 2016.
  • M. A. Park, The Mediating Effects of Emotional Expression and Ambivalence in the Relationship between Selfdisclosure and Marital Intimacy, Master’s Thesis, Korea University, Seoul, 2023.
  • S. Kim, E. Yang, and J. Kwon, “Effects of Online/Offline Self-Disclosure on the Sense of Community and Happiness: Comparison between the Horizontal Collectivism and the Vertical Collectivism,” Journal of Cybercommunication Academic Society, Vol. 30, No. 4, pp. 1-42, 2013.
  • H. S. Lee, The Relationship between Rumination on Trauma and Self-Disclosure: Focusing on Interaction with AI Chatbots, Master’s Thesis, Keimyung University, Daegu, 2024.
  • M. H. Seo, “The Relationship between Types of Self-Disclosure, Self-Concept, and Ego-Resilience,” Master’s Thesis, Keimyung University, Daegu, 2024.
  • C. W. Jang, The Process of Change in the Experience of Self-Disclosure Usage According to the Professional Development of Experienced Counselors, Ph.D. Dissertation, Ewha Womans University, Seoul, 2025.
  • M. Y. Lee, The Effects of Self-Disclosure and Empathic Response on Intimacy, Master’s Thesis, Korea University, Seoul, 2009.
  • S. Y. Kim, The Effects of Adolescents’ SNS Use on Self-Concept, Self-Disclosure, and Social Support, Master’s Thesis, Chung-Ang University, Seoul, 2017.
  • E. H. Chung, The Effects of Adolescents’ SNS Self-Disclosure on Peer Relationships: The Mediating Effect of Empathy, Master’s Thesis, Woosuk University, Wanju, 2023.
  • M. H. Cho, Changes in Language Anxiety and Willingness to Communicate at English Flipped Classroom, Master’s Thesis, Dankook University, 2019.
  • H. S. Kim, A Study on Changes in Teachers’ Perception through Educational Drama-Focused Communication Activities, Master’s Thesis, Yong In University, Gyeonggi, 2012.
  • H. H. Lee, A Study on Korean University Students’ Willingness to Communicate in English in EFL Contexts, Master’s Thesis, Seoul National University of Education, Seoul, 2016.
  • S. M. Han, A Conversational Analysis on Pragmatic Failures in Intercultural Communication between Korean Native Speakers and Korean Learners, Master’s Thesis, Yonsei University, 2005.

Appendix

부 록

Survey items for measuring self-disclosure and communication depth

저자소개

배현영(Hyun-Young Bae)

2024년:한국기술교육대학교 IT융합과학산업대학원 (공학석사 - AI융합교육학과)

2024년~현 재: 서강대학교 메타버스전문대학원 박사과정

※관심분야:AI, AI융합교육, 가상융합, 디지털트윈 등

김민재(Min-Jae Kimm)

2005년:서강대학교 언론대학원 디지털미디어 전공 석사

2009년:단국대학교 대학원 조형예술학 박사

2022년~현 재: 서강대학교 메타버스전문대학원 초빙교수

2023년~현 재: 한국공학대학교 교수

※관심분야:메타버스, 디지털콘텐츠, UX

Fig. 1.

Fig. 1.
Research model

Fig. 2.

Fig. 2.
Modified explanatory sequential mixed methods design

Table 1.

Major previous studies on the moderating effects of user characteristics in GPT-based interaction

Key Variable(s) Participants Theoretical Model Moderated Relationship Reference
Age, digital familiarity, trauma severity Adults with trauma experience SPT Self-disclosure intention ↔
Trust/disclosure toward chatbot
[28]
Self-Disclosure tendency, concern about facial exposure General adults
(experimental study)
Anonymous Interaction Model Chatbot interface ↔
Immersion and emotional expression
[29]
Technology innovativeness General users
(online panel)
TAM Self-congruity/expectation ↔
Continued use intention for GPT
[30]
GPT usage experience, gender, age University and elementary students User-Centered Interaction Framework GPT interaction ↔
Emotional and immersive response
[31]

Table 2.

Demographic and technology use characteristics of participants

ID Gender Age GPT Usage Frequency AI Service Familiarity Preferred Input Method Participation Type
U1 Male 36 Occasionally Moderate Text Survey, Interview
U2 Female 33 Frequently Very Familiar Voice Survey, Interview
U3 Male 24 Frequently Very Familiar Text Survey
U4 Male 23 Occasionally Moderate Voice Survey, Interview
U5 Male 27 Occasionally Moderate Text Survey, Interview
U6 Male 23 Frequently Very Familiar Text Survey
U7 Male 23 Frequently Familiar Text Survey
U8 Male 21 Frequently Familiar Voice Survey
U9 Male 24 Frequently Moderate Text Survey
U10 Male 28 Frequently Very Familiar Text Survey
U11 Male 42 Frequently Very Familiar Voice Survey, Interview
U12 Female 61 Never Unfamiliar Text Survey
U13 Female 65 Never Very Unfamiliar Voice Survey, Interview
U14 Male 65 Never Very Unfamiliar Voice Survey, Interview
U15 Female 45 Frequently Very Familiar Text Survey, Interview
U16 Female 63 Never Very Unfamiliar Voice Survey
U17 Male 64 Never Very Unfamiliar Voice Survey
U18 Female 43 Frequently Very Familiar Voice Survey, Interview
U19 Female 34 Frequently Very Familiar Text Survey
U20 Female 48 Frequently Very Familiar Voice Survey

Table 3.

Reliability Analysis of Measurement Instruments

Variables Number of Items Cronbach’s α
Self-Disclosure(Text Input) 8 0.89
Self-Disclosure (Voice Input) 8 0.94
Communication Depth(Text Input) 7 0.95
Communication Depth(Voice Input) 7 0.97

Table 4.

Frequency analysis of demographic and categorical variables

Variable Category Frequency (n) Percentage (%)
Gender Male 12 60
Female 8 40
GPT Usage Experience Never 5 25
Occasionally 3 15
Frequently 12 60
AI Service Familiarity Very Unfamiliar 4 20
Unfamiliar 1 5
Moderate 4 20
Familiar 2 10
Very Familiar 9 42.1
Interface Preference Text 10 50
Voice 10 50

Table 5.

Descriptive statistics of key variables(n = 20)

Variable No. of Items Min Max Mean
(M)
SD Skewness
Age 1 21 65 39.6 16.30 0.53
Self-Disclosure (Text Input) 8 2 5 3.96 0.79 –1.24
Self-Disclosure (Voice Input) 8 2 5 3.89 0.93 –0.75
Communication Depth (Text Input) 7 1.43 5 3.84 1.01 –1.04
Communication Depth (Voice Input) 7 1.57 5 3.73 1.10 –0.59

Table 6.

Shapiro-Wilk normality test results for key variables(n = 20)

Variable Shapiro–Wilk df p-value Normality
Self-Disclosure (Text Input) 0.89 20 p = .02 Not Satisfied
Self-Disclosure (Voice Input) 0.91 20 p = .06 Satisfied
Communication Depth (Text Input) 0.89 20 p = .03 Not Satisfied
Communication Depth (Voice Input) 0.89 20 p = .03 Not Satisfied

Table 7.

Differences in self-disclosure and communication depth by input modality (Wilcoxon signed-rank test)

Variable Input Modality Mean (M) SD Z p-value Result
Self-Disclosure Text 3.96 0.79 –0.52 p = .60 Not Significant
Voice 3.89 0.93
Communication Depth Text 3.84 1.01 –0.85 p = .40 Not Significant
Voice 3.73 1.10

Table 8.

Mixed ANOVA results for self-disclosure and communication depth by input modality and age group(n = 20)

Variable Effect F p Partial η² Result
Self-Disclosure
(SD)
Input Modality (Main Effect) 0.37 .55 0.02 Not Significant
Age Group (Main Effect) 5.43 .03 0.23 Significant
Input Modality × Age Group Interaction 3.57 .08 0.17 Marginally Significant
Communication Depth
(CD)
Input Modality (Main Effect) 0.02 .89 0.00 Not Significant
Age Group (Main Effect) 8.52 .01 0.32 Significant
Input Modality × Age Group Interaction 9.04 .01 0.33 Significant

Table 9.

Mixed ANOVA results for self-disclosure and communication depth by input modality and GPT usage experience(n = 20)

Dependent Variable Effect F p Partial η² Result
Self-Disclosure
(SD)
Input Modality (Main Effect) 1.66 .22 0.09 Not Significant
GPT Usage (Main Effect) 5.43 .03 0.23 Significant
Input Modality × GPT Usage Interaction 0.94 .41 0.11 Not Significant
Communication Depth
(CD)
Input Modality (Main Effect) 2.09 .17 0.12 Not Significant
GPT Usage (Main Effect) 8.52 .01 0.32 Significant
Input Modality × GPT Usage Interaction 4.08 .04* 0.34 Marginally Significant

Table 10.

Means, standard errors, and 95% confidence intervals of self-disclosure and communication depth by input modality and preference match(n = 20)

Variable Prior Input Preference Input Modality Mean (M) Standard Error (SE) 95% Confidence Interval
Self-Disclosure
(SD)
Text Preference Text 3.64 0.30 [3.04, 4.24]
Voice 3.34 0.29 [2.73, 3.95]
Voice Preference Text 4.29 0.14 [3.99, 4.59]
Voice 4.45 0.16 [4.10, 4.80]
Communication Depth
(CD)
Text Preference Text 3.36 0.37 [2.54, 4.18]
Voice 3.14 0.39 [2.29, 3.99]
Voice Preference Text 4.23 0.16 [3.86, 4.60]
Voice 4.41 0.18 [4.03, 4.79]

Table 11.

Demographic characteristics of in-depth interview participants

Participant Gender Age AI Service Familiarity Input Modality Preference
Participant A Male 36 Moderate Text
Participant B Female 33 Very Familiar Voice
Participant C Male 23 Moderate Voice
Participant D Male 27 Moderate Text
Participant E Male 42 Very Familiar Voice
Participant F Female 65 Very Unfamiliar Voice
Participant G Male 65 Very Unfamiliar Voice
Participant H Female 45 Very Familiar Text
Participant I Female 63 Very Unfamiliar Voice
Participant J Female 43 Very Familiar Voice

Table 12.

Examples of qualitative coding for the theme 'expression control and self-censorship'

Participant Quotation Code Theme
Note. Participant statements were translated and lightly edited for clarity.
“When typing, I thought and revised multiple times, so I ended up expressing myself more cautiously.” (Participant A) Self-censorship, Cautious expression Expression control
“Speaking allowed me to respond instantly without filtering my thoughts, so I was able to express my true feelings more.” (Participant G) Spontaneity, Direct emotional expression Expression control

Table 13.

Summary of qualitative codes and user experiences by interface type

Theme Code Text Interface Voice Interface
Expression Control High self-censorship, cautious expression Low self-censorship, spontaneous expression
Emotional Expression Use of emoticons and structured sentences for refined emotional delivery Emotional delivery through prosody, speech rate, rhythm, and pauses
User Convenience Preferred by younger users, allows visual confirmation of content Emotional delivery through prosody, speech rate, rhythm, and pauses
Perception of Human-Like Interaction Function-centered, difficulty with emotional immersion Felt like talking to a real person, emotionally engaging interaction

Table 14.

Coding framework for the qualitative analysis of GPT interface usage

Upper Code Lower Codes
Self-Disclosure Emotional Statements, Concerns, Emotional Retrospection, Confessions
Emotional Expression Anxiety, Gratitude, Affection, Hope, Loneliness
Inner Monologue Self-Reflection, Self-Promise, Self-Doubt, Self-Comfort
Expression Control Cautiousness, Spontaneous Reaction
Relationship Orientation Self, Family, Parents, Children, Spouse, Friends, Community

Table 15.

Frequency comparison of superordinate and subordinate codes by interface type

Upper Code Lower Code Text Voice
Self-Disclosure
(SD)
Emotional Statements 18 15
Concerns 11 20
Emotional Retrospection 4 3
Confessions 14 3
Emotional Expression Anxiety 13 15
Gratitude 3 8
Affection 5 5
Hope 5 4
Loneliness 7 5
Inner Monologue Self-Reflection 7 10
Self-Promise 7 10
Self-Doubt 4 4
Self-Comfort 4 3
Expression Control Cautiousness 27 18
Spontaneous Reaction 6 6
Relationship Orientation Self 10 10
Family 8 8
Parents 8 8
Children 7 7
Spouse 5 5
Friends 5 5
Community 3 3

Table 16.

Survey items for measuring self-disclosure and communication depth

Construct Survey Item References
Note. This English version is provided for publication purposes. The original items were developed and administered in Korean.
Self Disclosure 1. I shared personal stories that I usually don’ t talk about in my conversation with GPT. [34],[35]
2. I was able to express my emotions and feelings honestly to GPT. [36],[37]
3. I talked about my regrets or shameful experiences with GPT. [38]
4. GPT made me feel that it would not judge me for opening up. [39],[40]
5. I felt more comfortable talking to GPT than to a human. [41],[42]
6. I naturally expressed my inner feelings during conversations with GPT. [43],[44]
7. I frequently shared my thoughts and feelings with GPT. [35],[45]
8. As the conversation progressed, I gradually shared more personal stories. [42],[37]
Communication Depth 1.The conversation had emotional meaning beyond simple information exchange. [46]
2. The topics discussed were personally important to me. [47]
3. I felt GPT responded to me sincerely. [47]
4. The conversation progressed into deep and meaningful topics. [48]
5. The flow of conversation was natural and immersive. [49]
6. I felt that my emotions were respected in the conversation. [47]
7. As the conversation went on, I felt emotionally connected with GPT. [47]