Korea Digital Contents Society
[ Article ]
Journal of Digital Contents Society - Vol. 25, No. 12, pp.3593-3610
ISSN: 1598-2009 (Print) 2287-738X (Online)
Print publication date 31 Dec 2024
Received 14 Oct 2024 Revised 14 Nov 2024 Accepted 27 Nov 2024
DOI: https://doi.org/10.9728/dcs.2024.25.12.3593

확장된 UTAUT 모형을 활용한 AI 이미지 생성 도구 사용자들의 지속적 사용의도에 관한 연구: DALL-E 3, Midjourney, Stable Diffusion의 비교를 중심으로

진지훈1 ; 민자경2, *
1세종대학교 디자인이노베이션학과 박사과정
2세종대학교 디자인이노베이션전공 부교수
Study on Continuous Use Intention of AI Image Generation Tools Based on Extended UTAUT Model: Comparison of DALL-E 3, Midjourney, and Stable Diffusion
Zhi-Xun Chen1 ; Ja-Kyoung Min2, *
1Doctor’s Course, Department of Design Innovation and Visual Design, Sejong University, Seoul 05006, Korea
2Associate Professor, College of Design Innovation, Sejong University, Seoul 05006, Korea

Correspondence to: *Ja-Kyoung Min Tel: +82-2-3408-2972 E-mail: mjk@sejong.ac.kr

Copyright ⓒ 2024 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

초록

본 연구는 DALL-E, Midjourney, Stable Diffusion 세 가지 AI 이미지 생성 도구에 대한 사용자 만족도와 지속적 사용의도 간의 관계를 분석하고, 각 도구의 특성에 따른 차이를 비교하였다. DALL-E는 노력기대, 사회적 영향, 가격가치가 만족도에 유의미한 영향을 미쳤으며, 플랫폼 신뢰는 지속적 사용의도에 영향을 미치지 않았다. Midjourney는 만족도가 지속적 사용의도에 직접적인 영향을 미치는 동시에, 플랫폼 신뢰를 통해 부분매개효과를 보였다. 특히, 커뮤니티 상호작용과 혁신성향이 만족도와 신뢰 형성에 중요한 역할을 했다. Stable Diffusion은 만족도가 지속적 사용의도에 직접적 영향을 미치지 않았으며, 플랫폼 신뢰가 완전매개 역할을 했다. 디지털 기술역량은 DALL-E와 Midjourney에서 플랫폼 신뢰를 강화하여 지속적 사용의도를 높이는 조절된 매개효과를 보였지만, Stable Diffusion에서는 유의미하지 않았다. 이는 각 도구의 기술적 특성과 사용자 경험의 차이를 반영하였다.

Abstract

This study analyzed the relationship between user satisfaction and continued usage intention across three artificial intelligence (AI) image generation tools: DALL-E, Midjourney, and Stable Diffusion, further examining the differences stemming from each tool’s unique characteristics. For DALL-E, effort expectancy, social influence, and price value were found to significantly influence user satisfaction, whereas platform trust did not impact continued usage intention. In the case of Midjourney, user satisfaction directly affected continued usage intention, with platform trust serving as a partial mediator. Notably, community interaction and innovation tendency played pivotal roles in fostering satisfaction and trust. For Stable Diffusion, satisfaction did not directly influence continued usage intention, and platform trust acted as a full mediator. Digital technical competence demonstrated a moderated mediation effect in enhancing platform trust and increasing continued usage intention for DALL-E and Midjourney; however, this effect was not significant for Stable Diffusion.

Keywords:

UTAUT, AI Image Generation Tools, Use Intention, Digital Technological Competence, Platform Trust

키워드:

통합기술수용이론, AI 이미지 생성 도구, 사용의도, 디지털 기술역량, 플랫폼 신뢰

Ⅰ. 서 론

4차 산업혁명은 국가, 기업, 산업, 개인 전반에 걸쳐 혁신적인 변화를 일으키고 있으며, 디지털 기반의 기술혁신은 핵심 기술, 산업 체제, 직업 구조 등에 커다란 변화를 가져오고 있다. 특히, 인공지능(Artificial Intelligence, AI)은 사물 인터넷, 빅데이터, 모바일과 함께 현대사회의 변화를 주도하는 중요한 키워드로 부상하고 있다[1]. 딥러닝 기술의 발전으로 인공지능은 인간의 뇌 신경망을 모방한 자가 학습 방식을 기반으로 한 새로운 유형으로 등장하였다. 2022년 11월에 출시된 챗GPT 서비스는 컴퓨터가 아닌 실제 사람과 대화하는 것 같은 경험을 제공하며, 기존의 기술과 비교할 수 없는 높은 관심을 불러일으켰고, 사용자 수는 빠른 속도로 증가하고 있다. 이러한 생성형 AI는 텍스트, 이미지, 코딩, 음성, 영상, 사운드, 3D 등 다양한 분야로 확장되고 있으며[2], 특히 이미지 생성 AI는 인간이 그린 그림이나 사진과 비교할 때도 뛰어난 수준의 이미지를 생성할 수 있어, 사회적 및 경제적 측면에서 큰 영향을 미치고 있다. 가장 주목받는 이미지 생성 기술 중 하나는 생성형 적대 신경망(Generative Adversarial Networks, GAN) 모델을 적용한 이미지 생성형 AI로, 사용자는 텍스트 프롬프트를 입력하여 시각적으로 아름답고 독창적인 이미지를 생성할 수 있다[3],[4].

그러나, 생성형 AI의 결과물은 본질적으로 가변적이며, 텍스트 프롬프트의 개방성으로 인해 이미지 구성의 제어에 한계가 존재한다. 이러한 이유로 사용자는 AI 시스템과의 상호작용에서 어려움을 겪을 수 있다. 텍스트 프롬프트만으로는 원하는 이미지를 정확히 표현하기 어렵고, 무작위적이고 일관성이 없는 과정과 수많은 시행착오로 인해 원하는 이미지와 정확히 일치하는 결과를 얻지 못해 사용자는 좌절감을 느끼게 된다[5],[6]. 사용자는 다양한 목적과 목표를 가지고 이미지 생성형 AI를 사용하지만, 시스템과의 상호작용 방식에 차이가 존재하므로, 사용자 의도를 효과적으로 표현할 수 있는 방법과 원하는 이미지를 생성할 수 있는 상호작용 방식에 대해 사용자 경험 관점에서 철저히 고려할 필요가 있다[7]. 이러한 접근은 사용자가 AI 시스템을 보다 효율적으로 활용할 수 있도록 지원하며, AI와의 상호작용에서 발생하는 문제를 해결하는 데 기여할 것이다.

한국 국내에서 AI 이미지 생성 도구에 대한 선행연구는 주로 유용성과 효율성을 높이기 위한 사례 연구 및 프롬프트 요소에 관한 연구에 집중되어 있다[8],[9]. 이러한 연구들은 대부분 주관적 사례 분석을 중심으로 이루어졌으며, 객관적인 자료의 지원이 부족한 한계가 있다. 본 연구는 기존의 연구들과는 달리, 사례 기반의 분석을 넘어서 AI 이미지 생성 도구를 활용한 사용자의 경험을 통해 유의미한 객관적 자료 및 관찰된 통계 자료를 바탕으로 분석을 진행한다. 이를 통해, AI 이미지 생성 도구의 실제 사용성과 효율성에 대한 보다 정확한 평가와 객관적인 이해를 제공하고자 한다. 본 연구는 인공지능 수용 의도를 측정하기 위해, 1980년 이후 개발된 다양한 기술 수용 모형을 심층적으로 검토하였으며, 특히 국외 연구에서 널리 활용된 인공지능 수용 이론을 참조하였다[3],[5]. 이 중 통합기술수용이론(UTAUT; Unified Theory of Acceptance and Use of Technology)을 연구 모형으로 최종 선정하여 분석을 진행하였다. 이는 소비자들이 특정 정보기술을 어떻게 수용하고, 그 이유가 무엇인지를 이해하기 위해, 많은 연구자들이 태도, 행동의도, 행동만족도 등 사회심리학적 변수를 중심으로 한 접근법을 활용하고 있다. 또한, 본 연구에서는 2024년 최고의 13가지 AI 아트 생성기 목록[10]을 기준으로 DALL·E 3, Midjourney AI, Stable Diffusion을 대상도구로 선정하여 연구를 진행하고자 한다.

본 연구의 절차는 다음과 같다. 첫째, 세 가지 AI 이미지 생성 도구를 연구사례로 삼아, 인터페이스 디자인과 프롬프트 두 가지 측면에서 도구의 특성과 장단점을 분석한다. 둘째, 선행연구를 통해 UTAUT 모델의 각 변수에 대한 조작적 정의를 수행하고, 이를 기반으로 이론적 연구 틀과 연구가설을 수립한다. 셋째, 설문조사를 통해 데이터를 수집하고, 구조 방정식 모델을 구축하여 데이터를 분석한다. 이를 통해, 세 가지 AI 이미지 생성 도구 간의 변수 간 관계 차이를 비교 분석한다. 본 연구은 기존 연구에서 다루지 못한 부분을 보완하여, AI 이미지 생성 도구의 실질적 활용 방안을 모색하고, 사용자 경험을 보다 체계적으로 분석하는 데 기여할 것으로 기대된다.


Ⅱ. 이론적 배경 및 연구가설

2-1 AI 이미지 생성 도구

AI 이미지 생성 도구를 사용하여 창작할 때, 사용자가 직관적으로 경험하는 주요 요소는 인터페이스 디자인과 프롬프트 반응 능력의 두 가지 측면을 고려하는 것이 필수적이다[11]. 인터페이스 디자인은 사용자와 도구 간의 상호작용의 기초를 이루며, 간결하고 직관적인 레이아웃과 시각적 매력은 사용자가 처음 도구를 접할 때 주는 인상과 조작의 용이성에 큰 영향을 미친다[12]. 프롬프트 반응 능력은 도구의 핵심 성능을 나타내며, 사용자의 입력을 얼마나 정확하게 이해하고 이미지 생성 품질을 결정하는지에 중요한 영향을 미친다. 이는 사용자에게 제공되는 결과의 만족도뿐만 아니라 프롬프트를 조정해야 하는 빈도에도 영향을 미친다[2]. 높은 프롬프트 이해 능력은 도구의 효율성을 향상시켜 사용자가 필요에 맞는 결과를 신속하게 얻을 수 있게 한다. 이와 같이, 인터페이스 디자인과 프롬프트 반응 능력은 도구의 사용자 경험을 전반적으로 개선하고, 사용자가 원하는 창작 결과를 효율적으로 달성할 수 있도록 돕는다.

1) DALL-E 3

DALL·E 3는 OpenAI에서 개발한 최신 텍스트-이미지 생성 AI 모델로, 2023년에 출시되었다. 이 모델의 이름은 픽사 애니메이션의 주인공 로봇 ‘WALL·E’와 초현실주의 화가 ‘살바도르 달리’의 이름을 결합하여 명명되었다[13]. DALL·E 3는 사용자에게 직관적이면서도 강력한 이미지 생성 기능을 제공한다. 프롬프트가 세부적이지 않을 경우 이미지의 품질이 다소 떨어질 수 있지만, 그 대신 창의적이고 개성 있는 결과물을 생성하여 예술가의 작품과 같은 독창성을 자주 나타낸다. 이 도구는 강화된 텍스트-이미지 연관성을 기반으로, 사용자의 복잡하고 구체적인 설명을 반영하며, 다양한 스타일과 주제를 지원한다. 이를 통해 사용자는 다양한 창의적 시각 결과물을 얻을 수 있다. 그림 1과 같이 DALL·E 3는 OpenAI 웹사이트의 서브 페이지를 통해 접근할 수 있으며, 현재는 GPT-4.0 유료 버전에서만 사용 가능하다. 이와 같은 기능적 특성은 DALL·E 3를 현대 텍스트-이미지 생성 모델의 최전선에 위치시키며, 연구와 실용적 응용 모두에서 중요한 역할을 한다.

Fig. 1.

DALL-E3 interface

DALL·E는 사용자 친화적인 간단한 인터페이스를 제공하며, 프롬프트 사용법에서도 특별한 문법 없이 쉽게 활용할 수 있는 특징을 지닌다. 이전 버전인 DALL·E 2에서는 최초 생성된 이미지를 조정하기 위해 사용자가 원하는 이미지를 선택한 후, 표시되는 서브 아이콘의 ‘Edit’ 기능으로 진입하여 대략적인 형태로 원하는 양식으로 확장해야 했다. 이러한 과정은 다소 복잡하고 직관적이지 않은 방식이었다. 그러나 DALL·E 3에서는 이러한 조정용 서브 아이콘이 완전히 제거되고, 오로지 텍스트 프롬프트를 통한 조정에 의존하게 되었다(그림 2). 이로 인해 사용자는 보다 단순하고 직관적인 방식으로 이미지 생성 과정을 조정할 수 있게 되었으며, 텍스트 프롬프트의 중요성이 더욱 강조되었다. 이러한 변화는 DALL·E 3의 사용자 경험을 개선하고, 도구의 사용 편의성을 크게 향상시키는 방향으로 작용하고 있다.

Fig. 2.

DALL-E3 image adjustment prompt

2) Midjourney AI

Midjourney는 Leap Motion의 공동 설립자였던 David Holz가 이끄는 Midjourney 팀에서 개발한 이미지 생성 AI 도구로, 디스코드(Discord) 채팅 및 커뮤니티 앱을 통해서만 사용이 가능하다. 그림 3과 같이 사용자는 입장한 디스코드 채널에서 ‘/imagine’ 명령어 뒤에 프롬프트를 입력하여 이미지를 생성하며, Midjourney는 주로 초현실적인 이미지를 생성하는 경향이 있다. 디스코드에서 이미지를 생성하는 인터페이스는 게시판 형식의 채팅 플랫폼을 기반으로 하고 있으며, 이는 디스코드 가입 및 채팅 방식의 불편함을 감수해야만 사용할 수 있는 구조를 취하고 있다. 사용자가 입력한 명령에 따라 생성된 이미지는 대화창의 다른 이미지들에 의해 밀려 위로 올라가므로, 이전 이미지를 찾기 위해서는 대화창을 스크롤해야 하는 불편함이 있다.

Fig. 3.

Midjourney interface

디스코드는 원래 게임 사용자들이 함께 사용하던 텍스트 및 음성 채팅 플랫폼으로, 채팅봇 기능을 개발하고 운영할 수 있는 부가 서비스를 제공한다. Midjourney 개발자들은 게임과 채팅에 익숙한 디스코드에서 초기개발 협의와 테스트를 진행하였고, 최종적으로 디스코드 채팅봇 서비스 형태로 운영하기로 결정하여 그림 4와 같은 게시판 형식의 인터페이스를 채택하였다. 디스코드를 처음 사용하는 사용자는 채팅 명령 형식의 결제 과정, 프롬프트 입력법, 개인 서버 구성 등 구체적인 사용법을 새롭게 익혀야 하는 불편함이 있으나, 프롬프트 사용에 익숙하지 않은 초보자들도 고품질의 이미지를 생성할 수 있어 사용자 수가 꾸준히 증가하고 있다. 초기에는 무료로 일부 기능을 사용할 수 있었으나, 현재는 무료 사용이 불가능하며 개인 사용자는 월 30달러의 비용을 지불해야 제한 없이 이미지를 생성할 수 있다.

Fig. 4.

Midjourney bulletin format interface

3) Stable Diffusion

Stable Diffusion은 2022년 Stability AI가 여러 학술 연구원 및 비영리 단체와 협력하여 개발 및 출시한 딥러닝 기반 텍스트-이미지 생성 모델이다. 이 모델은 기존의 이미지 생성 AI와 달리, 서비스에 접속할 필요 없이 개인 컴퓨터에 직접 설치하여 사용할 수 있는 유일한 모델로, 사용자는 자신의 컴퓨터에서 텍스트 설명에 따라 이미지를 생성할 수 있다. Stable Diffusion은 오픈 소스로 제공되므로, 누구나 소스 코드를 활용하여 자신만의 이미지 생성기를 구축할 수 있다. 이를 통해 전 세계의 개발자들이 다양한 시나리오에 맞춘 이미지 생성기를 개발하고 공유하고 있다. 그러나, 특정 시나리오에서는 이미지 생성의 저하나 부정확성이 발생할 수 있으며, 개별 개발자의 접근성도 문제가 될 수 있다. 또한, 모델이 주로 영어 설명이 포함된 이미지로 학습되었기 때문에 알고리즘의 편향 가능성도 존재한다.

Stable Diffusion은 유일하게 개인 PC에 개별 설치가 가능하며, HTML로 제작된 인터페이스를 통해 복잡하면서도 세부적인 제어가 가능하다. 일반 프롬프트와 네거티브 프롬프트를 각각 입력할 수 있으며, 다양한 옵션과 고유의 프롬프트 작성 문법을 통해 이미지를 정밀하게 제어할 수 있다. 그림 5와 같이 단어의 중요도는 괄호를 사용하여 조정할 수 있으며, 슬라이더나 수치 입력을 통해 해상도와 같은 모든 제어 값을 세밀하게 조정할 수 있다. 한 번에 생성할 수 있는 이미지의 개수, 이미지 변화 정도, ControlNet 제어 등 다양한 옵션을 제공하여 초보자에게는 복잡하게 느껴질 수 있으나, 기본값을 유지하고 주요 프롬프트만 조정하여 쉽게 이미지를 생성할 수 있다. 이러한 특징으로 인해 Stable Diffusion은 사용자에게 강력한 커스터마이징 옵션을 제공하며, 텍스트-이미지 생성 분야에서 유연하고 강력한 도구로 자리매김하고 있다.

Fig. 5.

Stable Diffusion bulletin format interface

4) 각 도구의 기술적 차이

표 1에 나타난 것처럼, DALL-E 3, Midjourney AI, Stable Diffusion은 각기 다른 강점과 약점을 지니며, 기술적 구현 방식과 사용 목적에 따라 다양한 사용자 요구를 충족시킬 수 있다.

Comparison of features in AI image generation tools

DALL-E 3는 고급 딥러닝 모델 아키텍처를 기반으로 텍스트-이미지 변환을 수행한다. Transformer 아키텍처를 사용해 자연어를 디코딩하여 이미지 생성으로 연결하며, 모델은 대규모 텍스트 및 이미지 데이터셋을 통해 훈련되었다. 특히, 높은 품질의 이미지 생성은 세부적인 텍스트 명령어를 기반으로 이루어지며, 이미지를 구성하는 요소를 정확히 이해하고 조합할 수 있는 강력한 컨텍스트 해석 능력을 제공한다. 또한, ChatGPT와의 통합은 사용자가 이미지 생성 명령을 자연어로 입력할 수 있도록 지원해 접근성과 사용성을 크게 향상시켰다. 다만, 콘텐츠 생성 제한(예: 민감하거나 비윤리적인 주제와 관련된 콘텐츠 제한)과 구독 기반 기능 제공으로 인해 고급 기능 사용에는 추가 비용이 발생할 수 있다. DALL-E 3는 콘텐츠 제작자와 비전문가를 포함한 폭넓은 사용자층에 적합하다.

Midjourney는 생성적 적대 신경망(GAN)과 유사한 아키텍처를 사용하여 예술적 스타일이 두드러진 이미지를 생성하는 모델이다. 모델은 미세 조정된 데이터셋을 통해 훈련되었으며, 특히 회화적이고 감각적인 시각적 표현이 강조된 결과물을 생성한다. 플랫폼은 Discord 기반 상호작용을 특징으로 하며, 사용자는 채팅 명령을 통해 모델에 접근하고, 커뮤니티를 통해 생성된 작품을 공유하고 피드백을 받을 수 있다. 이는 사용자가 사회적 영향을 통해 플랫폼 신뢰를 강화하는 동시에, 독창적이고 실험적인 프로젝트를 개발하는 데 적합하다. 다만, Discord 플랫폼에 대한 이해와 적응이 필요하며, 구독 기반 모델로 인해 지속 사용 시 추가 비용 부담이 발생할 수 있다. Midjourney는 예술가, 디자이너, 창작자 등 창의적인 콘텐츠를 중시하는 사용자에게 적합하다.

Stable Diffusion은 오픈 소스 기반의 확산 모델(diffusion model)로, 이미지 생성을 위해 대규모 데이터셋에서 사전 훈련된 가중치를 활용한다. 이 모델은 사용자가 로컬 환경에서 배포 및 실행할 수 있도록 설계되어 있으며, 다양한 하드웨어와 소프트웨어 환경에서 실행 가능하다. 특히, 사용자에게 커스터마이징과 확장성을 제공해, 코드 수정, 데이터셋 변경, 모델 미세 조정이 가능하다. 이는 주로 기술적 요구 사항이 높은 개발자, 연구자 및 기업 사용자에게 적합하며, 사용자 정의를 통해 특정 산업이나 프로젝트에 최적화된 이미지를 생성할 수 있다. 그러나, 모델 실행을 위해 GPU 리소스 및 기술적 지식이 요구되며, 비전문가에게는 배포 및 사용 과정이 어려울 수 있다. Stable Diffusion은 연구 목적의 실험, 프로토타이핑, 또는 특정 요구사항을 만족하기 위한 맞춤형 프로젝트에 적합하다.

2-2 확장된 통합기술수용이론

Venkatesh et al.은 기술 수용에 대한 높은 예측력과 설명력을 제공하는 통합기술수용이론(UTAUT; Unified Theory of Acceptance and Use of Technology)을 제시하였다[14]. 이 이론은 기술수용모델, 합리적 행위 이론, 사회인지이론, 동기모델, 혁신확산이론을 포함한 8개의 주요 기술 관련 이론을 통합하여 구축된 것으로, 다양한 조직적 및 비조직적 환경에서 기술 수용과 사용의도에 영향을 미치는 핵심요인을 규명하는 데 폭넓게 적용되고 있다. 통합기술수용이론는 성과기대(Performance Expectancy), 노력기대(Effort Expectancy), 사회적 영향(Social Influence), 촉진조건(Facilitating Conditions)을 주요 변수로 삼아 소비자의 행동의도를 예측하는 데 효과적인 이론으로 평가된다. 본 연구에서는 AI 이미지 생성 도구의 특성을 고려하여 UTAUT의 주요 요인들을 모두 채택하였다.

성과기대는 소비자가 특정 기술을 사용함으로써 얻게 되는 이익의 정도로 정의되며, 이는 개인이 해당 기술이나 시스템이 자신의 성과 달성에 얼마나 기여할 것이라고 기대하는지를 나타낸다[15]. 본 연구에서는 AI 이미지 생성 도구 사용을 통해 얻을 수 있는 이익이나 만족도를 성과기대로 정의한다. 노력기대는 소비자가 기술을 사용하는 데 필요한 노력이 어느 정도 용이한지를 나타내며, 특히 기술 사용 초기 단계에서는 이를 극복하는 것이 중요한 과제가 된다[14]. 본 연구에서는 AI 이미지 생성 도구를 활용하는 과정에서 요구되는 노력과 그 노력을 극복함으로써 느끼게 되는 사용의 용이성을 노력기대로 정의한다.

사회적 영향은 가족, 친구 등 가까운 인물들이 특정 기술이나 시스템 사용에 대해 얼마나 긍정적 지지를 보내는지에 대한 정도를 의미한다[16]. 본 연구에서는 주변 친구들이 AI 이미지 생성 도구를 활용한 디자인 작업을 추천하는 정도를 사회적 영향으로 간주한다. 촉진조건은 개인이 기술을 사용하는 데 있어 필요한 조직적, 기술적 자원이나 기반이 얼마나 갖춰져 있다고 인식하는지를 의미한다[14]. 본 연구에서는 AI 이미지 생성 도구 사용을 위한 시스템 운영 능력, 장치, 기술적 지식 등의 보유 여부를 촉진조건으로 정의한다. 이러한 요인들이 충족될 때, 혁신적 기술에 대한 만족도와 사용의도가 높아지며, 그 결과 기술수용이 촉진될 것이다. 이를 바탕으로 본 연구는 다음과 같은 연구가설을 설정한다.

  • 가설 1: 사용자는 AI 이미지 생성 도구에 대한 성과기대가 서비스 만족도에 정(+)의 영향을 미칠 것이다.
  • 가설 2: 사용자는 AI 이미지 생성 도구에 대한 노력기대가 서비스 만족도에 정(+)의 영향을 미칠 것이다.
  • 가설 3: 사용자는 AI 이미지 생성 도구에 대한 사회적 영향이 서비스 만족도에 정(+)의 영향을 미칠 것이다.
  • 가설 4: 사용자는 AI 이미지 생성 도구에 대한 촉진조건이 서비스 만족도에 정(+)의 영향을 미칠 것이다.

Venkatesh et al.은 일반 소비 상황에서 개인적 요인이 더욱 자유롭게 반영될 수 있도록, 기존 정보 기술수용모델의 한계를 보완한 UTAUT2를 제안하였다[17]. 이후 다양한 연구자들이 UTAUT2를 각 첨단기술 분야에 적용하면서, 해당 환경에 적합한 새로운 요인을 추가하는 방식으로 연구를 확장해 왔다. 각 분야의 연구자들이 UTAUT 이론을 기반으로 자신들의 연구대상에 맞는 요인을 더해 ‘확장된’ UTAUT 모델을 활용한 사례들은 다음 표 2에 정리되어 있다.

References on UTAUT2

표 2에서 확인할 수 있듯이, Zhang, Yoon은 AI 기술이 적용된 무용예술공연에서 관람자가 느끼는 몰입감이 관람 만족도와 재관람 의도에 미치는 매개효과를 분석하였다. 연구결과, 사회적 영향, 가격 가치, 콘텐츠 품질 등 확장된 통합기술수용요인이 관람만족도에 유의미한 영향을 미친 반면, 성과기대는 관람 만족도에 큰 영향을 주지 않는 것으로 나타났다. 이를 통해 AI 기술이 접목된 무용공연에 대한 소비자 행동을 더욱 심층적으로 이해하려는 시도를 했다[15]. Lee의 연구는 확장된 UTAUT를 적용하여 ChatGPT Plus 유료 서비스 도입 및 확산 과정에서 소비자들의 사용의도와 구매행동에 영향을 미치는 요인을 분석하였다. 연구결과, 성과기대, 노력기대, 촉진조건, 쾌락적 동기, 가격 가치, 콘텐츠 품질이 ChatGPT Plus 구매의도에 유의미한 영향을 미친 반면, 사회적 영향과 이용 습관은 큰 영향을 미치지 않았다. 또한 학력이 성과기대, 쾌락적 동기, 콘텐츠 품질과 구매 의도의 관계를 조절하는 것으로 확인되었다[16]. Quan의 연구는 MZ세대가 AI 앵커를 사용하는 의도에 영향을 미치는 요인을 조사하였다. 혁신확산이론, 통합기술수용모델, 지각된 위험 이론을 바탕으로 7가지 요인(상대적 이점, 적합성, 관찰 가능성, 사회적 영향, 지각된 위험, 쾌락적 동기, 개인 혁신성)을 설정하고 실증연구를 진행한 결과, MZ세대는 AI 앵커에 대한 지식과 인지도가 낮으며 이용의도가 뚜렷하지 않았다. 특히, 관찰 가능성과 쾌락적 동기는 이용의도에 긍정적인 영향을 미쳤으나, 지각된 위험은 이용의도나 행동에 큰 영향을 주지 않는 것으로 나타났다[19].

본 연구는 기존 UTAUT 모델의 요소를 바탕으로 AI 이미지 생성 도구에 적용하고자 하였으며, 추가적으로 가격가치와 혁신성향 변수를 포함하였다. 가격가치는 소비자가 특정 기술을 사용할 때 지불한 비용 대비 얻는 혜택의 정도를 의미하며, 본 연구에서는 이를 AI 이미지 생성 도구를 통해 사용자들이 비용 대비 더 큰 혜택을 인식하는 정도로 정의한다. 혁신성향은 사회 집단 내에서 다른 구성원보다 새로운 기술을 빠르게 수용하고, 이를 분석하여 우수성을 찾아내는 능력을 의미하며, 새로운 기술에 대한 적극적인 태도는 과학기술 발전에 중요한 기여를 한다. AI 이미지 생성 도구에 대한 사용자의 혁신성향은 새로운 기술에 대한 개방성과 수용 의지를 반영하며, 본 연구에서는 이러한 혁신성향을 사용자가 AI 도구를 신속하게 받아들이고 창의적으로 활용하려는 경향으로 정의하고자 한다. 이 처럼, 사용자가 지불한 비용에 비해 도구의 성능과 기능이 적절하다고 판단할 때, 가격가치는 만족도를 증진시키는 중요한 요인이 된다. 또한, 혁신성향이 높은 사용자는 새로운 기술을 긍정적으로 받아들이고 적극적으로 활용하는 경향이 있어, AI 이미지 생성 도구의 새로운 기능을 탐색하며 더 큰 만족감을 느낄 가능성이 크다. 이러한 요인들이 결합되어 사용자의 전반적인 서비스 만족도에 긍정적인 영향을 미칠 것으로 예상되며, 이를 바탕으로 본 연구는 다음과 같은 연구가설을 제시하고자 한다.

  • 가설 5: 사용자는 AI 이미지 생성 도구에 대한 가격가치가 서비스 만족도에 정(+)의 영향을 미칠 것이다.
  • 가설 6: 사용자는 AI 이미지 생성 도구에 대한 혁신성향이 서비스 만족도에 정(+)의 영향을 미칠 것이다.

2-3 사용자 만족도 및 지속적 사용의도

사용자 만족은 특정 제품이나 서비스의 이용 경험을 바탕으로 한 전반적이고 주관적인 평가적 반응으로 정의된다. 이는 소비자의 기대를 초과하여 충족시켰을 때 나타나는 반응을 의미하며, 일반적으로 상품이나 서비스에 대한 소비자의 총체적인 평가로 간주된다[20],[21]. 만족은 태도 변화, 재구매 의도, 긍정적인 구전, 충성도, 불만 제기 등의 구매 후 행동에 영향을 미치기 때문에 마케팅에서 매우 중요한 개념으로 다루어진다. 사용자의 만족은 제품이나 서비스를 이용하는 과정에서 느끼는 주관적 즐거움의 정도로 이해되며, 이는 소비자의 감성적 측면을 고려한 개념이다[22]. 본 연구에서는 AI 이미지 생성 도구 사용 시 소비자가 느끼는 주관적 즐거움과 만족의 수준을 사용자 만족으로 정의한다. 또한, 사용의도는 특정 시스템에 대해 사용자가 태도를 형성한 후 이를 실행하려는 의지와 신념을 의미한다. 시스템 사용에 대한 개인의 의도를 측정하는 것은 사용의도 연구에서 중요한 부분으로 여겨진다. 지속적 사용의도는 사용자가 특정 기술이나 시스템을 장기적으로 사용할 의지를 나타내는 결정적 요인이다. 본 연구에서는 AI 이미지 생성 도구에 대한 소비자의 장기적인 사용 태도와 의지를 지속적 사용의도로 정의한다.

AI 기술이 적용된 서비스, 플랫폼, 애플리케이션의 사용과 관련된 연구에서는 소비자의 만족도와 지속적 사용의도에 대한 다양한 논의가 이루어지고 있다. AI 스피커 사용 경험을 대상으로 한 연구에서는 사용자가 인식한 가치와 만족도가 지속적 사용의도에 긍정적인 영향을 미친다는 결과를 도출하였으며, 이는 사용자 만족도가 지속적 사용의도에 중요한 역할을 한다는 점을 확인하였다[18]. 또한, AI 챗봇 이용자를 대상으로 한 연구에서는 세 가지 심리적 욕구(인지된 자율성, 인지된 유능성, 인지된 관계성)가 만족도 및 지속적 사용의도에 미치는 영향을 분석한 결과, 사용자 만족도가 지속적 사용의도에 긍정적인 영향을 미친다는 사실이 확인되었다[22]. 더불어, 생성형 AI 사용자들을 대상으로 한 연구에서도 사용자 만족도가 높을수록 지속적 사용의도가 강화된다는 결과가 나타났다[23]. 이러한 선행연구를 바탕으로 본 연구는 다음과 같은 연구가설을 제시하고자 한다.

  • 가설 7: 사용자는 AI 이미지 생성 도구에 대한 사용자 만족도가 지속적 사용의도에 정(+)의 영향을 미칠 것이다.

2-4 신뢰성

교환 관계에서 신뢰(Trust)는 정보, 제품, 서비스 등과 관련된 교환 참여자 간 기대 수준을 의미하며, 이는 교환 참여자가 사전에 인지한 내용과 일치하는 행동을 기대하는 것과 관련이 있다[24]. 신뢰는 거래 당사자 간 호의적이고 관대한 행동을 통해 형성되며, 이러한 우호적인 행위는 신뢰 구축의 중요한 요소로 작용한다. 상대방이 호의적인 태도를 보일 때, 거래자는 자연스럽게 그 대상자에 대해 신뢰를 형성하는 경향이 있다. 신뢰는 거래 관계에서 중요한 역할을 하며, 거래 당사자가 물리적으로 가까이 있지 않더라도 감각적인 정보를 통해 신뢰를 쌓을 수 있다. 온라인 플랫폼에서 신뢰를 형성하기 위해서는 사용자가 기대하는 가치를 지속적으로 제공하는 것이 필수적이다. 이러한 신뢰는 사용자가 해당 플랫폼에 계속 머물며 활동하게 만드는 핵심 요인이 된다[25]. 예를 들어, 미디어 플랫폼에서 사용자가 기대하는 주요 가치는 사회적 교류와 즐거움에 있으며, 이러한 가치를 충족시킬 때 플랫폼에 대한 신뢰가 형성될 수 있다[26].

이러한 신뢰성의 개념을 바탕으로 본 연구에서는 AI 이미지 생성 도구에 대한 신뢰성을 사용자가 해당 도구의 성능과 결과물의 품질을 믿고 의지할 수 있는 정도로 정의하고자 한다. 즉, 도구가 일관되게 높은 품질의 이미지를 생성하고, 사용자의 명령어와 설정에 맞춰 정확한 결과를 제공하며, 오류나 불안정한 작동 없이 안정적으로 작동하는지를 포함한다. AI 이미지 생성 도구의 신뢰성이 높을수록 사용자는 이를 다양한 작업에 자신 있게 활용할 수 있으며, 창의적 프로젝트나 상업적 용도로도 더욱 안심하고 사용할 가능성이 커진다. 반면, 신뢰성이 낮을 경우 사용자 경험에 부정적 영향을 미쳐 도구 활용도가 감소할 수 있다. 이처럼 AI 이미지 생성 도구에 대한 신뢰의 형성은 사용자가 해당 도구를 지속적으로 사용하는 데 중요한 동기 부여 요소이며, 사용자가 도구에 인지한 가치를 더욱 강화하는 기본 요건이 된다.

한편, 신뢰성과 지속적 이용 의도 간의 관계를 살펴본 Jeong, Kim의 연구에서는 신선식품 O2O 플랫폼을 대상으로, 플랫폼 이용경험이 있는 소비자들을 대상으로 한 실증분석을 통해 세분화된 이용 동기와 지각된 가치가 만족, 신뢰, 지속적 이용의도에 미치는 영향을 조사하였다. 연구결과, 신뢰성이 지속적 이용의도에 긍정적인 영향을 미치는 것으로 나타났다[24]. Zhou, Jung의 연구에서도 메타버스 플랫폼에 대한 신뢰가 형성될 경우 지속적 이용의도가 증가하는 것으로 확인되었다[22]. 또한, Jang et al.은 AI 기반 음성비서 서비스에서 신뢰와 프라이버시 염려가 지속적 사용에 미치는 영향을 분석하였으며, 405명을 대상으로 한 설문 조사 결과, 지각된 유용성, 이용 편의성, 사회적 영향이 AI 음성비서 서비스 이용에 긍정적인 영향을 미친 반면, 프라이버시 염려는 신뢰와 상호작용하여 지속적 이용 의도를 억제하는 것으로 나타났다. 이 연구는 AI 기술 도입 시 신뢰를 강화하고 프라이버시 우려를 완화하는 방안이 필요함을 강조한다[27]. 따라서, AI 이미지 생성 도구에서도 사용자가 도구의 성능과 데이터 보안에 대한 신뢰가 형성될 때 만족도가 높아지고, 장기적으로 도구를 지속적으로 사용하는 경향이 강화될 것으로 예상된다. 즉, 신뢰성은 사용자 경험을 긍정적으로 증대시키며, 프라이버시 우려를 줄여 지속적 사용의도를 촉진하는 중요한 매개요소로 작용한다. 이를 바탕으로 다음과 같은 연구가설을 제시하고자 한다.

  • 가설 8: 사용자는 AI 이미지 생성 도구에 대한 사용자 만족도와 지속적 사용의도의 영향관계에서 신뢰성은 매개효과를 작용할 것이다.

2-5 디지털 기술역량

디지털 기술 역량(Digital Technological Competence)은 디지털 기술 환경에서 정보 자원을 수집, 저장, 재생산하는 데 필요한 개인의 기술적 능력 수준을 의미한다[28]. 이는 사용자가 디지털 환경에서 기술적 문제나 이슈를 발견하고 이를 해결할 수 있는 자신감을 나타내며, 이러한 역량은 사용자의 디지털 자산 활용 및 성과 달성에 기여한다. 본 연구에서는 디지털 기술 역량을 AI 이미지 생성 도구를 사용하는 과정에서 정보 자원을 수집하고 조정 및 관리하는 데 필요한 개인의 기술적 능력과 적응력 수준으로 정의하고자 한다.

사용자의 디지털 기술역량은 첨단기술 환경에서 특정 행동을 촉진하는 핵심 요소로 작용한다. Lee et al.의 연구는 조직 내 기술역량이 협업 성과와 만족도에 미치는 영향을 분석하면서, 파트너 간 신뢰가 중요한 조절 역할을 한다는 점을 밝혔다[29]. 또한, Hwang의 연구, Zhou, Jung의 연구에서는 메타버스 환경에서 디지털 기술 역량이 신뢰와 지속적 이용의도 간 관계에서 조절역할을 한다는 사실을 확인하였다[22],[30]. AI 이미지 생성 도구는 복잡한 알고리즘과 다양한 입력 옵션을 제공하며, 프롬프트 작성, 스타일 조정, 파라미터 설정 등 세부적인 조정을 통해 결과물을 생성할 수 있다. 선행연구에 따르면, 디지털 기술역량이 높은 사용자는 이러한 복잡한 기능을 이해하고 효과적으로 활용하여 원하는 결과를 도출하고, 도구의 잠재력을 극대화할 수 있다. 반면, 기술역량이 낮은 사용자는 도구의 복잡한 기능을 충분히 이해하지 못해 결과물의 품질 저하나 사용상의 어려움을 겪을 가능성이 크다. 이를 바탕으로 본 연구는 다음과 같은 연구가설을 제시하고자 한다.

  • 가설 9: AI 이미지 생성 도구에 대한 사용자 만족도가 신뢰성을 통해 지속적 사용의도에 영향을 미치는 과정에서, 디지털 기술역량은 조절된 매개효과를 작용할 것이다.

Ⅲ. 연구방법

3-1 연구모형

본 연구는 선행연구들을 바탕으로 UTAUT 모형을 활용하여 DALL-E 3, Midjourney, Stable Diffusion 등 인공지능을 이용한 이미지 생성 플랫폼의 성과기대, 노력기대, 사회적 영향, 촉진조건, 가격가치와 사용자의 혁신성향이 사용자의 사용만족도에 미치는 영향을 플랫폼별로 각각 살펴보고자 한다. 또한, 이러한 사용만족도가 사용자들의 플랫폼에 대한 신뢰와 지속적 사용의도에 미치는 영향도 분석하고자 한다. 아울러, 이러한 영향 관계에서 플랫폼 신뢰의 매개효과와 사용자의 디지털 기술역량에 의한 조절된 매개효과가 있는지를 탐구하고자 한다. 이를 선행 연구를 바탕으로 체계적으로 모형화하여 그림 6을 통해 제시하였다.

Fig. 6.

Research model

3-2 변수의 측정

본 연구에서 활용된 설문지 항목들은 기존 연구에서 신뢰성과 타당성이 검증된 측정 도구들을 바탕으로 연구 목적에 맞게 수정·보완하여 사용하였다. 예비 조사를 통해 부적절한 문항들을 수정 및 보완함으로써 최종 설문 문항의 표면 타당성을 확보하였다. 모든 문항은 5점 리커트 척도(1점: 전혀 그렇지 않다 ~ 5점: 매우 그렇다)로 평가되었으며, 평균 점수가 높을수록 해당 변수의 수준이 높음을 의미한다. 각 요인별 측정 문항 구성 및 플랫폼별 요인의 신뢰성 분석 결과는 표 3에 제시되었다.

Composition of the scale of variables

DALL-E 3의 각 변수에 대한 Cronbach's α 값은 .774에서 .892로 나타났으며, Midjourney의 각 변수에 대한 Cronbach's α 값은 .777에서 .886, Stable Diffusion의 각 변수에 대한 Cronbach's α 값은 .788에서 .889로 나타났다. 이러한 값들은 모두 Nunnally & Bernstein이 제시한 기준인 .7을 초과하여 신뢰도가 높음을 확인할 수 있었다.

3-3 연구대상

본 연구는 인공지능 이미지 생성 플랫폼 DALL-E 3, Midjourney, Stable Diffusion의 사용 만족도와 지속적 사용 의도에 영향을 미치는 요인을 분석하기 위해 진행되었다. 연구 대상은 해당 플랫폼을 활용한 경험이 있는 30세 미만의 젊은 층으로 설정하였으며, 이들은 기술 수용성이 높고 디지털 플랫폼을 적극적으로 활용하는 주요 사용자층이라는 점에서 선정되었다. 연구 자료는 2024년 8월 10일부터 9월 10일까지 약 한 달간 온라인 자기보고식 설문조사를 통해 수집되었으며, 판단표본추출법을 사용하여 연구 목적에 부합하는 참여자를 모집하였다. 설문 시작 전에는 참여자들이 현재 사용 중인 플랫폼을 확인하는 스크리닝 과정을 거쳐 최종적으로 설문에 참여할 수 있도록 하였다. 조사 결과, 총 384개의 응답이 수집되었으며, 이 중 불성실한 응답으로 판단된 32개의 데이터를 제외한 352개의 유효 응답을 분석에 활용하였다. 설문 참여자들에게는 참여에 대한 감사의 표시로 4,000원 상당의 기프티콘을 제공하였다. 최종적으로 DALL-E 3을 사용한 응답자는 115명, Midjourney를 활용한 응답자는 130명, Stable Diffusion을 활용한 응답자는 107명으로 나타났다. 이러한 데이터를 바탕으로 본 연구는 각 플랫폼 사용자들의 만족도와 지속적 사용 의도에 미치는 주요 요인을 체계적으로 분석하고자 한다.

성별에서는 DALL-E 3과 Stable Diffusion 사용자는 여성이 남성보다 많았으나, Midjourney 사용자는 남성 비율이 52.3%로 여성보다 약간 높았다. 연령대 분포를 살펴보면, DALL-E 3 사용자는 20대가 55.7%, Midjourney 사용자는 20대가 58.5%, Stable Diffusion 사용자는 20대가 68.2%로 나타나 모든 플랫폼에서 20대 사용자가 가장 많은 것으로 확인되었다. 학력 분포를 보면, DALL-E 3 사용자의 경우 대학교 졸업(재학)이 34.8%, 전문대 졸업(재학)이 32.2%였으며, Midjourney 사용자는 각각 33.1%와 31.5%로 유사한 비율을 보였다. Stable Diffusion 사용자의 경우는 각각 30.8%와 26.2%로 나타났다. 모든 플랫폼에서 대학교 졸업(재학) 사용자가 가장 많았고, 그 다음으로 전문대 졸업(재학) 사용자가 많았다. 직업 분포에서는 모든 플랫폼에서 학생 비율이 가장 높았다. DALL-E 3 사용자의 경우 학생이 48.7%, Midjourney는 52.3%, Stable Diffusion은 41.1%로 나타났다. 주 플랫폼 이용 빈도에서는 DALL-E 3 사용자의 경우 56회 사용 비율이 36.5%로 가장 높았으며, Midjourney와 Stable Diffusion 사용자의 경우도 56회 사용 비율이 각각 32.3%와 36.4%로 가장 높게 나타났다.

3-4 자료분석

본 연구는 데이터 수집과 분석 과정을 명확히 기술하여 연구의 재현성을 높이고자, SPSS 29.0과 AMOS 26.0을 활용한 다양한 통계 기법을 적용하였다. 설문 조사 항목은 응답자의 기본 정보(예: 연령, 성별, 플랫폼 사용 경험), 사용만족도, 지속적 사용의도, 플랫폼 신뢰 및 디지털 기술역량을 측정하기 위해 Likert 5점 척도를 기반으로 설계되었으며, 응답자 모집은 디지털 플랫폼 관련 커뮤니티와 소셜 미디어를 통해 이루어졌다. 수집된 데이터는 기술통계분석과 신뢰도 분석, 상관분석을 통해 기본 구조를 확인하였으며, AMOS를 사용한 확인적 요인분석(CFA)을 통해 측정모델의 집중타당성과 판별타당성을 검증하였다. 경로분석을 통해 연구 모델의 적합성을 확인하고, 사용만족도와 지속적 사용의도 간의 관계에서 플랫폼 신뢰의 매개효과를 Process Macro의 Model 4로 분석하였으며, 매개효과의 유의성을 검토하기 위해 부트스트래핑 방법(표본 크기 5,000, 95% 신뢰구간)을 적용하였다. 추가적으로, 디지털 기술역량이 플랫폼 신뢰의 매개효과를 어떻게 조절하는지 확인하기 위해 Process Macro의 Model 14를 활용하여 조절된 매개효과 분석을 수행하였다. 이 과정에서 신뢰구간에 0이 포함되지 않을 경우 통계적으로 유의한 효과로 판단하였으며, 이를 통해 변수 간 구조적 관계와 조절·매개효과를 정교하게 규명하였다.


Ⅳ. 연구결과

4-1 상관관계 및 기술통계

본 연구에서는 각 플랫폼에 대한 성과기대, 노력기대, 사회적 영향, 촉진조건, 가격가치, 혁신성향, 사용만족도, 플랫폼 신뢰, 지속적 사용의도 및 디지털 기술역량 등의 주요 변수들 간의 상관관계를 분석하였다. 표 4에 제시된 결과에 따르면, DALL-E 3의 변수 간 상관계수는 r=.243에서 r=.578 사이로 나타났고, Midjourney는 r=.226에서 r=.480 사이, Stable Diffusion은 r=.255에서 r=.492 사이로 나타났다. 모든 상관계수는 p<.01 수준에서 통계적으로 유의한 정적 상관관계를 보였으며, 각 변수들 간 상관계수가 .850을 초과하지 않아 다중공선성의 위험이 없음을 확인할 수 있었다.

Discriminant feasibility analysis results and descriptive statistics

DALL-E 3의 각 변수에 대한 왜도는 –1.520에서 -.898 사이로, 첨도는 -.735에서 1.341 사이로 나타났다. Midjourney의 경우 왜도는 –1.349에서 -.590 사이로, 첨도는 -.920에서 .797사이로 나타났다. Stable Diffusion의 경우 왜도는 –1.096에서 -.459 사이로, 첨도는 –1.185에서 -.211사이로 나타났다. 모든 변수의 왜도의 절댓값이 2.0 이하이고 첨도의 절댓값이 7.0 이하인 기준을 충족함으로써, 본 연구에서 사용된 모든 변수들이 정규분포를 따르고 있다고 판단할 수 있으며, 이는 구조방정식 모델 검정의 기준을 충족함을 확인하였다.

4-2 확인적 요인분석 결과

측정모형의 적합성을 평가하기 위해 Kang의 제안에 따라 CMIN/DF, CFI, TLI, RMSEA, 그리고 SRMR 같은 적합도 지수를 검토하였다[40]. CMIN/DF는 3 이하, CFI와 TLI는 .90 이상, RMSEA와 SRMR은 .08 이하일 때 좋은 적합도로 평가된다. DALL-E 3의 측정모형 적합도 분석결과, χ²=779.252(df=618, p=.000), CMIN/DF=1.259, IFI=.926, TLI=.912, CFI=.923, RMR=.079, RMSEA=.048로 나타났다. 이는 모든 적합도 지수 기준을 충족하며, 잠재변수들이 관측변수들에 의해 잘 설명된다는 것을 의미한다. Midjourney의 측정모형 적합도 분석결과, χ²=760.671(df=620, p=.000), CMIN/DF=1.227, IFI=.941, TLI=.930, CFI=.939, RMR=.087, RMSEA=.042로 나타났다. 이 또한 모든 적합도 지수 기준을 충족하여 잠재변수들이 관측변수들에 의해 잘 설명되었음을 보여주었다. Stable Diffusion의 측정 모형 적합도 분석결과, χ²=765.479(df=620, p=.000), CMIN/DF=1.235, IFI=.932, TLI=.920, CFI=.930, RMR=.057, RMSEA=.047로 나타났다. 이는 모든 적합도 지수 기준을 만족하며, 잠재변수들이 관측변수들에 의해 잘 설명되고 있음을 확인하였다. 따라서 본 연구의 측정 모형은 세 가지 플랫폼 모두에서 높은 적합도를 보여주며, 이는 측정 모델이 자료에 잘 부합함을 나타낸다.

표 5에서 볼 수 있듯이, 각 플랫폼에 대한 확인적 요인분석 결과, DALL-E 3, Midjourney 및 Stable Diffusion의 모든 측정변수들의 요인 적재량이 .651에서 .864 사이로 나타났으며, 모두 .5 이상으로 p<.001 수준에서 통계적으로 유의미한 결과를 보였다. 이를 통해 DALL-E 3, Midjourney 및 Stable Diffusion에 대한 각 변수의 측정 모델이 자료에 적합함을 확인할 수 있었다. 잠재변수들의 집중타당성을 평가하기 위해 개념신뢰도(Construct Reliability: C.R)와 평균분산추출지수(Average Variance Extracted: AVE)를 검토한 결과, 모든 변수의 개념신뢰도는 DALL-E 3의 경우 .773에서 .892 사이, Midjourney의 경우 .780에서 .886 사이, Stable Diffusion의 경우 .790에서 .890 사이로 나타나 .7 이상의 높은 수준을 보였다. 평균분산추출값(AVE) 또한 DALL-E 3의 경우 .532에서 .641 사이, Midjourney의 경우 .541에서 .622 사이, Stable Diffusion의 경우 .572에서 .647 사이로 나타나 모두 .5 이상이어서 집중타당성이 충분히 확보되었음을 확인할 수 있었다.

Confirmatory factor analysis results

더불어, 잠재변수들의 AVE 제곱근이 다른 변수들과의 상관계수보다 높게 나타나면 판별타당성이 확보된다고 판단할 수 있다. 이에 따라 표 3에서 보이는 것과 같이, DALL-E 3, Midjourney 및 Stable Diffusion에 대한 모든 잠재변수들의 AVE 제곱근이 다른 변수들과의 상관계수보다 높게 나타나 판별타당성이 확보되었음을 확인할 수 있었다. 이는 각 플랫폼의 잠재변수들이 명확하게 구분되며, 서로 다른 개념들을 측정하고 있음을 의미한다.

4-3 경로분석 결과

표 6에 보이는 것과 같이 각 플랫폼에 대한 연구모형의 경로분석을 실시하였다. DALL-E 334의 구조모형 적합도를 검토한 결과, χ²=4712.541(df=536, p=.000), CMIN/DF=1.329, IFI=.908, TLI=.903, CFI=.911, RMR=.029, RMSEA=.051로 나타나 모델이 전반적으로 매우 우수한 적합도를 보였음을 확인할 수 있었다. 구조모형의 경로계수를 분석한 결과, 성과기대가 사용만족도에 미치는 영향은 통계적으로 유의하지 않았으나(β=.115, p>.05), 노력기대(β=.236, p<.05), 사회적 영향(β=.343, p<.001), 가격가치(β=.220, p<.05)가 사용만족도에 유의한 정(+)적 영향을 미치는 것으로 나타났다. 촉진조건(β=-.010, p>.05)과 혁신성향(β=.147, p>.05)은 사용만족도에 유의한 영향을 미치지 않는 것으로 나타났다. 사용만족도는 지속적 사용의도(β=.536, p<.001)에 유의한 정(+)적 영향을 미쳤다.

Hypothesis test result

Midjourney의 구조모형 적합도를 검토한 결과, χ²=727. 491(df=545, p=.000), CMIN/DF=1.335, IFI=.913, TLI=.950, CFI=.957, RMR=.058, RMSEA=.053로 나타나 모델이 전반적으로 매우 우수한 적합도를 보였음을 확인하였다. 구조모형의 경로계수를 분석한 결과, 성과기대가 사용만족도에 미치는 영향은 통계적으로 유의하지 않았으나(β=.070, p>.05), 노력기대(β=.238, p<.05), 사회적 영향(β=.444, p<.001), 가격가치(β=.199, p<.05), 혁신성향(β=.264, p<.05)이 사용만족도에 유의한 정(+)적 영향을 미치는 것으로 나타났다. 또한, 촉진조건(β=-.070, p>.05)은 사용만족도에 유의한 영향을 미치지 않는 것으로 나타났다. 사용만족도는 플랫폼 신뢰(β=.346, p<.01)와 지속적 사용의도(β=.301, p<.01)에 유의한 정(+)적 영향을 미쳤으며, 플랫폼 신뢰 또한 지속적 사용의도에 유의한 영향을 미쳤다(β=.298, p<.01).

Stable Diffusion의 구조모형 적합도를 검토한 결과, χ²=749.332(df=574, p=.000), CMIN/DF=1.305, IFI=.907, TLI =.902, CFI=.904, RMR=.072, RMSEA=.056로 나타나 모델이 전반적으로 매우 우수한 적합도를 보였다. 구조모형의 경로계수를 분석한 결과, 성과기대(β=.318, p<.001), 노력기대(β=.442, p<.001), 사회적 영향(β=.229, p<.05), 촉진조건(β=.297, p<.01), 혁신성향(β=.192, p<.05)이 사용만족도에 유의한 영향을 미치는 것으로 나타났으나 가격가치(β=.180, p>.05)는 사용만족도에 유의한 영향을 미치지 않는 것으로 나타났다. 사용만족도는 플랫폼 신뢰(β=.303, p<.01)에 유의한 정(+)적 영향을 미쳤으나, 지속적 사용의도(β=.192, p>.05)에는 유의한 영향을 미치지 않는 것으로 나타났다. 플랫폼 신뢰는 지속적 사용의도에 유의한 정(+)적 영향을 미치는 것으로 확인하였다(β=.549, p<.001).

4-4 플랫폼 신뢰의 매개효과 검증

본 연구에서는 각 플랫폼에 대한 사용만족도와 지속적 사용의도 간의 관계에서 플랫폼 신뢰의 매개효과를 검증하기 위해 부트스트래핑(bootstrapping) 방법을 적용하여, 5,000회의 부트스트랩 표본 추출과 95% 신뢰구간을 기준으로 분석을 진행하였다. 분석 결과는 표 7에서 확인할 수 있다.

Mediation effect analysis results

DALL-E 3에서 플랫폼 신뢰의 매개효과 검증 결과, 사용만족도가 플랫폼 신뢰를 경유하여 지속적 사용의도에 미치는 간접효과는 .031(p>.05)로 나타나 통계적으로 유의하지 않은 것으로 확인되었다. 또한, 신뢰구간(-.051~.099) 내에 '0'이 포함되어 있어, 플랫폼 신뢰의 매개 역할이 통계적으로 유의미하지 않음을 확인하였다.

Midjourney에 대한 플랫폼 신뢰의 매개효과 검증 결과, 사용만족도가 지속적 사용의도에 미치는 플랫폼 신뢰의 간접적 영향은 .074(p<.001)로 통계적으로 유의미한 것으로 나타났으며 신뢰구간(.040~.150) 내에 '0'이 포함되지 않아 플랫폼 신뢰의 중요한 매개 역할이 확인되었다. 또한, 사용만족도가 지속적 사용의도에 미치는 직접적 영향은 .275(p<.001)로 통계적으로 유의하였으며, 신뢰구간(.093~.456) 내에 '0'이 포함되지 않아 사용만족도가 지속적 사용의도에 대해 직접적인 영향을 미치는 것으로 나타났다. 즉, 사용만족도는 지속적 사용의도를 증가시키는 데 직접적으로 정(+)적 영향을 미칠 뿐만 아니라 플랫폼 신뢰를 통해 간접적으로도 영향을 미치는 것으로 확인되었다. 따라서, Midjourney의 경우 플랫폼 신뢰는 사용만족도와 지속적 사용의도 사이에서 부분적인 매개 역할을 하는 것으로 나타났다.

Stable Diffusion에 대한 플랫폼 신뢰의 매개효과 검증 결과, ‘사용만족도 ⟶ 플랫폼 신뢰 ⟶ 지속적 사용의도’ 경로의 간접 효과는 .107(p<.001)로 나타났다. 이 경로의 신뢰 구간이 .022~.218로, 0을 포함하지 않으므로 간접 효과가 통계적으로 유의함을 확인할 수 있었다. 이는 플랫폼 신뢰의 매개효과가 유의하게 나타났음을 의미한다. 또한, 사용만족도가 지속적 사용의도에 미치는 직접적 영향은 .168(p>.05)로 통계적으로 유의하지 않았으며, 신뢰구간(-.002~.338) 내에 ‘0’이 포함되어 있어 사용만족도가 지속적 사용의도에 직접적인 영향을 미치지 않음을 나타낸다. 따라서 사용만족도는 플랫폼 신뢰를 통해 간접적으로만 지속적 사용의도에 영향을 미치는 것으로 분석되었으며, 이러한 매개 관계는 완전매개로 해석된다.

4-5 디지털 기술역량의 조절된 매개효과 검증

본 연구에서는 사용만족도가 플랫폼 신뢰를 통해 지속적 사용의도에 미치는 간접효과가 디지털 기술역량 수준에 따라 어떻게 달라지는지 조사하기 위해 PROCESS macro의 Model 14를 사용하여 조절된 매개효과를 분석하였다. DALL-E 3에 관한 디지털 기술역량의 조절된 매개효과 검증결과는 표 8에 제시하였다. 분석결과에 따르면, 플랫폼 신뢰는 지속적 사용의도에 유의미한 영향을 미치는 것으로 나타났다(B=.329, p<.001). 디지털 기술역량도 지속적 사용의도에 유의미한 영향을 미쳤다(B=.310, p<.01). 또한, 플랫폼 신뢰와 디지털 기술역량의 상호작용 효과가 지속적 사용의도에 유의미한 영향을 미치는 것으로 나타났다(B=.228, p<.01). 이는 디지털 기술역량이 높을수록 플랫폼 신뢰가 지속적 사용의도에 미치는 영향이 강화됨을 의미한다.

Moderated mediation effect on DALL-E 3

한편, 사용만족도와 지속적 사용의도 간의 관계에서 플랫폼 신뢰의 조건부 간접효과를 디지털 기술역량의 평균 및 ±1 표준편차를 기준으로 분석한 결과, 평균-1SD일 때 간접효과는 .011(95% CI=.054~.101), 평균일 때 간접효과는 .028(95% CI=.019~.095), 평균+1SD일 때 간접효과는 .044(95% CI=.021~.129)로 나타났다. 이는 모든 경우에서 95% 신뢰구간의 하한값과 상한값 사이에 0이 포함되지 않아, 디지털 기술역량이 평균 및 ±1SD에서 플랫폼 신뢰가 사용만족도와 지속적 사용의도 간의 관계를 매개하는 간접효과가 통계적으로 유의하다는 것을 확인시켜준다. 즉, 디지털 기술역량이 높아질수록 플랫폼 신뢰를 통해 사용만족도가 지속적 사용의도에 미치는 긍정적인 영향이 커지는 것으로 나타났다. 이는 지속적 사용의도를 확대하기 위해서는 플랫폼 신뢰뿐만 아니라 디지털 기술역량을 강화하는 것도 중요하다는 점을 시사한다.

디지털 기술역량의 조절된 매개지수의 Bootstrapping 95% 신뢰구간에서 0이 포함되지 않음으로써, 디지털 기술역량에 의해 조절된 매개효과가 통계적으로 유의하다는 것이 확인되었다(매개지수=.014, 95% CI=.027~.063). 이는 DALL-E 3에 관한 사용만족도가 플랫폼 신뢰를 통해 지속적 사용의도에 미치는 간접효과가 디지털 기술역량에 의해 조절되고 있음을 의미한다.

Midjourney에 대한 디지털 기술역량의 조절된 매개효과 검증 결과는 표 9에 제시하였다. 분석 결과에 따르면, 플랫폼 신뢰는 지속적 사용의도에 유의미한 영향을 미치는 것으로 나타났다(B=.249, p<.001). 디지털 기술역량도 지속적 사용의도에 유의미한 영향을 미쳤다(B=.410, p<.01). 또한, 플랫폼 신뢰와 디지털 기술역량의 상호작용 효과가 지속적 사용의도에 유의미한 영향을 미치는 것으로 나타났다(B=.339, p<.01). 이는 디지털 기술역량이 높을수록 플랫폼 신뢰가 지속적 사용의도에 미치는 영향이 강화됨을 의미한다.

Moderated mediation effect on Midjourney

한편, 사용만족도와 지속적 사용의도 간의 관계에서 플랫폼 신뢰의 조건부 간접효과를 디지털 기술역량의 평균 및 ±1 표준편차를 기준으로 분석한 결과, 평균-1SD일 때 간접효과는 .031(95% CI=.051~.115), 평균일 때 간접효과는 .051(95% CI=.003~.138), 평균+1SD일 때 간접효과는 .071(95% CI=.001~.203)로 나타났다. 이는 모든 경우에서 95% 신뢰구간의 하한값과 상한값 사이에 0이 포함되지 않아, 디지털 기술역량이 평균 및 ±1SD에서 플랫폼 신뢰가 사용만족도와 지속적 사용의도 간의 관계를 매개하는 간접효과가 통계적으로 유의하다는 것을 확인시켰다. 즉, 디지털 기술역량이 높아질수록 플랫폼 신뢰를 통해 사용만족도가 지속적 사용의도에 미치는 긍정적인 영향이 커지는 것으로 나타났다. 이는 지속적 사용의도를 확대하기 위해서는 플랫폼 신뢰뿐만 아니라 디지털 기술역량을 강화하는 것도 중요하다는 것을 밝혔다.

또한, 디지털 기술역량의 조절된 매개지수의 Bootstrapping 95% 신뢰구간에서 0이 포함되지 않음으로써, 디지털 기술역량에 의해 조절된 매개효과가 통계적으로 유의하다는 것이 확인되었다(매개지수=.014, 95% CI=.025~.087). 이는 Midjourney에 대한 사용만족도가 플랫폼 신뢰를 통해 지속적 사용의도에 미치는 간접효과가 디지털 기술역량에 의해 조절되고 있음을 확인하였다.

Stable Diffusion에 대한 디지털 기술역량의 조절된 매개효과 검증결과는 표 10에 제시되어 있다. 분석결과, 플랫폼 신뢰가 지속적 사용의도에 유의미한 영향을 미치는 것으로 나타났다(B=.205, p<.001). 또한, 디지털 기술역량도 지속적 사용의도에 유의미한 영향을 미쳤다(B=.331, p<.01). 그러나, 플랫폼 신뢰와 디지털 기술역량의 상호작용 효과는 지속적 사용의도에 통계적으로 유의하지 않았다(B=.043, p=.547). 이는 플랫폼 신뢰가 지속적 사용의도에 미치는 영향이 디지털 기술역량에 조건적이지 않음을 확인하였다.

Moderated mediation effect on Stable Diffusion

또한, 조절된 매개효과의 분석은 개별 경로의 유의성 여부와 상관없이 조절된 매개 지수의 유의성에 기반하여 판단된다. 이에 따라 디지털 기술역량의 조절된 매개지수의 Bootstrapping 95% 신뢰구간을 확인한 결과, 신뢰구간 내에 0이 포함되어 있어 조절된 매개효과는 통계적으로 유의하지 않은 것으로 나타났다(매개지수=.014, 95% CI=-.020~.076). 이는 디지털 기술역량이 사용만족도와 지속적 사용의도 간의 관계에서 플랫폼 신뢰의 매개효과를 조절하지 않음을 의미한다.


Ⅴ. 결 론

5-1 논의

본 연구는 세 가지 AI 이미지 생성 도구를 사례로 하여, 인터페이스 디자인과 프롬프트 측면에서 각각의 특성과 장단점을 분석하였다. 또한, 선행연구를 바탕으로 UTAUT 모델의 변수들에 대해 조작적 정의를 내리고, 이를 토대로 이론적 연구 틀과 연구가설을 설정하였다. 설문조사를 통해 수집한 데이터를 구조 방정식 모델로 분석하였으며, 이를 통해 세 가지 AI 이미지 생성 도구의 변수 간 관계에서 나타나는 차이를 비교하였다. 연구결과는 다음과 같다.

첫째, DALL-E, Midjourney, Stable Diffusion 세 가지 AI 이미지 생성 도구에 대한 사용자 만족도와 지속적 사용의도에 대한 비교 분석 결과, DALL-E는 노력기대, 사회적 영향, 가격가치가 사용만족도에 긍정적인 영향을 미쳤으며, 이 만족도는 지속적 사용의도에 유의한 영향을 미쳤다. 반면, 성과기대, 촉진조건, 혁신성향은 유의미한 영향을 나타내지 않았다. Midjourney의 경우, 노력기대, 사회적 영향, 가격가치, 혁신성향가 사용만족도에 유의미한 영향을 미쳤으며, 이 만족도는 플랫폼 신뢰와 지속적 사용의도에 긍정적으로 작용했다. 이와 함께 플랫폼 신뢰 역시 지속적 사용의도에 중요한 역할을 했다. Stable Diffusion에서는 성과기대, 노력기대, 사회적 영향, 촉진조건, 혁신성향이 사용만족도에 유의한 영향을 미쳤고, 사용만족도는 플랫폼 신뢰에 긍정적인 영향을 미쳤다. 그러나 사용만족도는 지속적 사용의도에는 유의미한 영향을 미치지 않았으며, 플랫폼 신뢰는 지속적 사용의도에 중요한 영향을 미쳤다.

이처럼 각 플랫폼은 사용자 만족도에 영향을 미치는 요인과 지속적 사용의도에 차이를 보인다. 특히 Midjourney와 Stable Diffusion은 사회적 영향과 노력기대가 중요한 요소로 작용하는 반면, DALL-E는 가격가치와 사회적 영향이 주요한 영향을 미친다는 점에서 차별화된다. 세 가지 AI 이미지 생성 도구, 즉 DALL-E, Midjourney, Stable Diffusion 간의 차이는 각 플랫폼의 특성 및 사용자 경험에서 비롯된다. DALL-E는 창의적이고 독창적인 이미지에 대한 기대가 높아 가격가치와 사회적 영향이 사용자 만족도에 크게 작용하며, 사용자는 가격에 민감하게 반응한다. 반면, Midjourney는 커뮤니티 내 활발한 상호작용으로 인해 사회적 영향이 크게 나타나고, 혁신성향도 중요한 요인으로 작용하는데, 이는 플랫폼이 지속적으로 새로운 기능을 도입하기 때문이다. Stable Diffusion은 오픈 소스 기반으로 제공되어 사용자가 커스터마이징할 수 있는 점이 성과기대와 노력기대를 높이는 요소로 작용하며, 가격가치의 중요성은 상대적으로 낮다. 이러한 차이는 각 플랫폼의 사용자 경험, 기능 업데이트 방식, 커뮤니티 참여 방법의 차이에서 기인하며, 이에 따라 사용자 만족도와 지속적 사용의도에 서로 다른 영향을 미치게 된다.

둘째, DALL-E, Midjourney, Stable Diffusion 세 가지 AI 이미지 생성 도구에서 사용만족도와 지속적 사용의도 간의 관계에서 플랫폼 신뢰의 매개효과를 비교한 결과, DALL-E는 플랫폼 신뢰가 이 관계에 영향을 미치지 않는 것으로 나타났다. 즉, 간접효과가 통계적으로 유의하지 않아 DALL-E에서는 플랫폼 신뢰가 중요한 요인으로 작용하지 않는다는 것을 보여주었다. 반면, Midjourney에서는 플랫폼 신뢰가 중요한 매개 역할을 하였다. Midjourney에서는 사용만족도가 지속적 사용의도에 직접적인 영향을 미치는 동시에, 플랫폼 신뢰를 통한 부분매개효과도 확인되었다. 이는 사용자가 플랫폼에 대한 만족감을 느낄수록 지속적으로 이용하려는 의도가 높아지며, 이러한 관계는 플랫폼에 대한 신뢰가 형성될 때 더욱 강화된다는 점을 보여준다. 특히, Midjourney 사용자들은 플랫폼의 예술적 이미지 생성 능력과 활발한 커뮤니티 상호작용에서 만족감을 얻고, 이를 기반으로 플랫폼 신뢰가 지속적 사용의도를 촉진하는 중요한 요인으로 작용하고 있음을 시사한다. Stable Diffusion에서는 사용만족도가 지속적 사용의도에 직접적인 영향을 미치지 않고, 플랫폼 신뢰가 이 관계를 완전히 매개하는 것으로 나타났다. 이는 사용자가 만족감을 느끼더라도 플랫폼에 대한 신뢰가 없이는 지속적으로 사용하려는 의도가 형성되지 않는다는 것을 의미한다. Stable Diffusion은 오픈 소스 특성상 높은 유연성과 커스터마이징 가능성을 제공하지만, 안정성과 신뢰성이 확보되지 않을 경우 지속적 사용의도가 낮아질 수 있음을 보여준다. 이와 같은 결과는 두 플랫폼이 사용자 경험과 신뢰 형성에서 서로 다른 특징을 지니고 있음을 시사하며, 이를 기반으로 각 플랫폼에 적합한 개선 전략을 도출할 수 있다.

종합적으로, 세 도구는 플랫폼 신뢰의 매개효과에서 서로 다른 양상을 보인다. DALL-E는 플랫폼 신뢰가 매개 역할을 하지 않으며, Midjourney는 부분매개, Stable Diffusion은 완전매개효과를 보이는 점에서 각 도구의 사용자 경험과 신뢰 형성의 중요도가 다르게 작용함을 알 수 있다. DALL-E는 창의적이고 실험적인 이미지 생성에 집중하는 사용자들이 결과물에 중점을 두어 플랫폼 신뢰의 역할이 미미한 것으로 나타났다. 반면, Midjourney는 활발한 커뮤니티와 사용자 간 교류를 통해 플랫폼 신뢰가 형성되며, 이 신뢰가 사용만족도와 지속적 사용의도 간의 관계에서 부분적으로 매개효과를 발휘한다. Stable Diffusion의 경우, 오픈 소스 특성으로 인해 사용자들이 기술적 안정성에 대한 신뢰를 갖춰야만 지속적으로 사용할 가능성이 높아, 플랫폼 신뢰가 완전매개 역할을 한다. 이처럼 각 도구는 사용자들이 기대하는 경험과 신뢰 형성 방식에 따라 매개효과가 상이하게 나타났다.

셋째, DALL-E, Midjourney, Stable Diffusion 세 AI 이미지 생성 도구에서 사용만족도가 플랫폼 신뢰를 매개로 지속적 사용의도에 미치는 간접효과가 디지털 기술역량에 따라 어떻게 달라지는지 분석한 결과, DALL-E에서는 플랫폼 신뢰와 디지털 기술역량의 상호작용이 지속적 사용의도에 유의미한 영향을 미쳤다. 즉, 디지털 기술역량이 높은 사용자는 플랫폼 신뢰가 지속적 사용의도에 미치는 영향을 더욱 강화시켰으며, 조절된 매개효과도 통계적으로 유의했다. 이는 DALL-E 사용자 중 디지털 기술에 능숙한 이들이 플랫폼 신뢰를 통해 지속적 사용의도를 더욱 긍정적으로 형성한다는 것을 시사한다. Midjourney에서도 디지털 기술역량이 높을수록 플랫폼 신뢰와 사용만족도 간의 관계가 강화되었다. 특히, 디지털 기술역량의 조절된 매개효과가 유의미하게 나타났으며, 이는 디지털 기술에 능숙한 사용자일수록 사용만족도가 플랫폼 신뢰를 통해 지속적 사용의도에 미치는 영향을 크게 증대시킨다는 의미이다. 따라서 Midjourney 사용자는 기술적 역량이 높을수록 플랫폼 신뢰를 더 강하게 형성하고 장기적인 사용의도가 강화된다. 반면, Stable Diffusion에서는 디지털 기술역량이 플랫폼 신뢰와 지속적 사용 의도 간의 상호작용에 유의미한 영향을 미치지 않았다. 이는 디지털 기술역량이 Stable Diffusion에서 플랫폼 신뢰와 지속적 사용 의도 간의 관계를 조절하지 않는다는 것을 의미하며, 사용만족도와 지속적 사용 의도 사이에서 디지털 기술역량이 플랫폼 신뢰의 매개 효과를 강화하지 않는 것으로 나타났다.

DALL-E와 Midjourney에서는 디지털 기술역량이 높을수록 플랫폼 신뢰가 사용만족도와 지속적 사용의도 간의 관계를 강화하는 조절된 매개효과가 유의미하게 나타났다. 이는 두 도구가 창의적이면서 복잡한 작업을 요구하는 특성 때문으로, 기술 역량이 높은 사용자는 플랫폼 신뢰를 더욱 중요하게 여기며, 이를 기반으로 더 나은 성과를 기대하면서 지속적인 사용을 강화한다는 것이다. 반면, Stable Diffusion은 오픈 소스 기반으로 높은 기술적 자유도를 제공하기 때문에 디지털 기술역량이 사용자 신뢰와 지속적 사용의도 간의 관계에 유의미한 영향을 미치지 않았다. 이는 기술 역량이 높은 사용자들이 플랫폼 신뢰보다는 도구의 커스터마이징 가능성에 더 큰 가치를 두는 것으로 해석될 수 있다.

5-2 제언점

연구 결과, 각 플랫폼이 사용 만족도와 지속적 사용 의도에 미치는 요인에서 상이한 특성을 보였다. 첫째, DALL-E는 사용 만족도가 노력 기대(예: 플랫폼 사용 용이성), 사회적 영향(예: 사용자들의 긍정적 평가), 가격 가치(예: 기능 대비 합리적 비용)에서 주로 기인하며, 이러한 만족감이 지속적 사용 의도에 직접적으로 영향을 미쳤다. 반면, 플랫폼 신뢰는 상대적으로 낮은 중요도를 나타냈다. 이는 DALL-E가 직관적이고 간편한 사용성을 통해 사용자들에게 실용적이고 즉각적인 만족감을 제공하지만, 신뢰 형성 측면에서는 다소 부족함을 의미한다. 따라서 데이터 보안 강화와 성능 예측 가능성 개선 등의 기능적 보완과 함께, 고급 사용자들을 대상으로 한 심화 교육 프로그램 및 기술 지원을 통해 신뢰를 강화하는 전략이 필요하다.

둘째, Midjourney는 사용 만족도가 지속적 사용 의도에 강력한 영향을 미치며, 플랫폼 신뢰가 이 관계를 매개하는 핵심 요인으로 작용했다. 특히, 디지털 기술 역량이 높은 사용자일수록 신뢰가 사용 만족도와 지속적 사용 의도 간의 관계를 더욱 강화하는 변수로 나타났다. 이는 Midjourney가 독창적인 이미지 생성 기능과 활발한 커뮤니티 참여도를 통해 사용자 만족도를 높이고, 이러한 환경에서 신뢰가 플랫폼 활용의 장기성을 촉진하는 구조를 가지고 있음을 시사한다. 이에 따라 사용자 간의 상호작용을 강화하고, 고급 사용자들을 위한 맞춤형 기능 제공과 기술 지원을 확대함으로써 신뢰와 만족도를 동시에 높이는 전략이 요구된다.

셋째, Stable Diffusion의 경우, 사용 만족도가 지속적 사용 의도에 직접적인 영향을 미치지 않았으며, 플랫폼 신뢰가 이 관계를 전적으로 매개하였다. 또한, 디지털 기술 역량은 신뢰와 지속적 사용 의도 간의 관계에서 유의미한 조절 효과를 나타내지 않았다. 이는 Stable Diffusion이 주로 기술 숙련도가 높은 고급 사용자들 사이에서 활용되는 오픈 소스 플랫폼으로서, 사용자들이 만족감보다는 플랫폼의 안정성과 신뢰성을 더 중요하게 여긴다는 점을 반영한다. 이에 따라 플랫폼의 안정성 향상, 기술 지원 강화, 사용자 맞춤형 커스터마이징 자료와 세부적인 튜토리얼 제공을 통해 신뢰를 증진시키고 지속적 사용 의도를 이끌어내는 전략이 필요하다.

5-3 한계점 및 향후연구 방향

본 연구의 한계점은 다음과 같다. 첫째, 성별이나 소득 등 인구통계학적 변수를 조절변수로 고려하지 않았다. 둘째, 본 연구에서는 세 가지 AI 이미지 생성 도구를 사례로 삼아, 인터페이스 디자인과 프롬프트 측면에서 도구의 특성과 장단점을 분석하였으나, 각 도구의 시각적 효과나 이미지 생성 유형에 대한 세부적인 분석은 포함되지 않았다. 이러한 한계점을 바탕으로, 향후 연구에서는 인구통계학적 변수를 포함하여 다양한 변수와의 관계를 더 깊이 탐구할 필요가 있다. 또한, AI 이미지 생성 도구의 시각적 효과와 이미지 유형에 대한 구체적인 분석을 통해 사용자의 경험과 만족도에 영향을 미치는 다양한 요인을 심층적으로 이해하는 연구가 이루어져야 할 것이다.

Acknowledgments

본 연구는 과학기술정보통신부 및 정보통신기획평가원의 정보통신방송혁신인재양성(메타버스융합대학원)사업 연구 결과로 수행되었음(IITP-2024-RS-2023-00254529).

References

  • B. Kim, Y. Ahn, and K. Yoo, “Incorporation of Artificial Intelligence and Smart Factories in Domestic Manufacturing Industries,” Journal of the Korean Society of Mineral and Energy Resources Engineers, Vol. 58, No. 6, pp. 620-625, December 2021. [https://doi.org/10.32390/ksmer.2021.58.6.620]
  • D.-H. Kwon, “Analysis of Prompt Elements and Use Cases in Image-Generating AI: Focusing on Midjourney, Stable Diffusion, Firefly, DALL·E,” Journal of Digital Contents Society, Vol. 25, No. 2, pp. 314-354, February 2024. http://dx.doi.org/10.9728/dcs.2024.25.2.341
  • V. Venkatesh, “Adoption and Use of AI Tools: A Research Agenda Grounded in UTAUT,” Annals of Operations Research, Vol. 308, No. 1-2, pp. 641-652, January 2022. [https://doi.org/10.1007/s10479-020-03918-9]
  • D. Han, D. Choi, and C. Oh, “A Study on User Experience through Analysis of the Creative Process of Using Image Generative AI: Focusing on User Agency in Creativity,” The Journal of the Convergence on Culture Technology, Vol. 9, No. 4, pp. 667-679, July 2023. http://dx.doi.org/10.17703/JCCT.2023.9.4.667
  • T. Tanantong and P. Wongras, “A UTAUT-Based Framework for Analyzing Users’ Intention to Adopt Artificial Intelligence in Human Resource Recruitment: A Case Study of Thailand,” Systems, Vol. 12, No. 1, 28, January 2024. [https://doi.org/10.3390/systems12010028]
  • H. Vartiainen and M. Tedre, “Using Artificial Intelligence in Craft Education: Crafting with Text-to-Image Generative Models,” Digital Creativity, Vol. 34, No. 1, pp. 1-21, 2023. [https://doi.org/10.1080/14626268.2023.2174557]
  • S. Park and J. Heo, “Designing User Interaction for Variation Functions in Image Generative AI to Reflect User Intentions,” Journal of Industrial Design Studies, Vol. 18, No. 1, pp. 15-31, March 2024. [https://doi.org/10.37254/ids.2024.03.67.02.15]
  • K. Park, “Study on the Feasibility of Using AI Image Generation Tool for Fashion Design Development - Focused on the Use of Midjourney,” The Journal of the Convergence on Culture Technology, Vol. 9, No. 6, pp. 237-244, November 2023. http://dx.doi.org/10.17703/JCCT.2023.9.6.237
  • H. Park, “A Case Study on Application of Text to Image Generator AI DALL·E,” The Treatise on the Plastic Media, Vol. 26, No. 1, pp. 102-110, February 2023. http://dx.doi.org/10.35280/KOTPM.2023.26.1.11
  • The Creatives Hour. Top 13 AI Art Generators In 2024 (Reviewed and Ranked) [Internet]. Available: https://thecreativeshour.com/ai-art-generators/, .
  • G. P. Noel, “Evaluating AI-Powered Text-to-Image Generators for Anatomical Illustration: A Comparative Study,” Anatomical Sciences Education, Vol. 17, No. 5, pp. 979-983, September 2024. [https://doi.org/10.1002/ase.2336]
  • Z. Wang, G. Healy, A. F. Smeaton, and T. E. Ward, “Use of Neural Signals to Evaluate the Quality of Generative Adversarial Network Performance in Facial Image Generation,” Cognitive Computation, Vol. 12, No. 1, pp. 13-24, January 2020. [https://doi.org/10.1007/s12559-019-09670-y]
  • D. Siegle, “A Role for ChatGPT and AI in Gifted Education,” Gifted Child Today, Vol. 46, No. 3, pp. 211-219, July 2023. [https://doi.org/10.1177/10762175231168443]
  • V. Venkatesh, M. G. Morris, G. B. Davis, and F. D. Davis, “User Acceptance of Information Technology: Toward a Unified View,” MIS Quarterly, Vol. 27, No. 3, pp. 425-478, September 2003. [https://doi.org/10.2307/30036540]
  • Y. Zhang and M.-R. Yoon, “Consumer Behavior toward Chinese Dance and Arts Performances Integrated with Artificial Intelligence Technology: Study on UTAUT2,” Journal of Digital Contents Society, Vol. 25, No. 5, pp. 1105-1117, May 2024. http://dx.doi.org/10.9728/dcs.2024.25.5.1105
  • J.-E. Lee, “Chinese Consumers Behavior Research on ChatGPT Service Using the Extended Unified Theory of Acceptance and Use of Technology,” The Journal of Global Convergence Research, Vol. 3, No. 1, pp. 73-87, June 2024. http://dx.doi.org/10.57199/jgcr.2024.3.1.73
  • V. Venkatesh, J. Y. L. Thong, and X. Xu, “Consumer Acceptance and Use of Information Technology: Extending the Unified Theory of Acceptance and Use of Technology,” MIS Quarterly, Vol. 36, No. 1, pp. 157-178, March 2012. [https://doi.org/10.2307/41410412]
  • Y. M. Kwon and J. H. Song, “Exploring the Effects of Relationships between Consumers and AI Speakers on Consumers’ Control, Satisfaction toward the AI Speaker, and Intention to Use,” Information Society & Media, Vol. 24, No. 1, pp. 151-181, April 2023. [https://doi.org/10.52558/ISM.2023.04.24.1.151]
  • L.-Z. Quan, “Research on Factors Influencing Intentions and Behavior to Consume News Video Content with AI Anchors: Focusing on the MZ Generation,” Journal of the Korea Contents Association, Vol. 24, No. 7, pp. 294-312, July 2024. [https://doi.org/10.5392/JKCA.2024.24.07.294]
  • S.-H. Lee, S. Han, and K.-H. Park, “A Study on the Factors Affecting the Intention of Continuous Use of Intelligent Government Administrative Services,” Journal of Digital Convergence, Vol. 19, No. 11, pp. 85-93, November 2021. [https://doi.org/10.14400/JDC.2021.19.11.085]
  • R. Chu and S. Lim, “AI Chatbot Users’ Satisfaction and Intention for Continued Use: Moderating Effects of Chatbot Type and Motivations,” Journal of the Korea Contents Association, Vol. 20, No. 10, pp. 630-640, October 2020. [https://doi.org/10.5392/JKCA.2020.20.10.630]
  • C.-J. Zhou and E.-T. Jung, “Effects of Innovation Diffusion and Presence Factors on Continuous Use Intention of the Metaverse Platform: Focusing on XIRANG and ZEPETO,” Journal of Digital Contents Society, Vol. 25, No. 2, pp. 365-382, February 2024. [https://doi.org/10.9728/dcs.2024.25.2.365]
  • S.-J. Moon, “Exploring the Perceived Value of Generative AI and the Determinants of Continuous Use Intention,” The Journal of the Korea Institute of Electronic Communication Sciences, Vol. 19, No. 4, pp. 709-720, August 2024. [https://doi.org/10.13067/JKIECS.2024.19.4.709]
  • S.-H. Jeong and H.-K. Kim, “Effect of Trust in Metaverse on Usage Intention through Technology Readiness and Technology Acceptance Model,” Tehnički Vjesnik, Vol. 30, No. 3, pp. 837-845, April 2023. [https://doi.org/10.17559/TV-20221111061245]
  • B. Bae, “The Roles of Customer-Perceived Service Climate, Service Authenticity, and Service Provider Trust in Service Evaluation: The Moderating Effect of Customer Participation,” Korean Journal of Business Administration, Vol. 32, No. 9, pp. 1535-1560, September 2019. [https://doi.org/10.18032/kaaba.2019.32.9.1535]
  • B. Lu, Z. Wang, and S. Zhang, “Platform-Based Mechanisms, Institutional Trust, and Continuous Use Intention: The Moderating Role of Perceived Effectiveness of Sharing Economy Institutional Mechanisms,” Information & Management, Vol. 58, No. 7, 103504, November 2021. [https://doi.org/10.1016/j.im.2021.103504]
  • C. Jang, D. Heo, and W. J. Sung, “Effects on the Continuous Use Intention of AI-Based Voice Assistant Services: Focusing on the Interaction between Trust in AI and Privacy Concerns,” Informatization Policy, Vol. 30, No. 2, pp. 22-45, June 2023. [https://doi.org/10.22693/NIAIP.2023.30.2.022]
  • M. S. Yang and J. K. Kim, “Development a Scale for e-Learning Digital Literacy,” The Journal of Educational Information and Media, Vol. 22, No. 3, pp. 485-507, September 2016. [https://doi.org/10.15833/KAFEIAM.22.3.485]
  • S.-K. Lee, J. Park, B.-J. Jun, and W.-T. Chang, “Technology Capabilities, Collaboration Performance and Satisfaction: Moderating Effect of Trust,” Journal of Digital Convergence, Vol. 9, No. 5, pp. 175-191, October 2011.
  • I. Hwang, “The Influence of Supporting Values Related Personalization and Socialization in the Metaverse: The Role of Digital Technology Competence,” Journal of the Korea Contents Association, Vol. 23, No. 7, pp. 11-24, July 2023. [https://doi.org/10.5392/JKCA.2023.23.07.011]
  • W. H. DeLone and E. R. McLean, “The DeLone and McLean Model of Information Systems Success: A Ten-Year Update,” Journal of Management Information Systems, Vol. 19, No. 4, pp. 9-30, 2003. [https://doi.org/10.1080/07421222.2003.11045748]
  • J. P. Lee and M. H. Chang, “A Study on the Intention to Use Big Data Based on the Technology Organization Environment and Innovation Diffusion Theory in Shipping and Port Organization,” Journal of Korea Port Economic Association, Vol. 34, No. 3, pp. 159-182, September 2018. [https://doi.org/10.38121/kpea.2018.09.34.3.159]
  • C. Cui and S.-H. Seo, “A Comparative Study of Influencing Factors to Use Mobile Delivery Applications Based on the UTAUT Model,” Journal of Tourism Sciences, Vol. 42, No. 3, pp. 97-119, March 2018. [https://doi.org/10.17086/JTS.2018.42.3.97.119]
  • M. Y. Cho, C. Jang, and K. S. Han, “A Study on the Adoption Intention of O2O-Based Food Delivery Agency Service: Focused on the Small Traders in the Restaurant Industry,” Korean Journal of Business Administration, Vol. 30, No. 7, pp. 1257-1282, July 2017. [https://doi.org/10.18032/kaaba.2017.30.7.1257]
  • Y.-S. Cheon, “A Study of the Relationships among Hotel Corporate Social Responsibility, Service and Price Value, Customer Satisfaction, Customer Orientation, and Reuse Intention in Busan,” International Journal of Tourism and Hospitality Research, Vol. 30, No.1, pp. 123-136, January 2016. [https://doi.org/10.21298/IJTHR.2016.01.30.1.123]
  • B. Vandecasteele and M. Geuens, “Motivated Consumer Innovativeness: Concept, Measurement, and Validation,” International Journal of Research in Marketing, Vol. 27, No. 4, pp. 308-318, December 2010. [https://doi.org/10.1016/j.ijresmar.2010.08.004]
  • S. Yoo and Y. Lee, “A Study on the Impact of User’s Characteristics and Perceived Awareness on the Satisfaction to Using Personalization App -Focus on Android Launcher App-,” Journal of Korea Design Forum, No. 48, pp. 93-104, August 2015. [https://doi.org/10.21326/ksdt.2015..48.008]
  • X. Cheng, Y. Gu, and J. Shen, “An Integrated View of Particularized Trust in Social Commerce: An Empirical Investigation,” International Journal of Information Management, Vol. 45, pp. 1-12, April 2019. [https://doi.org/10.1016/j.ijinfomgt.2018.10.014]
  • S. Li and C. Qing, “The Effect of AR Technology’s Convenience on Purchasing Intentions in Mobile Shopping: Focusing on the Regulation Effect of Purchase Satisfaction,” Journal of Digital Convergence, Vol. 19, No. 5, pp. 41-46, May 2021. [https://doi.org/10.14400/JDC.2021.19.5.041]
  • H. Kang, “Discussions on the Suitable Interpretation of Model Fit Indices and the Strategies to Fit Model in Structural Equation Modeling,” Journal of the Korean Data Analysis Society, Vol. 15, No. 2, pp. 653-668, April 2013.

저자소개

진지훈(Zhi-Xun Chen)

2020년:중국 서화사범대 통계학과 (학사)

2023년:중국 칭다오과학기술대학교 디자인학과 (석사)

2023년~현 재: 세종대학교 디자인이노베이션학과 박사과정

※관심분야:인공지능, 디자인 마케팅

민자경(Ja-Kyoung Min)

2003년:세종대학교 산업디자인학과 (학사)

2006년:홍익대학교 시각디자인과 (석사)

2008년:School of the Art Institute of Chicago 비쥬얼커뮤니케이션학과 (석사)

2022년:홍익대학교 디자인공예학과 (박사)

2018년~현 재: 세종대학교 소프트웨어융합대학 디자인이노베이션 전공 부교수

※관심분야:가상현실(VR), 확장현실(XR), 증강현실(AR), UI&UX, 실감미디어(Immersive Media), 인공지능 등

Fig. 1.

Fig. 1.
DALL-E3 interface

Fig. 2.

Fig. 2.
DALL-E3 image adjustment prompt

Fig. 3.

Fig. 3.
Midjourney interface

Fig. 4.

Fig. 4.
Midjourney bulletin format interface

Fig. 5.

Fig. 5.
Stable Diffusion bulletin format interface

Fig. 6.

Fig. 6.
Research model

Table 1.

Comparison of features in AI image generation tools

Feature DALL-E 3 Midjourney AI Stable Diffusion
Developer OpenAI Midjourney Team Stability AI
Platform Web, API, ChatGPT Discord Local Deployment
Image Quality High-quality, complex images Artistic style images High-quality images
User Interface User-friendly Interacts via Discord Requires technical background
Customization Moderate Low High
Community Support Some support Strong community support Open-source community support
Typical Use Cases Creative design, marketing Art, illustration Research, development
Cost May require subscription Subscription-based Free (deployment costs apply)

Table 2.

References on UTAUT2

Reference Research Topic Factors
Notes: PV(Price Value), CQ(Contents Quality), HA(Habit), HM(Hedonic Motivation), PI(Personal Innovativeness)
Zhang, Yoon(2024) AI Dance and Arts Performances PE, SI, PV, CQ
Lee(2024) ChatGPT Service PE, EE, SI, FC, PV, CQ, HA
Kwon, Song(2023) Intelligent Vehicle PE, EE, SI, FC, PV, CQ, HA
Quan(2024) AI Anchors SI, HM, PI
Lee et al.(2021) Intelligent Government Services PE, EE, FC, PI

Table 3.

Composition of the scale of variables

Variable Number of Items References Cronbach’s α
DALL-E 3 Midjourney Stable Dif.
Performance Expectancy 5 [31] .858 .886 .889
Effort Expectancy 4 [32]
[33]
[34]
.822 .850 .869
Social Influence 3 .775 .793 .814
Facilitating Conditions 4 .875 .838 .879
Price Value 3 [35] .837 .777 .822
Innovativeness 6 [36] .892 .880 .889
User Satisfaction 4 [37] .855 .844 .864
Platform Trust 3 [38] .774 .787 .804
Continuous Use Intention 3 [39] .807 .829 .836
Digital Technological Competence 3 [28] .828 .797 .788

Table 4.

Discriminant feasibility analysis results and descriptive statistics

1 2 3 4 5 6 7 8 9 10 Mean 1 2 3 4 5 6 7 8 9 10 Mean
Panel A: DALL-E 3 Panel B: Midjourney
1. PE .740 .378** .437** .422** .439** .410** .494** .430** .578** .335** 3.854 .780 .241** .291** .308** .418** .296** .226** .404** .247** .367** 3.669
2. EE .735 .337** .364** .332** .437** .323** .411** .476** .455** 3.804 .765 .389** .270** .226** .261** .326** .261** .408** .480** 3.587
3. SI .733 .493** .311** .243** .359** .265** .303** .274** 3.762 .754 .427** .299** .312** .470** .362** .295** .352** 3.562
4. FC .798 .301** .268** .262** .282** .311** .391** 3.678 .752 .340** .298** .279** .324** .363** .323** 3.654
5. PV .801 .406** .283** .247** .263** .426** 3.919 .735 .239** .302** .316** .390** .409** 3.921
6. IN .762 .319** .489* .463** .338** 3.775 .744 .389** .331** .297** .458** 3.694
7. US .775 .247** .451** .304** 3.783 .760 .241** .316** .456** 3.762
8. PT .729 .425** .400** 3.841 .743 .341** .460** 3.569
9. CI .763 .430** 3.832 .789 .404** 3.651
10. DC .788 3.658 .754 3.544
Panel C: Stable Diffusion Notes: PE: Performance Expectancy;
EE: Effort Expectancy;
SI: Social Influence;
FC: Facilitating Conditions;PV: Price Value;
US: User Satisfaction;
IN: Innovativeness;
PT: Platform Trust;
CI: Continuous Use Intention;
DC: Digital Technological Competence;
* p<.05, **p<.01, ***p<.001;
Diagonal value: Square root of AVE;
1. PE .786 .383** .284** .261** .372** .443** .323** .289** .492** .255** 3.649
2. EE .792 .432** .342** .283** .272** .339** .388** .444** .422** 3.598
3. SI .773 .344** .309** .284** .318** .328** .294** .394** 3.414
4. FC .804 .325** .310** .267** .322** .343** .351** 3.610
5. PV .779 .383** .286** .359** .301** .295** 3.667
6. IN .756 .447** .437** .360** .412** 3.640
7. US .786 .332** .275** .377** 3.706
8. PT .762 .500** .524** 3.498
9. CI .796 .448** 3.710
10. DC .746 3.660

Table 5.

Confirmatory factor analysis results

DALL-E 3 Midjourney Stable Diffusion
Variable Items std. t-value CR AVE std. t-value CR AVE std. t-value CR AVE
Note: * p<.05, **p<.01, ***p<.001
Performance Expectancy PE1 .678 .858 .548 .863 .886 .609 .836 .890 .618
PE2 .755 6.978*** .785 10.428*** .743 8.473***
PE3 .777 7.141*** .743 9.641*** .800 9.367***
PE4 .729 6.778*** .754 9.828*** .781 9.072***
PE5 .759 7.005*** .749 9.747*** .768 8.855***
Effort Expectancy EE1 .752 .824 .540 .779 .850 .585 .823 .870 .627
EE2 .747 7.494*** .755 8.424*** .775 8.598***
EE3 .651 6.537*** .766 8.553*** .790 8.807***
EE4 .784 7.830*** .760 8.477*** .778 8.650***
Social Influence SI1 .788 .777 .537 .697 .798 .569 .803
SI2 .705 6.726*** .779 7.306*** .805 7.676***
SI3 .703 6.716*** .783 7.325*** .707 6.966***
Facilitating Conditions FC1 .785 .875 .637 .748 .839 .565 .769 .880 .647
FC2 .820 9.391*** .743 7.880*** .823 8.648***
FC3 .765 8.654*** .741 7.867*** .863 9.055***
FC4 .821 9.406*** .774 8.184*** .759 7.911***
Price Value PV1 .749 .842 .641 .774 .780 .541 .776 .823 .607
PV2 .786 8.183*** .714 6.840*** .789 7.433***
PV3 .862 8.631*** .718 6.861*** .773 7.341***
Innovativeness IN1 .739 .892 .580 .733 .881 .553 .714 .889 .572
IN2 .838 8.799*** .837 9.135*** .783 7.571***
IN3 .756 7.914*** .690 7.527*** .750 7.261***
IN4 .724 7.565*** .747 8.163*** .690 6.694***
IN5 .807 8.473*** .745 8.151*** .770 7.451***
IN6 .698 7.281*** .701 7.660*** .823 7.924***
User Satisfaction US1 .765 .857 .600 .699 .845 .578 .843 .865 .617
US2 .818 8.551*** .790 7.946*** .804 9.057***
US3 .723 7.548*** .713 7.270*** .729 8.038***
US4 .790 8.278*** .832 8.256*** .761 8.485***
Platform Trust PT1 .713 .773 .532 .737 .787 .552 .814 .806 .581
PT2 .703 6.178*** .760 7.354*** .736 7.348***
PT3 .770 6.454*** .731 7.167*** .733 7.320***
Continuous Use Intention CI1 .707 .807 .583 .715 .831 .622 .739 .837 .633
CI2 .768 7.066*** .847 8.223*** .778 7.531***
CI3 .812 7.305*** .798 8.011*** .864 8.063***
Digital Technological Competence DC1 .810 .830 .620 .767 .798 .568 .720 .790 .557
DC2 .777 8.198*** .758 8.130*** .735 6.688***
DC3 .775 8.180*** .736 7.905*** .783 7.022***
χ2=779.252 (df=618, p= .000), CMIN/DF=1.259, IFI= .926, TLI= .912, CFI= .923, RMR= .079, RMSEA= .048 χ2=760.671 (df=620, p= .000), CMIN/DF=1.227, IFI= .941, TLI= .930, CFI= .939, RMR= .087, RMSEA= .042 χ2=765.479 (df=620, p= .000), CMIN/DF=1.235, IFI= .932, TLI= .920, CFI= .930, RMR= .057, RMSEA= .047

Table 6.

Hypothesis test result

Path B β SE P Pass or not Path B β SE P Pass or not
Note: * p<.05, **p<.01, ***p<.001; See Table 4 for explanation of English abbreviations
Panel A: DALL-E 3 Panel B: Midjourney
H1: PE US .149 .115 .133 .261 Not H1: PE US .048 .070 .066 .472 Not
H2: EE .276 .236 .131 .035* Pass H2: EE .180 .238 .079 .022* Pass
H3: SI .335 .343 .118 *** Pass H3: SI .395 .444 .099 *** Pass
H4: FC -.010 -.010 .128 .939 Not H4: FC -.056 -.070 .084 .503 Not
H5: PV .247 .220 .125 .047* Pass H5: PV .175 .199 .084 .038* Pass
H6: IN .155 .147 .114 .173 Not H6: IN .211 .264 .082 .010* Pass
H7: US CI .479 .536 .112 *** Pass H7: US CI .343 .301 .128 .007** Pass
Panel C: Stable Diffusion DALL-E 3:
χ2=4712.541 (df=536, p= .000), CMIN/DF=1.329, IFI= .908, TLI= .903, CFI= .911, RMR= .029, RMSEA= .051.

Midjourney:
χ2=727.491 (df=545, p= .000), CMIN/DF=1.335, IFI= .913, TLI= .950, CFI= .957, RMR= .058, RMSEA= .053.

Stable Diffusion:
χ2=749.332 (df=574, p= .000), CMIN/DF=1.305, IFI= .907, TLI= .902, CFI= .904, RMR= .072, RMSEA= .056.
H1: PE US .356 .318 .107 *** Pass
H2: EE .450 .442 .134 *** Pass
H3: SI .284 .229 .110 .023* Pass
H4: FC .320 .297 .132 .003** Pass
H5: PV .224 .180 .135 .098 Not
H6: IN .265 .192 .143 .038* Pass
H7: US CI .159 .192 .087 .068 Not

Table 7.

Mediation effect analysis results

Platform Path Total Directly Indirect Mediating
Note: ***p<.001; The 95% confidence interval is in brackets; See Table 4 for explanation of English abbreviations
DALL-E 3 US→PT→CI .471*** .440*** .031 Non
(.297~.650) (.261~.618) (-.051~.099)
Midjourney US→PT→CI .349*** .275*** .074*** Partial mediation
(.166~.533) (.093~.456) (.040~.150)
Stable Diffusion US→PT→CI .275*** .168 .107*** Full mediation
(.089~.461) (-.002~.338) (.022~.218)

Table 8.

Moderated mediation effect on DALL-E 3

Variable Dependent Variables: Continuous Use Intention
B SE t 95%LLCI 95%ULCI
Note: **p<.01, ***p<.001; See Table 4 for explanation of English abbreviations
(Constant) .707 1.171 .604 -1.613 3.028
PT .329 .097 4.426*** .229 .601
DC .310 .114 4.109** .258 .294
PT * DC .228 .103 3.107** .213 .471
R²=.218, F =8.712***
DC Conditional Indirect Effects SE 95%LLCI 95%ULCI
Mean-1SD .011 .038 .054 .101
Mean .028 .028 .019 .095
Mean+1SD .044 0.038 0.021 0.129

Table 9.

Moderated mediation effect on Midjourney

Variable Dependent Variables: Continuous Use Intention
B SE t 95%LLCI 95%ULCI
Note: **p<.01, ***p<.001; See Table 4 for explanation of English abbreviations
(Constant) 2.267 1.154 1.965 -.016 4.550
PT .249 1.102 2.640*** .548 .670
DC .410 .094 4.409** .119 .591
PT * DC .339 1.002 3.482** .099 .247
R²=.053, F =5.968***
DC Conditional Indirect Effects SE 95%LLCI 95%ULCI
Mean-1SD .031 .041 .051 .115
Mean .051 .037 .003 .138
Mean+1SD .071 0.052 .001 .203

Table 10.

Moderated mediation effect on Stable Diffusion

Variable Dependent Variables: Continuous Use Intention
B SE t 95%LLCI 95%ULCI
Note: **p<.01, ***p<.001; See Table 4 for explanation of English abbreviations
(Constant) 1.656 .980 1.690 -.287 3.600
PT .205 .903 2.503*** .340 .840
DC .331 1.094 3.119** .320 .738
PT * DC .043 .079 .547** -.114 .201
R²=.228, F =8.114***
DC Conditional Indirect Effects SE 95%LLCI 95%ULCI
Mean-1SD .071 .045 -.013 .164
Mean .088 .052 .012 .216
Mean+1SD .095 .063 0.011 0.255