
생성형 AI 도구의 UX 설계 요소 비교 분석: ChatGPT와 Midjourney 사례를 중심으로
Copyright ⓒ 2025 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
초록
본 연구는 생성형 인공지능 도구인 Midjourney와 ChatGPT의 사용자 경험(UX)을 비교·분석하여 UX 평가 프레임워크와 설계 전략을 제안하는 것을 목적으로 한다. 인간 중심 디자인(HCD) 이론과 선행연구를 기반으로 접근성, 해석성, 반복 개선성, 몰입 지속성, 사용자 주도성의 5가지 UX 요소를 도출하였으며, 인터페이스 구조 분석과 사용자 기반 실험을 통해 정성·정량 데이터를 수집하였다. 분석 결과, 두 도구는 기능적 차이뿐 아니라 사용자 숙련도에 따라 UX 반응 양상에서 유의미한 차이를 보였고, Midjourney는 시각적 몰입과 창의적 탐색 중심의 UX, ChatGPT는 구조화된 피드백과 높은 접근성을 특징으로 하였다. 이러한 결과는 도구별 적응형 UI 설계와 매체 특화 UX 전략의 필요성을 시사하며, 본 연구는 생성형 AI 도구의 맞춤형 UX 설계에 있어 이론적 기반과 실무적 가이드라인을 제공한다.
Abstract
This study compares the user experience (UX) of two representative generative AI tools—Midjourney and ChatGPT—to propose a structured UX evaluation framework and actionable design strategies. Drawing on Human-Centered Design (HCD) theory and prior studies, the research identifies five key UX elements: accessibility, interpretability, iterative enhancement, sustained engagement, and user agency. The study employs a mixed-methods approach combining interface structure analysis with user-based experiments to derive qualitative and quantitative insights. The results indicate that the tools differ not only in modality—visual versus textual—but also in interaction patterns, which vary according to users’ experience levels. Midjourney facilitates immersive visual exploration with considerable creative freedom, whereas ChatGPT provides structured feedback and ease of access for novice users. These findings underscore the importance of adaptive UI strategies and modality-specific UX designs tailored to user expertise. The study contributes theoretically to UX research on generative AI and offers practical guidelines for the development of more inclusive, intuitive, and user-centered generative systems.
Keywords:
Generative AI, User Experience, UX Design, Midjourney, ChatGPT키워드:
생성형 인공지능, 사용자 경험, UX 설계Ⅰ. 서 론
1-1 연구 배경 및 목적
최근 생성형 인공지능(Generative AI)분야는 기술적 이정표를 통해 빠르게 발전하고 있다. 이 발전은 머신러닝과 신경망의 진보에 기반을 두고 있으며, 기존 데이터에서 새로운 콘텐츠를 생성하는 방식으로 기계의 역할을 혁신적으로 바꾸고 있다. 이러한 혁신은 인공지능이 단순한 데이터 분석을 넘어 텍스트, 이미지, 영상까지 새로운 결과물을 창조하는 방향으로 나아가고 있음을 반영한다[1].
생성형 AI는 기존의 규칙 기반 시스템과 달리 비결정성과 창의성이 결합된 상호작용 구조를 지니며, 그 결과물은 사용자 입력과 맥락에 따라 매번 달라질 수 있다. 이에 따라 전통적인 UX(User Experience) 설계 기준만으로는 사용자의 기대와 만족을 설명하거나 시스템 설계에 반영하기 어렵다. 특히 생성형 AI 도구는 예측 불가능한 생성 흐름, 프롬프트 중심의 인터페이스, 반복적 실험 기반의 조작 방식을 갖고 있어, 인간 중심 디자인(Human-Centered Design, 이하 HCD) 관점에서의 재해석과 설계 원칙의 구조화가 필요하다[2].
그럼에도 불구하고 기존 연구들은 대부분 생성형 AI 도구의 기술적 성능이나 사용성 중심으로 접근해온 경향이 있으며, 시각 기반(Midjourney)과 텍스트 기반(ChatGPT) 도구 간 UX 설계 요소를 비교한 실증적 연구는 드문 편이다. 특히 사용자 숙련도에 따른 UX 인식 및 반응 차이를 분석한 연구도 부족하다. 본 연구는 이러한 선행연구의 한계를 보완하고, 사용자 경험 중심의 관점에서 Midjourney와 ChatGPT의 UX 설계 요소를 비교·분석하고자 한다.
본 연구는 다음과 같은 세 가지 목적을 지닌다.
첫째, 학문적 목적으로, 생성형 AI 환경에 적합한 5가지 UX 설계 요소(접근성, 해석성, 반복 개선성, 몰입 지속성, 사용자 주도성)를 인간 중심 디자인(HCD) 이론과 선행연구 기반 구조화하고, 이를 바탕으로 분석 프레임워크를 제시한다.
둘째, 실무적 목적으로, 두 도구의 UX 특성을 비교함으로써 매체적 차이에 따른 UX 설계 기준과 실무 활용이 가능한 가이드라인을 도출한다.
셋째, 사회적 목적으로, 사용자 숙련도에 따른 UX 반응 차이를 분석하고, 이에 기반한 사용자 맞춤형 인터페이스 설계 방향과 디지털 격차 해소 방안을 제안한다.
이러한 목적에 따라 본 연구는 단순한 결과물이 아닌 생성 과정에서의 상호작용 흐름, 사용자의 몰입 경험, 제어 가능성에 주목하며, Midjourney와 ChatGPT가 제공하는 UX의 구조적 차이를 실증적으로 비교·분석한다.
1-2 연구 방법 및 범위
본 연구는 생성형 AI 도구의 사용자 경험을 분석하기 위해, 정성적 사례 분석과 정량·정성 사용자 조사를 결합한 혼합연구(Mixed Method)를 채택하였다. 분석 대상은 시각 생성형 도구인 Midjourney와 텍스트 생성형 도구인 ChatGPT로, 두 도구의 사용 흐름, 인터페이스 구조, 피드백 방식 등을 실제 사용 맥락에서 비교하였다.
연구는 다음의 두 단계로 구성된다.
첫째, 사례 분석 단계에서는 선행 연구와 인터페이스 구조 분석을 바탕으로 도출한 5가지 UX 설계 요소(접근성, 해석성, 반복 개선성, 몰입 지속성, 사용자 주도성)를 기준으로 두 도구의 상호작용 특성을 비교하였다.
둘째, 실증 조사 단계에서는 생성형 AI 사용 경험이 있는 성인 100명을 대상으로 설문 기반 정량조사를 실시하였으며, 이 중 12명을 대상으로 심층 인터뷰를 통해 정성조사를 수행하였다. 정량 분석은 UX 요소별 인식 차이를 파악하기 위해 독립표본 t-검정을 활용하였으며, 정성 분석은 주제분석법을 통해 사용자의 맥락적 경험과 개선 요구를 도출하였다.
연구의 범위는 2025년 기준의 Midjourney 및 ChatGPT 버전에 한정하며, 생성 결과가 아닌 생성 과정 전반의 UX 흐름과 사용자의 상호작용 경험에 중점을 두고 있다.
Ⅱ. 본 론
2-1 생성형 인공지능 도구의 개념과 특징
생성형 인공지능(Generative AI)은 사용자 프롬프트 입력에 기반하여 새로운 콘텐츠를 자율적으로 생성하는 알고리즘 기술이다[3]. 이는 “텍스트, 오디오, 이미지 등의 기존 콘텐츠를 활용하여 유사한 콘텐츠를 새로 만들어내는 인공지능 기술”로 정의되며[4], 창의적인 콘텐츠 생성이 가능하다는 특징을 갖는다.
대표적인 생성형 AI 도구로는 ChatGPT, StableDiffusion, Midjourney, Bard, Firefly 등이 있으며[5], 특히, ChatGPT는 자연어 기반의 대화형 생성 시스템으로, 사용자 질문에 대한 응답, 문서 요약, 코드 생성 등 광범위한 언어적 생산 기능을 수행하며 텍스트 기반 사용자 경험(UX)을 주도하고 있다[6]. 한편, Midjourney는 사용자의 텍스트 프롬프트 기반으로 고품질의 시각적 이미지를 생성하는 도구로, 시각 디자인 및 예술 창작 영역에서 개인의 창작 흐름에 직접 개입함으로써 새로운 유형의 협업 가능성을 제시한다[7].
생성형 인공지능의 등장은 기존의 버튼 및 메뉴 중심의 ‘도구형(tool-based)’ 인터페이스에서 자연어 기반의 ‘대화형(conversational)’ 인터페이스로의 근본적인 전환을 촉진하였다. 이러한 프롬프트 기반 상호작용은 사용자의 의도와 맥락을 해석하여 다양한 결과를 창의적으로 생성하는 새로운 UX 패러다임을 형성한다. 주목할 점은 이 상호작용이 본질적으로 비결정성(non-determinism)을 가지며, 동일한 프롬프트라도 실행 시점이나 맥락에 따라 결과가 달라질 수 있다는 점이다. 이는 기존 UX 설계에서 강조되던 예측 가능성과 일관성의 원칙을 재고하게 만든다[8].
2-2 인간 중심 디자인(HCD)의 원칙
인간 중심 디자인(HCD)은 제품이나 시스템을 설계할 때 사용자의 니즈, 맥락, 인지적 특성을 고려한 ‘사용자 중심’의 설계 철학이다. 국제 표준 ISO 9241-210에 따르면, HCD는 “사용자의 요구를 설계 전반에 반영하여 사용성과 만족도를 향상시키는 접근법”이다[9]. 핵심 원칙은 다음과 같다.
첫째, 사용자 중심 관점에서 문제를 정의하고 해결한다. 도널드 노먼(Donald Norman)은 진정한 사용성은 디자이너의 의도가 아닌 사용자 관점에서 출발한다고 강조하였다[10].
둘째, 사용자에 대한 심층적 이해를 바탕으로 설계를 시작한다. 「The HCD Toolkit」에서는 인터뷰, 관찰, 설문조사 등을 통해 사용자의 행동, 심리, 동기를 파악하는 것이 설계의 출발점임을 강조한다[11].
셋째, 반복적 설계를 통해 실제 사용성과 피드백을 기반으로 개선한다. 「Interaction Design」에서는 피드백 기반의 반복 설계가 사용자 중심 UX를 형성하는 핵심임을 설명한다. 프로토타이핑과 반복 테스트를 통해 사용자의 실제 사용 흐름과 일치하는 UX 구조를 구축할 수 있다[12].
넷째, 학제 간 협업을 통해 다양한 관점을 반영한다. IDEO의 팀 브라운(Tim Brown)은 다양한 분야의 전문가들이 참여하는 협업이 창의적 해결책을 도출하는 데 필수적이라고 강조한다[13].
다섯째, 사용자 경험(UX)의 감성적·맥락적 가치를 중시한다. 도널드 노먼(Donald Norman)은 디자인의 성공 여부는 ‘사용자 경험’이라는 사용자 감정과 인상을 고려한 정성적 요소에 있다고 하였다[14].
2-3 생성형 AI 도구의 UX 설계 요소
본 연구는 생성형 AI 도구의 UX 설계 요소를 체계적으로 도출하기 위해, 선행연구 기반 이론과 설계 원칙들을 통합적으로 분석하였다. 이를 위해 다음 세 가지 기준을 중심으로 구성하였다. 첫째, Nielsen의 사용성 원칙[15]과 둘째, Microsoft의 Human-AI Interaction Guidelines[16], 그리고 셋째, Shneiderman의 창의성 지원 도구(Creativity Support Tools) 프레임워크에서 제시하는 핵심 활동들을 생성형 AI 도구 맥락에서 재해석하였다[17]. 반복 출현 빈도 및 이론적 중요도 기준으로 다음의 5가지 핵심 요소를 도출하였다.
① 접근성(Accessibility): 사용자가 시스템을 처음 접했을 때 핵심 기능을 빠르게 학습하고 수행할 수 있도록 돕는 설계 요소이다. 이는 Nielsen의 학습용이성 개념을 생성형 AI 맥락에서 재해석한 것이다[15]. 자연어 프롬프트 기반 인터페이스는 직관적으로 보일 수 있으나, 실제로는 효과적인 입력 방법을 학습해야 하는 역설이 존재한다. 이에 따라 단계적 온보딩, 프롬프트 예시, 실시간 가이드 등의 설계가 필요하다.
② 해석성(Interpretability): 사용자가 시스템의 작동 원리와 결과 생성 과정을 이해할 수 있도록 돕는 능력이다. 이는 설명 가능한 인공지능(Explainable AI) 개념과 Amershi et al.의 “시스템 능력의 명확한 전달” 원칙에서 착안한 것이다[16],[18]. 생성형 AI는 비결정적 특성으로 인해 동일한 입력에도 결과가 다를 수 있으므로, 생성 과정의 시각화, 결과의 불확실성 표기, 결과의 근거 제시가 중요하다.
③ 반복 개선성(Repetition & Refinement): 사용자가 원하는 결과를 얻기 위해 프롬프트를 반복 수정하며 실험하는 과정을 지칭한다. Shneiderman의 창의적 작업 프로세스와 Brown의 디자인 씽킹 모델에서 제시된 반복적 탐색 및 프로토타이핑 개념을 통합한 것이다[17],[19]. 이를 UX 설계에 반영하면 프롬프트 이력 저장, 결과 비교 기능, 점진적 수정 도구 등이 필수적이다.
④ 몰입 지속성(Engagement): 사용자 경험을 긍정적으로 유지하는 핵심 요소로, Csikszentmihalyi의 몰입 이론(Flow Theory)에서 도출하였다[20]. 생성형 AI 사용 시 결과 대기 시간과 예측 불가능성은 몰입을 방해하는 요인이 될 수 있다. 따라서 진행 상태 표시, 중간 결과 미리보기, 시각화된 피드백을 통해 사용자의 참여를 유지하는 설계가 요구된다.
⑤ 사용자 주도성(Self-direction): 사용자가 시스템과의 상호작용에서 자신이 결과에 영향을 줄 수 있다는 자기효능감과 통제감을 갖는 정도를 말한다. 이는 Bandura의 행위주체성 이론(Human Agency Theory)에서 착안하였다[21]. 생성형 AI에서는 생성 파라미터 설정, 스타일 선택, 결과 수정 도구 제공 등을 통해 사용자 의도를 결과에 반영하는 설계가 핵심이다.
이상의 다섯 가지 설계 요소는 본 연구에서 수행하는 사례 분석 및 사용자 실험에서 도구 간 비교의 기준으로 활용된다.
Ⅲ. 사례분석
3-1 분석 대상 선정
본 연구에서는 생성형 AI 도구의 사용자 경험(UX)을 분석하기 위한 사례로 Midjourney와 ChatGPT를 선정하였다. 이 두 도구는 각각 시각 생성형 도구와 언어 생성형 도구를 대표하며, 표 1과 같이 인터페이스 구조, 상호작용 방식, 피드백 메커니즘 등에서 뚜렷한 차이를 지닌다. 이에 따라 사용자 경험의 주요 설계 요소별 특성을 비교·분석하기에 적합한 비교군으로 판단되었다.
3-2 분석 방법 및 구성
본 연구에서 제안한 분석 방법 및 구성 절차는 그림 1과 같다. 분석에 사용된 UX 설계 요소는 앞서 제시한 5가지(접근성, 해석성, 반복 개선성, 몰입 지속성, 사용자 주도성)이며, 각 요소별로 실험적 사용 결과를 수치화하여 비교하였다.
실험에 참여한 피험자는 12명(각 도구별 6명씩)으로 구성되었으며, 사용자 경험 수준에 따라 표 2와 같이 세 그룹으로 분류하였다. 각 그룹은 30분 간 태스크 기반 시나리오를 수행하였다. 이후 사용자는 사전 설문을 통해 배경 및 기대 수준을 파악하고, 심층 인터뷰를 통해 정성적 경험을 수집하였다.
3-3 Midjourney 사례 분석
Midjourney는 Discord 기반 커뮤니티 환경에서 작동하는 시각 생성형 AI 도구로, 텍스트 프롬프트를 기반으로 이미지를 생성하는 방식이다. 사용흐름은 그림 2와 같다.
초급 사용자는 주로 간단한 프롬프트를 입력하고, 결과에 대해 만족감을 느끼는 경우가 많다. 반면, 고급 사용자는 파라미터 조정 및 여러 번의 반복을 통해 보다 정교한 결과를 얻기 위해 활용한다.
표 3은 각 사용자 그룹별 UX 설계 요소에 따른 정량 수치를 정리한 것이다. 각 요소별 분석 내용은 다음과 같다.
① 접근성: Midjourney의 접근성은 Discord의 사용법을 배우는 데 시간이 소요되며, 초급 사용자에게는 초기 진입 장벽이 높다. 그러나 자연어 입력 방식이므로, 텍스트 프롬프트만으로 이미지를 생성할 수 있어 그 자체는 직관적이다. 초급 사용자는 첫 이미지 생성까지 평균 8.3분이 소요되었으나, 고급 사용자는 1.4분 만에 이미지를 생성할 수 있었다.
② 해석성: 결과-프롬프트 연관성에 대한 이해도가 사용자 숙련도에 따라 다르며, 고급 사용자는 파라미터 조정과 재시도 등을 통해 예측 가능한 결과를 얻을 수 있다. 그러나 초급 사용자는 결과와 프롬프트 간의 연관성을 직관적으로 파악하기 어려운 경향이 있다.
③ 반복 개선성: 반복 개선성은 고급 사용자가 파라미터를 조정하여 결과를 개선하는 방식이다. 특히 고급 사용자는 다양한 매개변수를 활용해 원하는 스타일을 재현할 수 있다. 반면 초급 사용자는 첫 번째 생성물에 만족하는 경향이 높다.
④ 몰입 지속성: Midjourney는 생성 과정을 실시간으로 시각화하여 사용자의 몰입을 유도한다. 90% 이상의 사용자들이 이미지를 생성하는 과정을 끝까지 관찰했으며, 초급 사용자는 이 과정에서 큰 만족감을 느낀다.
⑤ 사용자 주도성: 고급 사용자는 여러 파라미터를 조정하여 더 많은 제어권을 행사할 수 있다. 이러한 기능은 고급 사용자에게 특히 유용하며, 초급 사용자는 기본적인 프롬프트와 버튼 사용에 그친다.
3-4 ChatGPT 사례 분석
ChatGPT는 자연어 기반의 대화형 AI 도구로, 웹 브라우저를 통해 사용자가 질문을 입력하면, 그에 대한 답변을 텍스트로 제공한다. 사용흐름은 그림 3과 같다.
초급 사용자는 간단한 질문을 하고, 고급 사용자는 보다 복잡한 요청을 하며 시스템의 능력을 시험한다. 사용자는 대화의 흐름을 통해 점차 더 구체적인 요구를 할 수 있다.
표 4는 각 사용자 그룹별 UX 설계 요소에 따른 정량 수치를 정리한 것이다. 각 요소별 분석 내용은 다음과 같다.
① 접근성: ChatGPT는 웹 기반 인터페이스로 직관적이며, 별도의 학습 없이 바로 사용할 수 있는 점이 큰 장점이다. 초급 사용자는 첫 질문을 입력하는 데 평균 1.2분이 소요되었으며, 고급 사용자는 0.6분 만에 입력을 완료할 수 있었다.
② 해석성: ChatGPT는 응답에 대해 논리적이고 단계적인 설명을 제공하는 특징을 가지고 있으며, 고급 사용자는 시스템이 제공하는 답변의 구조와 과정을 잘 이해하고 이를 활용한다. 특히 고급 사용자는 불확실성의 표현이 신뢰성에 긍정적 영향을 미친다고 평가했다.
③ 반복 개선성: ChatGPT는 사용자가 요청에 따라 답변을 반복적으로 수정하고 추가하는 방식으로 사용된다. 고급 사용자는 이를 적극적으로 활용하며, 반복 개선을 위해 질문을 점차 세부적으로 조정한다.
④ 몰입 지속성: ChatGPT는 실시간 타이핑 애니메이션과 같은 시각적 피드백을 제공하여 사용자의 몰입을 높인다. 초급 사용자는 이 피드백에 높은 만족도를 보였으며, 고급 사용자는 이러한 애니메이션을 통해 진행 상황을 직관적으로 인식할 수 있었다.
⑤ 사용자 주도성: ChatGPT는 사용자가 원하는 방식으로 대화를 주도할 수 있도록 하며, 고급 사용자는 보다 구체적인 출력 형식을 요구하거나, 역할 설정, 파라미터 조정 등을 통해 결과를 세밀하게 조정할 수 있다.
3-5 Midjourney와 ChatGPT 간 비교 분석
Midjourney는 Discord 기반 커뮤니티 구조로 집단 학습을 촉진하며, 다양한 사용자들의 프롬프트와 결과물을 실시간 공유·학습할 수 있는 환경을 제공한다. 하지만 초기 진입 장벽이 있어 초급 사용자는 다소 어려울 수 있다. 반면 ChatGPT는 웹 기반 채팅 형식으로 즉시 사용 가능하며, 매우 직관적이고 접근성이 높다. 다만 텍스트 기반 시스템이기에 시각적 피드백을 통한 몰입감은 상대적으로 낮을 수 있다.
표 5는 각 사용자 그룹별 UX 설계 요소에 따른 정량 수치를 정리한 것이다. Midjourney와 ChatGPT 각 UX 요소별 비교 분석 내용은 다음과 같다.
① 접근성: ChatGPT는 웹 기반 인터페이스로 초급 사용자에게 더 높은 접근성을 제공하며, 자연어 입력 방식은 직관적이고 쉽게 사용할 수 있도록 돕는다.
② 해석성: ChatGPT는 논리적 추론 과정을 설명하는 기능을 통해 더 높은 해석성을 제공하며, 사용자가 결과를 이해하는 데 있어 우수한 성과를 보였다.
③ 반복 개선성: Midjourney는 다양한 매개변수를 활용하여 이미지 생성 후 반복적으로 수정할 수 있는 구조를 제공하며, ChatGPT는 대화형으로 연속적 개선이 가능하지만 그 자유도는 제한적이다.
④ 몰입 지속성: Midjourney는 시각적 이미지 생성 과정 시각화를 통해 몰입도를 유지하는 데 강점을 보였으며, ChatGPT는 타이핑 애니메이션을 통한 몰입감을 제공하지만 상대적으로 단조롭다.
⑤ 사용자 주도성: Midjourney는 고급 사용자들이 다양한 매개변수를 통해 이미지 결과를 세밀하게 제어할 수 있는 기능을 제공하며, ChatGPT는 프롬프트 설정을 통해 사용자가 대화의 흐름을 조정할 수 있도록 한다.
첫째, 접근성 설계의 중요성: ChatGPT는 접근성이 뛰어나 초급 사용자에게 유리하며, 웹 기반과 자연어 입력 방식의 직관적인 사용성은 초보자에게 적합하다. Midjourney는 커뮤니티 기반 시스템으로 초급 사용자는 진입 장벽을 느낄 수 있지만, 고급 사용자에게 자유로운 창작 가능성을 제공한다.
둘째, 해석성 향상: 두 도구의 해석성 차이는 피드백 방식에서 발생하며, ChatGPT는 논리적 추론과 불확실성 표현을 통해 사용자 신뢰를 구축하는 반면, Midjourney는 시각적 결과물의 직관성을 강조한다.
셋째, 반복 개선성 설계: 두 도구 모두 반복 개선 기능을 제공하지만, Midjourney는 이미지 생성 후 다양하게 수정할 수 있는 구조로 창의적 탐색에 적합하다. ChatGPT는 대화형 인터페이스를 통해 연속적 개선을 가능하게 한다.
넷째, 몰입 지속성 설계: Midjourney는 시각적 생성 과정 시각화를 통해 사용자의 몰입을 유도하며, ChatGPT는 실시간 타이핑 애니메이션을 통해 대화의 흐름을 유지시킨다.
다섯째, 사용자 주도성 설계: Midjourney는 고급 기능을 통해 사용자 주도성을 높이며, ChatGPT는 사용자가 대화의 흐름을 조정하는 방식으로 만족도를 높일 수 있다.
Ⅳ. 사용자 조사 및 결과 분석
4-1 조사 목적 및 개요
본 장에서는 앞서 진행한 Midjourney와 ChatGPT의 UX 설계 요소 분석을 바탕으로, 실제 사용자 그룹을 대상으로 한 정량적 및 정성적 조사를 통해 실증적 타당성을 확보하고자 한다. 본 연구의 목적은 사용자의 경험 수준에 따른 두 도구의 UX 차이를 명확히 비교하고, 각 도구의 강점과 개선 사항을 도출하는 것이다. 이를 통해 생성형 AI 도구의 사용성 및 사용자 경험 개선을 위한 실질적인 방향을 제시하고자 한다.
조사는 두 단계로 진행되었다. 1차 정량조사는 UX 설계 요소(접근성, 해석성, 반복 개선성, 몰입 지속성, 사용자 주도성)에 대한 사용자 인식을 측정하는 설문조사로, 총 100명의 사용자를 대상으로 진행되었다. 2차 정성조사는 1차 설문에 참여한 응답자 중에서 두 도구를 사용한 경험이 있는 12명을 선정하여, 심층 인터뷰를 통해 구체적인 사용 경험과 개선 요구 사항을 수집하였다.
4-2 정량 조사 분석
조사는 2025년 3월부터 4월까지 약 8주간 진행되었으며, 사용자는 총 100명(Midjourney 50명, ChatGPT 50명)으로 구성되었다. 설문은 7점 리커트 척도를 사용하여 UX 설계 요소별로 사용자 인식을 측정하였고, 수집된 데이터는 SPSS 28.0을 사용하여 독립표본 t-검정을 통해 분석하였다.
표 6의 설문지는 총 5가지 UX 설계 요소를 기준으로 설계되었으며, 각 요소는 3~4개의 세부 문항을 포함하여 총 18개의 문항으로 구성되었다. 이 문항들은 각 도구의 사용성, 만족도, 반복 사용 가능성 등을 평가하기 위해 고안되었다.
설문 결과, 표 7과 같이 두 도구는 각각 접근성, 해석성, 반복 개선성, 몰입 지속성, 사용자 주도성 등 주요 UX 요소에서 차이를 보였다. 특히 접근성과 해석성에서 유의미한 차이가 발견되었으며, 몰입 지속성에서는 Midjourney가 상대적으로 높은 점수를 기록하였다.
① 접근성: Midjourney는 4.12/7, ChatGPT는 6.08/7로, ChatGPT가 상대적으로 더 직관적이고 접근성이 높은 인터페이스를 제공하는 것으로 나타났다(p<0.001, 효과크기 1.83).
② 해석성: ChatGPT가 6.21/7, Midjourney가 3.24/7로, 해석성에서 ChatGPT가 우위를 보였다(p<0.001, 효과크기 2.85).
③ 반복 개선성: 두 도구는 비슷한 수준의 반복 개선성을 보였다. Midjourney는 5.76/7, ChatGPT는 5.82/7로, 두 도구 간 차이는 통계적으로 유의미하지 않았다(p=0.773, 효과크기 0.06).
④ 몰입 지속성: Midjourney는 6.15/7, ChatGPT는 5.38/7로, Midjourney가 몰입을 유지하는 데 유리한 특성을 보였다(p<0.001, 효과크기 0.76).
⑤ 사용자 주도성: 두 도구는 비슷한 수준의 사용자 주도성을 보였다. Midjourney는 5.84/7, ChatGPT는 5.69/7로 차이는 유의미하지 않았다(p=0.456, 효과크기 0.15).
4-3 사용자 수준별 분석
Midjourney와 ChatGPT의 접근성은 사용자 수준에 따라 상이한 특성을 보였다. 초급 사용자는 ChatGPT의 자연어 입력 방식이 직관적이고 빠르게 사용 가능하다고 평가했으며, 초기 진입에 큰 어려움 없이 질문을 입력할 수 있었다. 반면 Midjourney는 Discord 플랫폼의 특성상 초기 설정이 복잡하고 명령어 입력에 대한 학습이 필요하여, 초급 사용자들에게는 진입 장벽이 있었다. 초급 사용자는 첫 이미지 생성까지 평균 8.3분이 소요되었으며, 이는 ChatGPT의 첫 질문 입력 소요시간 1.2분에 비해 상당히 긴 시간이었다.
초급 사용자는 ChatGPT는 100% 성공적인 첫 질문 입력률을 보였으나, Midjourney는 초급 사용자의 첫 사용 성공률이 67%로 상대적으로 낮았다. 중급 및 고급 사용자는 두 도구 모두에 능숙하게 접근했으나, ChatGPT는 직관적인 텍스트 기반 인터페이스로 여전히 더 빠른 진입을 제공했다.
ChatGPT는 논리적이고 일관성 있는 텍스트 기반 응답을 제공하여, 해석성에서 우위를 보였다. 사용자는 “단계별 설명”과 “불확실성에 대한 명확한 표현”에 대해 긍정적인 반응을 보였으며, 이로 인해 신뢰성을 크게 향상시킬 수 있었다. 특히 “확실하지 않다”는 표현을 긍정적으로 평가한 사용자들이 많았다. Midjourney는 시각적 결과물을 생성하므로, 사용자는 결과를 직관적으로 이해할 수 있으나 프롬프트와 결과물 간의 연관성 파악이 어려운 경우가 많았다. 특히 고급 사용자들은 시드 값과 매개변수 조정을 통해 예측 가능한 결과를 얻을 수 있었지만, 초급 사용자들은 결과의 정확성을 예측하는 데 어려움을 겪었다.
초급 사용자는 ChatGPT는 단계별 설명을 제공하여 이해도가 높았다(6.0/7). Midjourney는 5.4/7의 이해도를 보였으며, 특히 “왜 이런 결과가 나왔는지 모르겠다”는 반응이 34%의 사용자에서 나타났다.
Midjourney와 ChatGPT는 모두 반복 개선성을 제공하지만, 접근 방식이 다르다. Midjourney는 시각적 실험을 통해 반복 개선을 수행할 수 있으며, 매개변수(예: --ar, --v 등)의 조정으로 더 정교한 결과를 도출한다. 고급 사용자들은 U/V 버튼을 활용하여 더 나은 결과물을 생성했으며, 반복 횟수는 고급 사용자가 평균 4.1회로 가장 높았다. 반면 ChatGPT는 대화형 개선 메커니즘을 제공한다. 사용자는 “더 자세히 설명해 주세요” 또는 “다른 관점에서 설명해 주세요"와 같은 프롬프트를 통해 결과를 개선할 수 있으며, 반복 요청을 통한 개선의 성공률이 높았다.
Midjourney는 평균 3.0회의 반복 횟수를 ChatGPT는 평균 3.7회의 반복 횟수로, ChatGPT가 반복 개선을 더 직관적으로 처리할 수 있었다.
Midjourney는 이미지 생성 과정이 실시간으로 시각화되므로 사용자의 몰입도를 높이는 요소로 작용했다. 생성된 이미지는 저해상도에서 고해상도로 점진적으로 발전하며, 사용자는 이 과정을 보며 몰입감을 높일 수 있었다. ChatGPT는 타이핑 애니메이션과 텍스트 진행을 통해 사용자의 몰입을 유지했으며, “AI가 생각하고 있다”는 인식을 제공하여 사용자의 주의를 끌었다. 그러나 ChatGPT는 시각적 요소가 부족하여 Midjourney보다 몰입도가 다소 낮았다.
Midjourney는 생성 과정 관찰률 90%, 몰입도 유지에 강점이며, ChatGPT는 타이핑 애니메이션 관찰률 94%, 예측 가능성 제공에 유리하다.
Midjourney는 고급 사용자에게 커스터마이징 가능한 매개변수 옵션을 제공하여 높은 사용자 주도성을 보였다. ChatGPT는 주로 텍스트 기반 입력을 통해 결과를 제어하지만, 시스템 프롬프트 설정 등으로 일부 고급 사용자는 자신의 요구에 맞게 제어할 수 있었다.
Midjourney는 고급 사용자가 매개변수 조정을 통해 더 높은 제어권을 행사(6.8/7)하였고, ChatGPT는 텍스트 입력 및 설정을 통한 제어로 평균 5.7/7의 만족도를 기록하였다.
4-4 인터뷰 기반 정성조사 결과 분석
Midjourney는 주로 창작 활동과 아이디어 시각화를 위한 도구로 활용되었다. 사용자는 반복적인 실험과 스타일 변경을 통해 점차 창의적인 작업을 도출해낼 수 있었다. 특히 고급 사용자들은 시드값과 매개변수 조정을 통해 결과를 보다 정밀하게 제어할 수 있다는 점에서 큰 만족감을 보였다. 예를 들어, 고급 사용자 M6은 “시드 값을 조정하면서 점차 내가 원하는 스타일을 찾을 수 있었다”며 결과물의 질을 개선하는 데 중요한 역할을 했다고 말했다.
ChatGPT는 정보 탐색, 학습, 문제 해결 등 다양한 용도로 사용되었다. 텍스트 기반의 직관적인 인터페이스 덕분에 사용자는 빠르게 질문을 던지고, 필요한 답을 얻을 수 있었다. ChatGPT의 자연어 처리 능력을 높이 평가한 사용자들은 “AI가 제공하는 답변을 텍스트로 즉시 이해할 수 있어 매우 효율적이었다”고 말했다.
첫째, 접근성에서 Midjourney 사용자들은 Discord 기반 인터페이스에 대한 진입 장벽을 높게 평가했다. 특히 초급 사용자들은 “처음에는 어떤 키워드를 써야 할지 막막했다”며 다른 사용자들의 프롬프트를 참조하면서 배우는 방식을 채택해야 했다. 초급 사용자 M2는 “Discord 환경 자체가 익숙하지 않아서 초기 진입이 어려웠다”고 말했다. ChatGPT 사용자들은 웹 기반 인터페이스 덕분에 매우 쉽게 접근할 수 있었다. 초급 사용자 C1은 “대화하듯 질문하면 답이 바로 나와서 매우 쉬웠다”고 말했다. 또 다른 초급 사용자 C2는 “특별한 학습 없이도 바로 사용할 수 있어 좋았다”고 덧붙였다.
둘째, 해석성에서 Midjourney 사용자들은 “왜 이런 이미지가 나왔는지 이해하기 어렵다”고 불만을 제기했다. 결과적으로, 해석성이 부족해 프롬프트와 결과 간의 연관성을 직관적으로 파악하기 어려웠다. 중급 사용자 M3는 “복잡한 프롬프트에서 어떤 요소가 결과에 영향을 주었는지 파악하기 힘들다”고 말했다. ChatGPT 사용자들은 “단계별로 설명을 제공해줘서 이해가 쉬웠다”고 반응했다. 초급 사용자 C1은 “AI가 어떻게 생각하고 결정을 내렸는지 알려줘서 더 신뢰가 갔다”고 말했다.
셋째, 몰입성에서 Midjourney 사용자는 생성 과정 시각화가 매우 흥미롭고 만족스러웠다고 응답했다. 고급 사용자 M6은 “이미지가 점차 변하는 과정을 보는 게 재미있다”며 시각적 변화 과정에서 느끼는 몰입감을 강조했다. 이러한 시각적 피드백은 사용자가 기대감을 유지하고 더 깊이 작업에 몰입하게 만들었다. ChatGPT 사용자들은 타이핑 애니메이션과 실시간 피드백에 대해 긍정적인 반응을 보였다. 초급 사용자 C3은 “타이핑하는 것처럼 글자가 나타나는 게 실감 나서 몰입감이 있었다”고 말했다. 중급 사용자 C4는 “긴 답변도 단계적으로 나와서 지루하지 않았다”고 언급하며 몰입을 높이는 효과가 있었다고 평가했다.
넷째, 반복 개선성에서 Midjourney 사용자는 반복적 실험을 통해 점진적으로 더 나은 결과를 도출할 수 있었다. 예를 들어, 초급 사용자 M1은 “첫 번째 결과에 만족하지 못했지만, 반복적으로 실험하면서 점차적으로 내가 원하는 스타일에 가까운 결과를 얻을 수 있었다”고 말했다. 고급 사용자 M5는 “매개변수와 스타일을 조정하여 결과를 최적화할 수 있는 점이 가장 큰 장점”이라며 반복 개선성을 강조했다. ChatGPT는 대화형 개선 메커니즘을 통해 반복적인 요청을 손쉽게 할 수 있었다. 중급 사용자 C3는 “더 구체적인 설명을 요청하면서 점차적으로 정확한 답변을 얻을 수 있었다”고 설명했다. 또한 고급 사용자 C6는 “대화 맥락을 유지하면서 반복적으로 개선할 수 있어 효율적인 문제 해결이 가능했다”고 평가했다.
다섯째, 사용자 주도성에서 Midjourney는 사용자가 매개변수와 스타일 조정을 통해 더 높은 사용자 주도성을 경험할 수 있는 도구였다. 고급 사용자 M5는 “시드 값과 변형 옵션을 사용하여 결과를 최적화할 수 있는 점에서 더 많은 제어감을 느낄 수 있었다”고 했다. ChatGPT 사용자는 프롬프트 조정과 시스템 프롬프트 설정을 통해 고급 사용자 수준의 자율성을 보장받았다. 사용자 C6은 “API 파라미터로 온도, 토큰 수 등을 조절해서 최적화된 결과를 얻을 수 있다”고 언급했다.
4-5 종합 분석
종합 분석 결과, Midjourney와 ChatGPT는 각각의 UX 특성과 장점을 가지고 있으며, 사용자의 경험 수준과 사용 목적에 따라 상이한 강점을 보였다. Midjourney는 시각적 결과 생성과 몰입도를 강조하는 창의적 작업에 적합한 도구로, 반복 실험을 통한 점진적인 개선을 유도하였다. 반면 ChatGPT는 텍스트 기반으로 빠르고 직관적인 접근을 제공하여 정보 탐색과 문제 해결을 위한 도구로 적합하다.
Midjourney는 초급 사용자가 접근하기 어려운 부분이 있으므로, 튜토리얼과 직관적인 프롬프트 작성 가이드라인이 필요하다. 이러한 분석 결과는 이후 제시할 UX 설계 가이드라인 및 결론에서 보다 구체적으로 제안된다.
Ⅴ. 결론 및 시사점
5-1 연구 결과 요약 및 한계
본 연구는 생성형 인공지능 도구 Midjourney와 ChatGPT를 대상으로, 사용자 숙련도에 따른 UX 특성을 5가지 UX 설계 요소 기준으로 비교·분석하였다. 그 결과, 두 도구는 기능적 차이뿐 아니라 사용 방식과 만족도에서 차이를 보였다.
Midjourney는 시각 피드백과 반복 실험 중심의 몰입형 구조를 지니며, 고급 사용자에게 높은 주도성과 창의적 탐색성을 제공하였다. 반면 ChatGPT는 프롬프트 기반의 구조적 피드백과 명확한 응답 방식으로, 초급 사용자에게 접근성과 해석성 측면에서 긍정적 평가를 받았다. 또한 두 도구 모두 반복 사용을 통해 결과 생성의 패턴을 파악하거나 전략적으로 제어하려는 행동이 나타났으며, 이는 비결정적 생성 구조 내에서도 사용자들이 '예측 가능한 불확실성'을 형성하고자 한다는 점을 시사한다.
본 연구의 주요 시사점은 다음과 같다.
첫째, 사용자 숙련도에 따른 기능 노출 방식과 상호작용 흐름의 차이를 분석함으로써, 사용자 수준에 따라 동적으로 조정되는 UX 설계 전략(adaptive UX design strategy)의 필요성을 실증하였다.
둘째, 프롬프트 중심의 생성형 AI 도구에서 사용자 경험을 구성하는 핵심 설계 요소를 구조화하고, 사용자 반응 기반 분석을 통해 UX 평가 및 설계 프레임워크를 제시하였다.
셋째, Midjourney와 ChatGPT를 매체 특성과 사용자 관점에서 비교함으로써, 시각 생성형 도구와 텍스트 생성형 도구 간 UX 전략의 차별화 필요성을 구체화하였다.
한계점으로는 분석 대상이 Midjourney와 ChatGPT 두 도구에 국한되어 있어, 생성형 AI 도구 전반으로의 일반화에는 제약이 있다. 또한 단기 실험 설계로 인해, 장기 사용에 따른 UX 변화나 적응 과정까지는 분석하지 못하였다. 향후에는 다양한 생성 도구를 포함하고, 종단적 분석 및 사용자 로그 기반 정량 연구가 병행될 필요가 있다.
5-2 UX 설계 가이드라인 제시
본 연구 결과를 바탕으로 도출된 UX 설계 가이드라인은 표 8과 같다. 이 가이드라인은 단순한 사용 편의성 향상을 넘어, 사용자 숙련도, 생성 매체의 특성, 프롬프트 기반 상호작용 구조를 통합적으로 반영하여 UX를 체계적으로 설계하는 데 목적이 있다.
① 진입 장벽 최소화(Entry Barrier Minimization)
프롬프트 입력을 기반으로 작동하는 생성형 AI 도구는 초급 사용자에게 높은 진입 장벽으로 작용할 수 있다. 이를 완화하기 위해, 사용자 수준에 따른 온보딩 경로 설정, 프롬프트 템플릿 제공, 실시간 힌트 제시 등 단계적 학습 유도 전략이 필요하다. 또한 Guided Mode와 Expert Mode를 구분해 제공함으로써 경험 수준에 따른 맞춤형 UI 설계가 요구된다.
② 결과 해석 가능성 향상(Enhancing Interpretability)
생성형 AI의 비결정적 결과 특성으로 인해, 사용자는 생성 과정을 이해하기 어렵거나 불확실성을 느낄 수 있다. 이에 따라 생성 로직 또는 의사결정 구조의 시각화, 시드값·파라미터의 명시, 불확실성 라벨링 등은 사용자 신뢰 형성에 중요한 UX 설계 요소가 된다.
③ 사용자 수준 기반 적응형 UI (Adaptive UI)
사용자의 숙련도에 따라 동일 도구의 UX가 전혀 다르게 작동하기 때문에, 인터페이스는 사용자의 사용 패턴이나 행동 로그를 기반으로 기능 노출 수준을 점진적으로 조정할 수 있어야 한다. 프롬프트 입력 환경에서는 ‘템플릿 → 수정 → 자유입력’으로 확장되는 단계별 UI 제공이 효과적이다.
④ 모달리티별 UX 전략(Modality-Specific Design)
시각 기반 도구(Midjourney)는 시각적 피드백, 반복 실험, 스타일 프리셋, 리믹스 기능 등을 통해 창의적 몰입을 유도해야 하며, 텍스트 기반 도구(ChatGPT)는 다회차 대화, 맥락 유지, 역할 기반 시나리오 제공을 통해 정보 탐색과 문제 해결을 돕는 설계가 적합하다. 각 도구의 매체 특성과 사용 목적을 고려한 UX 전략 수립이 필수적이다.
⑤ 지속적 참여 유도(Sustained Engagement)
반복 사용이 학습성과와 직결되는 생성형 AI의 특성상, UX는 사용자 몰입을 유지하고 반복 사용을 장려할 수 있어야 한다. 이를 위해 생성 이력 시각화, 프롬프트 기록 저장, 성취 뱃지 제공, 피드백 기반 성장 추적 기능 등 설계가 필요하다.
결론적으로, 생성형 AI 도구의 UX 설계는 단순한 사용성 향상을 넘어, 사용자 수준과 도구 특성을 고려한 전략적 접근이 요구된다. 본 연구는 이론적 프레임워크, 사례 비교, 사용자 조사 결과를 종합하여, 실무 적용이 가능한 UX 설계 체계를 제안하였다. 이는 향후 생성형 AI 도구의 사용자 중심 인터페이스 설계 및 장기적 사용성 확보를 위한 기초 자료로 활용될 수 있다.
References
- M. Mitchell, Artificial Intelligence: A Guide for Thinking Humans, New York, NY: Farrar, Straus and Giroux, 2019.
- D. A. Norman, The Design of Everyday Things: Revised and Expanded Edition, New York, NY: Basic Books, 2013.
- I. Goodfellow, Y. Bengio, and A. Courville, Deep Learning, Cambridge, MA: MIT Press, 2016.
- Korea Institute of Science and Technology Information (KISTI). Generative Artificial Intelligence [Internet]. Available: https://scienceon.kisti.re.kr/aiq/issue/selectIssueReportView.do?searchIssueRptNo=128
-
Y.-H. Lee, “Analysis of College Students' Perception about Generative Artificial Intelligence ChatGPT,” A Treatise on the Plastic Media, Vol. 26, No. 4, pp. 46-55.
[https://doi.org/10.35280/KOTPM.2023.26.4.6]
-
OpenAI, J. Achiam, S. Adler, S. Agarwal, L. Ahmad, I. Akkaya, ... and B. Zoph, “GPT-4 Technical Report,” arXiv:2303.08774, , 2023.
[https://doi.org/10.48550/arXiv.2303.08774]
- Midjourney. About Midjourney [Internet]. Available: https://www.midjourney.com, .
-
B. Shneiderman, Human-Centered AI, Oxford, UK: Oxford University Press, 2022.
[https://doi.org/10.1093/oso/9780192845290.001.0001]
- International Organization for Standardization, Ergonomics of Human-System Interaction – Part 210: Human-Centred Design for Interactive Systems, ISO, Geneva, Switzerland, ISO 9241-210:2019, 2019.
- D. A. Norman, The Design of Everyday Things: Revised and Expanded Edition, New York, NY: Basic Books, 2013.
- IDEO, The HCD Toolkit: An Introduction to Human-Centered Design, IDEO, 2015.
- H. Sharp, Y. Rogers, and J. Preece, Interaction Design: Beyond Human-Computer Interaction, 5th ed. Hoboken, NJ: Wiley, 2023.
- T. Brown, Change by Design: How Design Thinking Transforms Organizations and Inspires Innovation, New York, NY: Harper Business, 2009.
- D. Norman, Emotional Design: Why We Love (or Hate) Everyday Things, New York, NY: Basic Books, 2004.
- J. Nielsen, Usability Engineering, San Francisco, CA: Morgan Kaufmann, 1994.
-
S. Amershi, D. Weld, M. Vorvoreanu, A. Fourney, B. Nushi, P. Collisson, ... and E. Horvitz, “Guidelines for Human-AI Interaction,” in Proceedings of the 2019 CHI Conference on Human Factors in Computing Systems, Glasgow: UK, pp. 1-13, 2019.
[https://doi.org/10.1145/3290605.3300233]
-
B. Shneiderman, “Creativity Support Tools: Accelerating Discovery and Innovation,” Communications of the ACM, Vol. 50, No. 12, pp. 20-32, 2007.
[https://doi.org/10.1145/1323688.1323689]
-
M. T. Ribeiro, S. Singh, and C. Guestrin, “Why Should I Trust You? Explaining the Predictions of Any Classifier,” in Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, San Francisco: CA, pp. 1135-1144, 2016.
[https://doi.org/10.1145/2939672.2939778]
- T. Brown, “Design Thinking,” Harvard Business Review, Vol. 86, No. 6, pp. 84-92, 2008.
- M. Csikszentmihalyi, Flow: The Psychology of Optimal Experience, New York, NY: Harper & Row, 1990.
- A. Bandura, Guide for Constructing Self-Efficacy Scales, in Self-Efficacy Beliefs of Adolescents, Charlotte, NC: Information Age Publishingpp, pp. 307-337, 2006.
저자소개
2010년:중앙대학교 대학원 (예술학석사)
2019년:중앙대학교 대학원 (디자인학박사)
2013년~현 재: 한국공학대학교 겸임교수
2020년~현 재: ㈜ 키메이커스 이사
※관심분야:사용자 경험(User Experience), 인공지능 디자인(AI Design), 경험가치(Experience Value)



