| Browse Archives | About | For Contributors |
Sorry.
You are not permitted to access the full text of articles.
If you have any questions about permissions,
please contact the Society.
죄송합니다.
회원님은 논문 이용 권한이 없습니다.
권한 관련 문의는 학회로 부탁 드립니다.
| [ Article ] | |
| Journal of Digital Contents Society - Vol. 26, No. 11, pp. 3011-3023 | |
| Abbreviation: J. DCS | |
| ISSN: 1598-2009 (Print) 2287-738X (Online) | |
| Print publication date 30 Nov 2025 | |
| Received 11 Oct 2025 Revised 31 Oct 2025 Accepted 10 Nov 2025 | |
| DOI: https://doi.org/10.9728/dcs.2025.26.11.3011 | |
| 사용자 행동 수준에 따른 AI 컨펌 방식이 사용자 경험과 기술 수용에 미치는 영향 | |
박연수1 ; 임진호2, *
| |
| 1국민대학교 테크노디자인전문대학원 스마트경험디자인학과 석사과정 | |
| 2국민대학교 테크노디자인전문대학원 스마트경험디자인학과 교수 | |
Effects of AI Confirmation Modes and User Behavior Level on User Experience and Technology Adoption | |
Yon-Soo Park1 ; Jin-Ho Yim2, *
| |
| 1Master’s Course, Department of Smart Experience Design, Kookmin University, Seoul 02707, Korea | |
| 2Professor, Department of Smart Experience Design, Kookmin University, Seoul 02707, Korea | |
| Correspondence to : *Jin-Ho Yim Tel: +82-2-910-6768 E-mail: hci.yim@kookmin.ac.kr | |
Copyright ⓒ 2025 The Digital Contents Society
| |
본 연구는 생성형 인공지능 협업 맥락에서 컨펌 방식과 사용자 행동 수준의 관계를 혼합요인 설계와 구조방정식모형으로 검증하였다. 컨펌 방식은 신뢰, 통제감, 인지부하 및 지각된 유용성, 만족도, 사용 의도에서 통계적으로 유의미한 차이를 보였고, 지각된 사용 용이성은 유의미한 차이를 보이지 않았다. 사용자 경험은 지각된 사용 용이성과 지각된 유용성을 매개로 만족도와 사용 의도로 이어졌다. 행동 수준별 구조 지표의 전역 동치는 수용되었으나, 선호 기반 분석에서는 전략적 판단과 중간 과업에서 제안형, 단순 조작에서 명시적 컨펌 방식에 대한 선호가 확인되었고, 조건부 간접효과 차이는 일부에 한정되었다. 이러한 결과는 생성형 인공지능 협업 맥락에서 컨펌 방식-사용자 경험-기술 수용으로 이어지는 경로의 성립을 실증하고, 사용자 행동 수준을 반영한 정합성 해석 틀을 제안한다.
This study examined the relationship between AI confirmation modes and user behavior level in generative-AI collaboration using a mixed-factor design and structural equation modeling. The confirmation modes yielded significant differences in trust, perceived control, cognitive load, perceived usefulness, satisfaction, and behavioral intention, whereas perceived ease of use was not significant. The effects of user experience on satisfaction and behavioral intention were mediated by perceived ease of use and perceived usefulness. Structural concordance across behavior levels was not significant overall, whereas preference-based analyses indicated suggestive confirmation at the goal and task levels and explicit confirmation at the action level; conditional indirect effects were limited. The findings substantiate the pathway from confirmation modes to technology acceptance via user experience and propose a concordance framework that incorporates user behavior level for context-appropriate design.
| Keywords: Behavior Level, Human–AI Interaction (HAI), User Experience (UX), Technology Acceptance Model (TAM), Generative AI 키워드: 행동 수준, 인간–인공지능 상호작용(HAI), 사용자 경험(UX), 기술 수용 모델(TAM), 생성형 인공지능 |
|
인공지능 기술, 특히 Microsoft Copilot, Google Gemini, ChatGPT, Claude 등 대규모 언어모델(Large Language Model, LLM) 기반 생성형 AI 생산성 도구의 확산은 인간-컴퓨터 상호작용(Human-Computer Interaction, HCI)의 패러다임을 전환시키고 있다. 기존 HCI가 사용자 주도적이며 컴퓨터 시스템이 보조적인 도구 역할에 머물렀던 것과 달리, 이러한 AI 도구들은 이메일 작성, 문서 편집, 코드 생성, 데이터 분석 등 실제 업무에서 협업 파트너로 기능하며[1], 명시적 요청 없이도 상황을 예측해 작업을 제안하고 실행할 정도로 고도화되었다[2]. 이처럼 AI의 자율성과 자동화 수준이 높아짐에 따라 생산성은 향상되고 있지만, 과도한 자동화는 사용자의 책임감과 통제감 약화, 신뢰 저하 문제를 수반할 수 있다는 한계 또한 부각되고 있다[3]-[5]. 따라서 AI가 결과를 제공·확인·실행하는 방식과 사용자의 수용 메커니즘을 맥락에 맞게 규명하는 일이 중요하다.
이에 본 연구에서는 AI의 결과 제공·확인·실행 메커니즘을크게 명시적 컨펌(Explicit Confirmation), 암묵적 컨펌(Implicit Confirmation), 제안형 컨펌(Suggestive Confirmation)으로 정의하였다. 기존 HCI의 자동화 및 추천 시스템 연구들은 주로 암묵적, 명시적 구분을 중심으로 진행해 왔으나[3],[4], 본 연구는 이를 생성형 AI 협업 맥락으로 확장시키고, 최근 인간-인공지능 상호작용(Human-AI Interaction, HAI) 연구에서 강조되는 복수 제안과 대안 탐색 상호작용 개념을 반영하여 개념적 분석 틀을 마련하고자 하였다[5]. 실제 생성형 AI 도구들을 살펴보면, 기능별로 다른 컨펌 방식을 혼합하여 활용하고 있다. 문서작성 지원이나 이메일 교정에서는 명시적 방식이 주로 활용되고[6],[7], 자동 교정이나 인라인 보완에서는 암묵적 방식을 주로 활용하는 것으로 나타난다[6]. 재생성이나 다중 초안 기능은 명시적 컨펌의 성격을 지니면서도, 복수 대안을 순차 제공한다는 점에서 제안형 컨펌의 변형으로 해석된다[8]-[11]. 그러나 핵심 워크플로에서는 명시적 컨펌이 우세하며, 암묵적 컨펌과 제안형 컨펌은 특정 기능에 한정되어 사용자의 다양한 행동 맥락을 충분히 반영하지 못한다는 문제로 이어진다.
자동화 신뢰 이론은 적정 신뢰가 사용자 만족과 기술 수용의 핵심임을 강조했고[3], 자동화-인간 상호작용 이론 역시 자동화 수준에 따른 인지적 부담과 통제감에 영향을 준다고 보았다[12]. HAI 분야에서는 즉시성, 제어가능성과 같은 인터페이스 요인이 사용자 경험에 미치는 영향을 실증했다[5]. 다만 이런 논의들은 대부분 군사, 항공, 자율주행 등의 특수 도메인 중심으로 축적되어 사무나 지식노동 환경에서 생성형 AI 맥락을 입체적으로 설명하기에 한계가 있다. 또한 기존 연구는 개별 컨펌 방식의 효과를 제한된 맥락에서 분절적으로 분석하였기 때문에 과업 및 행동 맥락 등을 반영한 상호작용 설계로 일반화하기에는 한계가 있다.
따라서 본 연구에서는 이를 보완하기 위해서 사용자 행동 수준의 단계를 최종 의도와 목표를 설정하는 수준의 전략적 판단(Goal Level), 목표 달성을 위한 구체적 기능이나 절차를 수행하는 수준의 중간 과업(Task Level), 단일 행위나 반응을 실행하는 수준의 단순 조작(Action Level)으로 정의하였다. 이러한 구분은 기존 선행연구 이론인 활동이론[13], 목표–실행–평가 모델[14], 지각–인지–실행 구조[15], 자동·의지적 제어[16], 과업–기술 적합성[17] 등을 근거로 재구성하였다. 각 이론은 목표-행동 간 인지 요구, 통제와 자동화의 균형, 과업-기술 적합성에 따른 기술 몰입과 수용 강화 등 측면에서 교차구조 분석의 근거를 제공하며, 이를 통해 실제 생산성 도구 환경에 적합한 상호작용 설계의 조건을 구체화할 수 있다고 판단하였다.
본 연구의 목적은 생성형 AI 생산성 도구 맥락에서 사용자 행동 수준별(Goal, Task, Action) 컨펌 방식이 사용자 경험(신뢰, 통제감, 인지부하)과, 사용자 경험이 기술 수용(지각된 사용 용이성, 지각된 유용성, 만족도, 사용 의도)에 미치는 영향 관계를 탐색하는 데 있다.
특히 행동 수준별로 적합한 컨펌 방식이 무엇인지 파악함으로써, 비효율적인 반복 확인 방식과 전략적 자동 실행의 신뢰도 저하 등 실제 업무 환경에서 발생하는 문제들을 최소화하고, 설계 및 도입 단계에서부터 활용할 수 있는 실질적인 근거 또한 마련하고자 하였다.
Leontiev은 인간 활동을 활동–과업–조작으로 구분하며, 각 수준은 목표 지향성과 인지 개입 정도에 따라 계층적으로 구분된다고 보았다[13]. Norman은 인간–컴퓨터 상호작용을 목표 설정–실행–평가로 설명하고, 실행–평가 간 간극을 줄이는 피드백 설계의 중요성을 강조하였다[14]. Card et al.은 지각–인지–실행의 정보처리 구조에서 과업 수준별 인지부하 차이를 제시하였고[15], Norman & Shallice는 자동·의지적 제어의 대비를 통해 상호작용 요구가 과업 난이도와 익숙함에 따라 달라진다고 보았다[16].
이러한 이론은 목표–행동 간 인지 요구, 통제와 자동화의 균형, 과업–기술 상호작용 측면에서 본 연구의 사용자 행동 수준 구분(Goal, Task, Action)에 이론적 근거를 제공한다.
피드백은 시스템이 사용자 행위의 결과를 전달하거나, 사용자가 시스템을 평가하는 상호작용으로, Norman은 피드백의 즉시성과 명확성이 상호작용 간극 해소의 핵심이라 하였고[14], Shneiderman은 지속적인 통제감 유지가 신뢰와 수용의 조건이라 보았다[18]. Lee & See는 적절한 피드백이 자동화 신뢰의 전제임을 강조했고[3], Parasuraman et al.은 피드백 조정이 오류율과 인지부하에 영향을 미친다고 보았다[12]. Amershi et al.은 즉시성, 제어 가능성, 대안 제시 등의 피드백 설계 요인이 사용자 경험에 실질적 영향을 미친다고 밝혔다[5].
본 연구는 피드백의 하위 개념으로, 컨펌을 AI가 생성한 결과에 대해 사용자가 승인·거부·선택하는 상호작용으로 정의한다. 이는 실행 이전의 승인 절차를 포함하는 명시적 컨펌, 별도의 승인 절차 없이 자동으로 실행되는 암묵적 컨펌, 실행 전 복수의 대안을 제시하고, 사용자 선택에 따라 실행하는 제안형 컨펌으로 구분된다[3]-[5],[12].
앞선 이론을 종합해보면 행동 수준과 컨펌 방식 간의 정합성은 사용자 경험과 기술 수용에 영향을 미치는 중요한 설계 조건임을 알 수 있다. 과업의 인지적 맥락에 따라 요구되는 개입과 승인 절차가 달라지므로, 이에 부합하는 상호작용 전략과 컨펌 방식을 선택해야 한다.
Goal 및 Task 수준은 전략적 판단과 책임 있는 의사결정 혹은 대안 탐색과 선택이 중심이 되는 단계로, 사용자 주도적 개입과 명확한 정보 제공이 중요하게 작용한다. 이때는 명시적 컨펌이나 제안형 컨펌과 같은 구조가 적합할 수 있다[3]–[5].
Action 수준은 반복적이고 자동화 가능한 작업이 주를 이루며, 인지 개입이 낮은 경향이 있다. 이때는 지속적인 명시적 확인이 오히려 인지부하를 가중시키고 작업 흐름을 방해할 수 있어, 암묵적 컨펌이 효과적일 수 있다[12]. 다만 자동 실행이 사용자의 기대나 의도와 어긋날 경우 통제감 저하나 혼란을 유발할 수 있으므로[3],[5], 최소한의 선택권을 보장하는 간단한 명시적 컨펌이 적합할 수 있다.
이와 같은 정합성의 개념은 Goodhue & Thompson이 제시한 과업–기술 적합성(Task–Technology Fit, TTF) 이론과도 연결된다. 해당 이론은 과업의 성격에 적합한 기술 제공이 사용자의 성과와 수용도에 긍정적 영향을 미친다고 강조하며[17], 컨펌 방식 또한 행동 수준의 요구와 기능적 특성이 부합할 때 사용자 경험과 수용 가능성을 높일 수 있다.
본 연구에서 사용자 경험은 신뢰(Trust), 통제감(Perceived Control), 인지부하(Cognitive Load)로 구성된다. 신뢰는 AI 결과에 대한 수용 여부를 결정하는 요인이고[4], 통제감은 상호작용에서의 주도성과 예측 가능성을 의미한다[18]. 인지부하는 과업 수행 시 필요한 정신적 자원을 나타내며, 불필요한 승인이나 불투명한 자동화는 이를 증가시킨다[12].
이러한 사용자 경험 요인은 기술 수용 모델(Technology Acceptance Model, TAM)과 그 확장 모델들[19]–[21]에서 지각된 사용 용이성(Perceived Ease of Use), 지각된 유용성(Perceived Usefulness), 만족도(Satisfaction), 사용 의도(Behavior Intention)로 이어지는 경로를 매개한다. 신뢰 저하는 유용성과 사용 의도를 약화시키고, 낮은 통제감은 만족도 저하로, 낮은 인지부하는 사용 용이성 인식과 수용 의도 증대로 이어진다.
앞선 이론적 고찰과 논의를 종합하면, 행동 수준(Goal, Task, Action)에 따른 컨펌 방식(명시적, 암묵적, 제안형)은 사용자 경험(신뢰, 통제감, 인지부하)에 영향을 미치고, 이러한 영향이 기술 수용(지각된 사용 용이성, 지각된 유용성, 만족도, 사용 의도)으로 연쇄적으로 파급될 수 있다. 이는 컨펌 방식-사용자 경험-기술 수용의 연쇄 매개 경로와 행동 수준별 정합 탐색을 위한 연구모형과 가설 설정으로 이어진다.
앞서 선행연구[3]-[5],[12]와 실제 생성형 AI 생산성 도구를 바탕으로, AI 도구가 결과를 사용자에게 제공하고 실행하는 방식을 다음 세 가지로 구분한다.
Leontiev의 활동 이론[13], Norman의 목표–실행–평가의 HCI 모델[14], Card의 인지모델[15], Norman&Shallice의 주의 통제 이론[16], 그리고 Goodhue&Thompson의 과업–기술 정합성 이론[17]에 기반하여, 사용자의 행동을 다음 세 수준으로 조작화하였다.
본 연구는 잠재변수 기반 구조방정식모형(Structural Equation Modeling, SEM)을 통해 독립변수인 AI 컨펌 방식(명시적, 암묵적, 제안형)이 매개변수인 사용자 경험(신뢰, 통제감, 인지부하)에 미치는 효과와, 사용자 경험이 종속변수인 기술 수용(지각된 사용 용이성, 지각된 유용성, 만족도, 사용 의도)으로 이어지는 연쇄 경로를 검증한다. 또한 조절변수인 사용자 행동 수준(Goal, Task, Action)에 따라 컨펌 방식과 사용자 경험 간 관계의 강도가 달라지는지, 더 나아가 사용자 경험이 기술 수용으로 이어지는 간접효과가 달라지는지 검토한다. 이에 연구모형은 다음의 경로와 효과를 포함하며, 도식은 그림 1에 제시한다.
이어질 내용은 연구모형에 대응하여 연구 질문과 가설을 다음 네 가지 범주로 제시하였다.
본 연구의 참여자 모집, 실험 및 설문 자료 수집은 2025년 9월 15부터 18일까지 온라인 리서치 패널에서 수행하였다. 패널 데이터베이스의 만 19세 이상 성인 가운데 최근 생성형 AI 생산성 도구 사용 경험이 있는 사람을 선별하여 모집하였다. 연구는 IRB 승인(KMU-202506-HR-486) 하에 전자 동의를 받아 진행되었으며, 참여자에게 소정의 적립금을 제공하였다. 무응답, 불성실 응답 등 제외 기준에 해당하는 사례는 확인되지 않아 210부 전수를 분석에 활용하였고, 응답 자료는 익명화하여 저장·분석하였다.
참여자는 온라인 리서치 패널을 통해 모집한 성인 210명으로, 생성형 AI 기반 생산성 도구 사용 경험이 있는 20대부터 40대의 대학(원)생과 직장인으로 한정하여 업무 맥락의 과업 몰입과 외적 타당성을 확보하였다[22].
표집은 성별, 연령, AI 친숙도를 층화 기준으로 설정한 뒤 행동 수준 세 집단(Goal, Task, Action)에 교차 균등 무작위 배정하여 독립 변인과 외생 요인 간 불균형을 최소화하였다. 성별과 AI 친숙도는 각 집단에서 남성과 여성, 고활용과 저활용의 인원이 동일하도록 배정하였다. 연령대는 20대, 30대, 40대를 동일 비율로 목표하되 패널 가용성에 따라 집단별 각 연령대의 편차를 최대 두 명까지 허용하였다. AI 친숙도는 잠재적 교란 요인으로 간주하여 반복 노출의 누적 효과를 반영하고, 자기보고 편향을 줄이기 위해 사용 빈도 기준으로 조작화하였으며, 주 3회 이상 생성형 AI 도구 사용을 고활용, 주 2회 이하 사용을 저활용으로 정의하였다[23]. 인구통계 구성은 표 1에 제시하였다.
| Demographic Categories | Item | Frequency | % |
|---|---|---|---|
| Sex | Male | 105 | 50.0% |
| Female | 105 | 50.0% | |
| Age | Aged Between 20–29 | 70 | 33.3% |
| Aged Between 30–39 | 70 | 33.3% | |
| Aged Between 40–49 | 70 | 33.3% | |
| AI Familiarity (Based on Frequency of Use) |
High (More than 3 times a week) |
105 | 50.0% |
| Low (Less than 2 times a week) |
105 | 50.0% | |
| Total | 210 | 100% | |
본 연구는 3(사용자 행동 수준) × 3(AI 컨펌 방식)의 혼합설계를 사용하였다. 사용자 행동 수준은 피험자 간 요인으로 전략적 판단(Goal), 중간 과업(Task), 단순 조작(Action)의 세 집단으로 구성하고, AI 컨펌 방식은 피험자 내 요인으로 명시적, 암묵적, 제안형의 세 조건을 모든 참여자가 경험하도록 하였다. 참여자는 무작위로 행동 수준 집단에 배정되었으며, 컨펌 방식의 제시 순서는 무작위화하여 순서 효과를 통제하였다.
실험 과업은 제품 AS 문의 이메일 작성 및 편집을 기반으로 한 시나리오형 인터랙티브 프로토타입으로 구현하였다. 과업 맥락은 일상적으로 접할 수 있는 ‘제품 고장 AS 문의’ 상황으로 설정하여 과업 몰입을 높이고, 연구 결과의 외적 타당성을 강화하였다. 각 행동 수준은 Hayes와 Flower(1980)의 계획–작성–검토 쓰기 과정 모형[24]과 Flower 등(1986)의 전략적 수정–문단 및 문장 수준 편집–표면 오류 교정 구분[25]을 근거로 재구성하였다. 이에 따라 전략적 판단 수준은 ‘이메일 목적 및 전략 최적화’, 중간 과업 수준은 ‘어투·어조 수정’, 단순 조작 수준은 ‘맞춤법·띄어쓰기 교정’에 대응되도록 설계하였다. 이러한 구성은 글쓰기 행위의 인지적 층위와 본 연구의 행동 수준 분류 간 대응을 뒷받침하며, 요약은 표 2에 제시하였다.
| User Behavior Level | Hayes & Flower (1980) Cognitive Model[24] | Flower et al. (1986) Revision Level[25] | Experimental Task |
|---|---|---|---|
| Goal | Planning | Goal Revision | Optimizing the email’s communicative goal |
| Task | Translating | Local Revision | Adjusting tone and style |
| Action | Reviewing/Revision | Surface-level Revision | Correcting spelling and spacing |
AI 컨펌 방식은 Google Gemini, Workspace, Gmail Smart Compose, Microsoft Copilot, ChatGPT 등 실제 AI 기반 생산성 도구를 참조하여 구현하였다. 실행 전 사용자 승인(명시적), 별도 확인 없는 자동 반영(암묵적), 복수 대안 제시 후 사용자 선택(제안형)의 세 방식으로 구성하였으며, 제안 제시 방식, 상호작용 흐름, 인터페이스 패턴을 반영해 실제 사용 경험과의 유사성을 확보하였다.
최종 실험 조건은 행동 수준과 컨펌 방식의 교차로 도출된 아홉 개 조합이며, 조건별 과업 맥락과 사용자–AI 상호작용 흐름은 표 3에 요약하였다. 내용 타당성과 현실성은 HCI/UX 전문가 사전 검토로 점검하였다. 참여자에게는 컨펌 방식의 명칭을 제시하지 않고 무작위 순서로 조건을 경험하게 하였으며, 연구자는 사후 코딩으로만 조건을 식별하도록 하여 라벨 인지에 따른 평가 편향을 최소화하였다.
| Behavior Level × Confirmation Mode | Task Rationale | Scenario & User–AI Interaction |
|---|---|---|
| Goal x Explicit | Optimize the email’s communicative goal and strategy (revise the draft to align with the service-request objective and intended outcome). | AI presents a single revision; changes are applied only when the user approves / rejects. |
| Goal x Implicit | AI auto-applies the revision; the user reviews it after application. | |
| Goal x Suggestive | AI presents three alternative revisions; the user chooses one to apply. | |
| Task x Explicit | Adjust tone and style (refine politeness and clarity while strengthening assertiveness where appropriate). | AI presents a single revision; applied only upon user approval/rejection. |
| Task x Implicit | AI auto-applies the revision; the user reviews it after application. | |
| Task x Suggestive | AI presents three alternatives; the user selects one to apply. | |
| Action x Explicit | Correct surface-level errors (spelling and spacing; apply consistent orthographic conventions). | AI presents step-by-step corrections; applied only upon user approval/rejection. |
| Action x Implicit | AI auto-corrects and applies; the user reviews it after application. | |
| Action x Suggestive | AI highlights errors and proposes fixes; applied only upon user approval/rejection. |
실험 및 자료 수집은 그림 2와 같이 피그마(Figma) 프로토타입 실행 링크와 리서치 패널 설문 플랫폼으로 구성된 온라인 환경에서 진행되었으며, 기관 연구윤리위원회 승인을 받은 후 수행하였다. 모든 참여자는 연구 목적과 절차에 대한 안내를 받고 동의한 뒤 실험에 참여하였다. 참여자는 무작위로 행동 수준 집단(Goal, Task, Action)에 배정되어, 시나리오형 인터랙티브 프로토타입을 통해 각자 세 가지 컨펌 방식(명시적, 암묵적, 제안형)을 모두 경험하였다. 전체 절차와 소요 시간은 다음과 같다.
*Both the experimental prototypes and the online survey platform were designed and implemented in Korean.
총 소요 시간은 약 25~30분이었으며, 실험 종료 후 리서치 패널을 통해 소정의 보상을 제공하였다.
측정 도구와 항목은 선행연구에서 검증된 척도를 바탕으로 모든 변수를 1점= ‘전혀 그렇지 않다’부터 7점=‘매우 그렇다’까지의 7점 리커트로 측정하였다. 사용자 경험은 신뢰, 통제감, 인지부하[3]-[5],[12],[26]로, 기술 수용도는 지각된 사용 용이성과 지각된 유용성, 만족도와 사용 의도[19]–[21]로 구성하였다. 인지부하는 긍정 문항으로 측정되어 점수가 높을수록 부하가 낮음을 의미하며, 원척도를 유지하였다. 번역–역번역과 전문가 검토, 예비조사를 통해 언어적 타당성과 내용 타당성을 점검하였다. 신뢰도와 타당성 평가는 표준 절차에 따라 신뢰도는 내적 일관성으로, 타당성은 확인적 요인분석을 포함한 수렴 타당도와 판별 타당도 검토로 확인하였고, 다집단 분석에 앞서 측정 불변성도 점검하였다. 탐색적 분석을 위해 선호도 문항을 추가하여, 가장 선호하는 컨펌 방식과 가장 선호하지 않는 컨펌 방식을 선택하게 하고 이유를 서술하도록 하였다. 선호 분포는 행동 수준과 교차 분석하고, 서술 응답은 내용 분석을 통해 범주화하여 정합성 해석을 보완하였다. 측정 문항 전문과 항목–구성 매핑표는 표 4에 제시한다.
| Variable (Measurement Tool) |
Item |
|---|---|
| Trust [3],[4] |
I could trust this AI to operate accurately. |
| I felt confident in this AI’s judgments. | |
| I do not believe this AI would deliberately provide incorrect results. | |
| Perceived Control [5],[12] |
I felt that I was leading the workflow. |
| Despite the AI’s involvement, my final judgment was reflected. | |
| I was able to proceed with the task in the way I wanted. | |
| Cognitive Load [26],[12] |
I could carry out this task without undue effort. |
| I could understand the AI’s responses without excessive concentration. | |
| Reviewing and evaluating the AI’s responses was manageable without difficulty. | |
| Perceived Ease of Use [19],[20] |
This AI was easy to use. |
| Operating this AI was not complicated. | |
| I could use it naturally without prior training. | |
| Perceived Usefulness [19],[20] |
This AI increased my work efficiency. |
| This AI helped me achieve my goal. | |
| Overall, this AI felt like a useful tool. | |
| Satisfaction [21] |
Interacting with this AI was satisfying. |
| Using this AI was an enjoyable experience. | |
| Overall, I formed a positive impression of this AI. | |
| Behavioral Intention [19],[20] |
I intend to use similar AI systems in the future. |
| If such an AI is available, I would like to use it. | |
| I would apply this AI to my actual work. | |
| Most/Least Preferred AI Confirmation Mode & Reason | Among the three AI versions you experienced, please select the one you prefer the most. |
| Please describe in your own words why you prefer this option. | |
| Among the three AI versions you experienced, please select the one you prefer the least. | |
| Please describe in your own words why you do not prefer this option. |
본 연구에서 수집된 데이터는 다음과 같은 분석 절차를 통해 진행하였다. 기술통계와 혼합분산분석은 SPSS로 실시하였다. 확인적 요인분석과 구조방정식모형, HTMT, 부트스트랩 간접효과, 다집단 경로 동치 비교(ΔCFI, ΔRMSEA)는 R의 lavaan과 semTools로 주로 수행하였고, AMOS는 동일 모형의 재추정에 한해 보조적으로 사용하여 결과를 교차 검증하였다.
분석 절차는 다음과 같다.
(1) 측정모형 점검: 사용자 경험(MedV: 신뢰, 통제감, 인지부하)과 기술 수용(DV: 지각된 사용 용이성, 지각된 유용성, 만족도, 사용 의도)으로 구성된 7개 잠재변수의 내적 일관성을 확인하고, 확인적 요인분석으로 적합도를 평가하였다. 수렴 타당도는 요인적재치·구성 신뢰도(CR)·평균분산추출(AVE)로, 판별 타당도는 Fornell–Larcker 기준과 HTMT로 검토하였다. 필요 시 행동 수준 간 측정 불변성을 구성 단계–측정치 단계–절편 단계 순으로 점검하였으며, 판단 기준은 ΔCFI≤.010, ΔRMSEA≤.015를 사용하였다.
(2) 혼합분산분석: 3(행동 수준: Goal, Task, Action; 피험자 간)×3(컨펌 방식: 명시적, 암묵적, 제안형; 피험자 내) 혼합설계를 적용하여 컨펌 방식(IV)의 사용자 경험(MedV)에 대한 피험자 내 주효과(주변효과)를 검토하였다. 기술 수용(DV)의 평균 차이는 요약 표로 보조 보고하고, 해석은 구조모형 결과와 결합하였다. 구형성은 Mauchly 검정으로 확인하고, 위반 시 Greenhouse–Geisser 보정을 적용하였다. 사후비교는 보정된 유의수준을 사용하고, 효과크기는 ηp2로 보고하였다. 행동 수준별 차이는 상호작용 및 단순효과 요약 표에서 제시하며, 비유의 항목은 문장 보고로 최소화하였다.
(3) 구조방정식모형(SEM): 컨펌 방식(IV)이 사용자 경험(MedV)을 매개로 기술 수용(DV)으로 이어지는 연쇄 경로를 최대우도법(ML)으로 추정하였다. 간접효과의 유의성은 부트스트랩(BCa 95%, 5,000회)으로 평가하였다. 본 데이터는 결측치가 없어 별도 결측 처리는 적용하지 않았다.
(4) 다집단 분석(조절 및 조절된 매개효과): 행동 수준 간 경로 강도 차이는 자유모형과 경로 동치 제약모형의 전역 적합도 비교로 평가하였다. 전역 판단 기준은 ΔCFI ≤ .010, ΔRMSEA ≤ .015로 설정하였다. 조절된 매개효과는 집단별 간접효과를 부트스트랩(5,000회, BCa 95% 신뢰구간)으로 추정한 뒤, 집단 간 간접효과 차이(ΔIE)의 신뢰구간이 0을 포함하지 않을 때 유의한 것으로 판정하였다.
(5) 정합성 평가: 정합성은 구조적 지표와 선호 기반의 두 축으로 점검하였다. 구조 정합은 다집단 SEM의 전역 적합지수와 경로 동치 여부를 검토하여 요약하였고, 선호 정합은 행동 수준별 컨펌 방식의 최선호 및 비선호 분포의 편중을 교차표, 카이제곱 검정, Cramér’s V로 보고하였다.
(6) 정성 보완: 선호 및 비선호 사유의 자유응답을 내용 분석으로 코딩하였다. 예비 코딩을 통해 코드북을 정제한 후 본 코딩을 실시하였고, 코더 간 일치도는 코언의 카파(κ; Cohen’s kappa)로 확인하였다.
(7) 강건성 점검 및 공변량 통제: 성별, 연령, AI 친숙도를 공변량으로 포함한 대안 사양을 검토하고, 추정법 교차(WLSMV: weighted least squares mean and variance adjusted 등), 대안 경로 사양 비교, 다집단 경로 동치 재검증을 통해 핵심 경로의 부호, 유의성, 간접효과 판정이 불변함을 확인하였다.
수집 자료는 결측치가 없는 완전응답(n=210) 전수로 분석하였다. 조건 제시는 무작위로 배정되었으며, 이에 따른 순서효과 검정에서 유의한 차이는 나타나지 않았다. 전체 절차 준수율은 양호하였고, 이상치 검토 결과 분석에 영향을 미칠 사례는 확인되지 않았다. 또한 강건성 점검에서도 결론의 변화는 없었다. 인구통계 분포는 Ⅳ. 연구 방법 4-1의 표 1을 참조한다.
분석 결과 보고는 해석의 명료성과 지면 효율을 위해 다음을 주분석으로 한정한다.
표 5에서 확인할 수 있듯이 신뢰, 통제감, 인지부하, 지각된 사용 용이성, 지각된 유용성, 만족도, 사용 의도로 구성된 측정모형의 내적 일관성은 모든 조건(명시적, 암묵적, 제안형)에서 Cronbach’s α=.84–.95 범위로 양호–매우 우수한 수준이었다. 항목과 총점 간 상관은 .55–.90 범위로 확인되어 문항 제거에 따른 추가 개선은 필요하지 않았다.
| Variable | Number of items | Factor loading | Cronbach’s α | CR | AVE |
|---|---|---|---|---|---|
| TRUST | 3 | 0.63–0.95 | 0.840–0.862 | 0.857–0.872 | 0.668–0.697 |
| CTRL | 3 | 0.833–0.877 | 0.830–0.871 | 0.621–0.694 | |
| CL | 3 | 0.910–0.921 | 0.909–0.921 | 0.769–0.795 | |
| PEOU | 3 | 0.898–0.914 | 0.899–0.916 | 0.748–0.783 | |
| PU | 3 | 0.898–0.915 | 0.896–0.914 | 0.742–0.780 | |
| SAT | 3 | 0.885–0.933 | 0.886–0.932 | 0.721–0.820 | |
| BI | 3 | 0.926–0.939 | 0.929–0.940 | 0.813–0.839 |
확인적 요인분석에서 모형 적합도는 CFI=.956–.966, TLI=.944–.958, RMSEA=.064–.075, SRMR=.034–.038 범위로 권장 기준을 충족하였고, 표준화 적재치는 .63–.95 범위에서 모두 유의하였다. 수렴 타당도는 모든 구성에서 구성 신뢰도(CR)와 평균분산추출(AVE) 기준을 충족하였다.
판별 타당도의 경우 지각된 유용성–만족도–사용 의도 축에서 Fornell–Larcker와 HTMT 기준의 경계 또는 초과 사례가 관찰되었다. 이는 지각된 사용 용이성에서 지각된 유용성, 만족도, 사용 의도로 이어지는 TAM 연쇄 구조와 공유 상류요인에 따른 구조적 공변으로 해석된다. 세 구성은 기능, 역할, 지표가 상이하므로 구분을 유지하였다. 한편 통제감–인지부하는 과업 특성상 통제감 상승과 인지부하 감소가 동반되어 상관이 커지지만, ϕ=1 제약검정에서 동일구인 가설이 기각되어 별개 요인으로 유지하였다. 경계 및 위배 쌍은 표 6에 요약하였다.
| Pair | ϕ | min √AVE |
HTMT | Decision | Rationale |
|---|---|---|---|---|---|
| PU–SAT | 0.874–0.931 | 0.849–0.883 | 0.879–0.934 | Explicit and Suggestive: not satisfied; Implicit: boundary | High cohesion arises from the TAM chain and shared covariance; however, functions and indicators differ, so the factors are retained as distinct. |
| PU–BI | 0.878–0.924 | 0.861–0.883 | 0.883–0.927 | FL boundary to not satisfied; HTMT boundary to not satisfied | |
| SAT–BI | 0.931–0.966 | 0.849–0.906 | 0.933–0.959 | FL/HTMT not satisfied | |
| CTRL–CL | 0.856–0.882 | 0.788–0.833 | 0.817–0.870 | FL not satisfied; HTMT satisfied to boundary | Co-occurrence of higher control with lower load; ϕ=1 rejected (Explicit ΔSB-χ2=13.119, p<.001; Suggestive ΔSB-χ2=14.825, p<.001); retained as separate factors. |
혼합분산분석 결과, 컨펌 방식의 사용자 경험(MedV: 신뢰, 통제감, 인지부하)에 대한 피험자 내 주효과가 모두 유의하여 H1a–c 가설은 모두 지지로 판정되었다: 신뢰 F(2, 207)=17.56, p<.001, ηp2=.078; 통제감 F(2, 207)=25.32, p<.001, ηp2=.109; 인지부하 F(2, 207)=9.81, p<.001, ηp2=.045.
기술 수용(DV)의 평균 차는 보조로 표에 제시하고 해석은 그림 3의 구조방정식모형 결과와 결합하였다. 기술 수용(DV)에서는 지각된 사용 용이성을 제외한 지각된 유용성, 만족도, 사용 의도가 유의하였다: 지각된 사용 용이성 F(2, 207)=0.14, p=.867, ηp2=.001; 지각된 유용성 F(2, 207)=6.11, p=.002, ηp2=.029; 만족도 F(2, 207)=10.57, p<.001, ηp2=.049; 사용 의도 F(2, 207)=8.35, p<.001, ηp2=.039.
또한 표 7의 컨펌 방식별 사용자 경험(MedV) 주변평균을 기준으로 보면, 명시적·제안형 컨펌에서 신뢰, 통제감, 인지부하(점수↑=부하↓) 평균이 암묵적 컨펌보다 전반적으로 높게 나타났다.
| Variable | Explicit M (SD) |
Implicit M (SD) |
Suggestive M (SD) |
Main Effect (F(2,207), p, ηp2P) |
|---|---|---|---|---|
| TRUST | 5.141 (0.124) | 4.897 (0.146) | 5.181 (0.095) | F = 17.56, p < .001, ηp2 = .078 |
| CTRL | 5.236 (0.121) | 4.849 (0.101) | 5.309 (0.095) | F = 25.32, p < .001, ηp2 = .109 |
| CL | 5.448 (0.083) | 5.216 (0.126) | 5.440 (0.050) | F = 9.81, p < .001, ηp2 = .045 |
| PEOU | 5.568 (0.109) | 5.541 (0.124) | 5.549 (0.053) | F = 0.14, p = .867, ηp2 = .001 |
| PU | 5.576 (0.090) | 5.390 (0.121) | 5.573 (0.123) | F = 6.11, p = .002, ηp2 = .029 |
| SAT | 5.392 (0.151) | 5.130 (0.182) | 5.387 (0.069) | F = 10.57, p < .001, ηp2 = .049 |
| BI | 5.502 (0.140) | 5.233 (0.153) | 5.438 (0.167) | F = 8.35, p < .001, ηp2 = .039 |
구조모형 추정 결과, 전반적 적합도는 CFI=.926, RMSEA=.066, SRMR=.097로, H2a–H2h, H2k 핵심 경로가 전반적으로 지지되었다. 통제감은 신뢰와 인지부하에 유의하게 작용했고, 인지부하에서 지각된 사용 용이성으로, 지각된 사용 용이성에서 지각된 유용성으로의 연쇄가 유의하였다. 이어서 지각된 유용성은 만족도와 사용 의도에, 만족도는 사용 의도에 정적으로 유의하였다. 부트스트랩 검정에서 통제감의 직렬 간접효과(통제감 → 인지부하 → 지각된 사용 용이성 → 지각된 유용성 → 만족도·사용 의도; 통제감 → 신뢰 → 지각된 유용성 → 만족도·사용 의도)는 95% BCa CI 기준 유의하였다. 요약 추정치는 표 8과 표 9에 제시하였다.
| Paths | β | p | 95% BCa CI | Decision | |
|---|---|---|---|---|---|
| H2a | CTRL→TRUST | 0.701 | <.001*** | 0.550, 0.703 | Supported |
| H2b | CTRL→CL | 0.763 | <.001*** | 0.648, 0.786 | Supported |
| H2c | CL→PEOU | 0.707 | <.001*** | 0.600, 0.770 | Supported |
| H2d | PEOU→PU | 0.558 | <.001*** | 0.459, 0.651 | Supported |
| H2e | TRUST→PU | 0.406 | <.001*** | 0.304, 0.518 | Supported |
| H2f | PU→SAT | 0.685 | <.001*** | 0.628, 0.803 | Supported |
| H2g | PU→BI | 0.346 | <.001*** | 0.265, 0.503 | Supported |
| H2h | SAT→BI | 0.584 | <.001*** | 0.502, 0.738 | Supported |
| H2k | TRUST→SAT | 0.195 | <.001*** | 0.117, 0.296 | Supported |
| Paths | IE | 95% BCa CI | Std | Decision | |
|---|---|---|---|---|---|
| H2i | CTRL→CL→PEOU→PU→SAT | 0.193 | 0.132, 0.255 | 0.204 | CI-based significant |
| H2i | CTRL→CL→PEOU→PU→BI | 0.104 | 0.067, 0.140 | 0.103 | CI-based significant |
| H2j | CTRL→TRUST→PU→SAT | 0.184 | 0.137, 0.232 | 0.195 | CI-based significant |
| H2j | CTRL→TRUST→PU→BI | 0.099 | 0.052, 0.146 | 0.098 | CI-based significant |
강건성 점검에서 성별, 연령대, AI 친숙도를 공변량으로 포함한 MIMIC 모형과 Baseline(Core) 모형을 비교한 결과, H2 핵심 경로의 부호와 유의성은 유지되었고 표준화 계수 변화는 대부분 0–0.7%로 미미하였다. 다집단 경로 동치 검정에서도 성별, 연령대, AI 친숙도 모두 ΔCFI≤.010, ΔRMSEA≤.015를 만족하여 전역 동등성이 수용되었다.
따라서 사용자 경험(MedV)에서 기술 수용(DV)으로 이어지는 구조 경로는 하위집단 전반에서 구조적으로 동등하며, 보고된 메커니즘은 집단 구성 변화에도 강건하다. 이에 그림 3의 구조방정식모형을 제시한다.
다집단 구조방정식모형을 통해 행동 수준이 첫째, 컨펌 방식과 사용자 경험(MedV) 간 관계의 강도를 조절하는지, 둘째, 사용자 경험을 매개로 기술 수용(DV)에 미치는 간접효과의 크기를 조절하는지를 검증하였다.
전역 조절 검정에서 자유모형은 CFI=.936, TLI=.888, RMSEA=.149, SRMR=.077이었고 경로 동치 제약모형은 CFI=.937, TLI=.907, RMSEA=.136, SRMR=.081로 나타났으며, 두 모형 간 차이는 ΔCFI≈.000, ΔRMSEA=−.013으로 동등성이 수용되었다. 이에 따라 행동 수준 간 평균 경로는 동등하며 H4a는 기각되었다.
조건부 간접효과는 부트스트랩 검정에서 일부 대비만 유의하여 H4b는 부분 지지되었고, 결과는 표 10에 요약하였다. 구체적으로 Task 집단에서는 암묵적 컨펌의 간접효과가 만족도와 사용 의도에서 음의 방향으로 유의하였다. 집단 간 비교에서는 제안형 컨펌의 간접효과가 Action 집단이 Task 집단보다 유의하게 더 크게 나타났다. 이때의 유의성은 동일 컨펌 방식의 두 집단 간 간접효과 크기 차이를 의미하며, 특정 집단 내부에서 컨펌 방식들 간 서열을 지시하지 않는다.
| Group/Contrast – Effect | Est | SE | 95% BCa CI | Std. |
|---|---|---|---|---|
| Task IE_I→SAT | -0.213 | 0.066 | -0.358, -0.100 | -0.099 |
| Task IE_I→BI | -0.216 | 0.066 | -0.361, -0.102 | -0.094 |
| T−A ΔIE_S→SAT | -0.159 | 0.075 | -0.313, -0.020 | -0.074 |
| T−A ΔIE_S→BI | -0.168 | 0.079 | -0.330, -0.023 | -0.076 |
정리하면, 평균적 구조는 행동 수준 간에 동등하였으나 간접경로의 크기에서는 맥락 차가 일부 확인되었다.
행동 수준별 AI 컨펌 방식의 구조적 정합을 포함한 모형의 전역 적합도는 CFI=.731, RMSEA=.305, SRMR=.220으로 권장 기준(CFI≥.90, RMSEA≤.08, SRMR≤.08)을 충족하지 않았으며, 유의한 경로 계수도 검출되지 않았다. 따라서 행동 수준 간 구조적 정합의 차이는 통계적으로 확인되지 않았고, H4a는 기각되었다.
반면 선호 기반 정합에서는 행동 수준별 분포가 유의하게 달랐다. 선호 분포는 표 11과 같이, χ2(4)=17.67, p=.001, V=.205로 나타나 소-중 수준의 연관을 보였다. 구체적으로 Goal과 Task에서는 제안형 컨펌이 각 44.3%, 58.6%로 가장 선호되었고, Action에서는 명시적 컨펌이 48.6%로 가장 선호되었다. 비선호 분포 역시 표 12와 같이, χ2(4)=16.81, p=.002, V=.200으로 유의하였으며, 세 행동 수준 모두에서 암묵적 컨펌 방식이 각 Goal에서 48.6%, Task에서 50.0%, Action에서 50.0%로 로 가장 선호되지 않았다.
| Behavior Level | Explicit n (%) |
Implicit n (%) |
Suggestive n (%) |
Row Total |
|---|---|---|---|---|
| Goal | 25 (35.7%) | 14( 20.0%) | 31 (44.3%) | 70 |
| Task | 14 (20.0%) | 15 (21.4%) | 41 (58.6%) | 70 |
| Action | 34 (48.6%) | 18 (25.7%) | 18 (25.7%) | 70 |
| Column Total | 73 | 47 | 90 | 210 |
| Behavior Level | Explicit n(%) |
Implicit n(%) |
Suggestive n(%) |
Row Total |
|---|---|---|---|---|
| Goal | 14 (20.0%) | 34 (48.6%) | 22 (31.4%) | 70 |
| Task | 27 (38.6%) | 35 (50.0%) | 8 (11.4%) | 70 |
| Action | 11 (15.7%) | 35 (50.0%) | 24 (34.3%) | 70 |
| Column Total | 52 | 104 | 54 | 210 |
선호 기반 정합의 차이는 두 교차분석 모두에서 지지되었고, 효과크기는 V≈.20으로 크지 않으나 이론적 기대와 방향이 일치한다. 이는 행동 수준 맥락에 따라 컨펌 선호 구조가 체계적으로 달라짐을 보여 주며, 컨펌 방식이 사용자 경험을 거쳐 수용 경로로 작동한다는 본 연구의 구조모형을 보완하는 실무적 시사점을 제공한다.
선호 및 비선호 자유응답을 키워드 테마로 코딩해 행동 수준과 교차 분석한 결과는 다음과 같다. Goal에서 제안형 컨펌을 가장 선호한 이유는 ‘선택·주도권’ 40.7%, ‘아이디어·대안’ 7.4%, ‘맥락 적합’ 3.7% 순이었고, Task에서도 동일하게 ‘선택·주도권’ 40.0%, ‘아이디어·대안’ 2.9%, ‘맥락 적합’ 2.9%가 보고되었다. Action에서 명시적 컨펌의 최선호 사유로 ‘효율성’ 24.1%와 ‘선택·주도권’ 13.8%가 핵심으로 나타났으며, ‘맥락 적합’은 보조적으로 관찰되었다. 반면 암묵형은 전반적으로 낮은 출현율을 보였고 ‘효율성’ 등 단편적 이점만 제한적으로 언급되었다.
가장 선호하지 않는 컨펌 방식이 세 행동 수준에서 동일하게 암묵적 컨펌으로 선정된 이유로는 Goal에서 ‘인지부하’ 7.1%, ‘맥락 적합’ 3.6%, ‘선택·주도권’ 3.6%, Task에서 ‘근거·설명 가능성’ 8.3%, ‘아이디어·대안’ 5.6%, ‘선택·주도권’ 5.6%, Action에서 ‘선택·주도권’ 12.5%, ‘맥락 적합’ 7.5%, ‘근거·설명 가능성’ 5.0%가 보고되었다.
해석하면, 제안형에서 빈번히 제시된 ‘선택·주도권’과 ‘아이디어·대안’은 통제감과 신뢰를 높여 지각된 유용성·만족도·사용 의도로 이어지는 경로를 지지한다. Action에서 명시적이 선호된 ‘효율성’과 ‘주도권’은 사용 용이성과 통제감의 향상과 맞물려 수용을 강화하는 것으로 해석된다. 한편 암묵형에 대한 ‘인지부하’, ‘설명 가능성 부족’, ‘주도권 약화’라는 비선호 근거는 사용자 경험의 악화를 시사하며, 이는 표 10에서 확인된 Task 단계의 암묵형 간접효과가 만족도와 사용 의도를 낮추는 결과와 일치한다.
본 연구는 생성형 AI 환경에서 컨펌 방식(명시적, 암묵적, 제안형)이 사용자 경험(신뢰, 통제감, 인지부하)을 거쳐 기술 수용(사용 용이성, 유용성, 만족도, 사용 의도)으로 이어지는 메커니즘을 검증하였다. 분석 결과, 컨펌 방식은 사용자 경험에 유의한 영향을 미쳤으며, 명시적과 제안형의 사용자 경험 수준이 대체로 암묵형보다 높았다. 사용자 경험에서 기술 수용으로 이어지는 연쇄 경로는 전반적으로 지지되었고, 행동 수준 간 평균 구조는 동등했으나 조건부 간접효과에서는 일부 맥락 차가 확인되었다. 구체적으로 중간 과업 단계의 암묵형은 만족도와 사용 의도를 약화하는 방향으로 나타났고, 제안형의 간접효과는 단순 조작 단계가 중간 과업 단계보다 더 크게 나타났다. 구조적 정합 차이는 확인되지 않았으며, 선호 정합에서는 전략적 판단과 중간 과업에서 제안형 선호, 단순 조작에서 명시적 선호, 암묵형 전반 비선호라는 일관된 패턴이 확인되어 Ⅱ장에서 제시한 본 연구의 이론적 기대와 부합하였다.
실무적 시사점은 다음과 같이 정리된다. 첫째, 전략적 판단과 중간 과업에서는 제안형을 기본값으로 두고 대안의 수와 근거 제시, 핵심 차이와 예상 영향의 요약 비교를 제공하여 신뢰와 통제의 경로를 강화할 수 있다[5],[17]. 위험과 책임이 높은 상황에는 경량의 최종 승인 절차를 병행하여 책임성과 통제감을 보강한다[5],[22]. 둘째, 단순 조작에서는 원클릭 승인, 일괄 승인과 되돌리기 같은 간결한 명시적 설계나 자동 적용에 즉시 되돌리기와 변경 하이라이트와 같이 복구 가능한 기능을 적용하면 효율성과 통제감을 동시에 확보할 수 있을 것이다[12],[22]. 셋째, 암묵적은 중간 과업에서 간접효과가 음으로 나타난 점을 고려해 보이지 않는 자동화의 위험을 체계적으로 관리해야 한다. 이는 사전 규칙의 투명화, 자동 적용 범위의 사용자 설정, 변경 내역과 근거의 사후 제공, 즉시 되돌리기 기능을 기본 요건으로 포함하여 보완할 수 있을 것이다[5],[12],[22].
논의의 확장 측면에서, 본 연구가 제시한 행동 수준과 컨펌 방식의 정합성 프레임은 일반 사무와 노동 환경을 넘어 다른 업무 영역으로의 비교와 적용 가능성을 가진다. 기획, 디자인, 아이데이션 등 창의와 탐색 중심 과업에서는 다양한 대안과 이유 제시가 핵심이므로 제안형의 상대적 우위가 유지될 가능성이 높다. 의료, 재무, 법무처럼 규범과 안전이 중시되는 영역에서는 설명가능성과 책임성 확보를 위해 명시적 승인 절차의 비중이 커질 수 있다. 품질 점검이나 데이터 정리와 같이 반복적이고 규칙이 명확한 운영 과업에서는 자동화의 편익이 크므로 복구 가능한 기능을 포함한 설계가 효과적일 수 있으나, 되돌리기와 변경 추적, 감사 가능성 확보가 전제되어야 한다. 다자 협업 과업에서는 개인의 주도권뿐 아니라 팀 간 조율과 승인 권한이 얽히므로 제안형을 기본으로 두고 단계적 명시 승인을 병행하는 구성이 합리적일 수 있다. 이러한 일반화는 과업과 기술의 적합성이 성과와 수용을 좌우한다는 관점과 부합하지만, 본 연구의 평균 구조와 선호 패턴에 근거한 이론적 외삽이므로 도메인별 추가 검증이 요구된다.
본 연구의 한계와 향후 과제는 다음과 같다. 첫째, 과업과 도메인을 제품 AS 이메일로 한정하였으므로 코딩, 데이터 분석, 협업 작성 등 이질적 도메인으로 외삽하려면 재검증이 필요하다. 둘째, 지각된 유용성, 만족도, 사용 의도 간의 높은 결합도로 인해 판별력에 제약이 존재한다. 향후 연구는 고밀도 다중지표와 대체지표를 병행해 구인 간 구분을 한층 정교화할 필요가 있다. 셋째, 선호 기반 정합의 효과크기가 소-중 범위에 머물렀으므로 실제 사용 로그와 선택 실험을 결합해 선호와 행동의 정합을 현장 데이터로 실증하는 작업이 도움이 될 수 있다. 넷째, 보이지 않는 자동화의 설계 매개변수인 설명가능성, 복구 비용, 사용자 설정권을 요인 설계로 분해하고, 도메인, 위험도, 협업 구조를 축으로 한 다집단 분석과 부분 불변성, 혼합모형을 통해 조건부 간접경로의 활성 규칙을 규명하면 도메인별 차이와 공통된 일반적 특성을 반영한 보다 범용적인 가이드라인을 제시할 수 있을 것이다 .
종합하면, 본 연구는 생성형 AI 협업 환경에서 컨펌 방식이 신뢰, 통제감, 인지부하라는 사용자 경험 경로를 통해 기술 수용으로 이어진다는 작동 메커니즘을 실증하였다. 결과적으로 전략적 판단과 중간 과업에서는 제안형 중심의 설계를, 단순 조작에서는 승인 과정이 간결하고 복구 가능한 명시적 설계를 권고하며, 암묵형 적용 시에는 투명성과 복구 가능성을 전제로 한 위험 관리가 필요하다. 이러한 원칙은 신뢰, 통제, 인지부하의 균형을 통해 만족과 사용 의도를 견인하는 설계 지침으로 기능한다.
| 1. | S. Noy and W. Zhang, “Experimental Evidence on the Productivity Effects of Generative Artificial Intelligence,” Science, Vol. 381, pp. 187-192, 2023.![]() |
| 2. | I. H. Sarker, “AI-Based Modeling: Techniques, Applications and Research Issues Towards Automation, Intelligent and Smart Systems,” SN Computer Science, Vol. 3, 158, 2022.![]() |
| 3. | J. D. Lee and K. A. See, “Trust in Automation: Designing for Appropriate Reliance,” Human Factors, Vol. 46, No. 1 pp. 50-80, 2004.![]() |
| 4. | M. T. Dzindolet, S. A. Peterson, R. A. Pomranky, L. G. Pierce, and H. P. Beck, “The Role of Trust in Automation Reliance,” International Journal of Human-Computer Studies, Vol. 58, No. 6, pp. 697-718, 2003.![]() |
| 5. | S. Amershi, D. S. Weld, M. Vorvoreanu, A. Fourney, B. Nushi, P. Collisson, ... and E. Horvitz, “Guidelines for Human–AI Interaction,” in Proceedings of the 2019 CHI Conference on Human Factors in Computing Systems,Glasgow: Scotland, pp. 1-13, 2019.![]() |
| 6. | M. X. Chen, B. N. Lee, G. Bansal, Y. Cao, S. Zhang, J. Lu, ... and Y. Wu, “Gmail Smart Compose: Real-Time Assisted Writing,” in Proceedings of the 25th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, Anchorage: AK, pp. 2287-2295, 2019.![]() |
| 7. | T. N. Fitria, “Grammarly as AI-Powered English Writing Assistant: Students’ Alternative for English Writing,” Metathesis: Journal of English Language Literature and Teaching, Vol. 5, No. 1, pp. 65-78, April 2021.![]() |
| 8. | Microsoft. Microsoft 365 Copilot: Your Copilot for Work [Internet]. Available: https://www.microsoft.com/en-us/microsoft-365/copilot. |
| 9. | Google. Write Email Messages in Gmail [Internet]. Available: https://support.google.com/mail/answer/14199860?hl=en&ref_topic=13457461&sjid=12404233131405533586-NC |
| 10. | OpenAI. ChatGPT Release Notes [Internet]. Available: https://help.openai.com/en/articles/6825453-chatgpt-release-notes. |
| 11. | Anthropic. Introducing Claude [Internet]. Available: https://www.anthropic.com/index/introducing-claude. |
| 12. | R. Parasuraman, T. B. Sheridan, and C. D. Wickens, “A Model for Types and Levels of Human Interaction with Automation,” IEEE Transactions on Systems, Man, and Cybernetics - Part A: Systems and Humans, Vol. 30, No. 3, pp. 286-297, 2000.![]() |
| 13. | A. N. Leontiev, Activity, Consciousness, and Personality, Englewood Cliffs, NJ: Prentice-Hall, 1978. |
| 14. | D. A. Norman, “Cognitive Engineering,” in User Centered System Design, Hillsdale, NJ: Lawrence Erlbaum, pp. 31-61, 1986.![]() |
| 15. | S. K. Card, T. P. Moran, and A. Newell, The Psychology Of Human–Computer Interaction, Boca Raton, FL: CRC Press, 1983. |
| 16. | D. A. Norman and T. Shallice, “Attention to Action: Willed and Automatic Control of Behavior,” in Consciousness and Self-Regulation, Boston, MA: Springer, pp. 1-18, 1986.![]() |
| 17. | D. L. Goodhue and R. L. Thompson, “Task–Technology Fit and Individual Performance,” MIS Quarterly, Vol. 19, No. 2. pp. 213-236, 1995.![]() |
| 18. | B. Shneiderman, “Designing for Fun: How Can We Design User Interfaces to be more Fun?,” Interactions, Vol. 11, No. 5, pp. 48-50, 2004.![]() |
| 19. | F. D. Davis, “Perceived Usefulness, Perceived Ease of Use, and User Acceptance of Information Technology,” MIS Quarterly, Vol. 13, No. 3, pp. 319-340, 1989.![]() |
| 20. | V. Venkatesh and F. D. Davis, “A Theoretical Extension of the Technology Acceptance Model: Four Longitudinal Field Studies,” Management Science, Vol. 46, No. 2, pp. 169-332, 2000.![]() |
| 21. | A. Bhattacherjee, “Understanding Information Systems Continuance: An Expectation-Confirmation Model,” MIS Quarterly, Vol. 25, No. 3, pp. 351-370, 2001.![]() |
| 22. | J. Nielsen, Usability Engineering, Burlington, MA: Morgan Kaufmann, 1993.![]() |
| 23. | W. R. Shadish, T. D. Cook, and D. T. Campbell, Experimental and Quasi-Experimental Designs for Generalized Causal Inference, Boston, MA: Cengage Learning, 2002. |
| 24. | L. Flower and J. R. Hayes, “A Cognitive Process Theory of Writing,” College Composition and Communication, Vol. 32, No. 4, pp. 365-387, 1981.![]() |
| 25. | L. Flower, J. R. Hayes, L. Carey, K. Schriver, and J. Stratman, “Detection, Diagnosis, And The Strategies Of Revision,” College Composition and Communication, Vol. 37, No. 1, pp. 16-55, 1986.![]() |
| 26. | S. G. Hart and L. E. Staveland, “Development of NASA-TLX (Task Load Index): Results of Empirical and Theoretical Research,” Advances in Psychology, Vol. 52, pp. 139-183, 1988.![]() |
저자소개
2017년:국민대학교 시각디자인학과 (심화전공) 학사
2019년~2024년: Tencent Music Entertainment Group, 시니어디자이너
2024년~현 재: 국민대학교 테크노디자인전문대학원 스마트경험디자인학과 석사과정
※관심분야:인간–컴퓨터 상호작용(HCI), 사용자 경험(UX), 사용자 인터페이스(UI), 생성형 AI(Generative AI), 인간–인공지능 상호작용(Human-AI Interaction)
2007년:공학 박사, 고려대학교 산업시스템정보공학과(제품 및 시스템 개발 전공)
2012년:MBA, 알토대학교(IT Biz & Design Management 전공)
1992년~2009년: 삼성전자 VD(사) 개발팀 책임디자이너
2009년~2013년: 삼성전자 DMC(연) UX센터 수석디자이너
2013년~2016년: SK경영경제연구소 UX Rising Star Forum 위원
2013년~2021년: 삼성전자 의료기기(사) 디자인그룹 수석디자이너
2012년~현 재: UXPA Magazine 편집위원(다국어)
2018년~현 재: (사)대한인간공학회 이사, 대한인간공학회, 한국HCI학회, UXPA Korea 종신회원
2022년~현 재: 국민대학교 테크노디자인전문대학원 교수, 국민대학교 테크노디자인연구소 연구위원
※관심분야:고령 사용자 경험 디자인(Aging UX Design), 의료·헬스케어 사용자 경험 디자인(Medical & Healthcare UX Design), 인간공학 설계(Human Factors and Ergonomics Design), 사용자 경험(UX), 공학(Engineeing), 여가 사용자 경험 디자인(Leisure UX Design)