
자율주행 차량 내 사용자 경험 향상을 위한 컨텍스트 인식 기반 멀티모달 인터랙션 프레임워크 개발
Copyright ⓒ 2025 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

초록
본 연구는 자율주행 차량 내 사용자 경험 향상을 위해 사용자 컨텍스트를 인식하고 단계별로 최적화된 멀티모달 인터랙션을 제공하는 프레임워크를 제안한다. 제안한 프레임워크는 자율주행 단계에 따라 사용자 역할을 분류하고, 컨텍스트 인식 엔진을 통해 사용자 상태와 주변 환경을 실시간으로 모니터링하여 맞춤형 피드백을 제공한다. 프레임워크의 검증을 위해 델파이 기법을 활용하였다. 1차 평가에서는 프레임워크의 구조와 구성 요소를 검토하여 주요 개선 사항을 도출하고, 2차 평가에서는 수정된 프레임워크의 적합성을 심층적으로 분석하였다. 평가 결과, 사용자 맞춤형 피드백 설계, 상황 중요도 기반 피드백 제공, 시스템 안정성, 장기적 학습 가능성 측면에서 높은 유효성을 확인하였다. 본 연구는 자율주행 차량 내 사용자 중심의 멀티모달 인터랙션 설계와 최적화된 사용자 경험 제공을 위한 시스템 구축에 기여할 수 있을 것으로 기대한다.
Abstract
This research proposes a framework that recognizes user context and provides stage-optimized multimodal interactions to enhance user experiences in autonomous vehicles. The proposed framework classifies user roles according to the stage of autonomous driving and provides customized feedback by monitoring the user status and surrounding environment in real-time via a context-aware engine. We utilized the Delphi technique to validate the framework. First, we reviewed the structure and components of the framework to identify key improvements. Second, we conducted an in-depth analysis of the suitability of the modified framework. The evaluation results showed high validity in terms of user-customized feedback design, contextual importance-based feedback provision, system stability, and long-term learning potential. This research is expected to contribute to the design of user-centered multimodal interactions in autonomous vehicles and the construction of systems to provide optimized user experiences.
Keywords:
Mobility Experience, Autonomous Vehicle, Multimodal Interaction, Context-Aware, User Role Categorization키워드:
모빌리티 경험, 자율주행 차량, 멀티모달 인터랙션, 컨텍스트 인식 기반, 사용자 역할 분류Ⅰ. 서 론
최근 자율주행 기술이 빠르게 발전하며 인간의 개입 없이 차량이 스스로 주행을 할 수 있는 환경이 점진적으로 구현되고 있다. 국제 자동차 학회(SAE; Society of Autonomous Engineers)의 자율주행 단계에 따르면 Level 0의 비자동화 단계부터 Level 5의 완전 자동화 단계까지 분류할 수 있으며, 단계가 높아질수록 사용자의 개입 없이 시스템만으로 동작할 수 있도록 변화한다[1]. 현재 상용화된 자율주행 시스템은 Level 2.5 정도로 운전자의 개입이 필요한 조건부 자율주행 단계에 머물러 있다. 자율주행 기술이 적용됨에 따라 차량 내부의 사용자 경험 및 인터랙션 방식이 중요해지고 있으며, 단순한 주행을 넘어서 양질의 차량 경험을 제공하는 것이 핵심 과제로 주목받고 있는 추세이다[2]. 특히 차량의 자율주행 단계가 높아질수록 운전자의 개입이 줄어들고 동시에 차량 시스템의 역할이 확대되면서, 운전자는 제어권 전환 및 비상 상황에 대처해야 할 필요가 있다. 그러나 현재의 시스템은 운전자가 주행에 집중하지 않는 상황을 인식하지 못하기 때문에 자율주행 시스템에 대한 신뢰 부족과 불안감을 야기할 수 있다. Lee & See에 따르면, 사용자가 시스템을 신뢰하려면 상황에 맞는 피드백과 일관성 있는 대응이 필수적임을 강조하며, 자율주행 시스템 내에서 적절한 피드백 시스템의 필요성을 제기하였다[3]. 이러한 점에서 볼 때, 차량 시스템은 사용자 상태 및 주변 환경을 실시간으로 인식하고 상황에 따라 적절한 인터랙션 방식을 제공해 사용자가 시스템을 신뢰하고 안전하게 이용할 수 있도록 해야 한다. 그러나 현재의 자율주행 시스템은 자율주행 단계에 따른 사용자 경험의 차별화가 이루어지지 않고 있으며, 컨텍스트 인식 기반의 인터랙션 최적화가 이루어지지 않아 운전자 및 탑승자에게 일관된 피드백과 인터랙션을 제공하지 못하고 있다. 이러한 배경을 바탕으로 멀티모달 인터랙션을 자율주행 시스템에 적용하여 사용자 경험을 개선하기 위한 다양한 연구가 진행되어왔다. Mahr et al.은 자율주행 시스템에서 음성, 제스처, 시선 추적 등 다양한 입력 방식을 결합한 멀티모달 인터랙션을 통해 사용자 경험을 개선하는 방안을 제시하였다[2].이러한 선행 연구들은 자율주행 차량 내에서 양질의 사용자 경험을 제공하고 안전성 강화를 위해 멀티모달 인터랙션 및 컨텍스트 인식 시스템의 중요성을 말하고 있다. 그러나 기존 연구에서는 주로 자율주행 시스템에서 단일 모달리티 기반의 사용자 인터랙션 또는 특정 기술적 구현에 초점을 맞춰왔다. 이에 비해 본 연구는 자율주행 단계별 사용자 역할과 컨텍스트 인식을 기반으로 하는 멀티모달 인터랙션 프레임워크를 설계한 점에서 차별성을 갖는다. 본 연구는 자율주행 단계별로 사용자 상태 및 컨텍스트를 실시간으로 인식하여 사용자 경험을 최적화하는 멀티모달 인터랙션 프레임워크를 제안한다. 차량 내부의 다양한 센서와 사용자 모니터링 데이터를 통합하여 운전자 및 탑승자의 상태와 외부 환경 변화를 지속적으로 파악하여 자율주행 단계에 따른 사용자 역할 변화를 중심으로 적응형 피드백 및 인터랙션을 동적으로 조정하고자 한다.
본 연구에서 제안하는 프레임워크는 운전자 및 탑승자의 컨텍스트 인식과 멀티모달 인터랙션을 통합함으로써 자율주행 시스템의 신뢰성을 강화하고, 사용자에게 일관적이고 몰입된 주행 경험을 제공하고자 한다. 이를 통해 사용자 맞춤형 피드백 제공과 멀티모달 인터랙션 방식의 체계적 설계를 가능하게 하여, 사용자 경험과 시스템 신뢰성을 동시에 향상시키는 데 기여할 것으로 예상된다. 특히 실시간으로 사용자 상태와 외부 환경을 반영하여 피드백을 최적화하고, 멀티모달 인터랙션을 통합함으로써 정교한 사용자 중심의 인터랙션을 제시한다. 외부 환경 변화와 비상 상황에 유연하게 대응할 수 있는 구조적 설계를 통해 자율주행 시스템의 실질적인 활용성을 증대시키고, 사용자 안전과 편의성을 모두 충족할 것으로 기대한다.
본 연구는 다음과 같이 구성된다. 제2장에서는 연구의 기반이 되는 이론적 배경을 다루며, 자율주행 시스템, 컨텍스트 인식, 멀티모달 인터랙션 등의 개념을 정리한다. 제3장에서는 컨텍스트 인식 기반의 적응형 멀티모달 인터랙션 프레임워크를 제안하고, 구조 및 주요 구성 요소를 설명한다. 제4장에서는 전문가 평가를 통한 프레임워크의 검증 과정을 다루며, 델파이 기법을 활용하여 프레임워크의 실용성과 타당성을 평가한 결과를 제시한다. 제5장에서는 연구 결과를 바탕으로 논의 및 시사점을 도출하고, 연구의 한계와 향후 연구 방향을 제안한다. 이를 통해 본 연구가 자율주행 차량 환경에서 사용자 중심의 인터랙션 설계에 기여하는 바를 논의하고자 한다.
Ⅱ. 이론적 배경
2-1 자율주행 시스템
자율주행 시스템은 차량이 인간의 개입 없이 주변 환경을 인식하고 주행할 수 있도록 하는 기술을 말한다. 자율주행 시스템의 목표는 안전하고, 효율적인 주행을 통해 운전자의 편의성 및 이동성을 향상시키는 데 있다. 자율주행은 SAE의 기준에 따라 Level 0에서부터 Level 5까지 차량 주행 기능의 자율성 수준을 바탕으로 6단계로 분류할 수 있다. 각 단계에서 시스템의 자율성에 따라 운전자가 수행하는 역할과 시스템이 제공하는 피드백 및 인터랙션 방식은 달라진다[1]. Level 0은 비자동화 단계로, 운전자가 모든 주행 기능을 수행해야 한다. Level 1은 특정 기능(조향 또는 가속/감속)의 운전자 지원이 가능하며, Level 2에서는 시스템이 특정 조건 하에서 조향과 가속/감속을 동시에 지원하지만, 운전자가 주행 상황을 지속적으로 모니터링해야만 한다. Level 3에서는 특정 조건 하에서 시스템이 주행을 완전히 담당하지만, 필요 시 운전자의 개입이 필요하다. Level 4에서는 제한된 조건에서의 완전자율주행이 가능하며, Level 5는 모든 조건에서 운전자 개입 없이 완전자율주행이 가능한 것을 의미한다.
2-2 컨텍스트 인식 시스템
컨텍스트 인식 시스템은 사용자의 상태와 주변 환경을 실시간으로 모니터링하여 특정 상황에 맞는 최적의 반응을 제공하는 시스템을 말한다. Abowd et al.에 따르면, 컨텍스트 인식(Context-Awareness)은 시스템이 사용자와 주변 환경의 상황을 인식하여 이에 맞게 동작을 조정하는 것을 말한다[4]. 즉 다양한 센서 데이터를 수집하고 처리하여, 사용자의 현재 상태와 주변 환경 정보를 바탕으로 상황을 해석하고 적절한 피드백을 제공한다.
자율주행 차량에서 컨텍스트 인식 시스템은 운전자와 탑승자의 안전 및 신뢰성을 향상시키기 위해 필수적인 요소 중 하나로 자리잡았다. 자율주행 단계가 높아짐에 따라 운전자의 개입이 줄어들게 되며, 차량 내부 시스템은 사용자의 상태를 실시간으로 감지하여 피드백을 제공해야 할 필요성이 강조되고 있다. 특히 운전자가 부분적으로 개입해야 하는 Level 2와 Level 3 단계에서는 운전자가 수동 제어로 전환할 때 주의 분산이 자율주행 시스템의 신뢰성에 직접적인 영향을 미칠 수 있다고 하였으며[5], Choi et al.에 따르면, 사용자의 피로 상태를 실시간으로 감지하여 경고를 제공하는 시스템이 운전자 안전성 향상에 기여한다고 하였다[6]. 이를 통해 자율주행 시스템이 사용자 상태를 실시간으로 감지하고 반응하는 것을 요구함을 시사한다. 컨텍스트 인식 시스템은 사용자 상태 인식, 외부 환경 인식, 실시간 데이터 처리 및 피드백 조정 등의 요소로 구성되며, 각 요소 별 기능은 표 2와 같다.
사용자 상태 인식(Rocognize user state)은 시스템이 운전자의 주의력, 피로도, 스트레스 상태 등을 모니터링하여 현재 상태에 맞는 피드백을 제공하는 것으로, 자율주행 차량이 운전자가 주행에 집중하지 않거나 상태 저하를 판단하여 실시간 경고를 제공하는 것이다. 외부 환경 인식(External environment awareness)은 차량 외부의 도로 상태, 날씨, 교통 상황 등을 인식하여 주행 중 발생할 수 있는 위험요소를 사전에 감지하는 것으로, 자율주행 차량이 주변 환경을 실시간으로 분석하고 이에 맞는 반응을 제공하는 것을 목적으로 한다[7]. 실시간 데이터 처리 및 피드백 조정(Data Processing and Feedback)은 실시간으로 수집된 데이터를 분석하고, 현재 상황에 적합한 피드백을 조정하는 것으로, 자율주행 차량이 사용자 상태에 따라 피드백을 조정함으로써 사용자 신뢰 및 만족도를 높일 수 있음을 보여준다[8]. 자율주행 단계에 따라 컨텍스트 인식 시스템의 역할은 다르게 적용되며, Level 2에서 Level 3까지의 단계에서는 운전자의 상태를 면밀히 모니터링하고, 주의가 분산될 경우에 대비하여 경고하는 시스템이 필요하다. 반면, Level 4와 Level 5에서는 운전자 개입이 최소화되므로 탑승자의 편의 및 몰입 경험을 최적화하는 방향으로 시스템이 작동해야만 한다.
2-3 사용자 인터랙션
자율주행 차량 내에서의 사용자 인터랙션은 차량 및 사용자 간의 소통을 원활하게 하며, 시스템 신뢰성과 안전성을 높이는 데 중요한 역할을 한다. 자율주행 단계가 높아질수록 차량 내부 시스템이 더 많은 제어를 하게 됨으로써 운전자는 기존과는 다른 방식의 인터랙션을 필요로 한다. Koo et al.에 따르면 사용자가 자율주행 차량의 행동 및 의도를 이해할 수 있도록 설명을 제공하는 것이 중요하다고 강조하며, 이는 신뢰 및 이해를 촉진하여 사용자가 차량을 더 안전하게 이용할 수 있다고 말했다[9]. 특히, 상황이 복잡해질수록 사용자 및 시스템 간의 명확한 인터랙션이 요구되며, 이러한 인터랙션 설계는 사용자가 자율주행 시스템에 대해 느끼는 신뢰성과 만족도에 직접적인 영향을 미친다.
멀티모달 인터랙션(Multimodal Interaction)은 여러 가지 입력 방식과 피드백을 결합하여 사용자가 시스템과 인터랙션할 수 있게 하는 기술을 말한다. 사용자는 음성, 제스처, 터치, 시선 추적 등 다양한 모달리티를 통해 시스템과 의사소통할 수 있으며, 이러한 방식들은 사용자 경험을 보다 자연스럽고 효율적으로 제공할 수 있다. 특히 멀티모달 인터랙션은 사용자가 다양한 감각을 통해 시스템과 인터랙션하고 피드백을 받는 통합된 방식으로 볼 수 있다[10]. 멀티모달 인터랙션의 구성 요소는 일반적으로 입력 모달리티, 처리 엔진, 출력 모달리티로 구성할 수 있으며, 표 3과 같다.
입력 모달리티(Input Modality)는 음성 명령, 제스처, 터치 스크린, 시선 추적 등 다양한 방식으로 사용자 의도를 입력하는 모달리티이다. 처리 엔진(Processing engine)은 입력된 데이터를 해석하고, 사용자 의도에 따라 적절한 반응을 생성하는 역할을 한다. 마지막으로 출력 모달리티(Output Modality)는 시스템이 사용자에게 피드백을 제공하는 방식으로 시각 디스플레이, 오디오 사운드 및 음성 피드백, 햅틱 피드백 등이 포함된다[10], [11]. 이러한 구성요소를 바탕으로 고려할 때, 멀티모달 인터랙션은 사용자 편의성과 접근성을 극대화하며 여러 모달리티를 조합하여 사용자 경험을 직관적으로 제공하는 것을 목적으로 한다.
자율주행 차량 환경에서는 운전자 및 탑승자가 시스템과의 인터랙션을 통해 편의성 및 안전성을 높일 수 있도록 다양한 멀티모달 인터랙션이 제공되어야 한다. 특히 컨텍스트에 적합한 입력 방식을 적용하는 것이 중요하다. 예를 들어, 주행 중에는 음성 명령, 시선 추적, 터치 스크린 등을 상황에 따라 적절하게 조합하여 제공하는 것이다. 이러한 내용을 바탕으로 볼 때, 자율주행 차량에서 멀티모달 인터랙션은 사용자 신뢰를 증대시키고, 안전성을 높이며 운전자의 인지적 부담을 줄이는데 기여한다. 이는 자율주행 환경에서 멀티모달 인터페이스가 신뢰감 형성 및 사용자 경험에 긍정적인 영향을 미친다[12]. 이를 바탕으로 정리한 자율주행 차량 내 멀티모달 인터랙션의 적용 예는 아래 표 4와 같다.
이와 같이 멀티모달 인터랙션은 자율주행 차량에서의 사용자 경험을 풍부하게 하며, 안전성 및 편의성을 높이기 위해 필수적인 요소로 자리잡고 있다. 자율주행 차량에서의 멀티모달 인터랙션은 사용자 경험과 안전성 향상에 중요한 역할을 한다. Mehr et al.은 자율주행 차량에서 음성, 제스처, 시선 추적 등 다양한 입력 방식을 결합한 멀티모달 인터랙션은 사용자 경험을 크게 개선할 수 있다고 하였다[2]. Koo et al.은 자율주행 차량의 행동과 의도를 사용자가 이해할 수 있도록 설명을 제공하는 것이 중요하다고 강조했다[9]. 이는 사용자의 신뢰와 이해를 촉진하여 차량을 더 안전하게 이용할 수 있도록 한다. 또한 Gold et al.은 자율주행 차량에서 운전자와 시스템 간 인터랙션, 특히 제어권 전환 과정이 사용자 반응과 신뢰 형성에 중요한 영향을 미친다고 지적하며, 시스템 설계의 일관성과 직관성이 사용자 경험의 핵심 요소임을 밝혔다[14].
그러나 본 연구는 자율주행 단계별 사용자 역할 및 컨텍스트 인식에 기반한 멀티모달 인터랙션 프레임워크를 설계하고, 전문가 평가를 통해 이를 개념적으로 검증한 점에서 차별성을 갖는다. 특히, 실시간 컨텍스트 인식을 활용해 동적으로 인터랙션을 조정함으로써 단계별 사용자 경험 최적화를 목표로 삼고자 한다.
적응형 시스템(Adaptive System)은 자율주행 차량 내에서 사용자의 상태나 외부 환경을 실시간으로 모니터링하여 상황에 맞는 피드백을 제공하는 중요한 인터랙션 요소로써, 사용자와의 인터랙션 방식을 결정하는 중요한 요소 중 하나이다. 특히 이러한 시스템은 사용자의 상태 변화를 감지하여 피로 또는 주의 분산과 같은 상태가 발생할 경우 경고 알림을 제공하거나, 차량 주변의 교통 상황을 바탕으로 피드백을 조정하여 인터랙션을 최적화한다. 즉 운전자가 주행 상황에 집중할 수 있도록 돕고 자율주행 차량의 안전성을 향상시키는 역할을 한다. 또한 적응형 시스템은 사용자가 차량 시스템의 반응을 예측 가능하게 함으로써 신뢰성을 높일 수 있다. 일관성 있는 피드백은 운전자가 시스템의 반응을 쉽게 예측하고 그에 따라 행동할 수 있게 함으로써 신뢰를 형성하는데 기여한다. 이러한 시스템의 일관성은 사용자가 각 상황에서 제공되는 피드백을 인식하고 이해하는 데 중요한 역할을 한다. Stsebakhova에 의하면, 적응형 시스템은 사용자 경험을 향상시키고, 사용자 상태에 따라 실시간으로 피드백을 조정하여 사용자 및 시스템 간의 인터랙션 안전성과 효율성을 높이는데 기여한다고 하였다[13]. 이처럼 사용자 상태에 따른 실시간 적응형 피드백을 제공하는 시스템은 단순한 경고 제공을 넘어서 사용자와 차량 시스템 간의 인터랙션을 보다 안전하게 하고 신뢰성을 부여한다. 실시간 데이터에 기반하여 사용자 상태를 모니터링하고, 컨텍스트에 적절한 개인화된 피드백을 제공하여 운전자가 차량의 시스템을 신뢰하고 더욱 안전하게 사용할 수 있도록 지원한다.
2-4 자율주행 환경에서의 멀티모달 인터랙션
자율주행 차량 시스템에서 멀티모달 인터랙션을 적용한 설계는 사용자 경험을 극대화하기 위해 명확성, 일관성, 적응성을 갖춰야 한다. 사용자가 다양한 기능을 직관적이고 예측 가능하게 사용할 수 있어야 하므로, 멀티모달 인터랙션을 통해 자율주행 차량 내의 다양한 기능과 피드백이 사용자가 쉽게 이해할 수 있는 방식으로 제공되어야 한다. 예를 들어, 음성 명령과 시선 추적, 제스처 인식, 햅틱 피드백을 결합한 인터랙션을 통해 사용자는 직관적으로 차량과 인터랙션할 수 있으며, 이는 시스템의 일관성과 명확성을 높여 사용자 신뢰를 증대시킬 수 있다. Gold et al.에 따르면, 자율주행 차량에서 운전자 및 시스템 간의 인터랙션, 특히 제어권 전환 과정이 사용자 반응과 신뢰에 큰 영향을 미칠 수 있다[14]. 이는 시스템 설계의 일관성과 직관성이 사용자 경험에 중요한 요소임을 시사한다. 또한 사용자가 자율주행 차량 내에서 다양한 기능과 피드백을 쉽게 이해할 수 있도록 직관적인 인터페이스를 바탕으로 한 사용자 경험을 제공하는 것이 중요하다. 피드백의 일관성 및 인터랙션의 직관성은 사용자 신뢰성에 큰 영향을 미치며, 사용자가 인터랙션의 목적과 시스템 반응을 예측할 수 있을 때 신뢰도는 높아질 수 있다. 이는 자율주행 차량의 주행 방식에 대한 개인화된 설명이 제공될 때 사용자의 신뢰도와 이용 의도가 향상된다는 연구 결과와 동일한 맥락이다[8]. 이러한 요소는 사용자가 시스템을 이해하고 차량 제어에 신뢰를 갖고 사용할 수 있도록 한다.
이처럼 자율주행 환경에서의 적응형 멀티모달 인터랙션은 주행 단계 및 사용자 상태를 실시간으로 반영하여 단순한 정보 전달을 넘어서 사용자에게 최적화된 피드백을 제공한다. 적응형 시스템은 주행 단계 및 사용자 상태에 따라 각각의 모달리티를 조합함으로써 사용자의 주의 집중과 편안함을 동시에 보장하며, 이를 통해 시스템에 대한 사용자 신뢰를 증진시키고 자율주행 차량의 사용 경험을 더욱 풍부하고 안전하게 제공할 수 있다[15], [16].
Ⅲ. 컨텍스트 인식 기반의 멀티모달 인터랙션 프레임워크
3-1 자율주행 단계에 따른 사용자 인터랙션
자율주행 차량에서의 사용자 인터랙션은 자율주행 시스템의 자율성 수준에 따라 달라지며, 이는 각 단계에서 요구되는 피드백과 사용자 경험의 목표가 상이하다는 것을 의미한다. 본 연구는 이러한 단계별 사용자 인터랙션의 변화를 멀티모달 인터랙션 방식과 적응형 피드백 시스템으로 설계하고자 한다(그림 1 참조).
자율주행 단계가 높아질수록 시스템이 더 많은 주행 기능을 담당하게 되며, 사용자의 역할은 점차 모니터링과 비상 대응에서 편의성 및 몰입 경험으로 변화한다. 몰입 경험이 발생하는 것은 주요 사용 시스템이 주행 및 제어 관련에서 엔터테인먼트의 영역이 확장되는 것에서 비롯된다. 자율주행 초기 단계인 Level 2와 Level 3에서는 운전자의 개입이 필요하기 때문에, 시스템은 주행 제어와 주변 상황 모니터링을 지원하며, 운전자의 주의 집중을 도우면서 경고를 제공하는 인터랙션을 필수적으로 제공해야 한다. 반면, Level 4와 Level 5에서는 시스템이 대부분의 주행 기능을 처리함에 따라, 인터랙션의 초점은 탑승자의 편의성과 몰입 경험을 제공하는 데 맞춰진다. 자율주행 단계에 따라 운전자와 탑승자가 접근할 수 있는 시스템은 명확히 구분된다.
운전자의 경우, Level 2에서는 주행 제어 시스템, 경고 모니터링 시스템이며, Level 3에서는 주행 제어 시스템, 경고 모니터링 시스템에 간단한 제어 인터페이스로 변화한다. Level 4는 경고 및 모니터링 제어 시스템, 간단한 제어 인터페이스이며, Level 5는 전체 차량 제어 시스템만으로도 가능하다. 탑승자의 경우, Level 2와 Level 3에서는 엔터테인먼트 시스템, 정보 제공 시스템, 환경 제어 시스템에 접근 가능하며, Level 4와 Level 5에서는 엔터테인먼트 시스템, 정보 제공 시스템, 환경 제어 시스템, 비상 연락 시스템이다. 이 때, Level 4와 Level 5에서는 탑승자의 차량 제어권을 제한하여시스템 혼란을 미연에 방지한다.
멀티모달 인터랙션은 사용자 역할에 따라 각 시스템의 사용 권한과 조작 방식이 구분된다. 운전자의 경우, Level 2와 Level 3에서는 음성 제어, 간단한 제스처, 시선 추적이 해당되며, Level 4와 Level 5에서는 음성 제어, 터치 조작, 시선 추적, 제스처 조작이 가능하다. 탑승자의 경우, Level 2는 음성 제어, 간단한 제스처만 사용할 수 있으며, Level 3는 음성 제어, 터치 조작, 시선 추적, 제스처 조작을 할 수 있다. 이후 Level 4와 Level 5에서는 인터랙션 방식의 제한 없이 제공한다.
피드백 제공 방식은 자율주행 단계가 높아질수록 사용자의 직접적인 개입이 줄어들며, 이에 따라 단순화 및 집중화되어진다. Level 2에서는 청각 피드백, 촉각 피드백, 제한적 시각 피드백으로 운전자의 주의 집중을 돕고, 안전 관련 경고를 즉각적으로 전달한다. Level 3에서는 청각 피드백, 촉각 피드백으로 주행 모니터링 및 경고에 집중하며, 시각적 정보를 최소화한다. Level 4와 Level 5에서는 시각 피드백과 청각 피드백을 중심으로 탑승자의 편의성 및 몰입 경험을 제공하기 위해 정보를 직관적으로 전달한다.
자율주행 단계별 사용자 인터랙션은 각 단계에서 요구되어지는 사용자 역할과 경험의 목표에 따라 달라지며, 접근 가능한 시스템, 멀티모달 인터랙션 방식, 피드백 제공 방식을 단계별로 차별화하였다. 운전자가 차량 제어에 집중해야 하는 Level 2와 Level 3에서는 경고 및 모니터링 시스템 중심의 설계가 중요하다. 반면 Level 4와 Level 5에서는 사용자 편의성과 몰입 경험을 극대화하는 방향으로 시스템을 설계하였다. 이러한 접근 방식은 사용자 신뢰성과 안전성을 동시에 확보할 수 있는 기반을 제공한다.
3-2 적응형 멀티모달 인터랙션 계층 구조
적응형 멀티모달 인터랙션 계층 구조는 자율주행 차량 환경에서 사용자 상태와 외부 컨텍스트를 실시간으로 반영하여, 최적화된 인터랙션 방식과 상황 적응적 피드백을 제공하는 구조적 기반을 제공하기 위한 것이다. 이러한 계층적 구조는 각각의 세부 요소가 체계적으로 설계되어 일관성 있는 사용자 경험을 제공할 수 있으며, 시스템의 적응성과 신뢰성을 지속적으로 강화하는 것을 목적으로 한다.
적응형 멀티모달 인터랙션 시스템은 사용자 상태와 외부 컨텍스트를 기반으로 상황에 따라 적절히 반응할 수 있도록 설계된 5단계 계층 구조를 기반으로 한다. 레이어 1은 데이터 수집 및 전처리에 해당하는 단계로, 차량 내, 외부 센서 등을 통해 수집하는 데이터가 이에 해당한다. 내부 수집 데이터는 사용자의 행동(눈 깜박임, 음성 명령, 손동작) 및 상태(주의 분산, 피로) 모니터링이 해당되며, 외부 수집 데이터로는 차량의 주행 환경(날씨, 도로 상태, 교통 흐름)을 수집한다.
이 때, 유효하지 않은 데이터를 제거함과 동시에 다중 사용자에 대한 명령 우선순위를 설정한다. 레이어 2는 컨텍스트 인식 및 분석에 해당하는 것으로 사용자 상태 및 환경 데이터를 기반으로 상황을 분류하고 우선순위를 설정하는 과정이 해당된다. 레이어 3은 입력 방식 통합 및 설정으로 음성 명령, 제스처, 시선 추적 등 다양한 입력 방식을 통합하고, 유효성 검증을 통해 신뢰할 수 있는 입력만 처리한 다음 적합한 피드백 방식을 설정한다. 레이어 4는 실시간 피드백 및 사용자-시스템 인터랙션으로 사용자 상태와 외부 상황에 따라 실시간으로 피드백을 제공한다. 마지막으로 레이어 5는 자동 학습 및 적용으로 고도화 단계를 의미한다. 사용자 행동 데이터를 학습하고 반복적 패턴을 기반으로 시스템 성능을 지속적으로 개선하며, 학습 결과를 하위 레이어로 전달하여 시스템의 전반적인 적응성을 강화한다.
이러한 계층 구조는 사용자 상태 및 외부 컨텍스트 데이터를 단계적으로 처리하며, 각 레이어 간 체계적인 연결을 통해 사용자 경험의 일관성 및 시스템 신뢰성을 확보할 수 있다.
컨텍스트 인식 시스템은 사용자의 상태와 차량 외부 환경을 실시간으로 분석하여 상황에 맞는 반응을 제공하는 시스템의 핵심 요소이다.
내부 컨텍스트 인식에 해당하는 부분은 사용자 상태로 주의 집중, 피로, 스트레스 등을 모니터링하여 시스템 반응을 조정하는 것을 말한다. 예를 들어, 운전자의 주의가 분산되는 것이 감지되면 음성 경고를 제공하는 방식이다. 외부 컨텍스트 인식은 주행 환경인 날씨, 도로 상태, 주변 차량 위치 등을 실시간으로 분석하는 것으로, 비 오는 날에는 제동 거리 증가 경고를 제공하는 식으로 작동한다.
이러한 컨텍스트 분류 및 우선순위 산정은 긴급 상황과 비긴급 상황으로 분류할 수 있는데, 긴급 상황은 비상 경고와 같이 즉각적으로 사용자 개입이 필요한 상황을 뜻한다. 이에 비해 비긴급 상황은 탑승자에게 주변 관광 정보를 제공하는 등 상황 중요도 자체가 낮은 상황이 해당된다. 컨텍스트 인식 시스템은 사용자의 상태와 외부 환경 데이터를 결합하여 상황에 따라 적절한 피드백 제공을 위한 판단 근거를 마련하기 위한 시스템으로 볼 수 있다.
피드백 매커니즘은 사용자에게 정보를 전달하고 시스템과의 인터랙션을 유도하는 요소로 피드백의 세기와 형태는 사용자 상태 및 외부 컨텍스트에 따라 다르게 적용된다. 피드백 방식으로는 청각 피드백(운전자 주의 집중 및 경고음을 통한 위험 상황 알림 제공), 시각 피드백(제한된 환경에서 시각적 정보를 제공하여 탑승자 편의 향상), 촉각 피드백(운전자 주의가 분산된 상황에서 물리적 자극을 통해 즉각적인 반응 유도)으로 구성되며, 사용자 상태와 외부 컨텍스트를 반영하여 피드백 강도를 동적으로 조정하는 매커니즘이다. 피드백을 제공하는 것에서 그치지 않고, 피드백 제공 후 사용자의 반응 데이터를 수집하여 시스템 성능을 개선하는 것으로, 단순한 정보 전달을 넘어 사용자 신뢰성과 안전성을 확보하기 위한 인터랙션의 중요한 요소 중 하나이다.
Ⅳ. 시스템 평가
4-1 평가 설계 및 개요
앞 장에서 제안한 프레임워크의 검증을 위해 전문가 그룹을 대상으로 하는 델파이(Delphi) 조사 기법을 사용하였다. 델파이 조사는 개인의 의견보다 집단의 의견을 중시하며, 전문가 집단의 의견 일치를 통해 합의를 이끌어 내는 방법론으로, 미래 예측 및 불확실한 문제 해결 방안을 탐색하기 위해 자주 활용되는 방법론이다[17],[18].
본 연구는 자율주행 차량 내 시스템을 사용자 경험 관점에서 개선 및 제안하는 것을 목표로, UX 전문가, 차량 인터랙션 전문가, HCI 전문가 등 총 10명을 대상으로 평가를 진행하였다. 델파이 조사의 진행 과정은 그림 3에서 나타낸 바와 같이 1차 평가와 2차 평가로 구분되며, 단계별로 구체적인 목표와 방식이 설정되었다. 1차 평가는 문제점 도출 및 개선 방향 모색을 중점으로 두었다. 이를 위해 앞 장에서 제안된 프레임워크의 개요와 상세 설명을 제공하고, 도출된 평가 지표와 항목에 대해 리커트 5점 척도를 기반으로 정량적 데이터를 수집하였다. 또한 전문가 의견을 보충적으로 수집하여 구체적인 개선 방향을 제시할 수 있도록 하였다. 2차 평가는 1차 평가 결과를 기반으로 수정된 프레임워크의 적합성을 검증하는 데 초점을 맞추었다. 1차 평가에서 수집된 전문가 의견을 분석하고 이를 반영한 프레임워크를 제공한 후, 해당 프레임워크에 대한 검증 및 추가적인 의견을 수렴하였다. 평가 설계는 프레임워크의 구조적 적합성, 실용성, 적응성 등을 검토하며, 자율주행 단계별 사용자 인터랙션 정의와 멀티모달 인터랙션 계층 구조의 적합성을 평가하는 데 초점을 두고 진행하였다.
4-2 1차 전문가 평가
평가에 앞서 프레임워크의 체계적인 검증을 위해 평가 지표를 도출하였다. 이를 위해 자율주행 차량의 멀티모달 인터랙션 시스템 설계와 사용자 중심의 인터랙션 설계에 대한 선행 연구[19],[20]을 바탕으로 평가 기준을 설정하였다. 평가는 크게 두 가지 축으로 나누어서 진행하였다. 첫 번째 평가로 자율주행 단계에 따른 멀티모달 인터랙션 시스템 분류의 적합성을 평가하였고, 두 번째 평가로 적응형 멀티모달 인터랙션 프레임워크의 구조적 적합성 및 실용성을 검증하였다. 첫 번째 평가의 평가 지표는 아래 표 6과 같다.

Primary expert evaluation metrics - A classification of multimodal interaction systems based on autonomous driving level
자율주행 단계에 따른 멀티모달 인터랙션 시스템 분류(평가 1)는 자율주행 단계별 사용자 역할 및 시스템 제공 피드백 간의 적합성을 검토하기 위해 설계되었다. 이를 위해 객관식 및 주관식 평가 방식을 진행하였다. 객관식 평가 항목은 자율주행 단계별 인터랙션 방식의 적합성, 멀티모달 인터랙션의 변화, 단계별 피드백의 적합성, 사용자 경험의 단계별 차별성으로 구성되었다. 각 항목은 자율주행 단계에 따른 시스템 설계의 논리성과 유효성을 평가하기 위한 것이다. 주관식 평가는 자율주행 단계별 인터랙션 방식의 적합성과 단계별 피드백 제공 방식에 있어 개선이 필요한 방향에 대해 의견을 수집하였다.
적응형 멀티모달 인터랙션 프레임워크(평가 2)는 프레임워크의 구조적 적합성 및 실용성을 검토하는데 중점을 두었다. 평가 항목은 구조적 일관성 및 논리성, 피드백의 타당성 및 명확성, 유연성 및 적응성, 시스템 안정성 및 안전성, 사용자 중심으로 구성되었다. 각 평가 항목은 자율주행 차량 내 시스템 설계의 논리적 체계성과 적합성을 평가하기 위해 설정되었으며, 이를 통해 프레임워크의 완성도를 높이고자 하였다. 주관식 평가는 프레임워크의 개념적 이해도, 구성 요소의 적절성, 확장 가능성, 실용성, 개선 방향에 대한 전문가의 정성적 의견을 수집하는 방식으로 이루어졌다.
1차 전문가 평가 결과 분석을 위해 정량 분석과 동시에 수집한 전문가 의견을 정리하였다. 총 34개의 객관식 평가 문항을 대상으로 기술통계를 포함하여 안정, 합의도, 수렴도를 포함하여 내용 타당도 값을 도출하였다. 특히 내용타당도 비율(CVR: Content Validity Ratio)을 활용하여 평가 항목에 대한 타당성을 검증하였다. 객관식 평가에서는 리커트 5점 척도와 더불어 전문가 의견을 추가적으로 수집하였고, 주관식 평가를 통해 수집한 응답과 조합하여 전체 평가 결과 리포트를 작성하였다.
• 자율주행 단계에 따른 멀티모달 인터랙션 시스템 적용 분류
자율주행 단계별 사용자 맞춤형 피드백 제공의 필요성이 강조되었는데, 사용자의 연령과 운전 숙련도를 고려한 초보 운전자와 고령 운전자를 위한 맞춤형 피드백 설계가 필요하다고 제안하였다. 특히 초보 운전자의 경우 직관적이고 명확한 피드백이 필요하며, 고급 운전자의 경우 불필요한 피드백을 최소화하여 자율성을 보장하는 방식으로 개선해야 한다고 지적하였다. 또한, 자율주행 단계에 따른 멀티모달 피드백의 구분과 일관성을 확보하는 것이 중요하다고 제안하였다. 시각, 청각, 촉각 피드백이 자율주행 단계별로 적절히 구분되고, 일관된 방식으로 제공되어야 사용자 경험이 향상될 수 있다는 의견이 도출되었다.
프레임워크의 구조적 타당성 측면에서는 레이어별 역할과 자율주행 단계별 사용자 역할 및 피드백 방식의 구체적인 구분이 필요하다고 평가되었다. 특히 레이어 3과 같은 특정 레이어의 역할을 구체화하여 각 자율주행 단계에 적합한 피드백을 체계적으로 설계해야 한다는 의견이 제시되었다. 또한, 안전성과 편의성 간의 균형이 중요하다고 강조하며, 완전자율주행 단계에서는 과도한 피드백이 사용자 편의성을 저해하지 않도록 피드백 빈도와 강도를 조절해야 한다고 평가하였다.
• 적응형 멀티모달 인터랙션 프레임워크
적응형 멀티모달 인터랙션 프레임워크에 대한 평가에서는 피드백의 세부 정의와 적용 예시가 부족하다는 지적이 있었다. 다양한 상황에서 피드백이 작동하는 방식을 구체적인 시나리오로 제시할 필요가 있다고 강조하였다. 또한, 사용자 특성에 따라 피드백 타이밍과 강도를 조정할 수 있는 구조가 필요하며, 시스템이 사용자 피드백 반응 패턴을 학습하여 장기적으로 최적화된 피드백을 제공하는 것이 중요하다고 평가하였다.
프레임워크의 단계별 시뮬레이션과 검증이 필요하다는 의견도 제시되었으며, 시뮬레이션을 통해 피드백이 사용자에게 미치는 영향을 분석하고 이를 바탕으로 프레임워크를 개선하는 절차가 필수적이라고 평가하였다. 피드백이 시스템 신뢰도에 미치는 영향을 고려하여, 과도하거나 비일관적인 피드백이 혼란을 유발하지 않도록 설계해야 한다는 의견도 제시되었다. 전문가들은 피드백의 빈도, 강도, 타이밍을 유연하게 조정하여 사용자와 시스템 간 신뢰를 강화할 필요성을 언급하였다.
마지막으로, 프레임워크의 레이어 구조를 세분화하여 실시간 피드백과 사용자-시스템 간 상호작용 기능을 강화하고, 사용자 반응을 실시간으로 추적하여 피드백 개선에 활용하는 방안을 제안하였다. 이를 통해 프레임워크의 적용 가능성을 높이고, 구체적인 시나리오와 조건 설정을 통해 사용자 경험 기반의 평가를 진행해야 한다는 점이 강조되었다.
4-3 개선된 프레임워크
• 사용자 역할 및 접근 가능한 시스템
1차 평가에서 제시된 의견을 반영하여 자율주행 단계별 사용자 역할에 따른 시스템 접근 권한을 재정의하였다.
Level 2~3에서는 운전자가 차량 제어 및 경고 모니터링 시스템을 주로 사용하는 상황으로, 주행 제어 및 경고 모니터링 시스템에 대한 접근 권한을 강화하며, 비상 연락 시스템을 추가 적용하였다. Level 4에서는 주행 제어 역할이 시스템으로 넘어가는 단계이므로 운전자의 시스템 접근 범위를 축소하고자 접근 가능 시스템에서 기능적 제약 사항 및 조건을 점진적으로 줄여 Level 5는 기능적 제약이 없도록 하였다. 탑승자의 경우 Level 2~4에서 엔터테인먼트 시스템 및 정보 제공, 환경 제어, 비상 연락 시스템에 접근 가능하되, 기능적 제약을 점차 줄여 편의성을 향상시켰다. 다만, Level 4~5에서도 주행 제어 시스템에는 접근하지 못하도록 하여 안전성을 확보하였다.
사용자 역할에 따라 접근 가능 시스템을 차별화함으로써 각 자율주행 단계에서의 역할을 명확히 하고, 시스템 사용 경험의 혼란을 방지하였다.
• 멀티모달 인터랙션 구성
멀티모달 인터랙션 방식은 전체 자율주행 단계에서 최대한 동일하게 구성하였고, 약간의 조작 방식의 차이와 기능적 제약 및 조건을 두어 차별화하였다.
운전자의 경우, Level 2~3에서는 음성 제어 및 시선 추적만 제공하여 운전자 주의 분산을 최소화하고 직관적인 조작을 가능하게 하였다. Level 4~5에서는 운전자의 역할이 축소되므로 제스처 조작을 추가하였다. 탑승자는 Level 2~3에서 음성 제어와 시선 추적, 간단한 제스처를 통해 조작할 수 있도록 하였고, Level 4~5에서는 시각 피드백을 포함한 직관적인 인터랙션 방식과 제약없는 제스처를 통해 자유로운 인터랙션 환경을 제공하였다.
이러한 멀티모달 인터랙션 방식의 구성은 사용자 역할에 맞춰 제공함으로써 시스템의 직관성을 높이고 사용자 경험을 강화할 수 있도록 설계되었다.
• 피드백 제공 방식 및 제약 조건
사용자 상태 및 외부 컨텍스트를 반영하여 자율주행 단계별로 피드백 강도와 빈도를 차별화하였다. 피드백 제공 기준은 상황 중요도에 따라 분류되며, 사용자 경험과 안전성을 균형적으로 고려해 설계한 것이다. 자율주행 단계가 높아질수록 사용자는 차량 내부에서 시스템에 대한 주의가 줄어들고, 다른 행동을 할 가능성이 증가한다. 따라서 피드백 방식은 점차 단순하고 비침해적인 구조로 전환되어 몰입과 편안함을 방해하지 않도록 해야 한다. 먼저 시스템이 상황 중요도에 따른 피드백을 자체적으로분류하여, 긴급 상황에서는 강도 높은 피드백을 멀티모달로 제공하고 비긴급항황에서는 단일 모달리티를 활용하여 간결하게 전달한다. 또한 사용자 상태와 상황 중요도에 따라 피드백의 강도 및 빈도를 조정하였다. 예를 들어, 긴급 상황에서는 시각, 청각, 촉각 피드백을 동시에 제공하며, 일반 상황에서는 시각 피드백만을 활용한다.
사용자 특성 및 상황에 따라 세분화하였으며, 연령, 운전 숙련도, 개인 선호도 등을 반영하여 피드백 유형 및 강도를 분류한 것이다.
예를 들어, 고령 사용자의 경우 시각 피드백의 가시성을 강화하고, 청각 피드백의 음량을 조절하도록 설계하였다. 마지막으로 피드백 유형과 피드백 강도를 상황 중요도에 따라 명확하게 정의하였다. 이를 통해 일관된 피드백을 제공하고자 하였다.
• 레이어 간 연결성 보완
1차 평가에서 제기되었던 레이어 간의 연결 부족 문제를 해결하기 위해 데이터 흐름과 피드백 전달 경로를 구체화하여 설계하였다.
먼저, 레이어 1에서 레이어 2의 연결로 차량 내부 및 외부 데이터의 전처리 결과가 컨텍스트 분석 단계로 명확하게 전달될 수 있도록 데이터 구조를 정비하였다. 레이어 4에서 레이어 5의 연결은 사용자 피드백 제공 후 사용자의 반응 데이터를 수집하여 학습 결과로 통합하는 경로를 명확히 정의하였다. 이 과정에서 학습된 데이터는 레이어 3 및 레이어 4로 재전달되어, 피드백과 입력 방식 통합에 반영되는 구조이다.
• 레이어별 주요 변경 사항
레이어 1: 데이터 수집 및 전처리에서는 외부 환경 데이터의 수집 범위를 확대하고, 차량 주변 상황 데이터를 포함한 컨텍스트를 통합적으로 처리할 수 있도록 설계하였다.
또한 데이터 유효성 검증 단계에서 오류를 식별하고, 이를 제거할 수 있는 프로세스를 강화하였다.
레이어 2: 컨텍스트 인식 및 분석은 컨텍스트 인식 엔진 처리 프로세스로 사용자 상태와 외부 상황을 종합적으로 분석하여 시스템이 상황에 적합한 대응을 할 수 있도록 지원하는 핵심 단계라고 볼 수 있다. 복합적으로 수집한 데이터를 분류하고 상황을 구조화하고 상황을 정밀하게 인식하여 다차원적으로 분석한다. 예측 모델 기반의 잠재적인 위험 상황을 판단하며, 위험 발생 가능성을 미리 식별하여 예방적 조치를 취한다. 이러한 프로세스는 이전 단계에서 수집된 데이터를 기반으로 작동하며, 컨텍스트 인식 정확성을 높이는 데 중점을 두고 있다.
레이어 3: 입력 방식 통합 및 설정에서는 다양한 입력 방식을 수집, 통합, 검증하여 사용자 명령을 해석하는 단계이다. 사용자가 제공하는 음성, 시선, 제스처, 터치 등의 입력 신호를 실시간으로 인식하고 분류한 다음, 다양한 입력 신호를 조합하여 사용자의 의도를 해석하며, 멀티모달 인터랙션의 직관성과 유연성을 강화한다. 이후 수집된 입력 신호의 신뢰도를 검토하여 오류나 부적절한 입력을 제거한다.
레이어 4: 실시간 피드백 및 사용자-시스템 인터랙션은 피드백 제공에 따라 사용자 상태뿐만 아니라 외부 컨텍스트를 반영하여 피드백 강도를 입체적으로 조정하도록 설계하였다. 또한 컨텍스트 변화에 따라 피드백 빈도와 내용을 즉시 조정할 수 있도록 실시간 피드백 구조를 개선하였다.
레이어 5: 자동 학습 및 적용에서는 학습된 데이터를 기반으로 레이어 3 및 레이어 4에 피드백을 제공하여 시스템의 적응성과 유연성을 강화하였다. 이를 통해 사용자 행동 패턴과 외부 컨텍스트를 동시에 고려하는 피드백 조정이 가능하다.
본 연구에서 제안한 프레임워크의 이해를 돕기 위해 자율주행 Level 3 환경에서의 사용자 시나리오를 구성하였다. 해당 시나리오는 고속도로 주행 중 운전자가 피로로 인해 주의가 분산된 상태에서, 주변 차량이 갑작스럽게 끼어들기를 시도하며 위험 상황이 발생한 상황을 가정한 것이다.
이러한 상황에서 시스템의 대응 프로세스는 먼저 차량 내부 센서를 통해 운전자의 피로 상태를 감지하고, 외부 센서를 통해 끼어들기를 시도하는 차량의 움직임을 인지한다. 이를 바탕으로 컨텍스트 인식 엔진은 운전자의 주의 분산 상태와 주변 환경의 위험도를 결합하려 이를 긴급 상황으로 분류한다. 이후 시스템은 피드백 제공을 위해 헤드업 디스플레이(HUD)에 차량 간 거리 축소 경고를 표시하고, 음성 안내를 제공하며, 스티어링 휠의 진동을 통해 위험 상황을 알린다.
이러한 시나리오를 통해 제안된 프레임워크의 단계별 작동 과정을 구체적으로 설명하고, 긴급 상황에서 멀티모달 인터랙션 및 피드백 제공 방식의 적합성을 확인하는 것에 있다.
4-4 2차 전문가 평가
1차 전문가 평가의 정량적 분석 결과를 바탕으로, 개선된 평가 지표를 도출하였다. 총 27개의 객관식 평가 문항 중 CVR 값이 0.6 미만으로 나타난 문항은 평가에서 제외하였고, 최종적으로 17개의 객관식 평가 문항으로 구성하였다. 이를 통해 평가 항목의 타당성 및 적합성을 강화하였다.
첫 번째 평가인 자율주행 단계에 따른 멀티모달 인터랙션 시스템 분류는 자율주행 단계별 인터랙션 방식과 사용자 경험의 차별성을 평가하기 위한 것으로, 1차 전문가 평가에서 도출된 결과를 바탕으로 재구성되었다. 특히 단계별 멀티모달 인터랙션의 변화와 피드백의 적합성 항목은 CVR값이 기준치에 미달하여 2차 전문가 평가 문항에서 삭제하였다. 이로 인해 자율주행 단계별 시스템 분류의 적합성에 초점을 맞추는 방향으로 객관식 문항을 구성하였다. 또한, 주관식 평가 문항은 1차 평가에서 제안된 개선 사항이 2차 평가 대상 프레임워크에 적절히 반영되었는지 확인하는 것에 중점을 두었다. 이를 위해 전문가들에게 추가적인 보완이나 수정이 필요한 부분에 대한 의견을 작성하도록 요청하였다.
두 번째 평가인 적응형 멀티모달 인터랙션 프레임워크에 대한 평가는 프레임워크의 구조적 타당성 및 실용성을 검토하기 위한 것으로, 표 8과 같다. 1차 전문가 평가 결과를 바탕으로, 객관식 평가 문항 중 일부 평가 지표 및 하위 항목은 삭제하였다. CVR값이 기준치에 미달한 지표(단계별 멀티모달 인터랙션의 변화, 단계별 피드백 적합성, 확장 가능성, 시스템 안전성, 데이터 관리 및 처리의 효율성) 및 항목은 최종 문항에서 제외되었으며, 수정된 문항은 프레임워크의 구조적 일관성, 피드백의 명확성 및 적응성, 시스템 안정성 등을 보다 명확히 검토할 수 있도록 재설계되었다. 주관식 평가 문항은 첫 번째 평가와 동일하게 구성하였다.

Secondary expert evaluation metrics - A classification of multimodal interaction systems based on autonomous driving level
2차 전문가 평가는 1차 전문가 평가에서 수정 의견과 개선 방향을 토대로 재구성한 프레임워크를 제공한 다음, 이에 대한 의견을 수집하는 방식으로 진행되었다. 1차 전문가 평가와 동일하게 정량 분석을 통해 전문가 의견 일치도 및 합의 수준을 파악하였다. 분석 결과, 전문가들의 의견이 대체로 일치되었으며, 일관성 있는 답변으로 판단되어 2차 전문가 평가에서 본 연구의 평가를 종료하였다.
평가 분석 결과, 제안된 프레임워크는 사용자 맞춤형 피드백 제공, 상황 중요도 기반의 피드백 설계, 시스템 안정성, 그리고 장기적 학습 가능성 측면에서 긍정적인 평가를 받았다.
첫째, 사용자 맞춤형 피드백 제공이 프레임워크의 주요 강점으로 언급되었다. 초기 설정 단계에서 사용자의 연령, 운전 숙련도, 선호도 등 기본 데이터를 수집하여 피드백 강도와 유형을 조정하는 개인화 구조가 사용자 경험을 향상시키는 것에 효과적일 것으로 평가되었다. 또한 사용자의 행동 패턴을 기반으로 학습이 누적됨에 따라 피드백이 점차 정교화되어지는 구조가 긍정적으로 작용할 것으로 보인다고 하였다.
“사용자 반응 및 운전 패턴의 데이터를 통해서 연령대, 운전 숙련도 등의 여러 변수에 반응할 수 있도록 피드백 세기를 세밀하게 조정할 수 있는 점에서 매우 긍정적일 것이라 예측한다.” (전문가 2)
둘째, 피드백 제공 방식은 상황 중요도에 따라 강도 및 빈도를 조정하며, 자율주행 단계별로 차별화된 설계를 통해 사용자 집중도와 안전성을 동시에 고려한 구조로 평가되었다. 특히 자율주행 Level 2와 Level 3에서는 운전자의 인지 부하를 최소화하고, Level 4와 Level 5에서는 비상 상황에 대해 필요한 수준의 경고를 제공하는 구조가 적절하다는 의견이 제시되었다.
“특히 상황 중요도에 따른 피드백 유형 분류는 자율주행 단계에 따른 사용자 역할 별 멀티모달 인터랙션 시스템 설계 시 실질적인 도움이 될 것으로 판단됩니다. 피드백 분류 기준은 매우 구체적이어서 개선 사항이 적절히 구현되었다 생각합니다.” (전문가 4)
셋째, 시스템 안정성 측면에서는 레이어 간 연결성 및 오류 처리 방안이 체계적으로 설계되어 데이터 유효성 검증과 오류 발생 시 하위 레이어로 회귀하여 재처리하는 과정이 신뢰도를 높일 수 있는 구조로 평가되었다. 또한 반복 학습과 검증하는 과정을 통해 장기적으로 시스템의 정확도와 적응성이 강화될 것으로 기대되었다.
“단계별 데이터 흐름과 상호작용 방식에 대한 설명이 보완되어 피드백까지의 처리 과정이 논리적으로 연결되어 있다. 또한 오류 발생 시 해당 레이어로 이동/재실행하여 상위 레이어로 전파되는 것을 제지한 점에서 일관성을 높일 수 있을 것으로 보인다.” (전문가 7)
마지막으로, 다중 사용자 환경에서 사용자 전환 옵션 적용의 필요성이 제기되었고, 상황별 피드백 적용의 시나리오와 오류 처리 반복 시의 대처 방안 등의 추가 개선 사항이 제안되었다. 특히 렌터카와 같은 공유 차량 환경에서의 사용자 맞춤형 인터랙션 제공 방식에 대한 고려가 필요하다는 의견도 제시되었다.
이러한 결과를 바탕으로 본 연구에서 제안한 프레임워크는 사용자 중심의 멀티모달 인터랙션 설계와 피드백 제공 방식에서 높은 평가를 받았으며, 지속적인 학습 및 개선을 통해 자율주행 차량 환경에서 사용자 신뢰성과 편의성을 더욱 향상시킬 가능성을 확인하였다.
4-5 평가 결과 및 논의
본 연구는 델파이 조사 기법을 활용하여 1차 전문가 평가와 2차 전문가 평가를 통해 자율주행 차량 환경에서의 멀티모달 인터랙션 시스템 및 적응형 프레임워크의 타당성을 검증하였다. 1차와 2차 전문가 평가를 통해 프레임워크의 구조적 적합성과 개선 가능성을 정량적 및 정성적으로 분석하였다.
1차 전문가 평가는 자율주행 단계별 멀티모달 인터랙션 시스템 및 적응형 멀티모달 인터랙션 프레임워크의 구조를 검토하는 것에 초점을 두었다. 총 34개의 객관식 평가 문항을 바탕으로 내용타당도(CVR), 안정도, 합의도, 수렴도를 도출하여 평가 항목의 타당성을 검증하였다. 평가 결과, 사용자 맞춤형 피드백 제공, 멀티모달 피드백의 일관성, 프레임워크의 구조적 구체화, 그리고 안전성 및 편의성 간의 균형을 주요 개선점으로 제안하였다.
먼저 자율주행 단계에 따른 멀티모달 인터랙션 시스템 분류는 자율주행 단계별로 사용자 맞춤형 피드백 설계가 필요하다는 점이 강조되었다. 특히 초보 운전자와 고령 운전자를 대상으로 하는 직관적이고 명확한 피드백 제공이 필요하며, 고급 운전자의 경우 불필요한 피드백을 줄여 자율성을 보장한다고 평가되었다. 또한 자율주행 단계별 멀티모달 피드백의 구분과 일관성 확보가 필요하다고 언급되었다. 시각, 청각, 촉각 피드백이 단계별로 명확히 구분되어 일관된 방식으로 제공되어야 사용자 경험이 향상될 수 있다는 의견이 제시되었다. 프레임워크의 구조적 타당성 측면에서는 레이어별 역할과 자율주행 단계별 사용자 역할 및 피드백 방식의 구체적 구분이 필요하다고 평가되었다.
적응형 멀티모달 인터랙션 프레임워크의 평가에서는 피드백 제공 방식의 구체화가 주요 개선점으로 제안되었다. 전문가들은 다양한 상황에서 피드백이 작동하는 방식을 구체적인 시나리오로 제시해야한다고 강조하며, 사용자 특성에 따라 피드백 타이밍 및 강도를 조정할 수 있는 구조의 필요성을 언급하였다. 또한 시스템이 사용자 피드백 반응 패턴을 학습하여 장기적으로 최적화된 피드백을 제공하는 구조가 긍정적으로 평가되었다. 프레임워크의 단계별 시뮬레이션과 검증을 통해 피드백 효과를 분석하고 이를 바탕으로 개선하는 절차가 필요하다는 의견도 제시되었다.
이러한 전문가 의견을 바탕으로 개선한 프레임워크를 대상으로 2차 전문가 평가를 진행하였다. 2차 전문가 평가는 제안된 개선 사항이 적절히 반영되었는지 검증하였다. 분석 결과, 전문가들의 의견이 대체로 일치하였으며, 프레임워크가 사용자 중심의 설계와 피드백 제공 방식에서 높은 평가를 받았다.
초기 설정 단계에서 사용자의 기본 정보를 수집하여 개인화된 피드백을 제공하는 구조가 긍정적으로 평가되었다. 특히 사용자의 행동 패턴을 학습하여 피드백이 정교화되는 구조는 사용자 경험을 향상시키는 데 효과적일 것으로 보였다. 또한 상황 중요도에 따라 피드백의 강도와 빈도를 조정하고, 자율주행 단계별로 차별화된 피드백 제공 방식을 통해 사용자 안전성 및 편의성을 모두 고려한 설계가 적절하다고 평가되었다. 추가적으로 레이어 간의 연결성 및 오류 처리 방안이 체계적으로 설계되어 데이터 유효성 검증 및 오류 발생 시 처리 방안이 신뢰도를 높일 수 있는 것으로 평가되었으며, 반복 학습과 검증을 통해 시스템의 정확도 및 적응성을 강화할 것으로 보았다.
Ⅴ. 결 론
본 연구는 자율주행 차량 환경에서 사용자 상태 및 외부 컨텍스트를 실시간으로 반영하여 멀티모달 인터랙션을 최적화하는 컨텍스트 인식 기반의 적응형 멀티모달 인터랙션 프레임워크를 제안하였다. 자율주행 기술의 발전에 따라 사용자 및 차량 간의 인터랙션이 단순한 운전 제어를 넘어 개인화된 경험과 신뢰성 확보로 확장되고 있는 상황에서 본 연구에서 제안하는 프레임워크는 사용자 중심의 인터랙션 설계를 위한 구체적인 구조와 운영 방안을 제시하였다.
프레임워크 개발 및 평가에 따른 주요 연구 결과는 다음과 같다. 첫째, 자율주행 단계별 사용자 역할과 인터랙션 방식을 명확히 정의하였다. 자율주행 단계에 따라 운전자와 탑승자의 역할을 명확히 구분하고, 접근 가능한 시스템과 시스템이 제공하는 피드백 방식의 차별성을 설계하였다. 이를 통해 각 단계에서 사용자 안전성 및 편의성을 보장할 수 있는 인터랙션 체계를 구축하였다. 둘째, 데이터를 수집 및 전처리부터 컨텍스트 분석, 입력 방식 통합, 실시간 피드백 제공, 학습 및 최적화에 이르는 체계적인 레이어 구조를 설계하였다. 특히 사용자 상태 및 외부 환경 데이터를 종합적으로 반영함으로써 인터랙션의 적합성과 유연성을 강화하였다. 셋째, 전문가 평가를 통해 프레임워크의 구조적 타당성과 실용성을 검토하였다. 1차 전문가 평가에서는 사용자 맞춤형 피드백 제공, 멀티모달 피드백의 일관성, 프레임워크의 구조적 구체화, 그리고 안전성과 편의성 간의 균형에 대한 주요 개선 사항이 도출되었다. 이를 반영하여 프레임워크를 수정하였고, 2차 전문가 평가를 통해 전문가 의견 합의 절차로 프레임워크의 적합성을 검증하였다. 평가 결과, 수정된 프레임워크는 사용자 맞춤형 설계와 상황 중요도 기반의 피드백 제공, 데이터 기반 학습 가능성 측면에서 높은 평가를 받았다. 마지막으로, 다양한 사용자 상황에 적응하는 실시간 피드백 매커니즘을 개발하였다. 사용자 상태 및 외부 컨텍스트에 따라 피드백 강도를 조정하고, 상황 변화에 즉각적으로 대응할 수 있는 실시간 피드백 구조를 제안하였다. 이를 통해 사용자 신뢰도를 높이고, 위험 상황에서의 대응력을 개선하였다.
본 연구에서 제안하는 프레임워크는 사용자 신뢰 및 안전성을 중심으로 자율주행 차량 환경에서 멀티모달 인터랙션 설계의 새로운 방향성을 제시한다. 자율주행 단계별 사용자 역할과 컨텍스트 인식 기반 멀티모달 인터랙션 설계를 통해 사용자 경험을 최적화하는 체계적 접근을 학문적으로 제안하며, 실시간 컨텍스트 반영과 적응형 피드백 구조를 통합하여 자율주행 환경에서 인간-기계 인터랙션 연구를 확장하는 데 기여할 것으로 예상한다. 또한, 전문가 평가를 통해 프레임워크의 타당성을 입증하며, 향후 실증 연구를 위한 기초를 제공하였다. 본 프레임워크는 자율주행 단계별 인터랙션의 차별성을 강조하는 동시에, 데이터 기반의 학습 및 최적화를 통해 시스템의 장기적인 성능 향상을 도모한다는 점에서 실용적인 의의를 가진다.
다만, 본 연구는 개념적 설계를 중심으로 이루어진 점에서 한계가 있으며, 실제 환경에서의 구현과 성능 검증이 필요하다. 특히 비상 상황에서의 피드백 강도와 우선순위 설정에 대한 구체적인 가이드라인 개발, 다양한 사용자 그룹을 대상으로 한 검증이 추가적으로 이루어져야 한다. 향후 제안한 프레임워크를 실제 자율주행 차량 환경이나 시뮬레이터에 적용해 실증적 데이터를 수집하고, 시스템의 효과성을 검증할 필요가 있다. 또한, 비상 상황에 최적화된 피드백 강도와 우선순위를 설정하는 가이드라인을 개발함으로써 사용자 신뢰와 안전성을 강화할 방안을 모색해야 한다. 더불어, 연령, 문화, 운전 경험 등 다양한 요인을 반영한 사용자 그룹별 최적화된 인터랙션 방식을 설계하고, 장기적인 사용자 데이터 축적을 통해 시스템의 학습 및 적응성을 평가하는 연구가 진행되어야 한다. 이를 통해 본 연구에서 제안한 프레임워크의 실용성과 확장 가능성을 강화할 수 있을 것이다.
본 연구는 자율주행 차량 환경에서 사용자 경험 최적화와 신뢰성 증진을 목적으로 고도화된 적응형 멀티모달 인터랙션 프레임워크를 제안하였으며, 사용자 요구사항을 반영하고 위험 상황에서의 안전성과 실시간 적응성을 강화하는 데 기여할 것으로 기대된다.
Acknowledgments
이 논문은 2024년도 정부(문화체육관광부)의 재원으로 한국콘텐츠진흥원의 지원을 받아 수행된 연구임(No.RS-2024-00441262).
References
- SAE International. J3016_202104: Taxonomy and Definitions for Terms Related to Driving Automation Systems for On-Road Motor Vehicles [Internet]. Available: https://www.sae.org/standards/content/j3016_202104/, .
-
D. Kern and A. Schmidt, “Design Space for Driver-Based Automotive User Interfaces,” in Proceedings of the 1st International Conference on Automotive User Interfaces and Interactive Vehicular Applications (AutomotiveUI ’09), Essen, Germany, pp. 3-10, September 2009.
[https://doi.org/10.1145/1620509.1620511]
-
J. D. Lee and K. A. See, “Trust in Automation: Designing for Appropriate Reliance,” Human Factors, Vol. 46, No. 1, pp. 50-80, 2004.
[https://doi.org/10.1518/hfes.46.1.50_30392]
-
G. D. Abowd, A. K. Dey, P. J. Brown, N. Davies, M. Smith, and P. Steggles, “Towards a Better Understanding of Context and Context-Awareness,” in Proceedings of the 1st International Symposium on Handheld and Ubiquitous Computing (HUC’99), Karlsruhe, Germany, pp. 304-307, September 1999.
[https://doi.org/10.1007/3-540-48157-5_29]
-
N. Merat, A. H. Jamson, F. C. H. Lai, M. Daly, and O. M. J. Carsten, “Transition to Manual: Driver Behaviour when Resuming Control from a Highly Automated Vehicle,” Transportation Research Part F: Traffic Psychology and Behaviour, Vol. 27, Part B, pp. 274-282, November 2014.
[https://doi.org/10.1016/j.trf.2014.09.005]
-
H. Choi, M. Back, J. Kang, and K. Lee, “Driver Drowsiness Detection Based on Visual-Feature Using Multi-Modal Learning,” The Journal of Korean Institute of Communications and Information Sciences, Vol. 43, No. 7, pp. 1124-1132, July 2018.
[https://doi.org/10.7840/kics.2018.43.7.1124]
-
C. Badue, R. Guidolini, R. V. Carneiro, P. Azevedo, V. B. Cardoso, A. Forechi, ... and A. F. De Souza, “Self-Driving Cars: A Survey,” Expert Systems with Applications, Vol. 165, 113816, March 2021.
[https://doi.org/10.1016/j.eswa.2020.113816]
-
T.-S. Kim and J. Choi, “The Effect of Perceived Personalization of Driving Style of Autonomous Vehicle on User’s Trust and Intention to Use,” Journal of Digital Contents Society, Vol. 20, No. 3, March 2019.
[https://doi.org/10.9728/dcs.2019.20.3.587]
-
J. Koo, J. Kwac, W. Ju, M. Steinert, L. Leifer, and C. Nass, “Why Did My Car Just Do That? Explaining Semi-Autonomous Driving Actions to Improve Driver Understanding, Trust, and Performance,” International Journal on Interactive Design and Manufacturing, Vol. 9, No. 4, pp. 269-275, November 2015.
[https://doi.org/10.1007/s12008-014-0227-2]
-
P. R. Cohen, M. Johnston, D. McGee, S. Oviatt, J. Pittman, I. Smith, ... and J. Clow, “QuickSet: Multimodal Interaction for Distributed Applications,” in Proceedings of the 5th ACM International Conference on Multimedia (MULTIMEDIA ’97), Seattle: WA, pp. 31-40, November 1997.
[https://doi.org/10.1145/266180.266328]
-
S. Oviatt, “Ten Myths of Multimodal Interaction,” Communications of the ACM, Vol. 42, No. 11, pp. 74-81, November 1999.
[https://doi.org/10.1145/319382.319398]
-
S. H. Hong and J. H. Choi, “Effect of Multimodal Agent Interface on Trust and Safety in Autonomous Driving Environment -Focusing on the Context of Non-Driving Related Task and Take-over Request-,” Design Convergence Study, Vol. 19, No. 2, pp. 3-21, April 2020.
[https://doi.org/10.31678/SDC81.1]
- T. Stsebakhova, “Human-Computer Interaction Design for Adaptive User Interfaces in Autonomous Vehicles,” Journal of AI-Assisted Scientific Discovery, Vol. 3, No. 2, pp. 1-14, June 2024.
-
C. Gold, D. Damböck, L. Lorenz, and K. Bengler, “Take over!” How Long Does It Take to Get the Driver back into the Loop?,” Proceedings of the Human Factors and Ergonomics Society Annual Meeting, Vol. 57, No. 1, pp. 1938-1942, September 2013.
[https://doi.org/10.1177/1541931213571433]
-
C. Park, W. Na, and H. Lee, “Driver Friendly Adaptive Cruise Control by Driver Behavior,” Transactions of KSAE, Vol. 26, No. 3, pp. 416-425, May 2018.
[https://doi.org/10.7467/KSAE.2018.26.3.416]
-
W. Na, J. Park, and H. Lee, “Study on TTC-Based Optimal Lane Change Algorithm in Adaptive Cruise Control,” Transactions of KSAE, Vol. 27, No. 8, pp. 627-636, August 2019.
[https://doi.org/10.7467/KSAE.2019.27.8.627]
- D. Lee and M. Lee, “Human-Computer Interaction (HCI) Technology Policy Trends,” The Magazine of the IEIE, Vol. 34, No. 6, pp. 20-29, June 2007.
- H. Park and K. Cho, “Design for Web-based Delphi Technique System,” Journal of The Korean Data Analysis Society, Vol. 7, No. 1, pp. 257-270, 2005.
-
A. Gomaa, “Adaptive User-Centered Multimodal Interaction towards Reliable and Trusted Automotive Interfaces,” in Proceedings of the 2022 International Conference on Multimodal Interaction (ICMI ’22), Bengaluru, India, pp. 690-695, November 2022.
[https://doi.org/10.1145/3536221.3557034]
-
A. Gomaa and M. Feld, “Adaptive User-centered Neuro-Symbolic Learning for Multimodal Interaction with Autonomous Systems,” arXiv:2309.05787, , September 2023.
[https://doi.org/10.48550/arXiv.2309.05787]
저자소개
2017년:단국대학교 시각디자인 (학사)
2019년:국민대학교 테크노디자인전문대학원 (디자인학석사)
2022년:국민대학교 테크노디자인전문대학원 (디자인학박사)
2022년~2023년: 바디프랜드 경험디자인연구소
2024년~현 재: 차세대융합기술연구원 재난안전융합연구센터 데이터과학연구실
※관심분야:데이터 분석, 사용자 경험, 모빌리티, 멀티모달 인터랙션
2006년:아주대학교 정보 및 컴퓨터공학 (학사)
2016년:과학기술연합대학원대학교 (KIST) (공학박사)
2016년~2019년: KIST 영상미디어연구센터 박사후 연구원
2019년~현 재: 차세대융합기술연구원 재난안전융합연구센터 데이터과학연구실 실장
※관심분야:데이터 과학 및 공학, 클라우드·엣지컴퓨팅, 블록체인