Korea Digital Contents Society
[ Article ]
Journal of Digital Contents Society - Vol. 27, No. 4, pp.1037-1046
ISSN: 1598-2009 (Print) 2287-738X (Online)
Print publication date 30 Apr 2026
Received 02 Feb 2026 Revised 12 Feb 2026 Accepted 27 Feb 2026
DOI: https://doi.org/10.9728/dcs.2026.27.4.1037

생성형 AI 캐릭터 얼굴 감정표현에 따른 사용자의 감정 인식에 대한 연구

김소림1 ; 유현정2, *
1이화여자대학교 일반대학원 조형예술대학 디자인학부 미디어인터랙션디자인전공 박사과정
2이화여자대학교 조형예술대학 디자인학부 교수
User Perceptions of Emotions in the Facial Expressions of AI-Generated Characters
Sorim Kim1 ; Hyun-Jung Yu2, *
1Ph.D. Course, Media Interaction Design Major, The Graduate School, Ewha Womans University, Seoul 03760, Korea
2Professor, Division of Design, College of Art & Design, Ewha Womans University, Seoul 03760, Korea

Correspondence to: *Hyun-Jung Yu Tel: +82-2-3277-3920 E-mail: hyunjung@ewha.ac.kr

Copyright ⓒ 2026 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

초록

최근 생성형 AI 기술은 애니메이션 제작에서 얼굴 감정 표현의 새로운 가능성을 제시하고 있으나, 복합적이고 섬세한 감정을 구현하는 데에는 한계가 존재한다. 본 연구는 폴 에크만의 FACS와 플루칙의 감정 바퀴 이론을 기반으로, 생성형 AI가 표현한 표정의 감정 인식 정확도와 전달력을 분석하였다. 동일한 3D 캐릭터 스타일을 기준으로 기본 감정과 복합 감정을 포함한 총 24개의 AI 표정을 생성하고, 총 205명 대상 온라인 설문을 통해 201건의 유효 응답(98.0%)을 수집·분석하였다. 그 결과, 기쁨 76.6%, 분노 75.6%, 슬픔 70.7%로 높은 인식률을 보였지만, 놀람 43.4%, 공포 4.4%, 혐오 4.4%는 낮게 인식되었다. 복합 감정에서는 경멸 68.8%, 절망 59.0%가 중간 수준으로 인식됐지만, 질투 12.2%, 반감 10.2%는 매우 낮은 인식률을 기록하였다. 이는 생성형 AI가 명확한 감정 표현에는 효과적이지만, 맥락적·심리적 깊이를 전달하는 데에는 제한이 있음을 보여준다. 본 연구는 애니메이션 실무에서 AI 기반 감정 표현을 위한 프롬프트 설계와 강도 제어의 중요성과 활용 가능성을 제시한다.

Abstract

The application of generative AI in animation has expanded to the generation of facial expressions; however, conveying subtle and complex emotions remains a challenge. This study examines the recognition accuracy and effectiveness of AI-generated facial expressions based on Paul Ekman’s Facial Action Coding System and Plutchik's emotion wheel. Using a consistent 3D character style, 24 facial expressions (six basic and six complex emotions) were generated and evaluated via an online survey (N = 205, valid = 201, 98.0%). The results showed that joy (76.6%), anger (75.6%), and sadness (70.7%) achieved high recognition accuracy, whereas surprise (43.4%), fear (4.4%), and disgust (4.4%) were poorly recognized. Among complex emotions, contempt (68.8%) and despair (59.0%) were moderately recognized, whereas envy (12.2%) and disapproval (10.2%) showed extremely low recognition. These findings indicate that generative AI is effective in generating clear emotions but limited in expressing subtle, context-dependent affect, highlighting the need for structured prompt design and intensity control in animation practice.

Keywords:

Animation Production, Facial Expression, Generative AI, Character, Facial emotions

키워드:

애니메이션, 감정 표현, 생성형 AI, 캐릭터, 감정 애니메이팅

Ⅰ. 서 론

1-1 연구의 필요성과 목적

4차 산업혁명의 핵심 기술인 인공지능(Artificial Intelligence)은 단순 데이터 분석을 넘어 인간의 삶에 핵심 기술로 자리매김하고 있다[1]. 특히 생성형 AI는 애니메이션과 영상 콘텐츠 제작에서 ‘AI 애니메이션’이라는 새로운 장르가 형성될 만큼 기존 애니메이션 제작 방식에 혁신을 촉진하고 있다[2]. 생성형 AI의 핵심 기술인 텍스트를 이미지로 만들 수 있는(Text-to-Image) 기능은 스스로 제작자의 의도를 분석하며, 캐릭터의 감정 표현을 창작하는 수준까지 발전하고 있다. 산업계에서는 애니메이션과 영상 콘텐츠 제작에서 새로운 장르와 기법을 열어가는 핵심 도구로 자리 잡고 있다[3].

그러나 현시점에서 AI가 원하는 장면을 생성하기 위해 프롬프트(Prompt)에 넣는 단어의 조합을 이용해야 하며, 감정을 정확하게 해석하고 표현하기 위해서는 한계가 있어 지속적으로 연구가 필요하다[4].

본 연구에서는 폴 에크만(Paul Ekman)의 FACS(동작 코딩 시스템, Facial Action Coding System)[5]와 로버트 플루칙(Robert Plutchik)의 감정의 바퀴(Wheel of Emotions) 이론[6]을 바탕으로, 애니메이션을 위한 생성형 AI가 제작한 캐릭터 표정에 대한 사용자의 감정 인식 정확도와 전달력을 분석하였다. 에크만의 FACS는 얼굴 근육 단위에 근거한 객관적 분석 기준을 제공하며, AI가 생성한 표정의 구조적 타당성을 평가하는 기반이 된다. 플루칙의 이론은 복합적 감정 구조를 설명하는 장점이 있어[7], 두 이론의 결합을 통해 기본 감정과 복합 감정의 표현을 강도 변화까지 동시에 검증할 수 있다는 점에서 연구 목적에 적합하다. 이러한 분석을 통해 생성형 AI의 감정 표현 수준을 진단할 뿐만 아니라, 애니메이션 제작 현장에서 AI 기반 표정 생성의 실무 활용 가능성을 제시하고자 하였다.

1-2 연구의 범위 및 방법

본 연구는 생성형 AI가 표현한 감정 표정을 인간 사용자가 어떻게 인식하는지를 실증적으로 분석하였으며, 특히 감정 인식의 정확도, 자연스러움, 전달력, 강도 등 네 가지 지각 요소를 중심으로 평가하였다.

1) 이론적 기반 및 감정 체계 구축

선행 연구를 통해 FACS와 감정 바퀴 이론을 결합하여 연구 프레임워크를 구축하였다. FACS 매뉴얼에서 제시하는 얼굴 부위별 동작 단위(Action Unit, AU)를 기반으로 프롬프트 설계 기준을 선정하였으며, 감정 심리학 문헌 고찰을 통해 기본 감정 6종(기쁨, 슬픔, 분노, 공포, 놀람, 혐오)과 복합 감정 6종(경외, 반감, 경멸, 절망, 질투, 자부심)을 도출하였다. 기본 감정은 약(Low)·중(Medium)·강(High)의 3단계 강도로 변주하여 총 24개의 실험 자극을 설계하였다.

2) 실험 표본 생성 프로토콜

실험 절차는 다음과 같은 절차로 이루어졌다. 먼저 Midjourney (v6.0)를 이용하여 FACS 기반 프롬프트가 의도한 AU를 정확히 구현하는지 교차 검증하였다. 영상 검증을 위한 모델테스트로는 Hailuo AI, Kling AI, Sora, Runway를 사용하였고, 그 결과 정교한 표정 생성을 지원하는 프로그램으로 평가받으며[8] 캐릭터 외형 일관성과 AU 반영 정확도에서 가장 우수한 Kling AI를 채택하였다. 그다음 FACS 기반 분류 체계를 적용하여, 영역별 움직임을 감정 프롬프트 설계 기준으로 선정하였다. 각 감정조합에 대해 약 5초 길이의 영상을 생성하였으며, 모든 프롬프트에 기준 이미지를 레퍼런스로 주입해 손발 동작을 제한하고 표정만을 집중하여 촬영하였으며, 불필요한 배경·소품 묘사를 배제하고 얼굴 중심으로 각 조합당 프롬프트를 3회씩 입력하였다. 이후, 조합당 1개씩 Midjourney 교차 검증 결과와의 시각적 일치도, 프롬프트에 명시된 모든 AU의 완전한 구현 여부, 캐릭터 외형의 일관성 유지를 근거하여 총 24개의 대표 영상을 선별하였다. 생성된 표정은 온라인 설문 플랫폼을 통해 205의 응답자에게 설문하였다 (유효 응답 201건, 98.0%).

본 연구는 생성형 AI가 출력한 표정에 대한 사용자 인식 패턴을 분석함으로써, AI 기반 감정 표현의 강점과 한계를 실증적으로 규명하고자 하였다. 연구 결과는 애니메이션 제작 현장에서 생성형 AI를 활용한 감정 표현 프롬프트 설계 및 강도 제어의 실무적 가이드라인을 제공할 것으로 기대된다. 나아가 AI 애니메이션의 감정 표현 정교화를 통해 창작자의 제작 시간 및 노동력을 절감하고, 인간과 AI가 소통하는 인터랙티브 애니메이션의 감정 몰입도를 향상하는 데 기여할 수 있을 것이다.


Ⅱ. AI와 애니메이션의 감정 표현

2-1 생성형 AI의 이미지 구현

생성형 AI가 이미지를 생성하는 원리는 크게 학습 단계와 생성 단계 두 가지로 이루어진다. 학습 단계에서는 대규모 이미지 데이터 세트를 분석하여 패턴과 특징을 학습하고, 생성 단계에서는 학습된 정보를 바탕으로 사용자의 텍스트 입력에 따라 새로운 이미지를 만들어낸다[9]. 이렇게 이미지 구축에 사용되는 프롬프트를 어떻게 구성하느냐에 따라 만들어지는 이미지의 성격이 천차만별로 생성된다. 조유석은 디자이너들이 더욱 정교한 결과물을 만들어 낼 수 있도록 프롬프트의 기본 구성 체계를 구체화하였다[10].

이러한 프롬프트 활용은 단순한 사물 묘사를 넘어, 감정 표현에도 정교하게 적용될 수 있다. Yunlong Wang은 감정 표현이 내포된 프롬프트를 자동으로 편집 및 개선하는 방식이 이미지 생성의 정밀도와 감정 전달 효과를 유의미하게 높인다고 하였다[11]. 이 방법은 Kling AI, Sora, Veo3 등 영상 결과물을 주로 하는 모델들에서도 확장되어 활용되었다.

2-2 표정 애니메이션의 원리와 감정 분류

1) 표정 애니메이팅을 위한 감정의 조합

애니메이션에서 표정은 캐릭터의 내적 상태를 관객에게 효과적으로 전달하는 핵심 요소로, 정교한 얼굴 움직임 묘사가 필수적이다. 에크만은 기쁨, 슬픔, 분노 등 여섯 가지 기본 감정을 제시하며 표정의 보편적 단서를 규명했고[12], 이를 바탕으로 FACS를 이용해 안면 근육의 움직임을 세분화하여 각 감정이 어떤 근육의 물리적 조합으로 드러나는지를 정량적으로 체계화했다[5]. 김미숙 역시 이마, 눈, 입 주변 등 영역별 근육 작용이 감정별 표정의 차이를 결정한다고 분석하며, 이러한 기계적 조합의 중요성을 뒷받침했다[13]. 나아가 플루칙의 이론을 통해 감정이 단일하고 고정된 상태가 아니라, 서로 다른 감정이 상호작용하고 결합하며 복합적인 정서를 형성한다고 설명했다[6]. 이는 표정 표현이 단순히 안면 근육의 조합을 넘어, 감정 자체의 심리적 조합에 기반을 둔다는 점을 나타낸다. 즉, 감정은 이산적 범주를 넘어 연속적이고 다차원적인 구조를 가지며, 이는 인간의 실제 감정 경험이 지닌 복잡성을 반영한다.

2) 생성형 AI와 애니메이터의 감정 표현 접근법 비교

생성형 AI와 인간은 감정을 인식하고 표현하는 방식에서 근본적인 차이를 가진다. 생성형 AI는 대규모 학습 데이터로부터 감정과 그에 상응하는 표정, 색감, 구도 등의 시각적 패턴을 통계적으로 학습한다. 예를 들어 “슬픔”이라는 키워드를 입력받았을 때, 과거에 학습한 슬픔 관련 이미지들에서 공통으로 나타난 시각 요소, 예컨대 ‘처진 눈꺼풀, 파란색 계열의 조명, 어두운 조명’ 등을 조합하여 해당 감정에 대응하는 표정을 생성한다. 그리고 애니메이션으로 발동될 시, 기준이 되는 이미지를 기반으로 동화가 형성된다. 이 과정은 전적으로 패턴 기반의 확률적 재구성에 의존하며, 생성 결과는 입력된 프롬프트의 해석 범위와 학습된 통계에 따라 결정된다.

반면, 인간 애니메이터는 감정을 단순히 패턴으로 재현하지 않고 ‘연기(Acting)’ 원칙을 적용하여 서사와 맥락 속에서 감정을 구축한다. 동일한 감정을 표현할 때도 캐릭터의 상황, 대사, 장면의 흐름을 고려해 표정을 설계하며, 이는 근육의 움직임을 기계적으로 모사하기보다 시간적 변화와 미묘한 전환을 통해 살아있는 듯한 감정을 창조한다. 예컨대 “슬픔”을 표현할 때, 단순히 눈꼬리를 내리거나 입꼬리를 처지게 하는 데 그치지 않고, 인물의 호흡, 눈동자의 초점 변화, 감정이 점차 고조되거나 억제되는 리듬을 함께 설계한다. 이러한 방식은 감정이 정적인 이미지가 아니라 연속적 움직임 속에서 드러나는 동세(動勢, dynamic motion)라는 점에서 AI의 통계적 생성과 본질적으로 다르다.

이러한 차이를 바탕으로 본 연구는 이러한 분석을 통해 생성형 AI의 감정 표현 수준을 진단하기 위해, 감정 인식률(Recognition Rate), 강도(Intensity), 자연스러움(Naturalness), 전달력(Clarity)의 네 가지 지각 요소를 평가 기준으로 설정하였다.


Ⅲ. AI 캐릭터 얼굴 감정 표현 프롬프트

3-1 프롬프트를 위한 감정 적용

본 연구는 산업 현장에서 애니메이션 제작과 AI 영상 생성에 직접 종사하고 있는 전문가 2인의 자문을 통해 연구 파이프라인을 보완하였다. 전문가 A(애니메이션 PD, 30년 이상 경력)는 AI 감정 표현의 한계가 명령의 모호성에서 비롯됨을 지적하며, 감정 데이터 구축 시 명확한 지시어 체계화와 프롬프트 구조의 일관성과 필요성을 강조하였다. 전문가 B(애니메이터, 8년 이상 경력)는 복합 감정이 단일 이미지만으로는 내재적 모호성으로 인해 해석이 달라지므로, 표정 애니메이팅의 핵심은 서사적 맥락과 감정의 연결성을 전제로 해야 함을 강조하였다. 이에 따라 본 연구는 AI 영상 생성 툴마다 도덕적·창의적 성향이 상이하다는 점을 고려하여, 복합 감정의 미묘한 표현을 안정적으로 제어하고 캐릭터의 형태 일관성을 유지할 수 있는 기준 모델을 구축하였다. 또한, FACS와 플루칙 감정 이론 기반의 정량적·정성적 설문을 병행하는 방식으로 ‘기초 파이프라인 구축 → 감정 체계 설정 → 표본 실험 → 비교·분석’의 4단계 연구 설계를 수립하였다.

감정 체계는 에크만의 기본 감정 이론과 FACS 매뉴얼에서 제시된 각 AU의 해부학적 정의를 기반으로 감정 표현 프롬프트를 구축했고[12] 여섯 가지 기본 감정(기쁨, 슬픔, 분노, 공포, 놀람, 혐오)의 표정 패턴을 구현하였다. 특히 본 연구에서는 FACS의 감정의 핵심 AU 조합에 따른 얼굴 부위별 서술을 중심으로 ‘동작 단위(Action Unit)’응용하였다. 또한 ‘강도 척도(Intensity Scale)’는 동일 AU 조합 내에서 근육 수축 정도만을 조절하는 방식으로 적용하여, 각 감정을 약(弱)·중(中)·강(强) 세 단계로 나누었다. 예컨대 ‘기쁨’의 경우 AU6(볼 근육)과 AU12(입꼬리 상승)과 강도를 나타내는 수식어(예: slightly, moderately, intensely)의 활성 강도를 조합해 단계별 차이를 설정하였다.

한편, 표현할 감정의 기준으로는 AI 기반 감정 표현의 정확성과 실용성을 평가하기 위해 에크만의 기본 감정 이론[12]과 플루칙의 감정 바퀴 모델[7]을 종합적으로 적용하였다. 에크만이 제시한 여섯 가지 기본 감정(기쁨, 슬픔, 분노, 공포, 놀람, 혐오)을 중심으로 각각의 강도별 변주를 주어 프롬프트를 구성하였으며, 플루칙 이론을 바탕으로 기본 감정의 조합으로 도출되는 ‘경외’, ‘반감’, ‘경멸’, ‘절망’, ‘질투’, ‘자부심’ 등 복합 감정 6가지를 추가 선정하였다. 복합 감정의 AU 조합은 에크만의 FACS에서 제시된 기본 감정별 핵심 AU를 그대로 적용한 것이 아니라, 플루칙의 감정 바퀴에서 제시하는 감정 조합 관계(Fear+Surprise 등)를 바탕으로 두 기본 감정의 AU를 저강도로 통합하였다.

복합 감정의 AU 재구성 원리는 두 기본 감정에 공통으로 관여하는 AU를 중심으로 우선 추출한 뒤, 각 감정의 핵심 AU 중 강도 변화에 민감한 항목을 저강도로 통합하는 방식으로 이루어졌다. 예컨대 ‘경외(Awe)’는 공포와 놀람의 공통 요소인 AU1+2(눈썹 상승)를 기본으로 하고, 공포 특유의 긴장 AU5 (상안검 상승)과 놀람의 AU26(턱 하강)는 저강도로 결합하여 두 감정의 방향성을 유지하되 과도한 왜곡을 방지하는 형태로 조정하였다. 이 과정에서 두 감정의 AU의 방향이나 범위가 충돌할 경우, FACS에서 제시하는 ‘넓은 범위 AU의 우세성(broader area activation dominance)’ 원칙[14]를 적용하여, 더 큰 운동 범위를 가진 AU가 작은 AU를 흡수하는 방식으로 통합하였다. 예를 들어 슬픔의 AU1(inner brow raise)과 놀람의 AU1+2(full brow raise)이 결합하는 경우, 두 AU는 독립적으로 표현되지 않고 AU1+2와 같이 더 넓은 영역을 활성화하는 AU로 통합된다. 이러한 방식으로 각 복합 감정에 대해 두 기본 감정의 핵심 AU를 과도하게 중첩하지 않는 범위에서 통합하여, 본 연구의 목적에 부합하는 조작적 기준을 마련하였다.

3-2 표본 설정

본 연구는 실험의 표준화와 감정 표현의 정확성을 위해 Pixar 하우스 스타일의 미국 애니메이션 스타일의 3D 아바타 모델을 기준 캐릭터로 선정하였다. 픽사 애니메이션이 감정 과학자 폴 에크만의 직접적인 자문을 받아 제작된 <Inside Out>에서, 과학적으로 검증된 감정 표현 원칙을 애니메이션에 적용한 선례가 있기 때문이다[5]. 이는 본 연구에서 적용하고자 하는 감정 분석 방법론과 이론적 일관성을 갖는다.

AI 모델의 표본 엔진 선별 과정에서는, 정밀한 묘사 능력이 검증된 Midjourney를 이용하여[15] 프롬프트의 적합성과 감정 표현의 정확도를 교차 검증하였다. 이후 검증된 프롬프트 중 일부 감정을 선정하여, 여러 영상 생성형 AI 엔진에 동일한 프롬프트를 입력하고 결과물을 비교하는 사전 테스트를 하였다. 그 결과 Kling AI가 Pixar 스타일의 3D 캐릭터 외형을 안정적으로 유지하면서도 AU 서술에 따른 표정 변화를 가장 정확하게 반영하고, 동일 프롬프트에 대한 반응 편차가 가장 적은 것으로 나타났다. 또한 동일 캐릭터를 기준으로 여러 감정·강도 표정을 반복 생성할 수 있어 본 연구와 같이 감정 간 인식 차이를 비교하는 실험 설계에 가장 적합하다고 판단하였다. 이에 본 연구에서는 최종 표본 생성 엔진으로 Kling AI를 선정하였다. 본 연구에서 Kling AI는 실험 수행 시점에 사용 가능한 버전(video model 2.1)을 기준으로 활용하였으며, 이후 업데이트된 버전은 본 연구의 분석 범위에 포함하지 않는다.

Experimental emotion types

3-3 프롬프트 적용 및 생성 결과 관찰

1) 기쁨

기쁨은 전반적으로 표정의 일관성이 드러나 있다. ‘약’ 단계는 눈꼬리의 이완, 미소가 거의 드러나지 않는 입 주변 등으로 인해 편안함이나 가벼운 만족감에 가까운 정서를 드러낸다. ‘중’ 단계는 입꼬리의 상승과 눈의 개방 정도가 더 뚜렷해졌지만 중간 강도에서 표현한 구분이 상대적으로 약화하는 경향이 나타났다. 반면 ‘강’ 단계에서는 입이 넓게 열리며 이가 드러나고 눈꼬리가 강하게 들려 전형적인 웃음 표정이 구현되어, 다소 강하게 인지가 되었다.

Joy expression (low/medium/high)

2) 분노

분노 표현 역시 감정의 점진적 변화를 효과적으로 구현할 수 있음을 보였다. 상부 영역의 눈썹 안쪽 하강, 안와 영역의 눈 크기와 모양 변화, 중부 영역의 볼과 코 부분 긴장감, 하부 영역의 입 모양 변화가 단계별로 자연스럽게 구현되었으며, 특히 약한 강도에서 강한 강도로의 증진이 인간의 분노 표현 패턴과 유사하게 보였다.

Anger expression (low/medium/high)

3) 슬픔

슬픔의 시각적 구현 과정에서는 다소 예외적인 양상이 나타났다. 초기 교차검증을 위해 Midjourney 기반 이미지 생성을 수행했을 때, ‘울음을 억제하거나 감정을 숨기는’ 표정이 반복적으로 출력되는 경향이 관찰되었다. 이 현상은 Kling 에서도 동일하게 나타났다. 특히 강도를 높여 통곡하는 수준의 프롬프트를 묘사하여도 눈물을 충분히 구현하지 못하고 하관 부분은 턱이 떨리는 움직임을 보이지만 눈에는 눈물기가 없는 등 슬픔의 정도가 지나치게 절제되거나 다르게 묘사되는 현상이 반복되었다.

Sad expression (low/medium/high)

이러한 경향은 생성형 AI 모델의 학습 데이터 분포 편향으로 해석될 수 있다. 생성형 AI 모델은 인터넷에서 무작위로 수집된 대규모 데이터셋을 기반으로 학습되며, 이 과정에서 데이터에 내재한 편향된 표현 패턴이 생성 결과에 반영될 수 있다[16]. 이러한 원리를 고려할 때, 미디어 환경에서 유통되는 슬픔 관련 이미지에 절제된 표현이 상대적으로 많을 경우, 모델이 억제된 슬픔 패턴을 높은 확률로 출력하는 편향이 발생했을 가능성이 있다.

4) 놀람, 공포, 혐오

놀람, 공포, 혐오의 감정은 각 감정 간의 구분이 명확하지 않고 차이를 구별하여 구현하는 데 일부 한계를 보였다. 예를 들어, 놀람에서는 상부 영역의 눈썹 상승, 안와 영역의 눈 확장, 하부 영역의 입 벌어짐이 적절히 표현되었으나 혐오 등의 감정이 혼재되어 표정의 뚜렷함이 떨어지는 모습을 보였다. 혐오 역시 하관의 일그러짐이나 눈썹의 비대칭 등 특정 표현 요소는 나타났으나, 강도별 표정 변화는 제한적이었다.

Surprise, fear, disgust expression (low/medium/high)

5) 복합 감정

복합 감정의 시각적 구현을 위해, 각 감정은 해당하는 두 가지 기본 감정의 프롬프트를 혼합하는 방식으로 구성하였다. 여기에 더해 감정의 의미적 맥락을 강화하기 위해 사전적 정의와 감정에 대한 정서적 서술을 프롬프트에 함께 포함했다. 결과는 전반적으로 기본 감정에 비해 표현력이 비교적 준수한 것으로 나타났다. 이는 두 가지 기본 감정을 혼합한 프롬프트 구성이 감정의 다층적 구조를 더욱 풍부하게 반영했기 때문으로 해석할 수 있으나, 상황 표현에 대한 이해도에 따라 공감 여부가 달라질 가능성도 있을 것으로 사료된다.

Complex emotion expression

지금까지의 결과로 봤을 때, 기본 감정 중 ‘기쁨’, ‘분노’는 비교적 뚜렷하게 표현되었으나, 슬픔의 경우 특이한 현상이 관찰되었는데, 강한 프롬프트에도 불구하고 지속적으로 ‘감정을 억제하는’ 표정을 생성하는 경향을 보였다. ‘놀람’, ‘공포’, ‘혐오’ 등은 강도나 명확성 측면에서 다소 약하게 나타났다. 복합 감정은 기본 감정을 혼합하고 서술형 묘사를 덧붙인 프롬프트를 통해 전반적으로 나쁘지 않은 표현력을 보였으나, 상황적 맥락 이해도에 따라 관찰자의 공감 여부가 달라질 가능성이 높다.


Ⅳ. AI 캐릭터 표정에 대한 사용자의 감정 인식 조사

본 결과물의 평가 지표를 위해, 생성형 AI 콘텐츠가 대중 매체에서 광범위하게 소비되고 있음을 고려하여, 연령, 직업 등 다양한 배경의 일반 사용자 205명을 대상으로 모집하였다. 참여자의 인구통계학적 특성은 표 7과 같다.

Participant characteristics

설문은 2025년 7월 20일~ 7월 23일 약 나흘간 온라인으로 진행되었으며, 구글 폼(Google Forms)을 통해 수집하였다. 응답 완료율 및 일관성 검토를 거쳐 전체 문항의 50% 이상 미응답을 제외한 유효 응답 201부(98.0%)를 분석 대상으로 선정하였다. 표 8표 9의 감정 인식 결과는 유효 응답 201건을 기준으로 분석한 결과이다. 진행된 설문은 정량 문항으로 구성되었으며 각 표정에 대한 감정 인식 여부(Recognition), 감정 강도의 인지(Intensity), 자연스러움(Naturalness), 감정 전달력(Clarity)을 평가하도록 설계하였다. Recognition Rate(%)는 유효 응답자 201명 중 해당 감정을 정확히 인식한 비율을 나타내며, Intensity, Naturalness, Clarity는 5점 리커트 척도(1=매우 낮음, 5=매우 높음)로 측정한 평균값이다. 또한 개방형 주관식 문항을 포함하여, 주관식 질문에서는 특정 감정을 인식한 이유를 중심으로, 표정 해석에 활용된 시각적 단서나 혼란을 유발한 요소 등을 기술하도록 구성되었다. 이를 통해 사용자 판단 과정에 대한 질적 근거를 확보할 수 있었으며, 단순한 인식 정확도뿐 아니라 어떤 표정 요소가 주요 판단 기준으로 작용했는지, 그리고 감정 전달의 자연스러움과 몰입감이 어떠한 방식으로 평가되었는지를 종합적으로 분석할 수 있었다.

Basic emotion expression(N=201)

Complex emotion expression(N=201)

4-1 기본 감정

사용자 인식률 분석 결과, 표 8에 제시된 바와 같이 기쁨(76.6%)과 분노(75.6%)가 가장 높은 인식률을 보였으며, 슬픔 표정은 AI 생성 과정에서 눈물과 같은 표현이 절제되었음에도, 사용자 인식률은 70.7%로 비교적 높게 나타났다. 반면, 놀람(43.4%)은 중간 수준의 인식률을 보였으며, 공포(4.4%)와 혐오(4.4%)는 매우 낮은 인식률을 나타냈다. 공포의 경우 응답자의 31.7%가 다른 감정과 혼합된 표정으로 인식하였고, 27.3%는 감정을 명확히 구분하지 못한 것으로 나타났다. 혐오는 35.1%가 놀람으로 오인하였고, 31.2%가 혼합된 감정으로 인식하였다. 이는 AI가 생성한 공포와 혐오 표정이 각각 슬픔 및 놀람의 시각적 특징과 중첩되어 응답자가 명확히 구분하기 어려웠기 때문으로 해석된다. 놀람의 경우 43.4%의 인식률을 보였으며, 32.2%가 다른 감정과 혼합된 것으로, 18%가 불명확하다고 응답하였다. 이러한 결과는 부정적 감정군(공포, 놀람, 혐오) 전반에서 AI 생성 표정이 감정 간 경계가 모호하게 표현되는 경향이 있음을 나타낸다.

참여자들의 개방형 응답에서는 기쁨과 분노를 구분할 때 주로 “입꼬리의 방향과 볼의 부피 변화”, “눈가 주름 및 눈매의 긴장도”를 핵심 단서로 사용한다고 응답하였다. 슬픔의 경우 “눈꺼풀이 처지면서 시선이 아래로 떨어지는 점”, “입꼬리가 아래로 끌려 내려가는 느낌”이 반복적으로 언급되었다. 한편, 공포와 놀람은 “눈이 과도하게 커져 두 감정을 구분하기 어렵다”, “턱이 크게 떨어져 놀람처럼 보인다”라는 의견이 다수 제기되어, 두 감정 간 변별력을 충분히 제공하지 못했음을 확인할 수 있었다. 혐오 표정에 대해서는 “코주름과 입 주변 긴장은 잘 보이지만, 전체 인상이 과장되어 보인다”라는 피드백이 관찰되었고, 이는 부정 감정 전반에서 ‘강도 과잉’과 ‘자연스러움 저하’가 동시에 작동하고 있음을 보여준다.

4-2 복합 감정

복합 감정에 대한 인식률 분석 결과(표 9 참조), 경멸(Contempt)이 68.8%의 인식률로 가장 높았고, 절망(Despair) 59.0%가 그 뒤를 이었다. 반면, 반감(Disapproval) 10.2%와 질투(Envy) 12.2%는 매우 낮은 인식률을 보여, 감정 조합에 따라 지각 편차가 크게 나타났다. 특히 복합적으로 표현된 표정에 대해서는 ‘잘 모르겠다’라는 응답이 다수 확인되었으며, 질투의 경우 49.3%가 감정을 전혀 식별하지 못한 것으로 나타나, 감정 간 경계의 모호성과 복합 해석의 어려움을 확인하였다.

참여자들의 판단 근거를 분석한 결과, 참여자들은 복합 감정을 해석할 때도 눈의 시선 방향, 눈썹의 기울기, 입꼬리 등의 기본 감정과 동일한 단서를 활용하였으나, 두 감정 단서 간 불일치나 강도 과잉이 혼란 요인으로 작용한 경우도 나타났다. 예를 들어, 경멸(Contempt, 68.8%)이 가장 높은 인식률을 보인 것은 “미간 찌푸림(분노 요소)”과 “코주름(혐오 요소)”이 시각적으로 강하게 결합해, 두 가지 감정의 특징이 상호 강화(reinforcement) 효과를 낸 것으로 해석된다. 참여자들은 분노(89.3%)와 혐오(44.9%)의 특성을 동시에 인식하였으며, 이는 두 AU 조합이 명확하게 구현되었음을 의미한다. 자부심(Pride, 29.8%)의 경우, “입은 웃고 있으나(기쁨 요소) 눈썹은 부정적(분노 요소)”이라는 판단 근거가 나타났으며, 이는 자부심 = 분노 +기쁨 조합의 설계 의도와 일치한다. 참여자들은 두 가지 상반된 표정 단서를 동시에 포착하여 복합 감정으로 해석하였다. 그러나 이 표정에서 혼동을 느껴 19.5%는 놀람으로 인식하는 현상이 일어났다.

질투는 “하향하는 시선” 등의 슬픔의 특징은 인식했으나 “무슨 반응인지 이해하지 못함”이라는 응답이 많았다. 이러한 결과는 복합 감정 인식에서 기본 감정의 전형적 표정 단서가 '해석의 앵커(interpretive anchor)' 역할을 하며, 사용자는 이를 조합하여 보다 복잡한 감정을 추론한다는 것을 시사한다. 다만, 두 기본 감정을 취합하는 과정에서 혼란 요인으로 작용하는 경우도 발생하였다.

전체 설문 결과를 종합하면, 생성형 AI가 표현한 감정은 전반적으로 중간 이상의 수용 가능성과 자연스러움을 보였으나, 여전히 개선이 필요한 영역이 존재함이 확인되었다. 응답자들이 가장 구분하기 어려웠던 요소는 ‘감정 강도 구분(약·중·강)’이 48.3%로 가장 많았으며, 그 외에도 ‘전체 표정의 느낌을 읽는 방법(34.6%)’이나 ‘기본 감정 간 구분(예: 기쁨 vs 혐오)’가 33.2%로 주요 혼란 요인으로 지목되었다. 본 연구에서 감정 강도는 동일 AU 조합 내에서 프롬프트 수식어 조절을 통한 근육 수축의 정도만을 조절하는 방식으로 설계되었으나, 실제 생성 이미지에서는 단계 간 시각적 분리가 충분히 확보되지 않았고 응답자들 또한 감정 종류 자체보다 강도 구분을 가장 어려운 요소로 인식하였다.

따라서 감정 강도 분석은 이번 연구에서는 탐색적 시도로 남겨두고, 후속 연구에서는 (1) FACS AU 강도 값을 수치상으로 명시하는 구조화된 프롬프트 설계, (2) AU별 강도 제어를 지원하는 차세대 AI 모델 활용, (3) 시간적 변화(타이밍, 속도)를 포함한 동적 표정 설계를 통해 보다 정교한 강도 차이를 구현할 필요가 있다. 추가로 AI의 감정 표현이 향후 개선된다면 ‘상황이나 맥락을 반영한 감정 생성(예: 기쁜 이유, 슬픈 이유)이 보완’이 가장 높은 비율(48.3%)로 언급되었고, 그 외에도 ‘보다 정교한 안면 근육 표현’(42.0%), ‘감정 강도 표현의 다양화’, 등의 의견이 제시된 만큼, AI 감정 표현이 단순한 표정만을 보여주는 것이 아니라 스토리텔링 맥락과 감정 스펙트럼에 대한 종합적 상황이 고려된 연구가 필요하다.


Ⅴ. 결 론

본 연구는 생성형 AI가 표현한 얼굴 표정이 실제 사용자에게 어떻게 인식되는지를 검증하기 위해 첫째, 폴 에크만의 FACS와 플루칙의 감정 이론을 기반으로 감정 범주와 AU 조합을 체계화하여 프롬프트 설계 기준을 마련하였다. 둘째, 해당 기준을 적용해 기본 감정과 복합 감정을 각각 약·중·강의 세 단계로 구성하고, 동일한 3D 캐릭터 스타일을 유지한 총 24개의 AI 표정을 생성하였다. 셋째, 205명의 온라인 설문 중 201건의 유효 응답(98.0%)을 바탕으로, 생성형 AI가 표현한 24개 감정 표정의 인식 정확도와 전달력을 분석하였다. 설문 결과, 기본 감정의 경우 기쁨 76.6%, 분노 75.6%, 슬픔 70.7%로 높은 인식률을 보였지만, 놀람 43.4%, 공포 4.4%, 혐오 4.4%는 매우 낮은 인식률을 기록하였다. 복합 감정에서는 경멸 68.8%, 절망 59.0%, 경외 36.6%, 자부심 29.8%로 중간 수준의 인식을 보였으나, 질투 12.2%, 반감 10.2%는 매우 낮게 인식되었다. 또한 참가자들은 눈썹의 기울기, 입꼬리의 방향 등 표정의 흐름이나 변화를 통해 유추하려 했으며, 감정 강도 구분에는 가장 큰 어려움을 느끼는 것으로 나타났다.

이러한 결과는 생성형 AI가 표면적 감정 묘사에는 일정 수준 도달했지만, 맥락적 해석과 복합적 감정의 심리적 깊이를 구현하는 데에는 추가적인 연구와 기술 개선이 필요함을 확인하였다. 특히 감정 강도 조절을 프롬프트에만 의존하면서 타이밍, 맥락, 속도, 미세 동작 등 애니메이션 고유 요소까지는 분석 범주에서 제외되어 실제 애니메이션에서 활용되는 복잡한 문맥 기반의 표현까지는 반영하지 못한 한계가 있다. 특히 슬픔과 같은 감정에서 관찰된 억제 표현 경향은 프롬프트 설계의 문제를 넘어 학습 데이터의 분포 편향에서 비롯된 것으로 해석되며, 이는 본 연구가 수행된 시점(2025년 7월)의 기술적 조건을 반영한 결과임을 밝혀둔다. 또한 본 연구는 탐색적 성격의 기술통계 분석을 중심으로 수행되었으며, 감정별 인식률 및 평가 점수 차이에 대한 추론통계적 검정은 포함하지 않았다. 이는 단일 AI 모델과 특정 캐릭터 스타일로 한정된 실험 조건, 특정 시점(2025년 7월)의 기술 수준 기록이라는 연구 특성, 빠르게 변화하는 AI 기술의 일반화 가능성 제한을 고려한 결정이다. 따라서 본 연구에서 관찰된 차이가 통계적으로 유의한지는 확인되지 않았으며, 결과 해석은 기술적 경향성 수준에 국한된다. 향후 연구에서는 표본 크기 확대 및 통계적 검정을 통해 일반화 가능성을 검증할 필요가 있다.

향후 연구에서는 AU 강도와 서사적 맥락을 반영한 프롬프트 설계 정교화를 통해 애니메이션 실무에서 활용할 수 있는 AI 표정 라이브러리로 확장해 나갈 필요가 있다. 특히 단일 성별(남성 외형)의 Pixar 스타일 3D 캐릭터 1종만을 사용하여 제작하였으므로, 캐릭터의 성별, 연령, 외형 스타일, 문화적 배경 등이 감정 인식에 미치는 영향을 검증하지 못하였다. 후속 연구엔 (1) 성별·연령대별 캐릭터 다양화, (2) 2D 셀 애니메이션·리얼리스틱 렌더링 등 다양한 스타일 비교, (3) 문화권별 표정 해석 차이 검증 등을 통해, 생성형 AI 기반 감정 표현의 보편성과 특수성을 종합적으로 규명할 필요가 있다. 이러한 요소를 종합적으로 고려하여 더 다양한 사용자를 대상으로 감정 해석 차이를 고려한 실험 설계가 이루어진다면, AI 기반 애니메이션의 감정 표현은 보다 정밀하게 확장될 수 있을 것이다.

References

  • Ministry of Economy and Finance. Current Affairs Economic Terminology Dictionary [Internet]. Available: https://www.moef.go.kr/sisa/dictionary/detail?idx=2046, .
  • Research and Markets. GenAI in Animation Global Business Analysis Report 2025 [Internet]. Available: https://url.kr/zoc3yj, .
  • J. H. Yang and S. H. Yoon, Beyond ChatGPT to the Era of Generative AI: Cases of Media Content Generative AI Services and Ways to Secure Competitiveness, Media Issue & Trend, Vol. 55, No. 3/4, pp. 62-70, 2023.
  • Y. C. Zhang, “Research on Video Content Production Process Using Generative AI,” Journal of Communication Design, Vol. 88, pp. 316-326, July 2024. [https://doi.org/10.25111/jcd.2024.88.22]
  • Paul Ekman Group. Facial Action Coding System [Internet]. Available: https://www.paulekman.com/facial-action-coding-system/, .
  • R. Plutchik, “The Nature of Emotions: Human Emotions Have Deep Evolutionary Roots, a Fact That May Explain Their Complexity and Provide Tools for Clinical Practice,” American Scientist, Vol. 89, No. 4, pp. 344-350, July/August 2001. [https://doi.org/10.1511/2001.28.344]
  • A. Semeraro, S. Vilella, and G. Ruffo, “PyPlutchik: Visualising and Comparing Emotion-Annotated Corpora,” PLoS One, Vol. 16, No. 9, e0256503, September 2021. [https://doi.org/10.1371/journal.pone.0256503]
  • Digital Today. Generative AI ‘Kling’ Implements ‘Emotional Acting’ in Videos [Internet]. Available: https://www.digitaltoday.co.kr/news/articleView.html?idxno=566542, .
  • S. H. Lee, J. Y. Yoon, M. H. Park, J. H. Hyeong, and J. G. Ju, “Latest Trends in Text-to-Image Generation Models,” Journal of KIISE, Vol. 40, No. 12, pp. 21-30, December 2022.
  • Y. S. Cho, “A Study on the Utilization Cases of Image Generation AI for Deriving a Generative AI Prompt Structure- Focusing on Comparative Analysis of Components in Image Generation AI Prompts-,” The Journal of Brand Design Association of Korea, Vol. 22, No. 3 pp. 229-242, 2024. [https://doi.org/10.18852/bdak.2024.22.3.229]
  • Y. Wang, S. Shen, and B. Y. Lim, “RePrompt: Automatic Prompt Editing to Refine AI-Generative Art Towards Precise Expressions,” in Proceedings of the 2023 CHI Conference on Human Factors in Computing Systems, Hamburg, Germany, pp. 1-29, April 2023. [https://doi.org/10.1145/3544548.3581402]
  • P. Ekman, Universals and Cultural Differences in Facial Expressions of Emotion, in Nebraska Symposium on Motivation, Vol. 19, Lincoln, NE: University of Nebraska Press, pp. 207-282, 1972.
  • M. S. Kim, “A Study on the Facial Expressions and the Gestures of Emotion for the Character Animation I - Focusing on the Facial Expressions and the Gestures of Happiness and Sadness,” The Korean Journal of animation, Vol. 11, No. 4, pp. 23-42, September 2015.
  • P. Ekman, W. V. Friesen, and J. C. Hager, Facial Action Coding System: Investigator’s Guide, Salt Lake City, UT: Research Nexus, 2002.
  • D. M. Hanna, “The Use of Artificial Intelligence Art Generator ‘Midjourney’ in Artistic and Advertising Creativity,” The Journal of Design Sciences and Applied Arts, Vol. 4, No. 2, pp. 42-58, June 2023. [https://doi.org/10.21608/jdsaa.2023.169144.1231]
  • P. Schramowski, M. Brack, B. Deiseroth, and K. Kersting, “Safe Latent Diffusion: Mitigating Inappropriate Degeneration in Diffusion Models,” in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Vancouver, Canada, pp. 22522-22531, June 2023. [https://doi.org/10.1109/CVPR52729.2023.02157]

저자소개

김소림(Sorim Kim)

2019년:이화여자대학교 일반대학원 조형예술대학 디자인학부 미디어 인터랙션디자인 석사

2022년:Art of Academy University Visual Development M.F.A

2025년:이화여자대학교 일반대학원 조형예술대학 디자인학부 미디어 인터랙션디자인 박사 과정

2023년~현 재: 숭의여자대학교 겸임교수

2024년~현 재: 전북대학교 초빙교수

2026년~현 재: 이화여자대학교 강사

※관심분야:애니메이션, AI, 인터랙티브 아트(Interactive Art)

유현정(Hyun-Jung Yu)

1991년:이화여자대학교 미술대학 생활미술과 학사

1993년:Boston University M.F.A

2001년~현 재: 이화여자대학교 조형예술대학 디자인학부 교수

※관심분야:인터랙티브 아트(Interactive Art), 에듀테인먼트(Edutainment)

Table 1.

Experimental emotion types

Emotions Core AU Combination
Joy AU6 Cheek Raiser + AU12 Lip Corner Puller, + AU25 Lips Part
Sadness AU1 Inner Brow Raiser + AU4 Brow Lowerer + AU15 Lip Corner Depressor
Anger AU4 Brow Lowerer + AU7 Lid Tightener + AU23 Lip Tightener
Fear AU1+ 2 Brow Raise + AU4 Brow Lowerer + AU5 Upper Lid Raiser + AU20 Lip Stretcher + AU26 Jaw Drop
Surprise AU1+ 2 Brow Raise + AU5 Upper Lid Raiser + AU26 Jaw Drop
Disgust AU9 Nose Wrinkler + AU15 Lip Corner Depressor + AU16 Lower Lip Depressor
Awe=Fear+Surprise AU1+ 2 Brow Raise + AU5 Upper Lid Raiser + AU20 Lip Stretcher + AU26 Jaw Drop
Disapproval=Sadness+Surprise AU1+ 2 Brow Raise + AU5 Upper Lid Raiser + AU15 Lip Corner Depressor + AU26 Jaw Drop
Contempt=Disgust+Anger AU4 Brow Lowerer + AU7 Lid Tightener + AU9 Nose Wrinkler + AU15 Lip Corner Depressor + AU16 Lower Lip Depressor
Despair=Fear+Sadness AU1+ 2 Brow Raise + AU4 Brow Lowerer + AU5 Upper Lid Raiser + AU15 Lip Corner Depressor + AU20 Lip Stretcher+ AU26 Jaw Drop
Envy=Anger+Sadness AU1 Inner Brow Raiser + AU4 Brow Lowerer + AU7 Lid Tightener + AU15 Lip Corner Depressor + AU23 Lip Tightener
Pride=Anger+Joy AU4 Brow Lowerer + AU6 Cheek Raiser + AU7 Lid Tightener + AU12 Lip Corner Puller + AU23 Lip Tightener

Table 2.

Joy expression (low/medium/high)

Emotions Prompts

Joy(L)
a 3D animated man with a soft, subtle smile, lips slightly pulled back at the corners (AU12), cheeks gently lifted(AU6), eyes relaxed with faint narrowing, eyebrows in a neutral position, gentle joyful expression, shoulders visible

Joy(M)
a 3D animated man smiling broadly with lips pulled back upper teeth slightly visible (AU12), cheeks raised prominently (AU6), eyes narrowed with visible crow’s feet, chin relaxed, eyebrows softly curved in neutral position

Joy(H)
a 3D animated man showing big happiness with lips strongly pulled upward (AU12), lips fully pulled back exposing upper teeth, cheeks strongly raised creating deep smile lines (AU6), eyes narrowed with strong wrinkling around the corners, chin slightly lifted, eyebrows with neutral curve

Table 3.

Anger expression (low/medium/high)

Emotions Prompts

Anger(L)
a stylized 3D animation character showing mild anger, eyebrows slightly pulled down and closer together (AU4), eyes open with slight lid tightening (AU7), lips gently pressed together (AU23), subtle frown, light muscle tension in the face, controlled and restrained expression

Anger(M)
a stylized 3D animation character showing moderate anger, eyebrows clearly pulled down and drawn together (AU4), eyes narrowed with noticeable lid tension (AU7), lips pressed tightly together (AU23), visible frown lines, noticeable muscle tension in the face

Anger(H)
a stylized 3D animation character showing intense anger, eyebrows sharply pulled down and strongly knit together (AU4), eyes wide with intense hard stare (AU7), lips tightly pressed and jaw visibly tense (AU23), deep frown lines on forehead, strong overall facial tension

Table 4.

Sad expression (low/medium/high)

Emotions Prompts

Sad(L)
a stylized 3D animation character with inner eyebrows pulled upward and drawn together (AU1), upper eyelids slightly drooped with eyes looking down (AU4), lips gently parted with corners lowered (AU15), subtle tearful expression

Sad(M)
a stylized 3D animation character with eyebrows raised in the middle (AU1)and furrowed together (AU4), eyes half-closed with visible moisture or beginning tears, lip corners strongly pulled downward (AU15), mouth slightly trembling as if holding back sobs, expressive sadness

Sad(H)
a stylized 3D animation character crying intensely with inner brows raised (AU1) and pulled together (AU4), eyes squeezed shut with strong tension with tears streaming down, lip corners deeply depressed (AU15) and mouth open in sobbing, highly expressive sorrow

Table 5.

Surprise, fear, disgust expression (low/medium/high)

Emotions Prompts

Surprise(L)
a stylized 3D animation character with eyebrows slightly raised (AU1+2), upper eyelids gently lifted with eyes widened subtly (AU5), jaw barely lowered with lips softly parted (AU26), mild startled expression with light facial tension

Surprise(M)
a stylized 3D animation character with eyebrows clearly raised but not frowning (AU1+2), eyes fully widened with upper eyelids lifted (AU5), jaw dropped moderately open as if gasping (AU26), visible facial tension, startled expression

Surprise(H)
a stylized 3D animation character with eyebrows strongly raised high but not drawn together (AU1+ 2), eyes wide open with upper eyelids fully lifted (AU5), jaw dropped wide open showing teeth (AU26), intense startled expression with full facial tension

Fear(L)
a stylized 3D animation character with slightly widened eyes, upper eyelids raised (AU5), lower eyelids lightly tensed, eyebrows raised and drawn slightly together (AU1+2), jaw slightly lowered (AU26), lips gently pressed or faintly parted, subtle tension (AU20) around the mouth, expression of quiet unease

Fear(M)
a stylized 3D animation character showing clear fear, eyes wide open with raised upper eyelids (AU5) and tensed lower eyelids, eyebrows lifted high and pulled slightly inward (AU1+ 2), jaw lowered (AU26) with mouth slightly open as if gasping (AU25),lips stretched horizontally with visible tension in cheeks and jawline (AU20), startled and alert expression

Fear(H)
a stylized 3D animation character in extreme terror, eyes wide open with raised upper eyelids (AU5) and strongly tensed lower eyelids, eyebrows raised high and pulled tightly together (AU1+ 2), jaw dropped wide open (AU26) with lips stretched horizontally backward as if screaming (AU20) but not excessively wide, showing full fear and neck tension

Disgust(L)
a stylized 3D animation character showing mild disgust, eyebrows slightly lowered, subtle wrinkling on the nose bridge (AU9), lip corners slightly pulled downward (AU15), lower lip gently depressed (AU16), expression of quiet aversion

Disgust(M)
a stylized 3D animation character with nose visibly wrinkled (AU9), upper lip raised in an inverted “U” shape (AU15) and lower lip slightly protruding (AU16), eyebrows lowered and drawn inward, eyes narrowed in discomfort, clear expression of rejection or dislike

Disgust(H)
a stylized 3D animation character in intense disgust, face twisted in revulsion, nose tightly wrinkled (AU9), lip corners strongly pulled downward (AU15), lower lip deeply depressed and tense (AU16), eyebrows strongly pulled down, eyes squinting or turning away, mouth partly open with gagging tension, strong overall facial contraction

Table 6.

Complex emotion expression

Emotions Prompts

Awe
a stylized 3D animation character with an expression of awe, eyes wide open with fixed upward gaze, upper eyelids fully raised (AU5) while lower lids remain neutral, eyebrows raised but not drawn together (AU1+ 2), mouth slightly open in sort jaw drop (AU26) and faint lateral lip tension (AU20), facial muscles tense but still and absorbed in overwhelming emotion

Contempt
a stylized 3D animation character expressing contempt, eyebrows lowered (AU4) showing a unilateral sneer, eyes narrowed with lid tension (AU7), and a slightly wrinkled nose (AU9), and the lower lip pulled downward (AU16) with lip corner depressed (AU15) tightened with tension, conveying a mixture of disgust and anger.

Envy
a stylized 3D animation character showing a jealous expression, eyes narrowed slightly with a side glance (AU7), inner eyebrows lowered (AU1) and drawn together (AU4), lower eyelids slightly raised showing subtle tension, lips pressed with the corners slightly pulled downward in tension (AU15), subtle frown (AU23), visibly upset and conflicted expression combining anger and sadness

Disapproval
a stylized 3D animation character with a disappointed expression, eyes slightly widened (AU5), mouth slightly open then closed with lips turned down (AU15)with little jaw drop (AU26), eyebrows raised (AU1+2)with subtle frown, expression showing crushed expectations

Despair
a stylized 3D animation character showing devastation, with eyebrows raised (AU1+2) but slightly drawn together by a mild (AU4) activation, upper eyelids lifted (AU5) with tears streaming down and frozen in shock, lip corners subtly depressed (AU15) while the mouth is stretched and dropped open (AU20 + AU26), facial muscles collapsed in grief and fear

Pride
a stylized 3D animation character with a proud expression, eyebrows slightly raised and firm (AU4), tight confident eyes looking forward (AU7), cheeks lifted with gentle tension (AU6), mouth forming a subtle satisfied smile (AU12), jaw slightly tightened to convey self-assurance (AU23), expression combining confidence and joy

Table 7.

Participant characteristics

Category Subcategory N %
Gender Male 94 45.9
Female 108 52.7
Other 3 1.4
Age 10-19 7 3.5
20-29 66 32.2
30-39 63 30.7
40-49 37 18
50+ 32 15.6
Occupation Employed 114 55.6
Student 38 18.5
Homemaker 12 5.9
Self-employed/business owner 6 2.9
Professional 5 2.5
Freelance 6 2.9
Public sector employee 6 2.9
Unemployed 18 8.8
Animation Career related Experience Yes 41 20
No 164 80

Table 8.

Basic emotion expression(N=201)

Emotions Recognition Rate (%) Emotion Recognition Cues Key Reasons for Judgment Level Intensity Naturalness Clarity
Joy 76.6% Lip Corner Movement (72.2%)
Eye and Eyebrows (57.6%)
Overall Muscle Tension (29.8%)
1. Upturned lips
2. Feeling of looking happy
2. Eyes and mouth are smiling
L 2.94 3.26 3.25
M 2.94 3.27 3.20
H 4.02 3.14 3.79
Sadness 70.7% Eye and Eyebrows (68.3%)
Lip Corner Movement (39.5%)
Overall Muscle Tension (35.6%)
1. Drooping eyebrows
2. Shape and direction of eyes
3. Sad mood
L 2.90 3.19 3.19
M 3.20 3.46 3.40
H 3.37 3.36 3.43
Disgust 4.4%
Surprise (35.1%)
Mixed (31.2%)
Eye and Eyebrows (62.9%)
Overall Muscle Tension (46.8%)
Lip Corner Movement (39%)
1.Furrowed glabella
2. Widened eyes
3. Unclear emotion
L 2.87 3.12 3.06
M 3.51 3.43 3.44
H 3.22 3.28 3.21
Anger 75.6% Eye and Eyebrows (59.5%)
Lip Corner Movement (55.6%)
Overall Muscle Tension (50.7%)
1. Strong mouth movement
2. Furrowed eyebrows
3. Facial tension
L 2.93 3.17 3.06
M 3.46 3.48 3.50
H 3.97 3.50 3.83
Surprise 43.4%
Mixed (32.2%)
Unclear(18%)
Eye and Eyebrows (62%)
Overall Muscle Tension(50.7%)
Lip Corner Movement (46.3%)
1. Widened eyes
2. Unclear Emotion
3. Facial Tension
L 2.88 3.17 2.95
M 3.27 3.25 3.22
H 3.74 3.31 3.49
Fear 4.4%
Mixed (31.7%)
Unclear(27.3%)
Eye and Eyebrows (58.1%)
Overall Muscle Tension (44.9%)
Lip Corner Movement (40%)
1. Complex Appearance
2. Sad and shaky eyes
3. Suppression of lip muscles
L 2.82 3.04 2.93
M 3.04 3.17 3.00
H 3.33 3.12 3.07

Table 9.

Complex emotion expression(N=201)

Emotions Recognition Rate (%) Inferred Compositon Key Reasons for Judgment Naturalness Clarity
Awe 36.6% Surprise (77.6%)
Sadness (32.7%)
Fear (14.1%)
1. Gaze expansion and pupil movement
2. Eyebrow changes and furrowing
3. Mouth opened and mouth corner changes
3.45 3.35
Disapproval 10.2% Sadness (64.9%)
Surprise (44.4%)
1. Eyes closed and head lowered
2. Shape of eyebrows
3. Head movement
3.45 3.40
Contempt 68.8% Anger (89.3%)
Disgust (44.9%)
1. Furrowed glabella
2. Teeth exposed or clenched
3. Facial contraction and crumpling
3.57 4.28
Despair 59.0% Sadness (91.2%
Anger (13.2%)
Fear (6.8%)
1. Tearful expression
2. Downward mouth corners and distortion
3. Body gesture (shoulder, head)
3.61 4.30
Envy 12.2% Cannot Identify (49.3%)
Surprise (23.4%)
Sadness (11.7%)
1. Direction of eye gaze
2. Lips protruding forward
3. Many "cannot identify" responses
3.25 3.04
Pride 29.8% Joy (47.3%)
Surprise (19.5%)
Anger (14.6%)
1. Mouth smiling but eyebrows negative
2. Confusion from facial expression change
3. Inferred intentional expression
3.26 3.32