Korea Digital Contents Society
[ Article ]
Journal of Digital Contents Society - Vol. 26, No. 12, pp.3317-3326
ISSN: 1598-2009 (Print) 2287-738X (Online)
Print publication date 31 Dec 2025
Received 24 Sep 2025 Revised 29 Oct 2025 Accepted 25 Nov 2025
DOI: https://doi.org/10.9728/dcs.2025.26.12.3317

실시간 표정 인식을 활용한 어드벤처 게임 제작 연구: ‘도영(導迎)’ 제작 사례 중심으로

조규인1 ; 김혜경2, *
1경희대학교 디지털콘텐츠학과 석사
2경희대학교 디지털콘텐츠학과 교수
Development of an Adventure Game Using Real-Time Facial Expression Recognition: A Case Study on the Development of ‘Do-Young(導迎)’
Gyuin Jo1 ; Hye-Kyung Kim2, *
1Master, Department of Digital Contents, Kyung-Hee University, Yong-In 17104, Korea
2Professor, Department of Digital Contents, Kyung-Hee University, Yong-In 17104, Korea

Correspondence to: *Hye-Kyung Kim E-mail: hkkim@khu.ac.kr

Copyright ⓒ 2025 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

초록

본 연구는 표정 인식 기술을 주요 입력 방식으로 채택하여 물리적 조작 장치 없이 몰입할 수 있는 게임을 제작하였다. 제작을 위해 언리얼 엔진 5(Unreal Engine 5)와 라이브 링크 페이스(Live Link Face) 애플리케이션을 활용하였으며, 블루프린트를 통해 플레이어의 실시간 표정 및 얼굴의 움직임을 캐릭터의 행동, 상호작용, 환경 변화에 직접적으로 반영하였다. 게임의 콘텐츠는 반려동물과의 이별과 재회를 주제로 한 내러티브를 적용하여 감정적 공감과 몰입을 강화하였다. 향후 인식 정확도의 개선과 다양한 콘텐츠 확장을 통해 인터랙티브 게임 경험에서의 활용 가능성이 더욱 넓어질 것으로 기대한다.

Abstract

This study developed a game that enables immersive interaction without physical control devices by adopting facial expression recognition technology as the primary input method. The game was implemented using Unreal Engine 5 and the Live Link Face application, with Blueprint scripts employed to directly map the player’s real-time facial expressions and movements to the character’s actions, interactions, and environmental changes. The game’s narrative, centered on the themes of separation and reunion with a companion animal, was designed to enhance emotional empathy and player engagement. This study demonstrates the potential of facial expression recognition as an intuitive and emotionally resonant interface for interactive digital experiences. Future improvements in recognition accuracy and content diversity are expected to further broaden its applicability in interactive game design.

Keywords:

Facial Expression Recognition, Game Control Interface, Interactive Content, Unreal Engine 5, Live Link Face

키워드:

표정 인식, 게임 인터페이스, 인터랙티브 콘텐츠, 언리얼 엔진5, 라이브 링크 페이스

Ⅰ. 서 론

최근 들어 표정 인식 기술이 정교해지면서 관련 산업 시장이 크게 성장하고 있다. 보안 분야 뿐만 아니라 엔터테인먼트 분야 또한 표정 인식 기술을 폭넓게 활용하고 있으며 다양한 콘텐츠들이 꾸준히 개발되고 있다. 그러나 게임 분야의 표정 인식은 대부분 플레이어의 표정을 복제하여 활용하는 수준에 그치며 단편적인 상호작용만을 제공하고 있다. 따라서 지속적인 표정 인식의 활용을 유도하기 위하여 표정 인식을 게임 콘텐츠 진행에 있어서 핵심 입력 요소로 활용한 게임을 제작하고자 하였다.

본 논문은 게임 콘텐츠에서 전통적으로 사용되었던 키보드와 마우스, 터치스크린 등의 입력 방식을 대신하여 활용할 수 있는 수단으로 표정을 의도적으로 조작함으로써 캐릭터를 제어하는 게임 콘텐츠를 제작함에 있다. 선행 연구에 따르면 새로운 형태의 조작 방식인 의도적인 표정 조작을 활용한 게임 인터페이스는 게임 콘텐츠에서의 새로운 흥미 요소를 제공한다[1]. 기존의 게임 콘텐츠는 대부분 키보드, 마우스. 컨트롤러와 같은 물리적인 입력 장치에 의존하고 있다. 반면 본 작품은 실시간으로 플레이어의 표정을 인식하고 캐릭터의 행동과 환경의 변화로 상호작용하여 감정과 조작, 경험의 과정을 최소화한다. 이러한 구조는 표정을 짓는 행위 자체가 하나의 재미 요소가 될 수 있다. 다음은 긍정적인 정서의 유도이다. 안면 피드백 가설에 따르면 인간이 특정 감정과 연관된 얼굴 근육을 움직일 때, 실제로 그 감정을 경험하게 된다고 한다. 선행 연구에 따르면, 실험의 참가자들이 인위적으로 미소를 지은 결과 그렇지 않은 참가자에 비해 긍정적인 정서를 경험하였다[2]. 이는 의도적인 표정의 조작이 실제 감정 상태를 변화시킴을 알 수 있다. 게임 콘텐츠를 통해 긍정적인 표정을 유도하고 실제 감정 상태를 변화시킬 수 있음을 알 수 있다.

본 연구는 표정 인식 기술을 활용한 게임 인터페이스의 가능성을 제시하며, 이후 게임뿐만 아니라 교육, 심리치료 등 다양한 분야로 확장을 기대한다. 또한 본 작품은 능동적인 표정 인식을 기반으로 한 게임 플레이의 사례로서, 표정 인식 기술의 인터랙티브 콘텐츠 활용 연구에서의 기반을 제공할 수 있을 것으로 기대한다.


Ⅱ. 게임 인터페이스와 표정 인식 기술

2-1 게임 인터페이스 디자인

게임 인터페이스는 플레이어와 게임 간의 상호작용을 이루는 모든 장치를 뜻한다. 게임 인터페이스 디자인은 플레이어가 게임 콘텐츠에 몰입하고 효율적인 상호작용을 이루도록 하는 핵심 요소로서, 직관성, 접근성 등을 고려하여 디자인한다. 선행 연구에 따르면, 게임 인터페이스는 플레이어의 몰입과 게임 경험에 직접적인 영향을 미치는데, 형태와 환경에 따라 몰입에 방해가 되기도 하며 새로운 형태의 인터페이스 요소는 몰입을 높일 수 있다고 한다[3],[4]. 플랫폼에 따른 게임 인터페이스로 주로 터치스크린을 활용하는 모바일(스마트폰) 게임과 키보드, 마우스를 활용하는 PC게임, 전용 컨트롤러를 활용하는 콘솔 게임이 있다. 모바일 게임의 입력 인터페이스는 터치스크린을 활용하는 경우가 대부분이며 콘텐츠에 따라 가상 컨트롤러를 활용하기도 한다. 스크린의 크기와 해상도 등 물리적인 환경에 따라 입력 조작이 제한되기도 하지만 스크린을 직접 활용할 수 있기 때문에 매우 직관적이며 높은 접근성을 가진다. 그러나 다른 방식에 비해 이동성이 뛰어난 형태로 불안정한 조작 환경에 따라 몰입을 방해받을 가능성도 있다. 키보드와 마우스를 활용하는 경우 대중적으로 널리 사용되고 있지만 입력 장치를 효율적으로 사용하기 위한 최초 학습이 필요하다. 마우스의 활용은 정밀한 조작 및 고정된 환경에서 높은 몰입도에 장점이 있다. 콘솔 게임의 경우 전용 컨트롤러를 주로 사용한다. 고정된 환경에서의 조작과 콘텐츠에 따라 다양한 컨트롤러를 활용하여 몰입감을 극대화할 수 있지만 각각의 인터페이스에 따라 학습이 필요하다는 단점이 있다. 내용을 정리하면 표 1과 같다.

Comparison of general interface characteristic across gaming platforms

2-2 표정 인식 기술

1) 표정 인식 기술의 정의

표정 인식 기술(FER; Facial Expression Recognition)은 인간의 얼굴에서 나타나는 다양한 표정의 변화를 분석하여 감정 상태를 추정하는 기술로, 얼굴의 주요 부위(눈, 입, 눈썹 등)의 움직임이나 근육의 변화를 정량적으로 분석하여 이루어진다. 초기에는 정적인 이미지 기반의 분석에 머물렀으나 최근에는 3D 스캔, 실시간 영상 처리를 통해 정확하고 미세한 표정의 변화까지 인식할 수 있게 되었다. 표정 인식 기술은 보안, 교육, 로봇, 엔터테인먼트 등 다양한 분야에서 활용되고 있는 한편, 다양한 문화의 차이를 반영하지 못하거나 민감한 개인 정보를 다루고 있어 활용 시 무분별한 데이터 수집과 인권 침해 등 윤리적인 주의가 필요하다.

2) 표정 인식 기술의 활용

표정 인식 기술은 AI(Artificial Intelligence) 기반 기술 등 다양한 첨단 기술과의 융합을 통해 활용성이 무궁무진하며 다음과 같은 분야에서 사용되고 있다.

첫째, 헬스케어 및 심리치료 분야에서는 환자의 감정을 분석하고, 비언어적 신호를 기반으로 감정 반응을 인식하여 피드백을 제공하거나 우울, 불안 진단의 보조도구로 활용하고 있다. 메타버스 기술을 융합한 심리 상담 프로그램으로 사용자의 상태를 인식하여 해결책을 제시하기도 한다.

둘째, 마케팅 분야에서는 소비자의 얼굴 표정을 통해 광고, 제품, 콘텐츠에 대한 반응을 분석한다. 소비자가 특정 서비스나 제품을 접했을 때 나타나는 표정 데이터를 수집하여 서비스나 제품에 대한 만족도를 측정한다. 이는 감성 UX(User Experience) 분석의 도구로서 표정 인식 기술의 활용 가치를 보여준다.

셋째, 교육과 원격 수업 분야에서는 학습자의 몰입도와 이해도를 파악하는 데 활용할 수 있다. 학습자가 수업 중 나타내는 집중, 지루함 등의 표정을 인식하여 실시간 피드백을 제공하는 환경의 구축이 이루어지고 있다. 그러나 무분별한 데이터 수집, 인권 침해와 같은 윤리적 문제가 발생하고 있다.

3) 표정 인식 기반 콘텐츠 사례

엔터테인먼트 및 게임 분야에서는 표정 인식 기술을 사용자와 콘텐츠 간의 감성적 상호작용을 강화하는 도구로 활용하고 있으며, 이는 감성적 스토리텔링에 핵심적인 역할을 할 수 있다[5],[6].

Flying Mollusk의 Nevermind는 심리적 공포를 소재로 한 게임이다. 게임은 플레이어의 표정을 인식하여 게임의 난이도를 그림 1과 같이 실시간으로 조절하며, 특히 플레이어의 공포와 긴장 등의 표정을 인식할 경우 게임의 환경이 더욱 긴장감 있게 변하여 난이도가 증가한다[7]. 이 밖의 표정 인식을 활용한 콘텐츠 사례를 정리하면 다음 표 2와 같다.

Fig. 1.

A game based on facial expression recognition, Flying Mollusk - Nevermind

Case studies of facial expression recognition in game content


Ⅲ. <도영(導迎)> 작품 기획

3-1 작품의 목적

<도영(導迎)>은 표정 인식 기술을 게임의 핵심 조작 요소로 활용하여, 표정과 감정을 통해 플레이어와 콘텐츠가 능동적으로 상호작용할 수 있도록 기획하였다. 플레이어의 능동적인 표정 표현을 통해 게임 내의 환경을 변화시키고, 캐릭터의 행동을 제어하는 방식으로 더욱 몰입감 있는 경험을 창출하여 감정적 유대감을 형성하도록 유도하였다. 본 작품은 표정 인식을 단순한 입력 방식의 활용뿐만 아니라 감성적 스토리와 인터랙션을 결합한 콘텐츠의 활용 방안으로 제시하고자 한다.

3-2 MDA 프레임워크

작품의 기획을 위해 MDA 프레임워크를 활용하였다. MDA 프레임워크는 기술적 요소 (Mechanics), 동적 요소(Dynamics), 미적 요소 (Aesthetics)로 게임을 분석하고 설계하는 방법론으로 개발자와 플레이어의 관점을 모두 고려할 수 있으며 경험 중심 개발에 효과적이다[8],[9].

1) 기술적 요소

기술적인 요소로는 표정 인식 기술을 핵심적인 입력 수단으로 활용하였다. 기존의 게임 콘텐츠들이 일반적으로 키보드, 마우스, 컨트롤러와 같은 물리적인 입력 장치에 의존하는 것과 달리 본 작품은 플레이어의 얼굴 표정을 주요한 조작 수단으로 사용한다. 작품의 캐릭터는 플레이어의 미소, 눈, 입의 움직임에 따라 즉각적으로 행동한다. 플레이어의 표정과 캐릭터의 행동 사이에 규칙을 통해 플레이어는 표정의 조작을 게임의 중요한 요소로 인식하여 직관적인 경험을 창출한다.

2) 동적 요소

동적 요소로는 플레이어의 표정 변화가 게임의 환경과 상호작용하여 변화하는 구조를 갖추고 있다. 플레이어가 의도적으로 표정을 활용하고 게임이 이를 반영함으로써, 플레이어는 콘텐츠를 경험하는 내내 정서적 경험을 얻는다. 플레이어는 캐릭터를 효과적으로 제어하기 위해 지속적으로 본인의 표정을 인식하고 관리하며 몰입을 경험할 수 있다[10].

3) 미적 요소

미적 요소로는 플레이어가 표정 인식을 활용한 입력을 통해 캐릭터와 환경에 정서적 몰입을 경험하고 콘텐츠에 공감하는 것을 목표로 하였다. 게임의 주요 주제로는 반려동물과의 재회, 추억의 장소 여행으로 구성하여 정서적 접근을 시도하였다. 플레이어는 긍정적인 표정 표현을 하고 캐릭터를 조작하는 동안 캐릭터는 추억을 회상하고 아픔을 치유하는 과정을 거친다. 이러한 시각적, 서사적 구성은 게임 속에서 플레이어가 자신의 감정을 반영하여 긍정적인 경험을 하고 정서적 안정감을 느낄 수 있도록 의도하였다. 이 과정에서 플레이어는 스토리와 캐릭터에 유대를 형성하고 깊은 여운으로 만족감을 제공받는다.

3-3 스토리 구성

본 작품의 제목은 도영<導迎>으로 인도하여 맞이한다는 의미이다. 언젠가 삶을 마칠 때, 먼저 떠난 반려동물이 마중을 나온다는 이야기를 소재로 작성하였다. 1998년 영화 ‘천국보다 아름다운(What Dreams May Come)’에서는 주인공이 사망한 후 천국에 도착했을 때, 나타나는 반가운 존재로 생전에 사랑했던 반려견이 등장한다. 영화와 드라마 등 대중매체에서 반려동물을 가족으로 여기는 현대인의 정서가 잘 나타나며 이를 활용한 스토리텔링은 강력한 정서적 공감을 이끌어 낼 수 있다[11].

3-4 작품의 구성 요소

1) 캐릭터 설정

본 작품의 캐릭터는 단순히 게임 내에서 행동을 수행하는 존재를 넘어, 플레이어와 정서적 상호작용을 이루는 감정 매개체로 활용된다. 플레이어는 반려견의 시점에서 반려인과의 재회를 바탕으로 작고 귀여운 외형의 ‘치와와’ 캐릭터를 조작하게 된다. 이 캐릭터는 단순한 아바타가 아니라 플레이어의 표정을 인식하는 존재이며, 웃음을 통해 꽃을 심고 새로운 길을 여는 상호작용을 수행한다. 이러한 구조는 플레이어가 자신의 정서를 캐릭터로 나타내고 이를 통해 피드백을 받으며 몰입을 경험할 수 있다. 서사 구조에 있어서 ‘치와와’는 상징적인 의미를 갖는다. 치와와의 조상은 ‘테치치’라는 이름의 종으로 알려져 있다. 이 종은 고대 남아메리카 문화권에서 신성하게 여겨지며, 반려인을 사후세계로 올바르게 인도할 수 있다고 믿었다.

Fig. 2.

Excerpt from the film ‘What Dreams May Come’

Chihuahua model and skeletal mesh used in the game

2) 목표 설정

본 작품의 목표는 점수 중심의 구조에서 벗어나 정서적 서사를 중심으로 한 진행 목표로 설계하였다. 비슷한 진행 방식으로 그림 3의 3D 어드벤처 게임 ‘Journey’가 있다. 플레이어는 작은 캐릭터를 조작하여 여러 장소를 탐험하고 추억을 회상하며 여정을 수행한다. 이러한 목표 설정은 단순한 퍼즐을 풀거나 미션의 완수가 아닌 플레이어가 표정을 제어하고 감정을 표현하며 게임의 흐름을 주도하게 되고 패배 조건이 존재하지 않아 플레이어의 경험에 따라 서사가 이어지는 방식이다. 목표 달성의 압박보다도 정서적 환기와 회복 경험을 유도하는 과정 중심의 플레이 경험을 유도하고자 하였다.

Fig. 3.

3D adventure game ‘Journey’

3) 중심 소재

상호작용의 중심 소재 중 하나로 재스민(Jasmine) 꽃을 활용하였다. 재스민의 꽃말은 사랑과 우정을 의미하며 반려견의 반려인을 향한 무조건적인 사랑을 나타내고자 하였다. 원예 행위는 회복탄력성과 스트레스 대처에 긍정적인 영향을 미치며[12], 작품에서 플레이어는 표정 조작을 통해 그림 4와 같이 재스민 꽃을 심게 되고 정서적인 교감을 경험한다.

Fig. 4.

Interaction using jasmine*Currently, the content provides only a Korean-language interface.

4) 레벨 디자인

본 작품의 레벨 디자인은 플레이어가 캐릭터를 통해 정서적 경험의 탐색을 할 수 있도록 설계하였다. 플레이어는 과거 반려인과 추억이 깃든 다양한 공간과 환경을 그림 5, 표 4와 같이 순차적으로 탐험하며, 각 레벨과 장소마다 상호작용을 수행한다. 레벨의 환경은 시각적으로 따뜻한 분위기로 시작하여 섬세한 요소들로 제작되었다. 플레이어는 다양한 감정 상태를 자연스럽게 경험하며 게임을 진행한다. 레벨 디자인은 반려견이 반려인과 주로 생활하는 일상적인 장소들로 구성되어 있다. 집, 방 안과 같은 실내 환경, 공원 산책로, 여행지 등을 배치하였으며 현실적인 배경과 공감하며 몰입할 수 있다[13]. 이동 동선에 대한 배치는 한 가지 표정 입력값만을 반복적으로 사용하는 것을 방지하기 위해 회전에 대한 활용을 균형있게 유도하였다.

Fig. 5.

Level design

Level design


Ⅳ. <도영(導迎)> 작품 제작

4-1 제작 도구

본 작품은 표정 인식 기반의 직관적인 게임 인터페이스를 구현하기 위하여 적절한 게임 엔진과 실시간 얼굴 인식 기술을 활용하였다. 제작에 활용한 도구들은 기술적 구현, 데이터 처리, 인터랙션 등 주요 역할들을 수행하였다.

1) Unreal Engine 5

언리얼 엔진 5(Unreal Engine 5)는 본 작품 제작의 주요 도구로 사용되었다. 언리얼 엔진의 고급 그래픽 처리 기술을 활용하여 부드럽고 몰입감 있는 콘텐츠 환경을 제작하였다. 블루프린트는 복잡한 표정 데이터의 입력과 로직을 비주얼 스크립트 형태로 가공하여 프로그래밍에 대한 부담을 줄이고, 효과적인 테스트와 피드백이 가능하였다.

2) Live Link Face 및 ARKit

Live Link Face 앱과 ARKit 기술은 얼굴 인식 기반의 인터페이스 구현에 핵심적인 역할을 담당하였다. ARKit 기반의 표정 데이터 입력은 iOS 기기의 트루뎁스 카메라(True Depth Camera) 기술을 통해 정밀한 데이터를 실시간으로 인식하여 52개의 데이터 값으로 변환한다. 트루뎁스 카메라는 수천 개의 보이지 않는 점을 투사하고 분석하는 방식으로 데이터를 수집한다. 이러한 데이터를 실시간으로 언리얼 엔진에 연동하여 콘텐츠에 활용할 수 있는 형태로 가공한다. 수집된 데이터는 블루프린트를 통해 각각의 인터랙션에 매핑하여 활용할 수 있다.

4-2 표정 인식 기반 인터페이스 제작

본 작품은 실시간으로 표정 데이터를 수집하고, 이를 게임 인터페이스로 활용함으로써 키보드와 마우스의 조작 없이 얼굴 표정만으로 조작 가능한 게임 인터페이스를 구현하였다. 과정은 다음과 같다.

1) Live Link Face 데이터 수집

먼저 Live Link Face를 활용하기 위한 환경을 구축하였다. iOS 기기에 Live Link Face 앱을 설치한 후 카메라를 통하여 플레이어의 얼굴을 인식한다. 다음, ARKit에서 제공하는 52가지 표정 계수를 수집하였으며, 이 중 게임 인터페이스에 활용할 주요 데이터를 선별하였다. 마지막으로 데이터 연동을 통해 언리얼 엔진으로 실시간 전송하였다. 표 5와 같이 ARKit는 52가지 표정 데이터를 0과 1 사이의 데이터 값으로 변환하여 전송한다. 직관적인 조작 입력을 통해 접근성을 낮추고자 기본적인 이동 조작에는 왼쪽, 오른쪽 눈의 감기 정도와 입 벌림 정도, 웃음의 데이터를 활용하였다. 이후 블루프린트의 수정을 통해 다양한 데이터를 추가적으로 활용할 수 있으며 조합에 따라 미세한 표정 변화까지 인식할 수 있다.

Fig. 6.

True depth camera

ARKit’s 52 facial expression data

2) 블루프린트를 활용한 데이터 처리

언리얼 엔진에서 제공하는 블루프린트는 다양한 변수, 이벤트 호출 등 게임 개발에 필요한 핵심 기능들을 코드 작성 없이 구현할 수 있다. 그림 7, 그림 8과 같은 시각적 스크립팅 시스템은 프로그래밍에 익숙하지 않은 개발자, 디자이너, 기획자도 직접 로직을 쉽게 구현할 수 있도록 설계되었다. 본 작품과 같이 실시간 표정 인식 데이터와 캐릭터 동작, UI(User Interface), 사운드 등 다양한 요소가 유기적으로 연결되는 콘텐츠에서는 실시간 데이터와 상호작용의 제어가 핵심인데, 블루프린트는 이러한 과정에서 높은 직관성을 제공한다.

Fig. 7.

Animation blueprints

Fig. 8.

Animation control logic*A Korean-language interface was used in the development environment.

4-3 작품의 기능 및 특성

본 작품은 표정 인식 기반의 조작 방식을 활용하여 조작성과 정서적 몰입을 강화하는 게임 경험을 제공하는 것을 목표로 하였다. 작품의 주요 기능과 특성은 다음과 같다.

1) 표정을 활용한 입력

본 작품은 키보드, 마우스와 같은 물리적인 입력장치 없이, 플레이어의 얼굴 표정만으로 게임을 조작하는 인터페이스를 활용하여 제작하였다. Live Link Face 앱과 ARKit를 통해 표정 데이터를 실시간으로 수집하고 다양한 상호작용에 연결하였다. 특히, 표정 인식 기반의 입력은 단순한 트리거를 넘어, 플레이어의 의도적인 표정 조작을 유도하여 감정 표현과 콘텐츠를 자연스럽게 연결하였다. 그림 9는 표정 인식과 상호작용을 시연하는 모습으로 사용자의 표정에 따라 캐릭터의 움직임이 각각 달라지는 것을 보여준다. 입의 벌려진 정도에 따라 캐릭터의 전진, 눈의 감은 정도에 따라 캐릭터의 회전, 웃음 정도에 따라 캐릭터가 꽃을 심는 등의 상호작용을 시연하였다. 작품 내에서는 이러한 표정을 활용한 조작이 입력될 때마다 즉각적인 피드백을 통해 플레이어가 자신의 입력 결과를 인지하고 학습할 수 있도록 하였다.

Fig. 9.

Interface demonstration

2) 정서적 상호작용

본 작품은 표정 인식을 입력 수단으로 활용하고자 하였다. 플레이어는 주인공의 여정을 따라가며 웃음을 짓고 주인공과 함께 긍정적인 경험을 제공받는다. 이러한 표정 인식 인터랙션은 플레이어의 감정 상태를 콘텐츠에 투영하며 더 깊은 몰입과 감정적 상호작용을 유발하고자 하였다. 궁극적으로 콘텐츠를 통해 실시간 표정 인식의 기술적 실험을 넘어 이를 활용한 콘텐츠와 정서적 상호작용을 결합한 새로운 게임 경험의 가능성을 탐구하였다.

4-4 작품 시연 및 한계

작품의 시연은 Live Link Face 연결 확인, 튜토리얼 플레이, 메인 레벨 플레이의 순서로 진행되었다. 먼저 iOS 기기의 카메라를 통해 입력값이 제대로 전달되고 있는지 확인한 후 그림 10과 같이 진행되었다. 플레이어는 최초 메인 메뉴에서 시작하여 튜토리얼을 통해 표정 인식을 활용한 조작을 익힌다. 간단한 캐릭터의 제어부터 상호작용까지 익힌 다음 메인 메뉴로 돌아와 스토리를 진행하게 된다. 게임의 목표는 표정을 활용하여 캐릭터의 움직임을 제어하며 표정과 상호작용에 따라 변화하는 환경에서 목표 지점에 도달하여야 한다. 본 작품의 시연은 게임에 대한 경험이 풍부한 남, 녀 7인을 대상으로 테스트 후 사용성, 몰입성, 정서적 전달을 중심으로 인터뷰를 진행하였으며, 사용자 피드백을 종합적으로 수렴한 결과는 다음과 같다. 본 작품의 표정 인식 기반의 인터페이스는 기존의 물리적 조작과는 다른 차별화된 상호작용과 게임 경험을 제공하였으며, 조작은 쉽고 직관적이었다. 그러나 네트워크의 불안정 및 인식 오류를 경험한 참가자는 몰입감에 아쉬움을 느꼈고 다음과 같은 보완점을 도출하였다.

Fig. 10.

Game flowchart

첫째, 표정 인식의 정확도는 조명, 카메라의 각도 등 환경의 영향을 많이 받았으며 특정 각도에서 입력값이 다르게 나타나는 오류가 존재한다. 표 6은 시연 참가자에 따라 달라지는 표정 입력값을 기록하였다. 본 작품이 가장 자주 인식하는 입력값을 시연하는 사람에 따라 기록하였고, 이 수치에 따라 상호작용을 배치할 때 상호작용으로 이어지는 최소한의 값을 지정하였으나, 표본의 수가 많아질수록 오차범위 또한 넓어질 것을 고려하여 플레이어별로 자신의 표정 입력 값에 따른 범위를 수정할 수 있는 기능의 추가가 필요하다.

Facial expression recognition values by test session

둘째, 특정 표정을 반복적으로 사용하고 유지하는 경우 피로도가 빠르게 상승했다. 따라서 콘텐츠와 입력 감도, 레벨 구조의 수정 등의 개선이 필요하다.

결론적으로 본 작품은 새로운 형태의 인터페이스 실험으로서 플레이어의 긍정적인 몰입 경험과 정서적 반응을 이끌어낼 가능성을 보았으며, 향후 기술적 보완과 피드백 기반의 개선을 반복하여 더욱 완성도 있는 인터페이스로 확장될 가능성을 보여준다.

4-5 작품의 의의

본 작품은 게임 인터페이스의 실험적 시도를 통한 표정 인식 기반 조작 방식의 활용을 실증함으로써 향후 관련 연구 및 응용 분야에서 참고 자료로 활용할 수 있을 것으로 기대한다. 작품에서 활용한 표정 데이터의 조작 활용 변환은 유사한 콘텐츠를 기획하는 연구자에게 콘텐츠 기획 기반을 제공할 수 있으며, 낮은 기술 진입장벽으로 콘텐츠 구현이 가능함을 확인함으로써 소규모 단체와 개인 제작자의 표정 인식 기술을 활용한 작품 제작 확산에 기여할 수 있다. 그러나 표정 데이터는 민감한 생체 정보이므로 윤리적, 사회적 활용을 위해 데이터 보호 및 보안 강화, 문화 차이에 따른 해석 보완 등 다양한 주의점을 고려한다면 보다 폭넓은 활용을 통해 표정 인식 기술의 활용성이 확장될 것으로 기대한다.


Ⅴ. 결 론

본 연구는 최근 발전하고 있는 표정 인식 기술을 게임 콘텐츠의 주요 인터페이스로 활용하여, 플레이어의 감정 표현과 정서적 경험을 게임 내 상호작용의 요소로 발전시키고자 하였다. 현재 표정 인식 기술은 다양한 분야에서 활용되고 있지만 콘텐츠 분야에서 활용은 표정 복제와 아바타 생성 등 단순한 상호작용으로 제한되어 있다. 이에 본 연구는 표정 인식을 게임의 주요 조작 수단으로 도입하여 플레이어가 게임 콘텐츠에 더욱 능동적으로 표정 입력을 활용할 수 있도록 유도하였다. 이론적 배경을 통해 표정 인식 기술의 정의와 특징, 현황을 살펴보고 게임 인터페이스 디자인의 개념, 활용 현황을 조사한 후 연구 프로젝트로 게임 콘텐츠인 ‘도영(導迎)’을 제작하였다. 기획 및 제작은 플레이어 중심의 반복적이고 유연한 과정으로 진행하였으며 도구로는 언리얼 엔진 5와 Live Link Face 앱을 활용하였다. 이러한 과정을 통해 제작된 콘텐츠 ‘도영(導迎)’의 결론은 다음과 같다.

첫째, 표정 인식 기술을 게임 콘텐츠의 단순한 표정 복제와 감정 표현의 도구가 아닌, 게임의 주요 조작 수단으로 확대하여 적용하였다. 이는 기존의 물리적인 인터페이스의 한계를 넘어 플레이어의 정서적 경험과 게임 콘텐츠를 실시간으로 연결하는 새로운 게임 인터페이스 디자인의 가능성을 제시하였다. 이를 통해 플레이어는 본인의 감정을 능동적으로 표현하고, 게임을 통해 즉각 피드백을 받으며 몰입감을 높이는 구조를 구현할 수 있음을 보여준다.

둘째, 플레이어의 감정적 상호작용을 핵심으로 하는 게임 디자인의 방향성을 제안하였다. 본 작품은 플레이어가 캐릭터를 통해 자신의 실제 감정과 기억을 투사하고 표현할 수 있는 구조를 갖추고 있다. 이를 통해 플레이어는 게임을 플레이하는 것을 넘어, 캐릭터와 감정적 연결을 형성하여 정서적 회복을 경험할 수 있다.

셋째, 본 작품은 표정 인식 기술과 정서적 내러티브 콘텐츠의 결합을 통해 인터랙티브 미디어 콘텐츠의 가능성을 넓히고자 하였다. 실시간 표정 인식 데이터 처리, 감성 중심의 게임 디자인과 표현은 서로 다른 분야의 요소를 결합하여 콘텐츠의 전달력을 높이고자 하였다.

결론적으로, 본 연구는 표정 인식 기반의 조작을 활용한 게임과 플레이어 사이의 정서적 상호작용을 증진하고, 이를 통해 게임이 제공하는 몰입과 경험의 수준을 향상하고자 하였다. 인터뷰 결과 본 작품은 직관적인 조작성과 정서적 몰입에서 긍정적인 반응을 얻었으나, 얼굴 근육의 피로도 및 조작 환경에 따른 정확도는 몰입감을 방해할 수 있어 향후 개선 과제로 남아있다.

References

  • J. Ahn, “Analyzing the Impact Feedback in Games through Visual Grammars –Focused on Comparing RPG Genres by Platform–,” Cartoon & Animation Studies, No.72 pp. 393-424, 2023. [https://doi.org/10.7230/KOSCAS.2023.72.393]
  • F. Strack, L. L. Martin, and S. Stepper, “Inhibiting and Facilitating Conditions of the Human Smile: A Nonobtrusive Test of the Facial Feedback Hypothesis,” Journal of Personality and Social Psychology, Vol. 54, No. 5, pp. 768-777, 1988. [https://doi.org/10.1037/0022-3514.54.5.768]
  • K. J. Bahn and H. Kim, “A Study on the Effects of Experience Based Physical Interface on Game Flow,” Journal of Archives of Design Research, Vol. 21 No. 3 pp. 201-210, 2008.
  • S. D. Yang, “A Study on Player’s Immersion by Difference of Input Control Devices in Computer Games,” Journal of Korea Game Society, Vol. 10, No. 1, pp. 35-45, 2010.
  • T.-H. Kim, “Content Design and Production for Experiencing Korean, Chinese and Japanese Traditional Masks using AR Face Recognition Technology,” Journal of Digital Contents Society, Vol. 23, No. 12, pp. 2355-2364, 2022. [https://doi.org/10.9728/dcs.2022.23.12.2355]
  • C. S. Kim, S. H. Lee, and E.-H. Oh, “The Impact of Interaction Factors of Digital Contents on Flow and Use Intention,” The Journal of the Korea Contents Association, Vol. 11, No. 9, pp. 212-224, 2011. [https://doi.org/10.5392/JKCA.2011.11.9.212]
  • STEAM. Flying Mollusk - Nevermind [Internet]. Available: https://store.steampowered.com/app/342260/Nevermind/, .
  • R. Hunicke, M. LeBlanc, and R. Zubek, “MDA: A Formal Approach to Game Design and Game Research,” Proceedings of the Game Developers Conference (GDC), 2004.
  • S. Eom and J. Lee, “Application and Modification of the MDA Framework: Development of a Game Based on Webtoon IP and Proposal of the IP-MDA Framework,” Trans-, Vol. 17, pp. 155-178, 2024. [https://doi.org/10.23086/trans.2024.17.06]
  • P. M. Niedenthal, L. W. Barsalou, P. Winkielman, S. Krauth-Gruber, and F. Ric, “Embodiment in Attitudes, Social Perception, and Emotion,” Personality and Social Psychology Review, Vol. 9, No. 3, pp. 184-211, 2005. [https://doi.org/10.1207/s15327957pspr0903_1]
  • J. G. Kang, “The Advent of Pet-Fam People and Re-Consideration of a Companion Animal -Focusing on the Analysis of Korean Literature and Cinema since the 2000s,” The Comparative Study of World Literature, No. 54, pp. 5-27, 2016.
  • S. R. Jeong, “Effects of Horticultural Healing Program on Resilience and Stress Coping in Middle-aged Women,” Journal of Convergence Sustainability Management, Vol.7, pp. 34-41, 2019.
  • D. Polydorou, “Immersive Storytelling Experiences: A Design Methodology,” Digital Creativity, Vol. 35, No. 4, pp. 301-320, 2024. [https://doi.org/10.1080/14626268.2024.2389886]
조규인(Gyuin Jo)

2023년:용인예술과학대학교 시각디자인학과 (학사)

2025년:경희대학교 디지털콘텐츠학과 (석사)

2023년~2025년: 경희대학교 디지털콘텐츠학과 석사과정

※관심분야:미디어 아트, 확장현실(XR), 메타버스 등

김혜경(Hye-Kyung Kim)

1987년:고려대학교 심리학과 (문학학사)

1992년:Pratt Institute 대학원 (M..F.A.-컴퓨터그래픽스)

1993년~1999년: LG소프트

1999년~현 재: 경희대학교 예술디자인대학 디지털콘텐츠학과 교수

※관심분야:모션그래픽스, 인터랙션디자인, 미디어 아트, 실감형 콘텐츠 등

Fig. 1.

Fig. 1.
A game based on facial expression recognition, Flying Mollusk - Nevermind

Fig. 2.

Fig. 2.
Excerpt from the film ‘What Dreams May Come’

Fig. 3.

Fig. 3.
3D adventure game ‘Journey’

Fig. 4.

Fig. 4.
Interaction using jasmine*Currently, the content provides only a Korean-language interface.

Fig. 5.

Fig. 5.
Level design

Fig. 6.

Fig. 6.
True depth camera

Fig. 7.

Fig. 7.
Animation blueprints

Fig. 8.

Fig. 8.
Animation control logic*A Korean-language interface was used in the development environment.

Fig. 9.

Fig. 9.
Interface demonstration

Fig. 10.

Fig. 10.
Game flowchart

Table 1.

Comparison of general interface characteristic across gaming platforms

Category Mobile Games PC Games Console Games
Form
Input Method Touch-based Input Keyboard and Mouse Input Controller-
based Input
Control Accuracy Limited precision depending on screen form High precision through mouse-based control Moderate precision through analog stick control
Accessibility Highly intuitive and accessible Requires familiarity with keyboard operation Requires familiarity with controller operation
Design Flexibility Restricted by screen size and format independent interface with high design freedom Varies according to hardware environment
Feedback Visual feedback, vibration Visual, auditory feedback Visual, auditory and haptic feedback
Immersion Varies depending on screen size High immersion in desktop environments High immersion through dedicated controllers

Table 2.

Case studies of facial expression recognition in game content

Case Flying Mollusk -
Nevermind
(2015)
NBA 2K17 Face Scan
(2016)
Diffcat - FaceDance Challenge
(2017)
Platform PC PC, Console Mobile
Features Facial recognition, emotional data processing, game difficulty adjustment Player’s face scanned and reflected in the game character Rhythm game that mirrors player’s facial expressions
Interaction Game difficulty adjusted based on emotional states Reflecting scanned facial data onto in-game characters Player’s facial expressions directly linked to rhythm
Immersion High
(environment changes depending on emotional state)
Medium
(immersion tied to character customization)
Medium
(immersion linked to rhythm and expressions)
Functionality High
(gameplay progression tied to emotional regulation)
Low
(limited to customization setting)
Medium
(expression-
based interaction mechanics)
Implication Real-time emotional interaction reflecting psycological conditions Providing avatars customized through facial recognition Demonstrates usability of expression recognition in rhythm-based games

Table 3.

Chihuahua model and skeletal mesh used in the game

Model Collision
Lighting Skeleton

Table 4.

Level design

Room Bridge 1
Playground1 Playground2
Woods1 Woods2
Bridge 2 Garden1
Lake Ending

Table 5.

ARKit’s 52 facial expression data

DATA
browDown_L mouthClose
browDown_R mouthDimple_L
browInnerUp mouthDimple_R
browOuterUp_L mouthFrown_L
browOuterUp_R mouthFrown_R
cheekPuff mouthFunnel
cheekSquint_L mouthLeft
cheekSquint_R mouthLowerDown_L
eyeBlink_L mouthLowerDown_R
eyeBlink_R mouthPress_L
eyeLookDown_L mouthPress_R
eyeLookDown_R mouthPucker_L
eyeLookIn_L mouthPucker_R
eyeLookIn_R mouthRight
eyeLookOut_L mouthRollLower
eyeLookOut_R mouthRollUpper
eyeLookUp_L mouthShrugLower
eyeLookUp_R mouthShrugUpper
eyeSquint_L mouthSmile_L
eyeSquint_R mouthSmile_R
eyeWide_L mouthStretch_L
eyeWide_R mouthStretch_R
jawForward mouthUpperUp_L
jawLeft mouthUpperUp_R
jawOpen noseSneer_L
jawRight noseSneer_R

Table 6.

Facial expression recognition values by test session

Case Smile
(0~1)
Eye Close
Left/Right(0~1)
Mouth Open
(0~1)
#1 0.78 0.98 / 0.94 0.28
#2 0.67 0.97 / 0.95 0.52
#3 0.59 0.94 / 0.87 0.42
#4 0.66 0.95 / 0.93 0.31
#5 0.71 0.97 / 0.89 0.45
#6 0.67 0.95 / 0.88 0.35
#7 0.74 0.91 / 0.87 0.34