
저비용 VTuber 시스템 개발 및 인식 조사
Copyright ⓒ 2025 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

초록
유튜브와 라이브 스트리밍 플랫폼의 급격한 성장에 따라, 버튜버(VTuber)라는 새로운 형태의 콘텐츠 창작자가 빠르게 증가하고 있다. 버튜버는 가상의 아바타를 통해 시청자와 상호작용하며 다양한 콘텐츠를 제작하지만, 고가의 장비와 소프트웨어로 인해 초보 버튜버들이 진입 장벽을 느끼는 경우가 많다. 본 연구는 이러한 문제를 해결하기 위해 저비용으로 활용 가능한 버추얼 아바타 시스템을 개발하고, 일반인의 VTuber 활동에 대한 인식과 참여 가능성을 설문조사를 통해 분석하고자 한다. 얼굴 인식 기술을 활용한 저비용 VRM 아바타의 구현을 통해 초보 버튜버들이 직면한 기술적 어려움을 줄이고, 비용 부담을 완화하여 더 많은 창작자가 버튜버 시장에 참여할 수 있도록 돕는 것을 목표로 한다. 본 연구는 기존 고가 시스템 대비 비용 절감 효과와 접근성을 강화하기 위해 무료 프로그램과 Unity 기반 VRM 포맷을 사용하였다. 설문조사 결과는 VTuber 콘텐츠의 대중화 가능성과 시스템의 필요성을 증명하는 데 기여할 것이다.
Abstract
With the rapid growth of YouTube and live streaming platforms, a new form of content creators, known as virtual YouTubers (VTubers), has quickly gained popularity. VTubers interact with their audience through virtual avatars, creating diverse content. However, high equipment and software costs pose considerable barriers for novice VTubers. This study aims to develop a cost-effective virtual avatar system and analyze public perceptions and participation potential in VTuber activities through surveys to overcome existing equipment and software limitations. Specifically, a low-cost VRM avatar is implemented using facial recognition technology, which reduces technical challenges and financial burdens for novice VTubers, thereby enabling more creators to enter the VTuber market. This research uses free programs and a Unity-based VRM format to enhance cost efficiency and accessibility compared to existing expensive systems. Survey results contribute to demonstrating the potential for popularizing VTuber content and the necessity of such virtual systems.
Keywords:
Content Creation, Facial Recognition, Low-Cost Solution, Virtual Avatar, VTuber키워드:
콘텐츠 제작, 얼굴 인식, 저비용 솔루션, 가상 아바타, 버추얼 유튜버Ⅰ. 서 론
COVID-19 팬데믹은 사회 전반에 걸쳐 비대면 환경을 가속화시키며, 이를 통해 온라인 커뮤니케이션과 메타버스에 대한 관심을 급증시켰다. 이는 사회적 거리두기 정책과 디지털 전환의 가속화로 인해 메타버스와 같은 가상 공간에서의 활동이 보편화된 결과이다. 이러한 환경 속에서 메타버스는 단순한 기술적 도구를 넘어 사회적, 경제적 상호작용의 새로운 장으로 자리 잡고 있다[1]. 메타버스의 확장은 버추얼 유튜버(VTuber)와 같은 새로운 콘텐츠 제작자의 등장을 가능하게 하였다. VTuber는 2D 또는 3D 아바타를 통해 실시간으로 시청자와 소통할 수 있는 독특한 매체로, 게임, 음악, 예술 등 다양한 분야에서 새로운 창작과 시청 경험을 제공한다. 특히 시청자와 실시간 상호작용을 통해 몰입감 있는 콘텐츠를 제작할 수 있다는 점에서 큰 매력을 가진다. VTuber 콘텐츠의 성공적인 예로 일본의 ‘키즈나 아이(Kizuna AI)’와 같은 글로벌 인기 VTuber는 수백만 명의 팬층을 보유하고 있으며, 이는 VTuber 콘텐츠가 전 세계적으로 확산되는 데 큰 역할을 하였다[2].
1-1 VTuber의 발전과 한계
VTuber의 확산은 콘텐츠 제작자와 시청자 간의 새로운 형태의 관계를 구축하며, 디지털 콘텐츠 분야의 혁신을 이끌고 있다. 이러한 성공은 고성능 컴퓨터와 모션 캡처 장비, 그래픽 소프트웨어 등의 기술적 지원 덕분이다. 하지만 VTuber 시스템은 상당한 초기 비용을 필요로 한다. 예를 들어, 일본의 인기 VTuber 그룹 ‘홀로라이브(Hololive)’는 초기 투자 비용이 수천만 원에 달하는 것으로 알려져 있으며, 이는 초보 창작자들에게 큰 경제적 장벽으로 작용한다. 또한, 대부분의 VTuber 시스템은 높은 기술적 요구사항을 포함하고 있어 소규모 제작자와 초보자들이 접근하기 어렵다. 이러한 문제는 VTuber 시장이 특정 그룹에만 국한되지 않고, 다양한 창작자들에게 문을 열어야 한다는 필요성을 제기한다[3].
1-2 저비용 아바타 시스템의 필요성
VTuber와 같은 버추얼 콘텐츠 제작은 점차 대중화되고 있지만, 고비용 문제로 인해 콘텐츠의 다양성과 창의성이 제한된다. 특히, Unity 기반의 VRM 포맷과 같은 오픈소스 기술은 웹캠과 스마트폰만으로도 아바타를 구현할 수 있는 대안을 제공하며, 많은 창작자들이 적은 비용으로도 VTuber 콘텐츠를 제작할 수 있는 환경을 마련하고 있다. 저비용 시스템은 경제적 부담을 줄이면서도 VTuber 시장의 진입 장벽을 낮추는 데 중요한 역할을 한다. 예를 들어, 얼굴 인식 소프트웨어와 AR 기술의 발전은 사용자가 추가적인 장비 없이도 고품질 아바타 콘텐츠를 제작할 수 있게 한다. 이러한 기술적 접근은 기존 고가 장비를 대체할 수 있는 대안으로 주목받고 있다[4].
1-3 연구의 목적
본 연구는 저비용으로 구현 가능한 아바타 시스템의 필요성을 제기하고, VTuber 활동에서 발생하는 경제적 장벽을 해결하고자 한다. 이를 통해 경제적 부담을 최소화하면서도 사용자에게 높은 몰입감과 편리한 사용성을 제공하는 저비용 아바타 시스템을 개발하여, 다양한 온라인 콘텐츠 제작자들이 쉽게 접근할 수 있는 환경을 조성하는 것을 목표로 한다. 이 연구는 VTuber 활동에서 고비용 문제를 해결함으로써 창작의 접근성을 높이고, VTuber 생태계의 확장에 기여할 수 있을 것으로 기대된다.
Ⅱ. 이론적 배경
2-1 VTuber (Virtual YouTuber)
VTuber는 ‘가상 유튜버’를 의미하며, 가상 캐릭터, 즉 아바타를 통해 인터넷에서 콘텐츠를 제작하고 소통하는 새로운 유형의 창작자를 뜻한다. 일반적으로 실존 인물은 화면에 등장하지 않고, 사용자는 2D 또는 3D 캐릭터를 통해 자신의 목소리와 움직임을 아바타에 실시간으로 반영하여 시청자와 상호작용한다. 2016년 일본에서 최초로 등장한 VTuber는 이후 전 세계로 확산되어 글로벌 콘텐츠 시장에서 하나의 장르로 자리 잡았다. VTuber 콘텐츠는 특히 유튜브와 트위치와 같은 스트리밍 플랫폼에서 큰 인기를 끌고 있다.
VTuber 시스템의 핵심은 고급 모션 캡처 기술과 아바타 표현 소프트웨어다. 사용자는 얼굴 인식 또는 전신 모션 캡처 장비를 착용해 가상의 캐릭터를 제어하며, 이는 실시간으로 시청자와 상호작용하는 독특한 경험을 제공한다. 대부분 상위 VTuber들은 풀 바디 모션 캡처 장비와 고성능 컴퓨터를 사용해 높은 몰입감을 제공하지만, 이 과정에서 상당한 기술적, 경제적 비용이 발생한다. VTuber의 확산에는 고비용 장비를 대체할 수 있는 기술적 대안에 대한 연구가 중요한 요소다.
2-2 AR (Augmented Reality)
증강 현실(AR)은 현실 환경에 가상의 정보를 실시간으로 겹쳐 보여주는 기술로, 가상 콘텐츠와 현실을 융합하는 경험을 제공한다. 현실 세계와 가상 객체를 동시에 보여주어 사용자가 디지털 정보를 실감 나게 접할 수 있도록 하며, 스마트폰, 태블릿, HMD(Head Mounted Display) 등 다양한 장비를 통해 구현된다. AR은 게임, 교육, 마케팅 등 여러 분야에서 활용되지만, VTuber 시스템에서도 고가 장비 대신 저비용 대안으로 적용되고 있다. 웹캠이나 모바일 기기만으로도 AR 기술을 활용해 간단한 얼굴 인식과 아바타 표현이 가능하다[5].
Unity AR Foundation과 같은 오픈소스 소프트웨어는 VTuber 제작자가 자신의 표정이나 특정 움직임을 아바타에 반영하며 시청자와 상호작용할 수 있는 최소한의 환경을 제공한다. AR을 활용한 저비용 VTuber 시스템은 고비용 장비의 한계를 극복할 수 있는 현실적인 대안으로 주목받고 있으며, 초보 창작자들이 보다 쉽게 VTuber 활동을 시작할 수 있는 기술적 기반을 조성한다.
2-3 모션 캡처(Motion Capture)
모션 캡처는 사용자의 실제 움직임을 디지털 데이터로 변환하여 가상의 캐릭터에 적용하는 기술로, 애니메이션, 영화, 게임, VR 및 AR 응용 분야에서 널리 활용된다. 특히 VTuber 시스템에서는 사용자의 얼굴 표정과 전신 움직임을 실시간으로 아바타에 반영하여 실존 인물이 등장하지 않더라도 생동감 있는 캐릭터를 시청자에게 보여줄 수 있다. 모션 캡처는 전통적으로 고가의 장비와 복잡한 설치 환경이 필요하지만, 최근에는 얼굴 표정만을 캡처하거나 상반신에 국한된 모션 캡처 시스템이 등장하면서 비용과 접근성이 점차 개선되고 있다[6].
VTuber 콘텐츠에서 사용하는 모션 캡처는 크게 두 가지 방식으로 구분된다. 첫 번째는 전신 모션 캡처 방식으로, 사용자가 전신에 센서를 장착해 움직임을 추적하고 이를 3D 아바타에 실시간으로 반영한다. 두 번째는 얼굴 표정 캡처 방식으로, 주로 웹캠이나 스마트폰 카메라를 사용해 얼굴 근육 움직임을 인식하고 이를 아바타에 반영하는 방식이다. 특히 2D 아바타의 경우 얼굴 표정 캡처만으로도 충분히 생동감 있는 캐릭터를 표현할 수 있어 초보자들에게 접근성이 높은 대안으로 평가받고 있다.
2-4 VRM (Virtual Reality Model) 포맷
VRM은 가상 아바타의 데이터 형식을 표준화한 파일 포맷으로, 주로 3D 아바타의 호환성을 높이기 위해 사용된다. VRM 포맷은 일본에서 개발된 표준이며, 특히 VRChat, Cluster와 같은 가상 현실(VR) 플랫폼과 호환성이 높아 VTuber 제작자들 사이에서 널리 사용된다. VRM은 사용자가 설정한 표정, 모션, 머리카락과 같은 다양한 아바타 속성을 일관되게 저장할 수 있어 여러 플랫폼에서 동일한 아바타를 사용할 수 있게 돕는다[7].
VRM 파일은 데이터 효율성을 높이고 플랫폼 간의 호환성을 강화하는 동시에 제작자가 다양한 소프트웨어에서 아바타를 자유롭게 사용할 수 있도록 지원한다. 예를 들어, 사용자가 자신만의 아바타를 제작한 후 이를 VRM 포맷으로 저장하면, 다른 소프트웨어나 플랫폼에서도 그대로 불러와 사용할 수 있다. 특히 Unity와 같은 개발 환경에서 VRM 파일을 불러오면 아바타의 외형과 속성을 그대로 유지하면서 프로그램에 따라 원하는 기능을 추가할 수 있다. VRM은 VTuber 활동에서 일관성을 유지하는 중요한 역할을 하며 아바타 제작에 있어 접근성과 유연성을 제공한다.
Ⅲ. 기존 연구 및 문헌 조사
3-1 온라인 커뮤니케이션과 메타버스
COVID-19 이후 온라인 화상 미팅과 메타버스의 사용 사례가 증가했으며, 이와 관련된 연구는 주로 사용자 경험을 개선하고 몰입감을 높이는 방향으로 진행되었다. 해당 연구에서는 디자인적 사고 방법론을 사용하여 온라인 미팅 플랫폼에서 사용자 몰입감을 높이기 위해 3D 가상 배경을 활용하고 AR Face Mask를 적용한 사례가 있다[8]. 이러한 기술적 접근은 개인정보 노출에 대한 부담을 줄이고 사용자 간의 심리적 거리감을 해소하는 데 도움을 주었다.
3-2 기존 VTuber 시스템과 비용 문제
버튜버들은 일반적으로 고성능 컴퓨터, 고화질 웹캠, 모션 캡처 장비 등을 사용하여 방송을 진행하며, 이는 상당한 비용 부담으로 작용한다. 예를 들어, 일본의 대표 VTuber 소속사인 ‘홀로라이브(Hololive)’는 고가형 장비와 대규모 스튜디오를 활용하여 높은 품질의 콘텐츠를 제작하고 있다. 이러한 시스템은 시청자에게 강력한 몰입감을 제공하지만, 초기 투자 비용은 수천만 원에 달한다. 이에 반해, 일부 저가형 VTuber 시스템은 웹캠과 같은 저렴한 장비와 무료 소프트웨어를 활용하여 접근성을 높이는 데 초점을 맞추고 있다. 이러한 시스템은 초보 창작자들에게 진입 장벽을 낮추는 동시에 VTuber 생태계를 다각화하는 데 기여한다. 이로 인해 초보 크리에이터들이 쉽게 접근하지 못하고 활동을 포기하기도 한다[5]. 이러한 문제를 해결하기 위해, 고가 장비의 기능을 저렴한 솔루션으로 대체하여 접근성을 높이는 연구가 진행되고 있다. 웹캠이나 휴대폰 기반의 간단한 장비를 사용하는 것이 많이 연구되고 있으며, Unity AR Foundation과 같은 오픈소스 도구를 활용해 AR 기술을 결합한 저비용 아바타 시스템을 구현할 수 있다. Purdue University의 연구는 고가 장비가 몰입감을 제공하지만, 예산과 공간 제한으로 인해 저비용 대안이 더 실용적일 수 있다고 제시한다[6].
3-3 기존 VTuber 시스템의 사례 분석
기존 VTuber 시스템들은 보통 풀 바디 모션 캡처 장비, 고성능 컴퓨터 및 다양한 소프트웨어를 필요로 한다. 이러한 시스템들은 현실감 있고 몰입감 높은 콘텐츠 제작이 가능하지만, 초기 비용이 높아 초보 창작자들이 쉽게 접근하지 못하는 장벽으로 작용한다. 예를 들어, 고가형 시스템으로 대표되는 홀로라이브와 니지산지는 각각 3D 모션 캡처와 라이브 2D 기술을 활용하여 독창적이고 몰입감 있는 콘텐츠를 제작하고 있다. 특히, 니지산지의 경우 일부 콘텐츠에서 2D 아바타를 사용하여 초기 비용을 줄이려는 시도를 하고 있다. 고가형 VTuber 시스템은 수백만 원 이상의 모션 캡처 장비와 고급 소프트웨어를 활용하여 보다 전문적인 제작이 가능하다.
반면, 저가형 시스템으로는 VSeeFace와 Unity 기반 VRM 포맷이 대표적이다. VSeeFace는 무료 소프트웨어로, 웹캠을 활용하여 얼굴 움직임을 추적하고 이를 아바타의 실시간 반응으로 구현할 수 있다. Unity의 VRM 포맷은 사용자가 아바타를 커스터마이징하고 다양한 플랫폼에서 활용할 수 있도록 지원한다. 저가형 시스템들은 웹캠과 일부 무료 프로그램을 사용하여 초기 비용을 절감할 수 있으나, 기능적 한계로 인해 몰입감에서 차이를 보이는 경우가 있다.
본 연구는 이러한 두 시스템 사이에서 비용 효율성을 높이고 접근성을 개선하기 위해 무료 프로그램과 Unity 기반 VRM 포맷을 사용하였다[9],[10].
3-4 기존 연구와의 차별성
기존 연구는 주로 VTuber 시스템의 기술적 구조나 고가의 장비를 활용한 몰입형 콘텐츠 제작에 초점을 맞추어 왔다. 그러나 이러한 접근법은 비용 문제로 인해 초보 창작자들이 쉽게 접근하기 어렵다는 한계를 가지고 있다. 본 연구는 이러한 한계를 극복하기 위해 무료 소프트웨어와 저비용 하드웨어를 활용하여 VTuber 시스템의 경제적 접근성을 개선하였다.
기존 연구에서는 고성능 모션 캡처 장비와 고급 소프트웨어를 중심으로 연구가 진행되었으나, 본 연구는 Unity와 VRoid Studio, VSeeFace와 같은 무료 프로그램을 결합하여 비용을 최소화한 시스템을 제안하였다.
기존 시스템에서 제한되었던 표정 및 모션의 다양성은 Poiyomi Toon Shader와 BlendShape 설정을 통해 더욱 풍부하게 구현되었다.
VRM 포맷과 VSF SDK를 통합하여 다양한 플랫폼과의 호환성을 강화함으로써, 기존 연구보다 유연하고 확장 가능한 VTuber 생태계를 구축하였다.
Ⅳ. 설문조사
4-1 소비자 설문조사를 통한 데이터 수집
본 연구에서는 소비자 설문조사를 통해 일반인들이 버튜버에 대해 얼마나 관심이 있는지, 저비용 아바타가 생긴다면 실제로 만들어볼 의향이 있는지 등을 조사한다. 이를 통해 비용이 버튜버 활동의 주요 장벽인지, 혹은 관심 자체가 부족한지를 분석한다. 설문 문항은 다음과 같은 내용을 포함한다: 버튜버에 대한 관심도, 저비용 아바타 시스템의 도입 시 참여 의향, 그리고 현재까지 버튜버 활동을 시작하지 않은 이유. 이 조사를 통해 저비용 아바타 시스템의 필요성을 증명하고, 시장의 잠재 수요를 파악하고자 한다. 설문 결과는 저비용 아바타의 도입이 얼마나 많은 사람들의 참여를 유도할 수 있는지를 평가하는 중요한 지표가 될 것이다.
4-2 설문조사 결과와 VTuber 시장의 인식
설문조사에 응답한 118명 중 83.1%가 VTuber에 대해 들어본 적이 있다고 답했으며, 이는 VTuber라는 개념이 대중적으로 인지되고 있음을 보여준다. 하지만 VTuber 콘텐츠를 전혀 시청하지 않는 응답자는 75.4%로, 콘텐츠 소비가 인지도에 비해 낮은 수준임을 알 수 있었다. VTuber 활동을 시작하지 않는 주요 이유는 시간 부족과 콘텐츠 제작에 대한 자신감 부족, 그리고 기술적 어려움이었다. 이 중 기술적 어려움(43.3%)은 고비용 장비(31.1%)보다 더 큰 장애물로 나타났으며, 이는 기술적 장벽이 VTuber 시장 참여의 주요 장애 요소임을 시사한다. 또한, 많은 응답자가 컨텐츠 제작에 대한 자신감 부족(52.2%)을 이유로 들며, 기술적 문제 외에도 창의적인 부담이 진입 장벽으로 작용하고 있음을 보여준다.
응답자 중 80.5%는 저비용 VTuber 아바타 제작 시스템에 대해 알지 못했으나, 59.3%는 저비용 시스템이 있다면 사용해보고 싶다고 응답했다. 이는 VTuber 시장에서 낮은 진입 장벽의 시스템이 필요하다는 점을 뒷받침한다. 저비용 시스템에서 가장 중요한 요소로는 얼굴 인식 기능의 정확성(69.8%)과 사용자의 접근성(47.2%), 그리고 캐릭터의 커스터마이징 가능성(44.3%)이 꼽혔다. 응답자들은 실시간 상호작용을 통해 콘텐츠의 몰입감을 높이고, 현실적인 모션 캡처 기능(71.7%)과 스트리밍 중 실시간 반응 기능(49.1%)을 중요하게 여겼다. 또한, 응답자들이 선호하는 예산 범위는 3만 원에서 5만 원(28.8%)과 5만 원에서 10만 원(22.9%)으로 나타나, 저비용 시스템의 경제적 접근성이 중요한 요인으로 확인되었다.
향후 VTuber 시장이 성장할 것이라는 응답은 78.8%에 달했으며, 기술적 장비의 대중화 및 가격 인하(30.8%)와 콘텐츠의 다양화(36.5%)가 주요 개선점으로 제시되었다. 특히, 버츄얼 시장에 대한 대중의 인식을 개선해야 한다는 응답이 71.2%로 가장 높은 비중을 차지해, VTuber 시장의 성장을 위해 대중적인 접근성과 이해도를 높이는 노력이 필요하다는 점을 강조한다. 이는 VTuber 시스템의 대중화가 기술적 접근성과 시장 확대 모두에 중요한 역할을 할 수 있음을 보여준다.
Ⅴ. 연구 결과 및 논의
5-1 기존 프로그램을 활용한 검증
본 연구에서는 기존에 사용되던 VSeeFace, Unity, VRoid Studio와 이를 지원하는 VSF SDK를 기반으로 저비용 아바타 시스템을 검증하였다. VSeeFace는 사용자 얼굴의 움직임과 표정을 추적하여 실시간으로 아바타에 반영할 수 있는 소프트웨어로, 이를 통해 사용자와의 상호작용을 강화하였다. 또한, Unity와 VRoid Studio를 활용하여 제작된 VRM 아바타는 표정과 외형의 커스터마이징 기능을 제공하며, 다양한 BlendShape 기능을 활용해 아바타의 감정 표현을 세밀하게 구현할 수 있도록 개선되었다. 특히, Poiyomi Toon Shader를 도입하여 아바타의 조명과 표면 반사를 조정함으로써 몰입감 있는 외형을 구현하였으며, 악세사리와 의상 변경 기능을 추가하여 사용자 경험을 한층 풍부하게 만들었다. 이와 더불어, VSF SDK를 활용하여 VSFAvatar를 생성하고 VSeeFace와 연동하여 실시간으로 사용자 얼굴 데이터를 반영할 수 있도록 설정하였다. 이러한 연동 기술은 기존 Unity 기반의 VRM 아바타 시스템에서 표정 반영 속도 및 모션 처리 정확도를 개선하여 사용자의 표정 및 움직임 데이터가 지연 없이 아바타에 반영되도록 최적화한 결과이다. 이를 통해 고비용 시스템의 핵심 기능인 실시간 반응성과 몰입감을 저비용 시스템에서도 구현할 수 있었으며, 초기 비용 없이도 고품질의 VTuber 콘텐츠 제작이 가능하도록 지원하였다. 본 검증 과정을 통해 기존 기술을 기반으로 저비용 아바타 시스템의 효용성을 입증하였으며, 이는 VTuber 활동의 진입 장벽을 낮추고 콘텐츠 제작의 접근성을 높이는 데 기여하였다.
4-3 Shader 조정 및 기본 표정 생성
본 연구에서는 VRM 아바타의 몰입감 있는 표현을 위해 Poiyomi Toon Shader를 활용하여 조명과 표면 반사를 조정하고, 기본 표정을 생성하였다. Poiyomi Toon Shader는 셰이더 기반으로 아바타의 조명 효과, 음영, 표면 반사 등을 조정하여 보다 현실적이고 몰입감 있는 외형을 구현할 수 있고, Unity 엔진에서 쉽게 적용 및 커스터마이징할 수 있다. 또한 아바타의 조명과 표면 반사를 자연스럽게 표현하여 몰입감을 제공하며, 캐릭터가 더 생동감 있게 보여준다. 이는 사용자들이 아바타의 자연스러운 외형을 제어할 수 있도록 돕고, 다양한 상황에서 유연하게 아바타의 표정을 제어할 수 있도록 BlendShape 기능을 활용하였다.
5-2 VRM 아바타 제작 및 표정 다양성 구현
Unity와 VRoid Studio를 활용하여 제작된 VRM 아바타는 다양한 표정을 구현할 수 있도록 설정되었다. 사용자들은 BlendShape와 같은 기능을 통해 자신의 아바타가 다양한 감정을 표현할 수 있도록 제어할 수 있으며, 이를 통해 보다 풍부한 콘텐츠 제작이 가능하게 되었다. 표정의 다양성은 사용자 몰입도를 높이고, 실시간 스트리밍에서 청중과의 상호작용을 강화하는 데 기여한다. 또한 아바타의 악세사리나 의상들을 BlendShape로 수정하며 더욱 높은 다양성을 추구할 수 있다.
5-3 VSF SDK를 통한 VSFAvatar 생성 및 연동
VSeeFace와 VSF SDK를 활용하여 VSFAvatar를 생성하고, 실시간으로 사용자 얼굴 인식을 통해 아바타에 반영되도록 설정하였다. 이를 통해 저비용으로도 고품질의 몰입감을 제공하며, VTuber들이 사용자의 표정을 즉각 반영하여 실시간 소통이 가능하도록 한다. 이러한 연동 기술은 VTuber 시장에서 접근성을 강화하는 중요한 요소로 작용한다.
5-4 기존 저가형 VTuber 시스템과의 차별성
기존 저가형 VTuber 시스템은 주로 저렴한 장비와 일부 무료 소프트웨어를 사용하는 데 한정되어 있었지만, 본 연구는 이러한 한계를 극복하고 다양한 차별성을 제시하였다. 우선, VRM 포맷과 VSF SDK의 결합을 통해 무료 프로그램으로도 고품질의 아바타 제어 및 표정 구현이 가능하도록 최적화하였다. 기존 시스템은 기능적 다양성과 사용자 몰입감 측면에서 제한적인 경우가 많았으나, 본 연구에서는 비용 부담을 최소화하면서도 사용자 몰입감을 극대화할 수 있도록 Poiyomi Toon Shader를 활용하여 아바타의 외형을 더욱 사실적이고 매력적으로 표현하였다.
또한, VSeeFace와 VSF SDK를 활용한 실시간 얼굴 인식 기술은 사용자와 아바타 간의 즉각적인 반응성을 보장하며, VTuber 활동에서 중요한 실시간 상호작용성을 크게 향상시켰다. 기존 시스템에서는 표정의 다양성과 반응 속도가 제한되는 경우가 많았으나, 본 연구는 다양한 BlendShape 설정과 실시간 모션 반영 기능을 통해 보다 자연스러운 표현과 상호작용이 가능하도록 하였다. 이를 통해 VTuber 콘텐츠 제작 과정에서 시청자와의 소통 품질을 크게 개선하였다.
더불어, Unity 기반 VRM 포맷의 활용은 아바타가 다양한 소프트웨어와 플랫폼에서 유연하게 사용될 수 있도록 하였다. 기존 저가형 시스템이 특정 플랫폼이나 소프트웨어에 의존하는 한계를 지닌 반면, 본 연구는 이러한 제약을 없애고, 다양한 환경에서 자유로운 아바타 사용이 가능하도록 확장성을 제공하였다. 이로써 VTuber 생태계의 다양화와 대중화를 지원할 수 있는 가능성을 열었다.
마지막으로, Poiyomi Toon Shader를 사용한 조명과 표면 반사 조정은 기존 저가형 시스템이 제공하지 못하는 시각적 몰입감을 구현하였다. 이러한 최적화는 VTuber 콘텐츠의 품질을 한 단계 끌어올려, 경제적 부담 없이도 전문적인 콘텐츠 제작이 가능하다는 점에서 기존 시스템과의 중요한 차별성을 보여준다.
Ⅵ. 연구 논의
6-1 본 연구의 기여도
본 연구는 VTuber 활동에서 경제적 장벽을 낮추고 창작의 접근성을 확대하는 데 기여하였다. 무료 소프트웨어와 저비용 하드웨어만으로 고품질의 VTuber 콘텐츠 제작이 가능함을 입증하였다. 이는 VTuber 활동을 꿈꾸는 초보 창작자들에게 실질적인 대안을 제공한다. 기술적으로는 VSF SDK와 VSeeFace를 활용한 실시간 얼굴 인식 기술을 사용하여 사용자가 추가적인 고가 장비 없이도 자연스러운 상호작용을 구현할 수 있도록 지원하였다.
또한, Poiyomi Toon Shader를 통해 아바타의 시각적 품질을 향상시켰으며, 이는 기존 저비용 시스템과의 중요한 차별성을 제공하였다. 확장성을 위해 VRM 포맷을 활용하여 다양한 플랫폼에서 아바타를 유연하게 사용할 수 있도록 설계함으로써 VTuber 생태계의 대중화와 다양화를 촉진하였다.
설문조사를 통해 일반인들이 VTuber 시스템에서 기대하는 주요 요소를 분석하였으며, 이러한 데이터를 기반으로 시스템 설계에 반영함으로써 사용자 중심의 개발을 실현하였다.
6-2 연구 결과와 본 연구의 연관성
본 연구는 설문조사에서 제시된 주요 요구사항을 바탕으로 저비용 VTuber 시스템을 설계하고, 이를 통해 VTuber 시장 진입의 경제적, 기술적 장벽을 해결하고자 하였다. 설문조사에서 많은 응답자들이 기술적 어려움과 고비용 장비를 주요 장애물로 꼽았으며, 이는 VTuber 활동을 시작하는 데 있어 큰 제약으로 작용하고 있었다. 이를 해결하기 위해 본 연구는 무료 프로그램과 간단한 장비만으로도 VTuber 활동이 가능하도록 시스템을 설계하였다.
특히, 본 연구는 응답자들이 중요하게 생각한 얼굴 인식의 정확성과 사용자의 접근성을 만족시키기 위해 VSeeFace와 VSF SDK를 활용하여 실시간 얼굴 움직임과 표정 변화를 아바타에 자연스럽게 반영하였다. Droid 캠을 통해 휴대폰과 연동하여 실시간 반응성을 구현하였으며, VRM 아바타의 커스터마이징 기능과 Poiyomi Toon Shader를 활용하여 사용자들이 다양한 표현과 개성을 드러낼 수 있도록 하였다. 이는 설문조사에서 언급된 시스템의 유연성과 몰입감을 동시에 충족시켰다.
또한, 본 연구에서 개발된 시스템은 기존 고비용 시스템이 제공하는 주요 기능을 무료로 구현하였다. 설문 응답자들이 일반적으로 기대하는 예산 범위보다 훨씬 적은 비용, 사실상 비용이 들지 않는 방식으로 VTuber 활동을 가능하게 하였다. 이는 기존 설문조사에서 확인된 경제적 부담을 해결하고, 기술적 접근성을 극대화함으로써 VTuber 생태계를 확장할 수 있는 잠재력을 보여주었다.
결론적으로, 본 연구는 설문조사 결과에서 드러난 사용자 요구와 VTuber 시장의 현실적인 과제를 모두 반영하여 저비용 시스템을 설계하였다. 이 시스템은 대중화와 경제적 접근성을 모두 충족시켜 더 많은 사람들이 VTuber 시장에 참여할 수 있는 환경을 마련하였으며, 설문 응답자들이 기대했던 기술적 혁신과 몰입감을 동시에 제공하였다.
Ⅶ. 결 론
본 연구는 저비용 버추얼 아바타 시스템을 개발하여 VTuber 활동의 경제적, 기술적 장벽을 낮추는 데 기여하고자 하였다. 설문조사 결과를 바탕으로, 기술적 어려움과 비용 부담이 주요 장애물임을 확인하였고, 이를 해결하기 위해 VSeeFace, VSF SDK, Unity 기반 VRM 포맷 등 무료 소프트웨어와 간단한 장비를 활용한 시스템을 설계하였다. 이 시스템은 사용자 몰입감을 극대화하고 다양한 커스터마이징 옵션을 제공함으로써 기존 고가형 시스템과의 차별성을 확보하였다. 또한, 본 연구는 VTuber 생태계의 접근성을 확장하며 창작자와 시청자 간의 실시간 상호작용을 강화하는 데 중점을 두었다. 이를 통해 기존의 고비용 시스템 대비 경제적 부담을 줄이는 동시에, 보다 많은 사람들이 VTuber 시장에 참여할 수 있는 환경을 조성하였다. 이러한 결과는 VTuber 콘텐츠의 다양성을 확대하고 시장의 지속 가능한 성장을 도모하는 데 중요한 역할을 할 것으로 기대된다.
향후 연구에서는 사용자 피드백을 반영한 시스템 개선과 더불어, 다양한 문화적, 기술적 요구를 충족할 수 있는 기능 확장에 집중할 필요가 있다. 특히, 음성 변환, 스트리밍 중 실시간 반응성 강화 등 VTuber 활동에서 필요한 요소들을 추가적으로 구현함으로써 시스템의 완성도를 높이고자 한다.
본 연구는 VTuber 활동의 진입 장벽을 낮추는 기술적 대안을 제시하였으며, 디지털 콘텐츠 시장의 포괄성과 다양성을 확대하는 데 기여할 것이다.
Acknowledgments
본 연구는 과학기술정보통신부 및 정보통신기획평가원의 정보통신방송혁신인재양성(메타버스융합대학원)사업 연구 결과로 수행되었습니다(IITP-2024-RS-2024-00425383).
References
- Yonhap News. Metaverse Gains Momentum Amid COVID-19⋯Will It Create a Sustainable Ecosystem? [Internet]. Available: https://www.yna.co.kr/view/AKR20210312118700017, .
- Naver Blog. How to Become a VTuber: 2D/3D Character Creation and Purchase (Parts, Rigging, Live2D Meaning) [Internet]. Available: https://blog.naver.com/PostView.naver?blogId=sound8949&logNo=223402335990, .
- Naver Blog. How to Become a VTuber: 2D/3D Character Creation and Purchase (Parts, Rigging, Live2D Meaning) [Internet]. Available: https://m.blog.naver.com/gptfrontier/223484879341, .
- Naver Blog. How Are Virtual YouTubers Created? Introduction to Professional Programs and Necessary Equipment [Internet]. Available: https://m.blog.naver.com/starzr/221966035599, .
- iLounge. VTubing on a Budget: Affordable Tips for Aspiring VTubers [Internet]. Available: https://www.ilounge.com/articles/vtubing-on-a-budget-affordable-tips-for-aspiring-vtubers/, .
- Purdue University. AlterEcho: Loose Avatar-Streamer Coupling for Expressive VTubing [Internet]. Available: https://www.cs.purdue.edu/xrlab/assets/pdf/2021ISMARAlterEchoPopescu.pdf, .
-
N. Yee and J. Bailenson, “The Proteus Effect: The Effect of Transformed Self-Representation on Behavior,” Human Communication Research, Vol. 33, No. 3, pp. 271-290, July 2007.
[https://doi.org/10.1111/j.1468-2958.2007.00299.x]
-
J.-H. Lee and T. Woo, “Online Video Meeting Application Design Based on Design Thinking Methodology,” Journal of Digital Contents Society, Vol. 23, No. 7, pp. 1183-1189, July 2022.
[https://doi.org/10.9728/dcs.2022.23.7.1183]
- Maeil Business Newspaper. Virtual YouTubers’ Success and Cost Structures: Challenges and Opportunities in the Industry [Internet]. Available: https://www.mk.co.kr/news/it/10663613, .
- Korea Creative Content Agency (KOCCA). Content Industry Trend of Japan [Internet]. Available: https://welcon.kocca.kr/cmm/fms/CrawlingFileDown.do?atchFileId=FILE_6e7923aa-42ab-4614-9ef4-031dbdde089a&fileSn=1, .
저자소개
2018년~현 재: 경희대학교 우주과학과 학부과정
※관심분야:VR/AR 콘텐츠, VTuber, 메타버스(Metaverse)
2002년:University of Dundee (UK), Electronic Imaging. BA (Honours)
2004년:University of Dundee (UK), Electronic Imaging. MSc (이학석사)
2010년:University of Dundee (UK), Electronic Imaging. (게임학), PhD (이학박사)
2004년~2007년: University of Dundee, Lecturer
2007년~2010년: KAIST 엔터테인먼트 공학연구소, 선임연구원 (기능성 게임랩)
2010년~2012년: KAIST 문화기술대학원, Digital Art & Entertainment Track 초빙교수 (게임)
2012년~2013년: 서울대학교 차세대융합기술연구원, 게임융합미디어연구센터 센터장
2013년~2024년: 경희대학교 디지털콘텐츠학과 교수
2024년~현 재: 경희대학교 일반대학원 메타버스학과 교수
※관심분야:기능성 게임, 게임화, 게임문화, VR/AR 콘텐츠