Korea Digital Contents Society

Journal Archive

Journal of Digital Contents Society - Vol. 25 , No. 6

[ Article ]
Journal of Digital Contents Society - Vol. 25, No. 6, pp. 1497-1506
Abbreviation: J. DCS
ISSN: 1598-2009 (Print) 2287-738X (Online)
Print publication date 30 Jun 2024
Received 17 May 2024 Revised 11 Jun 2024 Accepted 11 Jun 2024
DOI: https://doi.org/10.9728/dcs.2024.25.6.1497

6자유도 기술을 활용한 유아의 3D 입체영상 인식과 지각에 관한 연구
방미향*
성결대학교 파이데이아 학부 조교수

Preschool Children’s Recognition and Perception of 3D Stereoscopic Videos Using 6 Degrees of Freedom Technology
Mi-Hyang Bang*
Assistant Professor, Division of Paidea, Sungkyul University, Anyang 14097, Korea
Correspondence to : *Mi-Hyang Bang Tel: +82-31-467-8114 E-mail: rifozom64@sungkyul.ac.kr


Copyright ⓒ 2024 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
Funding Information ▼

초록

본 연구는 유아 교육 매체로서 6자유도 입체영상 기술의 장점과 한계를 파악하고, 기술의 적용 범위를 확대하고자 수행되었다. 양안 시차와 운동 시차를 활용해 실감나는 3D 효과를 생성하는 이 기술은 사용자에게 풍부한 시각적 경험을 제공한다. 연구에서는 이 기술을 적용한 요가 프로토타입을 개발하여 유아들이 입체영상을 어떻게 인지하는지 조사하였다. 연구는 6세 및 7세 어린이 154명을 대상으로 동일한 내용의 2D와 3D 영상을 동시에 시청하게 하여, 입체영상이 유아의 인식 및 지각에 미치는 영향을 실증적으로 검증하였다. 그 결과 3D 입체영상은 유아들의 인식과 지각에 긍정적인 영향을 미쳤으며, 성별과 연령에 따라 입체영상 인식에 차이가 있음을 확인하였다. 이는 6자유도 입체영상 기술이 유아 교육 분야에 유용하게 적용될 수 있는 가능성을 시사하며, 해당 기술의 교육적 활용을 더욱 확장할 수 있을 것으로 기대된다.

Abstract

This study aims to identify the advantages and limitations of 6 degrees of freedom (6-DoF) stereoscopic imaging technology as a medium for early childhood education and to expand its range of application. Utilizing binocular disparity and motion parallax to create realistic 3D effects, this technology provides users with a rich visual experience. A yoga prototype was developed using this technology to investigate how children perceive stereoscopic images. In this study, 154 children aged 6 and 7 years were asked to watch 2D and 3D videos with the same content at the same time. The effects that stereoscopic videos had on children’s recognition and perception were empirically verified. The results showed that 3D stereoscopic videos had a positive effect on children’s recognition and perception, and their recognition of stereoscopic videos varied depending on gender and age. This suggests the possibility that 6-DoF stereoscopic imaging technology can be useful in early-childhood education, further expanding the educational use of this technology.


Keywords: Immersive Content, Comparison of 2D and 3D, 6 Degrees of Freedom (6-DoF), 3D Stereoscopic Videos, Early Childhood Yoga
키워드: 실감형 콘텐츠, 2D와 3D 비교, 6자유도, 입체영상, 유아 요가

Ⅰ. 서 론

입체영상은 두 눈의 시차를 이용하여 공간에 대한 깊이 정보를 제공함으로써 시청자에게 2차원 영상과는 다른 독특한 시각적 경험을 제공할 수 있다. 이러한 특성 때문에 20세기 초부터 입체영상은 의학, 기하학, 천문학, 화학 등 다양한 분야에서 교육 매체로서 활용되기 시작하였다[1],[2]. 2000년대에 디지털화가 진행됨에 따라 입체영상 제작과 시청 환경이 개선되어 교육 매체로서의 사용이 확대되었고[3], 2010년대 이후에는 입체영상을 직접 표시할 수 있는 디스플레이와 프로젝터가 널리 판매되면서 일반화되기에 이르렀다[4].

최근 디지털 이미징과 컴퓨터 그래픽스의 발전은 입체영상 기술을 한 단계 더 진화시켰으며, 가상 현실(VR)과 증강 현실(AR)과 같은 분야에서 혁신적인 경험을 제공하고 있다. 이러한 기술의 발전은 상용화를 가속화하며, 입체영상 기술의 적용 범위를 더욱 확대했다.

한 위치에서만 양안 시차를 지원하는 것이 가능했던 스테레오 입체영상 기술의 한계를 극복하여, 최근에는 딥러닝 기술의 발전으로 다중 시점 이미지[5], 혹은 동영상으로부터 양안 시차 및 운동 시차를 지원하는 입체영상 기술이 가능해지게 되었다.

본 연구는 이러한 양안 시차(binucular displarity)와 운동시차(motion parallax)를 지원하는 6자유도 입체영상 기술을 유아 교육 분야에 적용해 보고자 하며, 유아 교육 매체로서의 6자유도 입체영상 기술의 장점과 한계를 이해하고, 기술의 잠재적 적용 범위를 확대해 보고자 한다. 본 연구에서의 ‘유아’는 6세와 7세 아동을 포함하는 연령대를 지칭한다.

그동안 입체영상의 유아 분야에 대한 연구 및 적용은 드물었는데, 그 이유는 유아들의 시각적 및 인지적 발달을 과도하게 자극할 수 있는 기술적 요소들에 대해 신중한 접근이 필요하고, 유아들의 인지 발달 단계에 적합한 입체영상 콘텐츠의 개발에 대한 이해의 부재 때문이라 할 수 있다.

또한, 국내에서는 입체영상에 대한 시각 경험 연구가 드물었으며, 기존의 실험들은 영상 제작 과정에 대한 정보 없이 기존 영상을 사용하는 한계를 가졌다[6].

이에 본 연구에서 양안 및 운동 시차를 지원하는 6자유도 입체영상 기술의 공간적 깊이와 세밀한 표현력이 유아 신체 활동 교육에 큰 잠재력을 가지고 있다고 판단하였다. 특히 요가 프로그램과 같은 활동에서 입체영상 기술의 적용은 유아들에게 새로운 학습 경험을 제공할 수 있을 것으로 기대된다. 이를 검증하기 위해, 본 연구에서는 입체감을 최대화한 요가 관련 입체영상 프로토타입을 제작하였다.

제작된 프로토타입을 활용하여 유아들이 동일한 내용의 2D 영상과 3D 영상을 동시에 시청하게 한 후, 두 영상 간에 느껴지는 차이에 대한 유아들의 인식과 지각을 실증적으로 검증할 계획이다.

연구문제는 다음과 같이 설정하였다.

연구문제 1. 6자유도 입체영상 기술을 활용하여 흥미와 호기심을 이끌어 낼 수 있는 유아 요가 프로토타입을 어떻게 개발할 것인가?

연구문제 2. 유아들은 2D 영상과 비교하여 3D 입체영상을 어떻게 인식하고 지각하는가?

본 연구의 결과는 유아들의 3D 입체영상 인식과 지각에 관한 실증적인 데이터를 제공함으로써, 향후 입체영상 기술을 교육 분야에 적용할 때 유용한 가이드라인을 제공할 것으로 기대된다.


Ⅱ. 선행연구 고찰
2-1 입체영상 기술의 원리 및 유형

입체영상 기술은 다양한 방식으로 구현될 수 있으며, 그 중 가장 기본적인 형태는 양안 시차를 활용하는 스테레오 영상 기술이다. 이 기술은 두 카메라를 사용하여 각각 다른 위치 및 각도에서 촬영한 두 이미지를 활용, 뇌가 두 이미지의 차이를 해석함으로써 3D 효과를 인지하게 한다. 최근 연구에서는 스테레오 영상으로부터 추출한 뎁스맵을 이용하여 보다 정교한 운동 시차 효과를 지원하고 있다. 이는 관찰자의 시점 변화에 따라 보다 사실적인 3D 이미지를 생성할 수 있게 해 준다[7]. 현대에 산업계에서 가장 많이 활용되고 있는 볼류메트릭 기술은 영상 내 객체의 3차원 표면 정보를 정밀하게 캡처하고 이를 기반으로 실시간으로 입체영상을 생성할 수 있는 능력을 갖추고 있다. 이 기술은 양안 시차와 운동 시차를 모두 지원하며, 사용자의 시점 변화에 따라 다양한 각도에서 객체를 관찰할 수 있는 유연성을 제공한다. 볼류메트릭 기술은 반짝이는 금속이나 투명한 물체 등 특정 재질의 정확한 표현에는 한계가 있다. 또한, 머리카락이나 손끝 같은 미세한 구조의 디테일이 손실될 수 있다는 단점도 있다[8].

2-2 입체영상에서의 시각 경험

입체영상에서 관람자의 시각 경험은 학계의 지속적인 관심사였다. 초기 연구들은 관람자의 실재감, 입체감, 자연스러움, 그리고 부정적 효과를 중심으로 구성하여, 실험적 방법을 통해 이런 감각들이 강조되는 조건들을 식별하고자 하였다. 연구 방법은 주로 관람자에게 다양한 조건의 입체영상을 시청하게 한 뒤, 어떤 조건에서 실재감과 입체감이 강조되고, 부정적 효과가 최소화되는지를 탐색하는 실험적 접근이었다[9].

McIntire, Havig, & Geiselman은 2D 영상과 비교하여 3D 영상의 효과를 검증한 184개의 논문을 리뷰했다[10]. 이 리뷰는 실험 내용을 위치 및 거리 판단, 대상의 인식·동일화·분류, 대상의 공간적 조작, 내비게이션, 공간 이해 및 기억, 학습·훈련·계획의 6개 분야로 분류하여, 3D 영상의 효과 유무를 집계하였다. 전체 분야에서 거의 60%의 논문에서 3D 영상이 2D 영상보다 효과적이라고 보고되어 일반적으로 3D 영상의 우위가 인정되었다. 표 1은 McIntire 등에 의한 3차원 영상과 2차원 영상의 비교 논문을 요약한 것이다.

Table 1. 
Overall summary results (percentages of experimental results across task categories)
S3D is better Mixed NS = S3D Totals
Judgments of position and/or distances (%) 57 14 29 100
Finding/identifying/classifying objects (%) 65 8 27 100
Real/virtual spatial manipulations of objects (%) 67 15 18 100
Navigation (%) 42 0 58 100
Spatial understanding, memory, recall (%) 52 24 24 100
Learning/training/planning (%) 36 36 27 100

입체영상에서 관람자의 시각 경험은 여러 기술적 진보에도 불구하고 여전히 한계와 도전 과제를 안고 있다. 최근 일본의 연구에서 소니의 ELF-SR1 공간 재현 디스플레이 등은 입체감과 실재감을 높이는 새로운 시도들을 제시하고 있지만, 이러한 기술들은 아직도 사용자의 다양한 시각적 요구와 완전히 부합하지 않는 경우가 많다. 특히, 관람자가 경험하는 시각적 피로나 부정적 효과 최소화에 관한 문제는 여전히 해결되어야 할 주요 과제로 남아 있다[11].

또한 국내에서 입체영상의 시각 경험을 다룬 실험 연구도 매우 드물며[12],[13], 진행된 연구들은 영상 제작 과정에 대한 정보 없이 기존 영상을 사용하여 수행되었다. 이러한 접근 방식은 연구의 신뢰도에 의문을 제기하고, 입체영상 제작 기술의 발전에 기여하지 못하는 한계를 가지고 있었다.

본 연구는 기존의 한계를 극복하기 위해 6자유도 입체영상 기술의 특징을 최대한 살려 활용하여 유아 요가 관련 입체영상 프로토타입을 제작하고, 다수의 유아들을 대상으로 입체영상의 인식과 지각을 조사하였다. 이는 국내에서 매우 드문 실증적 연구라 할 수 있다.

2-3 입체영상 기술의 발전 동향

그림 1에서 나타난 것 같이 입체영상을 인식하는 데는 여러 요소가 영향을 미치지만, 특히 양안 시차와 운동 시차가 중요한 역할을 한다. 3D TV와 영화 등에서 사용되는 스테레오 입체영상 기술은 단일 시점에서의 양안 시차만을 지원한다. 이러한 기술적 한계로 인해 관람자가 정해진 위치를 벗어나게 되면 입체감을 제대로 느낄 수 없고, 머리를 움직여도 현실에서 경험하는 것처럼 운동 시차를 경험할 수 없다. 이로인해 여러 사람이 동시에 시청할 경우, 설정된 위치에 있는 사람만이 최적의 입체감을 느낄 수 있다.


Fig. 1. 
Principles of stereoscopic videos

스테레오 입체영상의 이러한 한계를 극복하기 위해 다양한 연구가 진행되어 왔다. 특히 스테레오 영상에서 깊이 지도를 추출하고, 이를 이용해 운동 시차를 구현하는 연구가 있었다. 이 방식에서는 사용자의 시점 변화에 따라 깊이 지도를 투영하여 새로운 영상을 생성하고, 정보가 부족한 부분은 영역 채우기 기법을 활용하여 완성한다. 그러나 정확한 깊이 지도를 만드는 것은 여전히 어려운 문제로, 이는 영상 왜곡 및 낮은 사용자 경험으로 이어진다.

최근에는 관련 하드웨어 및 소프트웨어 기술의 발전으로 라이트필드 디스플레이 혹은 시선 추적 방식을 포함하는 입체영상 디스플레이가 시장에 등장하고 있다. 이러한 기술은 보다 자연스러운 3차원 영상을 표현할 수 있게 해 기존의 스테레오 입체영상 기술의 한계를 넘어서고 있으며, 응용 분야의 확장 가능성을 보여 주고 있다.

또한 홀로그래피나 라이트필드 디스플레이의 기술적 진보와 함께, 플렌옵틱 기술 역시 입체영상 획득 및 콘텐츠 제작 발전에 크게 기여하고 있다.

플렌옵틱 기술은 마이크로 렌즈 어레이 또는 카메라 어레이를 활용하여 다양한 시점에서 4차원에서 7차원의 빛의 정보를 획득하고, 보다 풍부한 3D 이미지의 복원을 가능하게 한다. 이러한 접근법은 양안 시차와 운동 시차를 모두 지원하며, 광선의 경로를 계산하는 수학적 모델을 기반으로 새로운 시점에서의 영상을 생성할 수 있다[14].

플렌옵틱 기술과 관련하여, Japan Display의 라이트 필드 디스플레이는 고해상도의 3D 영상을 제공하는 새로운 기술로 주목받고 있으나, 아직 몇 가지 한계를 드러내고 있다. 예를 들어, 이미지 해상도와 관련된 기술적 제약과 비용 문제는 상용화에 있어서 중대한 장애물이 될 수 있다.

최근에는 딥러닝 기술의 발전으로 여러 시점의 이미지나 비디오를 학습하여 다양한 형태의 메타데이터(예: 코스트 볼륨_ Cost Volume, 다중 평면 이미지 _ Multi Plane Image)를 생성하고, 이를 바탕으로 새로운 시점의 영상을 만드는 기술들이 개발되었다. 이러한 기술들은 대규모로 학습된 딥러닝 네트워크를 필요로 하며, 이는 대규모 영상 데이터와 고급 학습 시스템을 보유한 소수의 대기업들이 주로 활용할 수 있었다. 그러나 최근에는 Neural Radiance Fields(Nerf) 기술이 등장하면서, 대규모 사전 학습 없이 입체로 생성하고자 하는 다중 시점의 이미지로부터 임의 시점의 영상을 생성할 수 있게 되었다. 이 기술의 등장으로 시점 생성 기술이 일반화되었으며, 다양한 개선 알고리즘들이 개발되고 있다. 2023년까지는 상업용 콘텐츠 생성에 사용하기에는 영상 품질이 다소 부족했지만, 2024년 이후로는 영상 품질과 렌더링 속도가 급속도로 향상되고 있고, 최근에는 가우시안 스플래터(Gaussian Splatter) 기술이 특히 주목받고 있다.

2023년도에 프로토타입 콘텐츠를 제작할 당시 Nerf와 같은 심층 학습 기반의 영상 생성 기술이 아직 초기 단계였기 때문에 영상 품질이 낮았다. 본 연구에서는 이 한계를 극복하기 위해 6자유도 입체영상 콘텐츠를 생성하는 과정에서 메타데이터 기반의 시점 생성 및 저작 기술을 활용하였고, 이를 통해 향상된 입체감과 시청자 경험을 제공할 수 있었다.


Ⅲ. 프로토타입 개발
3-1 프로토타입 시나리오 개발

본 연구는 유아들의 3D 입체영상에 대한 인식 및 지각을 탐구하기 위해, 유아들의 관심과 동기를 유발할 수 있는 ‘요가 타이틀송’ 콘텐츠를 초기 단계에서 개발하였다.

이 프로세스는 단순한 학습 도구를 넘어 실험적 매체로서, 유아들의 흥미와 호기심을 유발하고, 그들의 집중을 유지하게 하여 깊이 있는 데이터를 수집할 수 있는 데 초점을 맞추었다. 이러한 접근은 어린이들이 2D 및 3D 영상을 보며 보여 주는 반응을 관찰함으로써, 입체영상에 대한 효과적인 반응을 이끌어 내는 중요한 매개체로서 기능하도록 설계되었다.

프로토타입 시나리오는 교육전문가, 요가 전문가, 일러스트레이터, 디자이너를 포함하여 캐릭터 개발과 타이틀송의 작사, 작곡, 노래 및 안무 작업에 각 분야 최고의 전문가들이 참여하여 이루어졌다. 그리고 어린이들에게 호기심과 즐거움을 제공하는 디지털 콘텐츠 개발과 관련된 선행연구를 기반으로[15], 전문가들과의 논의 과정을 거쳐 유아들에게 교육적이면서도 흥미로운 경험을 제공할 수 있도록 시각적 및 감성적 반응을 자극할 수 있는 시나리오를 도출해 냈다.

3-2 다중 요소 동영상 입체영상 촬영 및 생성 프로세스

본 연구는 다중 요소 동영상 카메라를 사용하여 유아 요가 프로그램의 입체영상 촬영 및 생성을 목표로 하였다. 프로토타입 제작을 위해, 동기화된 60fps의 4K 해상도를 지원하는 16대의 카메라로 구성된 두 시스템을 사용하였다.

이 시스템들은 각각 영상의 정면과 좌측 45도 각도에서 촬영을 수행하여, 공간적 깊이와 다양한 시점에서의 영상 데이터를 획득하였다. 이러한 방법은 다차원의 시각적 정보를 포착하고, 더욱 풍부한 시청 경험을 제공하는 데 기여한다. 그림 2는 다중 요소 동영상 카메라를 사용한 입체영상 콘텐츠 획득 모습이다.


Fig. 2. 
Stereoscopic video content acquisition with multi-camera array

입체영상의 생성 과정에서는 딥러닝 기반으로 메타데이터를 생성하고 이를 기반으로 한 시점 생성 기술을 적용하였다. 이 기술은 다수의 요소 영상을 분석하여 입체감을 높이고, 각 시점에서 촬영된 영상 간의 일관성을 유지하며 입체영상을 구성한다. 구체적으로는 다음과 같은 단계를 거쳤다.

1) 다중 요소 영상에서 객체 인식

다중 요소 영상 촬영에서 촬영된 이미지 내에 등장하는 다양한 실사 객체와 컴퓨터 생성(CG) 객체 간의 상호작용 및 가려짐(Occlusion) 효과를 위해, 각 객체에 대해 개별 마스크를 생성하였다. 이러한 마스크 작업은 객체들 사이의 상호작용을 더욱 명확하게 나타내고, 복잡한 환경에서도 각 객체를 정확히 식별할 수 있게 돕는다.

2) 가상 카메라 계산

각 요소 영상에 대하여, 카메라의 위치와 시점을 정밀하게 계산하였다. 이 정보는 CG 객체를 효과적으로 합성하고 6자유도 입체영상을 생성하는 데 필요한 카메라의 외부(extrinsic) 및 내부(intrinsic) 정보를 확보하는 데 큰 도움이 되었다. 이 계산은 복잡한 3D 환경에서의 정확한 시각적 표현을 가능하게 하며, 입체영상 제작의 정확도를 향상시킨다.

3) 실사 및 CG 합성

각 요소 영상별로 실사 영상과 CG 객체를 결합한 합성 영상을 랜더링하였다. 이 과정에서 앞서 생성한 마스크를 stencil로 활용함으로써, CG 객체가 실제 객체에 의해 자연스럽게 가려지는 효과를 구현하였다. 이러한 방식은 입체감을 더욱 강조하며, 각 개별 요소 영상의 합성 결과를 바탕으로 시점 생성을 위한 메타데이터를 효과적으로 생성하였다. 이는 최종 영상의 리얼리즘과 시각적 퀄리티를 크게 향상시키는 중요한 단계다.

4) 시점 생성

본 연구의 사용자 실험을 위해서, 48시점을 제공하는 15인치 무안경 입체영상 디스플레이를 사용하였다. 각 디스플레이의 시점 수와 가시화 정보는 고정된 값이므로, 각 디스플레이에 맞게 앞 단계에서 생성한 메타데이터를 기반으로 다시점 영상을 생성하고 이를 MOV 형식의 동영상으로 제작하였다.

관찰자는 머리를 움직임에 따라 위치에 맞는 45 혹은 48 시점의 영상 중 한쌍을 양눈으로 보게 되며, 이를 통해 양안 시차를 경험하고, 머리의 움직임에 따라 운동 시차를 경험하게 된다. 해당 디스플레이는 디스플레이 패널의 해상도를 나누어 시점 영상 가시화에 사용하기 때문에 전체적인 해상도가 낮아지는 단점을 가지나, 동시에 2명 이상의 사람이 동일한 영상 콘텐츠를 경험할 수 있는 장점을 가진다. 다중 요소 동영상 입체영상 콘텐츠의 생성 프로세스는 표 2에 제시하고 있다.

Table 2. 
Multi-view based stereoscopic video content creation process
Object recognition
Virtual camera calculation
Live action and CG synthesis
Viewpoint generation

5) 입체 효과 극대화를 위한 영상 획득 장면 설정

실험 대상 디스플레이에서의 입체 경험 극대화를 위하여, 다양한 거리 및 시야각에 대한 객체 배치 실험을 반복하였다. 실험 결과를 기반으로 카메라 어레이와 실사 객체와의 최소 거리는 3m, 최대 거리는 6m로 설정하였다. 또한, 객체 간의 공간감 대비를 위하여, 인물 및 객체를 네 열로 배치하였다. 첫 번째 열에는 만들어 넣을 캐릭터 자리와 어린이, 두 번째 열에는 요가 선생님, 세 번째 열에는 소파를 배치하고, 네 번째 열의 벽면에는 그림이 걸린 액자를 부착하여 공간감을 더욱 풍부하게 표현하였다.

그림 3은 입체효과 극대화를 위한 영상 획득 장면 설정을 나타낸 것이다.


Fig. 3. 
Scene setup diagram for stereoscopic video content acquisition


Ⅳ. 연구 방법론
4-1 설문지 개발

본 연구의 설문 도구는 입체감, 피로감, 실재감 등 입체영상의 지각에 관한 선행연구를 기반으로 본 연구의 목적과 유아들의 발달 단계에 적합하게 개발되었다[16],[17].

선행연구의 설문지는 예비조사를 통해 신뢰도를 평가하여 재구성되었다. 예비조사는 2023년 11월 1일부터 11월 3일까지 실시되었으며, 성결대 부속 유치원 어린이 50명을 대상으로 실시하여 신뢰도를 만족시키지 못하는 문항을 제외함으로써 연구의 정밀성을 높였다(신뢰도 =.758). 설문 응답은 어린이의 발달 단계를 고려, 3점 척도(1-상, 2-중, 3-하)를 적용하여 유아들의 인지적 발달 수준에 맞춰 답변의 복잡성을 줄였다.

4-2 프로토 타입 개발

연구 참여 유아들에게 제공된 유아 요가 프로토타입 콘텐츠 영상은 6자유도 입체영상으로 제작되었는데, 이 영상은 일반 디스플레이에서는 2D로 보이고, 입체영상 디스플레이에서는 3D 효과를 경험할 수 있다.

유아들의 주의를 끌고 집중력을 유지하기 위해, 이 영상은 전체적으로 완결된 1분 길이의 타이틀송으로 구성되었다. 이는 일반적으로 실험에 사용되는 실험을 위한 단편적인 영상과 달리 완성된 콘텐츠를 제공함으로써 유아들에게 온전한 교육적 경험을 제공할 수 있게 하였다. 그림 4는 완성된 프로토타입 영상을 보여 준다.


Fig. 4. 
Stereoscopic video content on multi-view display


Ⅴ. 연구 실행
5-1 연구 설정 및 참여 기관

이 연구는 성결대학교 부속 유치원, 안양시 신일 유치원, 군포시 오금동 어린이집에서 6세와 7세 유아 159명을 대상으로 진행되었다. 실험은 2023년 11월 27일부터 12월 7일까지 교육기관의 일정에 맞게 이루어졌다.

참여한 교육기관별로 연구 일정과 참여 인원 분포는 표 3에 상세히 나타나 있다.

Table 3. 
Research schedule and participant distribution for each participating educational institution (N=159)
Place Date Age Gender Number of
participants
Kindergarten Affiliated with Sungkyul University 11. 27. 2023 Age 6 (n=28) Male 22 49
Age 7 (n=21) Female 27
Anyang Sinil Kindergarten 12. 6. 2023 Age 6 (n=37) Male 40 76
Age 7 (n=39) Female 36
Anyang Ogeum-dong Daycare Center 12. 7. 2023 Age 6 (n=14) Male 17 34
Age 7 (n=20) Female 17

5-2 영상 시청

유아들은 2D와 3D 영상을 동시에 시청했다. 모든 영상은 내용상 동일하며, 48시점을 제공하는 15인치 무안경 입체영상 디스플레이(Looking Glass Factory)와 그와 같은 크기의 아이패드를 사용하여 상영되었다.

프로토타입은 유아들이 영상 형식에 따른 입체적 인식 차이를 비교하는 데 사용되었다. 그림 5는 2D 영상과 3D 입체영상을 동시에 시청하는 실제 실험 모습이다.


Fig. 5. 
Viewing 2D and 3D stereoscopic videos simultaneously

5-3 관찰 및 응답

연구 과정에서 교사와 연구자는 유아들이 2D 및 3D 영상을 시청하며 경험하는 입체감과 직관적 반응을 자유롭게 표현할 수 있도록 적절한 환경을 조성하였다. 이를 통해 유아들이 2D와 3D의 두 영상 형식에 대해 느끼는 차이점을 자연스럽게 표출하도록 도왔다. 연구자와 교사는 이들의 발언과 반응을 세심하게 기록하였다.

5-4 설문 조사

영상 시청 후, 유아들은 간소화된 3점 척도를 사용하여 설문에 응답하였다. 연구자가 질문을 읽어 주고 어린이들이 구두로 답변하는 형식으로 진행된 구두 설문 조사를 실시하였다. 이 설문은 유아들의 인지 상태와 표현 능력을 최대한 고려하여 진행되었다.


Ⅵ. 연구 결과
6-1 분석

표본의 인구사회학적 특성을 보면, 참여 유아는 6세가 49.7%, 7세가 50.3%이며, 성별 분포는 남자가 49.7%, 여자가 50.3%로 균등하게 분포되어 있다.

본 연구에서 사용된 입체영상의 지각과 관련된 측정 도구의 신뢰도는 Cronbach’s α를 사용하여 평가되었다(α = 0.765), 이 결과는 각 항목의 내적 일관성이 학문적 기준을 충족함을 보여 준다.

연구 자료의 표본 수집은 편의 표본 추출 방법을 사용하여 실시되었다. 총 159명의 유아를 대상으로 실험을 진행하였고, 5명의 아이들은 실험에서 부실한 응답 결과로 제외되어 실제 분석에는 154명의 응답 결과가 분석되었다. 수집된 데이터는 SPSS 24.0 프로그램을 이용하여 분석되었다. 실험의 효과는 일표본 T-검정을 통해, 성별과 연령별 변인의 차이는 독립 표본 t-test를 통해 분석되었다.

5-2 결과

본 연구의 목적은 6자유도 입체영상 기술을 사용하여 유아 요가 ‘타이틀송’ 프로토타입을 제작하고, 6세 및 7세 유아들에게 2D 및 3D 형식으로 동시에 시청하게 한 후, 이 기술이 유아의 3D 영상 인식과 지각에 어떠한 영향을 미치는가를 조사하는 것이다.

이를 위해 일표본 T-검정을 사용하여, 표본 집단의 평균 입체영상 인식 점수가 통계적으로 유의미한 차이를 보이는지를 검정하였다.

1) 입체영상 인식 통계 결과

본 연구에서는 154명의 유아를 대상으로 2D와 3D 요가 프로토타입 영상을 함께 시청하게 한 후, 입체영상에 대한 인식을 측정하였다. 이를 위한 평가 도구로 일표본 T-검정(one-sample T-test)을 활용하여 표본집단의 입체영상 인식 평균 점수가 전체 모집단에 대한 귀무가설인 ‘입체영상 인식이 통계적으로 유의하지 않다.’에 대한 기각 여부를 검토했다. 연구 결과, 표본집단의 입체영상 인식 평균 점수는 2.720으로 산출되었고, 이는 표준편차 0.493의 분포를 보이는 것으로 나타났다. 통계적 분석을 통해, 해당 평균 점수는 통계적 유의성을 가지며(p-값이 0.05 이하), 이는 유아들이 3D 영상을 보았을 때 입체적 요소들을 인지하는 데 어려움이 없으며, 평균적인 인지 수준보다 높다는 것을 나타낸다. 표 4는 일표본 통계량을, 표 5는 일표본 검정 결과를 나타낸다.

Table 4. 
One-sample statistics (recognition of stereoscopic videos)
  N Mean Standard deviation
My eyes felt tired.* 154 2.73 0.595
The video was not comfortable to watch (incompatibility).* 154 2.73 0.561
I could see the video well from various angles. 154 2.69 0.619
Perception of stereoscopic videos 154 2.720 0.493
* 2 items were reverse-coded.

Table 5. 
One-sample test (recognition of stereoscopic videos)
Test value = 2
t Degree of freedom p-value
two-sided)
Mean
difference
95% confidence interval for difference
Lower bound Upper bound
My eyes felt tired. 15.315 153 .000*** 0.734 0.64 0.83
The video was not comfortable to watch (incompatibility). 16.243 153 .000*** 0.734 0.64 0.82
I could see the video well from various angles. 13.926 153 .000*** 0.695 0.6 0.79
Perception of stereoscopic videos 18.136 153 .000*** 0.720 0.642 0.799
*** p<.001

2) 성별에 따른 입체영상 인식 차이 분석

성별에 따른 연구변인들의 차이를 독립표본 t-test로 분석한 결과를 표 6에 정리하였다.

Table 6. 
Analysis of the differences in recognition of stereoscopic videos by gender
Gender t p-value
Male Female
My eyes felt tired. 2.63±.69 2.84±.46 -2.262 .025*
The video was not comfortable to watch (incompatibility). 2.63±.69 2.84±.37 -2.404 .017*
I could see the video well from various angles. 2.60±.71 2.79±.50 -1.889 .061
Perception of stereoscopic videos 2.62±.58 2.82±.35 -2.627 .009**
** p<0.01, * p<0.05
* 2 items were reverse-coded.

성별 연구변인들의 차이를 독립표본 t-test를 통해 분석한 결과 눈에 피로감을 느꼈다(t=-2.262, p<.05), 영상에 보기에 편하지 않았다(위화감)(t=-2.404, p<.05), 입체영상의 지각 전체(t=-2.627, p<.01) 항목은 5% 유의수준에서 통계적으로 유의한 차이가 있는 것으로 나타났으며, 다양한 각도에서 영상이 잘 보였다(t=-1.889, p>.05) 항목은 5% 유의수준에서 통계적으로 유의한 차이가 없는 것으로 나타났다.

눈의 피로감, 영상의 불편함(위화감), 입체영상의 전반적인 지각 능력에서 유의미한 차이를 나타낸 것은 성별에 따라 3D 영상 시청 시 느끼는 피로감이나 불편함이 다를 수 있음을 의미한다. 눈의 피로감과 영상의 불편함(위화감)에서는 여성이 더 민감할 수 있음을, 입체영상의 지각에서는 여성이 더 높은 인식을 보일 수 있음을 시사한다.

영상이 다양한 각도에서 잘 보인다는 항목에서는 성별 간에 통계적으로 유의미한 차이가 발견되지 않았다. 이는 성별에 관계 없이 유아들이 영상을 각각의 시점에서 비슷하게 인식하고 있음을 나타낸다.

‘입체영상의 지각’ 전체 항목에서도 남성 유아의 평균 점수는 2.60, 여성 유아는 2.79로, t 값은 -2.627(p = .009)로 측정되어, 통계적으로 유의한 차이를 보여 주며, 여자 유아들이 남자 유아들에 비해 입체영상을 인지하는 능력이 상대적으로 높음을 나타낸다.

3) 연령에 따른 입체영상 인식 차이 분석

연령별 연구변인들의 차이를 독립표본 t-test로 분석한 결과를 표 7에 정리하였다.

Table 7. 
Analysis of the differences in recognition of stereoscopic videos by age
Age t p-value
6 7
My eyes felt tired. 2.84±.43 2.63±.71 2.262 .025*
The video was not comfortable to watch (incompatibility). 2.86±.39 2.62±.67 2.709 .008**
I could see the video well from various angles. 2.78±.53 2.62±.69 1.621 .107
Perception of stereoscopic videos 2.82±.38 2.62±.57 2.627 .009**
** p<0.01, * p<0.05
* 2 items were reverse-coded.

그 결과 6세 유아들의 ‘눈에 피로감을 느꼈다’는 항목에 대한 평균 점수는 2.84로, 7세 유아들의 2.63에 비해 상대적으로 높게 나타났으며, t 값은 2.262(p = .025)로 계산되어 5%의 유의수준에서 통계적으로 유의미한 차이가 있음을 보여 준다.

‘영상 시청이 불편했다(위화감)’ 항목에서 6세 유아들의 평균 점수는 2.86, 7세 유아들은 2.62로 나타나, t 값은 2.709(p = .008)로, 이는 6세 유아들이 7세 유아들보다 입체영상 시청 중 불편함을 덜 느낀다는 것을 의미하며, 1%의 유의수준에서 통계적으로 매우 유의미한 차이를 나타낸다.

‘입체영상의 지각’ 전체에 대한 평가에서는 6세 유아들의 평균이 2.78, 7세 유아들의 평균이 2.62로 측정되어, 6세 유아들이 7세 유아들보다 입체영상을 더 잘 인지하는 것으로 나타났다. 이 차이는 t 값 2.627(p = .009)로, 1%의 유의수준에서 통계적으로 유의미하다.

하지만 ‘다양한 각도에서 영상이 잘 보였다’ 항목에서는 연령에 따른 통계적으로 유의미한 차이가 발견되지 않았다(t = 1.621, p = .107). 이는 연령 증가에 따른 영상의 가시성 인식 능력이 유의미하게 변화하지 않음을 시사한다.

그러나 6세 유아들이 7세 유아들에 비해 상대적으로 높은 점수를 보인 ‘눈에 피로감을 느꼈다’ 및 ‘영상 시청이 불편했다(위화감)’ 항목은 개발적 관점에서 보다 많은 관심을 요하는 영역으로 해석될 수 있다.

4) 유아들의 입체영상 인식에 대한 자유기술 분석

표 8은 이 연구에서 수집한 유아들의 자유기술 의견을 정리한 것으로, 유아들이 3D 입체영상에 대해 어떻게 인식하고 반응하는지를 광범위하게 보여 주고 있다. 이 데이터는 세 가지 주요 카테고리로 분류될 수 있다.

Table 8. 
Analysis of free notes on children’s recognition of stereoscopic videos
Visual presence It looks like it’s really standing. It seems real. It looks really alive. It looks like it turned into paper. It’s alive. It’s really in the forest. It looks like a piece of paper with a person inside. It feels like the butt will stick out when bending. It looks like there are real flowers. It feels like inside. It looks like a real frog. It looks real. It seems like it’s real. It felt real like I was seeing it right before my eyes. It looks like the house is inside. It seems like a house. The character seems to be standing together with a person.
Visual confusion and discomfort It seems crappy. There are many points. It’s blurry. It’s scary. I can’t see it well. It’s weird. It looks like dot-dot-dot. It looks foggy. It looks like dots. I can’t see more. It looks blurry. It’s weird, but I could see. I think my eyes will turn red. It’s hard to see. It was faint. I don’t know what it is.
Spatial location and motion recognition It looks 3D. It comes out more. The picture seems to be up here or far behind. Something looks different. It seems to be sticking out. It looks like it’s out front. It’s like 3D. It seems like 3D. It looks like it’s in front of the glass. It looks like it’s really sticking out. It’s 3D. It seems like it’s out. It looks close. The letters are in front. The flowers are spinning. The flower moves back and forth. It looks like 3D. It looks bigger. Seeing people pop out was most fun. I’ve never seen this. One seems to be out in front, and the other seems to be in the back. It was fun because it pops out. This (3D) is like virtual reality, and this (2D) is flat. It’s far away. It pops out. The plane looks like it’s out front. It’s in and it’s out front. This (3D) seems to pop out, and this (2D) doesn’t seem to pop out. It looks like it’s close. This (2D) is flat.

a. 시각적 실재감

많은 아이들이 입체영상이 "진짜 같다", "실제인 것 같다", "실감났다"라고 표현했으며, 이는 3D 기술이 아이들에게 현실감 있는 시각적 경험을 제공했음을 시사한다. 또한, "캐릭터가 사람이랑 같이 서 있는 것 같다"와 같은 의견은 CG 작업된 캐릭터가 입체영상과 자연스럽게 통합되어, 현실감 있는 시각적 경험을 제공했음을 보여 준다.

b. 시각적 혼란과 불편함

일부 아이들은 "잘 안 보인다", "눈이 빨개질 것 같아요", "흐리게 보인다"와 같이 입체영상을 보는 데 어려움을 겪었다고 보고했다. 이는 3D 영상의 특정 측면이 일부 아동에게 시각적 혼란이나 불편함을 유발할 수 있음을 나타낸다.

c. 공간적 위치와 움직임 인식

아이들은 입체영상의 요소들이 "앞으로 나와 보인다", "앞에 있는 것 같고 뒤에 있는 것 같다", "꽃이 빙글빙글 돌아감" 등의 표현을 사용하여, 영상의 공간적 깊이와 움직임을 인식하고 있다고 응답했다. 이러한 반응은 3D 기술이 아이들에게 다차원적 공간 인식을 가능하게 하는 것을 시사한다.

본 실험에서 도출된 유아의 다양한 시각적 인상과 감각적 경험은 향후 입체영상 기술을 활용한 교육 콘텐츠 개발에 있어 중요한 고려사항으로 작용할 것이다.


Ⅵ. 논의 및 결론

본 연구에서는 6자유도 입체영상 기술을 활용하여 유아 요가 관련 프로토타입 영상을 개발하고, 유아들이 3D 영상을 인식하고 지각하는 방식에 미치는 영향을 조사하였다. 분석 결과, 유아들은 3D 영상의 입체적 요소들을 쉽게 인지할 수 있었으며, 이는 평균적인 인지 수준보다 높게 나타났다. 또한, 성별과 연령에 따른 입체영상 인식의 차이를 발견하였는데, 특히 여성 유아와 6세 유아가 더 민감하게 반응하는 것으로 나타났다.

프로토타입 개발 과정에서는 다양한 전문가들이 참여하여 유아들의 흥미와 동기를 유발할 수 있는 콘텐츠를 설계하였다. 유아 요가 프로그램의 3D 영상은 촬영과 생성 과정에서 딥러닝을 활용한 메타데이터 생성 및 시점 생성 기술을 적용하여 입체감을 강화하였다. 이러한 기술적 접근을 통해 설계된 프로토타입은 유아들의 시각적 및 감성적 반응을 자극하며, 입체영상에 대한 효과적인 반응을 유도할 수 있었다.

이러한 연구의 주요 의의는 두 가지 측면으로 볼 수 있다. 첫째로, 본 연구는 새로운 기술인 6자유도 입체영상 기술을 그동안 상대적으로 연구가 이루어지지 않았던 유아 교육에 적용하여, 유아들의 시각적 및 감성적 반응을 자극할 수 있는 프로토타입을 만들었다는 점이다. 이는 입체영상 기술이 유아 교육 분야에 적합하다는 가능성을 보여 줌으로써, 교육 콘텐츠 개발에 새로운 가능성을 제시하였다 할 수 있다.

둘째로, 본 연구는 154명의 많은 유아들을 대상으로 한 매우 드문 실험 연구로, 유아들의 입체영상에 대한 지각 및 인식을 이해하는 데 중요한 기초적 자료를 제공했다. 특히 유아들이 2D 영상과 함께 3D 입체영상을 보면서 표현한 다양한 시각적 인상과 감각적 경험은 입체영상 기술의 교육적 활용에 대한 실증적인 기반을 마련하고, 교육 매체로서의 입체영상 기술의 장점과 한계를 이해하는 데 중요한 기초 자료로 활용될 수 있다.

연구의 주요 제한 사항으로는 유아들의 발달 단계상 자세한 표현이나 직접적인 설문 조사를 수행하기가 매우 어려웠고, 유치원 및 어린이집 등 공식 교육기관과의 협조를 얻는 과정도 원활하지 않아 연구 실행에 어려움을 겪었다. 연구 과정에서는 선행연구에서 나온 문항들을 유아에게 일괄적으로 적용하지 못해 예비조사가 이루어졌고, 그 과정에서 그들의 나이와 이해도를 고려하여 연구 도구를 또한 적절히 조정해야 했다.

앞으로도 입체영상 기술의 발전과 함께, 이를 교육에 통합하는 방법에 대한 지속적인 연구와 논의가 필요하며, 이는 교육 매체로서의 입체영상 기술의 잠재력을 실제 교육 현장에서 최대한 활용하기 위한 중요한 과정이 될 것이다.


Acknowledgments

이 논문은 2024년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원에 의하여 이루어진 연구로서, 관계부처에 감사드립니다(2022-0-00022, RS-2022-II220022, 초실감 메타버스 서비스를 위한 실사기반 입체영상 공간컴퓨팅 기술 개발).


References
1. A. W. Judge, Stereoscopic Photography: Its Application to Science, Industry and Education, 3rd ed. London, UK: Chapman & Hall, 1950.
2. C. Kennedy, “The Development and Use of Stereo Photography for Educational Purposes,” Journal of the Society of Motion Picture Engineers, Vol. 26, No. 1, pp. 3-17, 1936.
3. A. Johnson, J. Leigh, P. Morin, and P. Van Keken, “GeoWall: Stereoscopic Visualization for Geoscience Research and Education,” IEEE Computer Graphics and Applications, Vol. 26, No. 6, pp. 10-14, Novermber-December 2006.
4. S. Kawamura, Characteristics of 3D Video as Educational Media, Ph.D. Dissertation, Kobe University, Kobe, Japan, 2016.
5. B. Kerbl, G. Kopanas, T. Leimkuehler, and G. Drettakis, “3D Gaussian Splatting for Real-Time Radiance Field Rendering,” ACM Transactions on Graphics, Vol. 42, No. 4, 139, August 2023.
6. S. M. Cho and H. S. Kim, “Study on the Viewers’ Psychological Responses to Stereoscopic Images of 3D Film,” Journal of the Moving Image Technology Association of Korea, Vol. 1, No. 19, pp. 23-49, December 2013.
7. S.-G. Lee, G.-H. Kim, and J.-G. Kim, “The Establishment of the Secondary Copyright according to the Production Method of the 3D Stereoscopic Video Content and the Attribution,” Journal of Digital Contents Society, Vol. 15, No. 2, pp. 237-250, April 2014.
8. G. Kim, Develop for 3D Volumetric Video Capture Technology for Preserving the Intangible Cultureor Research, Korea Creative Content Agency, Naju, Technical Report TRKO202100000032, July 2020.
9. M. Kim, “Mother’s Perception on the Effect of Using Smart Devices by Young Children,” Journal of Digital Contents Society, Vol. 18, No. 3, pp. 517-524, June 2017.
10. J. P. McIntire, P. R. Havig, and E. E. Geiselman, “Stereoscopic 3D Displays and Human Performance: A Comprehensive Review,” Displays, Vol. 35, No. 1, pp. 18-26, January 2014.
11. H. Nate, H. Kubo, M. Shiraishi, and N. Okaichi, “Annual Report on Artistic Image Technology and Computer Graphics,” The Journal of the Institute of Image Information and Television Engineers, Vol. 75, No. 6, pp. 775-778, November 2021.
12. H.-J. Keum, “3D Effects: Presence, Identification and Enjoyment of the Movie ‘Avatar’,” Korean Journal of Journalism & Communication Studies, Vol. 54, No. 4, pp. 27-48, August 2010.
13. O.-K. Lee, “The Research on Users’ Experience Using 3D Image by Medium,” Journal of Communication Science, Vol. 11, No. 1, pp. 330-371, March 2011.
14. W. H. Son, H. W. Jang, S. J. Bae, S. J. Park, J. W. Kim, and D. H. Kim, “Plenoptic Image Processing Technology Trends,” Electronics and Telecommunications Trends, Vol. 31, No. 4, pp. 1-12, August 2016.
15. S. H. Nam, J. Y. Lee, G. Ko, and K. W. Suh, “Early Childhood Interactive Edutainment Content Production Platform Based on Motion Recognition,” Journal of Digital Contents Society, Vol. 20, No. 12, pp. 2397-2405, December 2019.
16. H. Matsukawa and T. Nishimori, “The Effect of 3D Video on Course Evaluation and Social Presence,” Journal of the Japan Society for Educational Technology, Vol. 38, No. Suppl., pp. 25-28, December 2014.
17. D. Chung and H. Yang, “Reliability and Validity Assessment in 3D Video Measurement,” Journal of Broadcast Engineering, Vol. 17, No. 1, pp. 49-59, January 2012.

저자소개

방미향(Mi-Hyang Bang)

1987년:고려대학교(문학사)

2004년:서강대학교 언론대학원(언론학석사)

2012년:KAIST 문화기술대학원(공학박사)

1987년~2021년: 금성출판사 R&D 이사

2024년~현 재: 성결대학교 파이데이아학부 조교수

※관심분야:메타버스(Metaverse), 에듀테크(EduTech), 실감형 콘텐츠(VR Contents) 등