Korea Digital Contents Society
[ Article ]
Journal of Digital Contents Society - Vol. 27, No. 2, pp.335-345
ISSN: 1598-2009 (Print) 2287-738X (Online)
Print publication date 28 Feb 2026
Received 16 Jan 2026 Revised 05 Feb 2026 Accepted 09 Feb 2026
DOI: https://doi.org/10.9728/dcs.2026.27.2.335

마커 기반 확정적 제어를 이용한 숏폼 콘텐츠 제작 워크플로우 자동화 시스템 구현

최현주1 ; 정재필2, *
1중앙대학교 예술공학부 학사과정
2중앙대학교 예술공학부 조교수
Implementation of a Marker-Based Deterministic Control Workflow Automation System for Short-Form Content Production
Hyunjoo Choi1 ; Jaepil Jeong2, *
1Bachelor’s Student, College of Art & Technology, Chung-Ang University, Anseong 17546, Korea
2Assistant Professor, College of Art & Technology, Chung-Ang University, Anseong 17546, Korea

Correspondence to: *Jaepil Jeong Tel: +82-31-670-3191 E-mail: jafeel@cau.ac.kr

Copyright ⓒ 2026 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

초록

본 연구는 숏폼 콘텐츠 제작 과정에서 반복적으로 발생하는 리프레임 및 자막 동기화 공정의 비효율성을 해결하기 위해, 제작자의 연출 의도를 사전 데이터로 활용하는 워크플로우 자동화 모델을 제안한다. 본 연구는 영상 편집 자동화를 사후 분석 중심의 처리 방식이 아닌 제작 공정 단계에서의 확정적 제어 관점으로 접근함으로써, 숏폼 콘텐츠 제작 워크플로우의 구조적 표준화 가능성을 학술적으로 제시한다. 이를 구현하기 위해 어도비 애프터이펙트 기반의 통합 자동화 패널을 설계·구현하였으며, 마커 데이터 분석을 통한 쇼츠 단위 컴포지션 일괄 생성, 하드 컷(Hard Cut) 자막 동기화 알고리즘, 그리고 Target 해상도 내 가이드 박스를 활용한 다중 리프레임 엔진을 적용하였다. 실험 결과, 동일한 반복 제작 조건에서 10개 클립을 일괄 제작할 경우 수동 작업 대비 총 제작 시간이 약 86% 단축되었으며, 클립 수 증가에 따른 공정 안정성 또한 향상됨을 확인하였다.

Abstract

This study proposes a workflow automation model that uses creators’ intent as pre-defined data to address inefficiencies in reframing and subtitle synchronization processes that frequently occur in short-form content production. Rather than relying on post hoc analysis-based or probabilistic automation approaches, this study adopts a deterministic control perspective at the production stage, thereby academically suggesting the potential for structural standardization of short-form content production workflows. To implement this approach, an integrated automation panel based on Adobe After Effects was designed and developed, incorporating marker-based batch composition generation, a Hard Cut subtitle synchronization algorithm that forcibly removes the previous subtitle one frame before the next begins, and a multi-mode reframing engine using guide boxes within the target resolution. The experimental results demonstrated that, under identical repetitive production conditions, batch generation of ten clips reduced total production time by approximately 86% compared to manual workflows, while also improving process stability as the number of clips increased.

Keywords:

Short-Form Content, Workflow Automation, After Effects Script, Reframe Engine, Hard Cut Subtitles

키워드:

숏폼 콘텐츠, 워크플로우 자동화, 애프터이펙트 스크립트, 리프레임 엔진, 하드 컷 자막

Ⅰ. 서 론

1-1 연구 배경 및 산업적 당위성

현대 미디어 소비 환경은 스마트 디바이스의 보급과 네트워크 기술의 발달로 인해 급격한 변화를 맞이하고 있다. 특히 1분 내외의 짧은 영상인 숏폼(Short-form) 콘텐츠는 빠른 장면 전환과 높은 정보 밀도를 특징으로 하며, 시청자의 주의 집중 시간을 중심으로 진화한 현대 영상 소비 트렌드의 핵심으로 자리 잡고 있다[1]. 이러한 시장의 패러다임 변화는 기존 16:9 비율의 가로형 영상을 9:16 비율의 세로형 영상으로 재가공하여 콘텐츠의 도달 범위를 확장하려는 OSMU(One Source Multi Use) 제작 수요를 급격히 증가시키고 있다.

영상 제작 현장에서는 정교한 시각 효과(VFX)와 모션 그래픽 구현을 위해 어도비 애프터이펙트(Adobe After Effects)를 필수적으로 활용하고 있다[2]. 그러나 가로형 영상을 세로형으로 변환하는 과정에서 발생하는 구간 분할, 리프레임(Reframe), 자산 재배치 등의 공정은 여전히 편집자의 수동 작업에 크게 의존하고 있다. 이러한 반복적 수작업 중심의 워크플로우는 제작 공정의 효율성을 저하시킬 뿐만 아니라, 대량 콘텐츠 생산 환경에서 작업자의 피로도를 증가시키고 일관된 품질 유지를 어렵게 만드는 주요 요인으로 작용한다[3].

1-2 기존 워크플로우의 한계 분석

기존의 숏폼 콘텐츠 제작 워크플로우는 기술적·실무적 측면에서 다음과 같은 한계를 지닌다. 첫째, 구간 분할 공정의 비효율성이다. 편집자는 타임라인 상에서 수동으로 구간을 설정하고, 각 구간별 컴포지션을 개별적으로 생성·관리해야 하며, 이 과정에서 프로젝트 구조의 복잡성이 급격히 증가한다. 이러한 문제는 시간 기반 영상 데이터를 체계적으로 구조화하지 못한 제작 환경에서 더욱 두드러지며, 실제 제작 현장에서는 반복적인 탐색과 수작업에 따른 시간적 비용 증가로 이어진다[4]. 한편 샷 경계 검출을 자동화하려는 다양한 알고리즘 연구들이 제안되어 왔으나[5],[6], 이러한 접근은 알고리즘적 처리 수준에서의 정확도 향상에 초점을 두고 있어, 복합적인 편집 맥락이나 제작자의 연출 의도를 포함한 제작 공정 전반을 포괄적으로 설명하는 데에는 한계가 있다.

둘째, 리프레임 공정의 예측 가능성 부족이다. 자동화 기능을 제공하는 일부 편집 도구가 존재하나, 레이어 기반으로 구성된 복합적인 애프터이펙트 프로젝트와의 호환성은 제한적이며, 이는 실제 제작 환경에서 안정적인 적용을 어렵게 만드는 요인으로 작용한다. 시선 추적(Gaze) 정보를 이용한 비디오 리프레임 방식 등 학술적 대안이 제시되고 있으나[7], 이러한 방식은 장면 구성의 왜곡이나 데이터 유실 가능성을 내포하고 있어, 제작자가 의도한 화면 구도를 일관되게 유지하는 데에는 제약이 따른다.

셋째, 반복 공정 관리의 구조적 한계이다. 숏폼 콘텐츠 제작은 다수의 짧은 결과물을 연속적으로 생성해야 하는 특성상, 동일한 작업 패턴이 반복된다. 그러나 기존 워크플로우는 인터랙티브한 영상 재구성이나[8] 정교한 자막 동기화 공정[9]을 체계적으로 자동화하지 못해 제작 공정 관리 비용이 지속적으로 증가하는 문제를 내포하고 있다[3].

종합하면 기존 연구들은 샷 경계 검출, 리프레임, 자막 정렬과 같은 개별 기능 중심으로 자동화 기술을 발전시켜 왔으나, 제작 공정 전반을 관통하는 워크플로우 관점에서 이들 공정을 통합하거나 제작자의 연출 의도를 제어 신호로 활용하는 구조를 제시하는 데에는 한계가 있다. 이러한 한계를 바탕으로 본 연구는 자동화 알고리즘의 성능 비교나 이론 분석이 아닌, 실제 제작 현장에 적용 가능한 워크플로우 자동화 시스템을 설계·구현하고 그 공정 모델의 실효성을 검증하는 시스템 구현 중심의 연구로 위치 지어진다.

1-3 연구 목적

본 논문에서 사용하는 ‘확정적 제어(deterministic control)’란, 제작자가 사전에 명시한 구간 정보, 메타데이터, 파라미터와 같은 의도 기반 입력값을 자동화 공정의 직접적인 제어 신호로 활용하여, 동일한 입력 조건 하에서 항상 동일한 결과를 산출하도록 설계된 자동화 방식을 의미한다. 이는 영상 콘텐츠를 사후적으로 분석하여 확률적으로 최적의 결과를 추론하는 인공지능 기반 자동화 방식과 달리, 제작 과정에서 이미 생성된 의도 정보를 중심으로 워크플로우 전반을 예측 가능하고 재현 가능하게 제어한다는 점에서 개념적으로 구별된다.

구체적으로는, 마커(Marker) 메타데이터를 활용하여 다수의 숏폼 컴포지션을 일괄 생성하고 프로젝트 자산을 체계적으로 관리하는 자동화 시스템을 구축한다. 또한 반복 공정을 시스템 차원에서 통합 관리함으로써 제작 공정 전반의 효율성을 향상시키는 것을 목표로 한다[3]. 마지막으로, 타겟 해상도 내에서 비율 가이드 박스를 활용하는 사용자 제어 기반 리프레임 환경과 안정적인 프리뷰 시스템을 제공하여 편집 결과의 신뢰성과 작업 유연성을 동시에 확보하고자 한다.

이러한 정의를 바탕으로 본 연구는 확률적 추론이나 사후 분석에 의존하는 기존 자동화 방식과 달리, 제작자가 사전에 명시한 의도 기반 데이터를 활용할 경우 영상 제작 자동화를 어디까지 결정적으로 제어할 수 있는가라는 연구 질문에서 출발한다. 이에 본 연구는 제작자의 연출 의도를 제어 신호로 구조화함으로써, 자동화 환경에서도 결과의 예측 가능성과 재현 가능성을 확보할 수 있는 워크플로우 자동화 모델을 제시하는 데 학술적 기여를 한다.

본 논문에서는 제안한 자동화 패널의 핵심 아키텍처와 구현 방식을 상세히 기술하고, 정량적 실험을 통해 기존 수동 제작 방식 대비 제작 시간 및 공정 효율이 얼마나 개선되는지를 분석함으로써 숏폼 콘텐츠 제작 공정의 표준화된 자동화 모델을 제시한다.


Ⅱ. 관련 연구 및 현황 분석

2-1 애프터이펙트의 ExtendScript 아키텍처 및 DOM 제어의 학술적 고찰

어도비 애프터이펙트는 영상 합성 및 모션 그래픽 공정 자동화를 위해 ECMAScript 표준 기반의 ExtendScript 인터페이스를 지원한다. 해당 스크립트 환경은 애플리케이션 내부의 DOM에 접근하여 프로젝트 자산(Project Items), 콤포지션(Compositions), 레이어(Layers) 및 개별 속성(Properties)을 객체 단위로 제어할 수 있는 계층적 구조를 가진다[2].

선행 연구 및 공식 기술 문서에 따르면, 애플리케이션 내부 스크립팅 방식은 외부 프로세스를 통한 단순 매크로나 배치 처리 방식에 비해 소프트웨어 고유의 데이터 구조에 직접 접근할 수 있어 연산 효율이 높고 렌더링 엔진과의 상호 운용성(Interoperability)이 우수하다는 장점을 가진다[2]. 본 연구는 이러한 아키텍처적 특성을 기반으로 레이어의 변형 속성(Position, Scale)을 수학적으로 연산하고, ScriptUI를 통해 소프트웨어 내부에 상주하는 통합 제어 패널을 구현함으로써 편집자가 작업 환경을 이탈하지 않고 주요 제작 공정을 수행할 수 있는 자동화 환경을 제공한다.

2-2 숏폼 제작 자동화 기술 현황 및 한계 분석

숏폼 콘텐츠의 급격한 확산에 따라 영상 편집 분야에서는 반복 공정을 자동화하려는 다양한 시도가 이루어지고 있다. 특히 제작 효율 향상을 목적으로 한 워크플로우 자동화 연구는 콘텐츠 제작 파이프라인 전반을 시스템 단위로 통합 관리하는 방향으로 발전하고 있다[3]. 그러나 이러한 접근은 고도화된 모션 그래픽과 다층적 레이어 구조를 사용하는 애프터이펙트 기반 제작 환경에서는 다음과 같은 실무적 한계를 지닌다.

1) 데이터 호환성 및 유실 문제

시간 기반 영상 데이터는 구조화 방식에 따라 강하게 종속되는 특성을 가지며, 소프트웨어 간 처리 구조가 상이할 경우 메타데이터 손실이나 정보 왜곡이 발생할 가능성이 높다[4]. 특히 최근의 연구들은 영상의 샷과 씬(Scene)을 체계적으로 배열하고 경계를 탐지하는 기술을 제안하고 있으나[8],[6], 자동화된 결과물을 다른 제작 환경으로 이관하는 과정에서 레이어 간 종속 관계나 시간적 연산 구조가 유지되지 않아 연출 의도가 훼손되는 문제가 보고되고 있다. 이러한 현상은 제작 워크플로우의 연속성을 저해하고, 추가적인 수작업 보정을 요구하는 요인으로 작용한다[3].

2) 자막 동기화의 정밀도 부족

숏폼 콘텐츠 제작은 다수의 짧은 결과물을 반복적으로 생성해야 하는 특성상, 구간 분할, 화면 비율 조정, 자산 복제와 같은 동일 패턴의 작업이 지속적으로 발생한다. 특히 자막 데이터와 영상의 시간적 정렬 연구에서 지적하듯[9], 기존 제작 환경에서는 이러한 반복 작업을 체계적으로 통합 관리하지 못해 공정 관리 비용이 누적되는 한계가 존재한다. 이는 워크플로우 자동화의 필요성을 더욱 부각시키는 요인으로 지적된다[3].

3) 제작자 의도 반영의 어려움

완전 자동화된 처리 방식은 사전에 정의된 알고리즘 규칙에 의존하기 때문에 제작자가 의도한 미학적 구도나 시각적 균형을 유연하게 반영하기 어렵다. 특히 시간 흐름에 따른 화면 구성 변화를 즉각적으로 검증하기 힘든 구조는 결과물에 대한 예측 가능성을 낮추며, 이는 제작 공정 전반의 신뢰성을 저해하는 핵심적인 한계로 작용한다[1].

2-3 동영상 장면 전환 탐지(SBD) 및 마커 기반 확정적 분할 기법

영상의 효율적인 재가공을 위한 구간 분할 기술은 컴퓨터 비전 분야에서 장면 전환 탐지(Shot Boundary Detection, SBD) 알고리즘을 중심으로 연구되어 왔다. 선행 연구들은 인접 프레임 간의 시각적 특징 변화, 전역적 특징 분석 및 시간적 패턴 분석 등을 통해 장면 전환 지점을 자동으로 검출하는 방식에 집중하고 있으며[5],[6], 이는 시간 기반 영상 데이터의 구조적 분석이라는 측면에서 의미 있는 접근으로 평가된다[4]. 그러나 이러한 방식은 시각적 변화가 크지 않은 대화 장면이나 연출자가 의도적으로 장면을 길게 유지하는 롱테이크(Long-take) 구간에서는 내러티브의 흐름과 편집 의도를 정확히 반영하지 못하는 한계를 지닌다. 그 결과, 숏폼 콘텐츠 제작에 있어 핵심 하이라이트를 안정적으로 선별하기에는 기술적 불확실성이 존재한다.

본 연구는 이러한 인공지능 기반 자동 탐지의 확률적 판단에 의존하는 대신, 제작자가 편집 과정에서 직접 부여한 마커 메타데이터를 확정적 파싱 데이터로 활용하는 방식을 제안한다. 이는 편집자의 의도를 명시적 데이터로 간주하여 처리하는 실무 중심의 접근으로, 자동화 과정에서도 연출 의도를 온전히 보존할 수 있다는 점에서 차별성을 가진다. 구체적인 기술적 특징은 다음과 같다.

1) 마커 기반 정밀 구간 분할(Marker-Based Segmentation)

기존의 SBD 기법이 이미 생성된 영상 데이터를 사후적으로 분석하는 방식이라면, 본 연구의 마커 기반 분할 기법은 제작자가 편집 단계에서 직접 설정한 메타데이터를 활용하는 사전 확정 방식이다. 이러한 메타데이터 중심의 워크플로우는 자동화 시스템에서 데이터 관리의 신뢰성을 높이는 효과적인 방법으로 보고된 바 있다. 특히 이는 기존의 인터랙티브 영상 재사용 및 키프레임 정렬 연구에서 지적된 오분류(False Positive) 가능성을 원천적으로 제거하는 대안이 된다[8]. 본 시스템은 애프터이펙트의 DOM에 직접 접근하여 각 마커의 타임코드와 주석(Comment) 필드를 파싱하고, 이를 기준으로 쇼츠 단위의 콤포지션을 자동 생성한다. 이를 통해 프로젝트 패널 내 자산 생성 및 관리까지 일괄 자동화함으로써 실무적 효율성을 크게 향상시킨다.

2) 하드 컷 자막 알고리즘(Hard-Cut Subtitle Algorithm)

모바일 시청 환경에서는 자막 간의 미세한 중첩이나 잔상도 시각적 간섭으로 작용할 수 있다. 실제 자막의 시간적 정렬 연구에 따르면[9], 일반적인 자막 처리 방식은 시간 코드 기반 동기화를 사용하므로 프레임 단위의 연산 오차로 인해 자막이 1~2프레임 중첩되는 문제가 발생할 수 있으며, 이는 워크플로우 자동화 환경에서 반복적으로 누적되는 품질 저하 요인이 된다[3]. 본 연구에서는 이를 해결하기 위해 다음 자막 시작 직전 프레임(t-1)에 이전 자막의 텍스트 데이터를 강제로 종료하는 ‘하드 컷’ 로직을 적용하였다. 이 방식은 불필요한 투명도 변화나 페이드 잔상을 제거하여, 작은 화면에서도 자막의 가독성과 정보 전달력을 안정적으로 유지할 수 있도록 한다.

3) 다중 모드 리프레임 엔진 및 가이드 시스템

리프레임 공정에서 본 연구는 단순한 자동 크롭 방식이 아닌, 제작자의 연출 의도를 실시간으로 반영할 수 있는 다중 모드 리프레임 엔진을 설계하였다. FILL_VERTICAL 및 FIT_HORIZONTAL 모드 외에도, CUSTOM_RATIO 모드를 통해 타겟 해상도 내에 비율 가이드 박스를 생성함으로써 결과물의 구도를 사전에 확인할 수 있도록 한다. 이러한 방식은 시선 추적(Gaze) 정보를 이용한 비디오 리프레임 연구 등에서 노출된 기술적 불확실성을 보완하며[7], 자동화된 워크플로우 환경에서도 제작자가 최종 화면을 예측하며 작업할 수 있는 안정적인 프리뷰(Stable Preview)를 제공한다. 이는 완전 자동화 시스템에서 지적되어 온 미학적 제어의 한계를 보완하는 실무 친화적 접근이라 할 수 있다[3].

2-4 본 연구의 차별성 및 공정 최적화 방향

본 연구는 앞서 분석한 기존 숏폼 제작 자동화 기술의 한계를 극복하기 위해, 어도비 애프터이펙트 내부에서 모든 공정이 완결되는 통합 워크플로우를 제안한다. 본 시스템은 단순히 반복 작업을 자동화하는 수준을 넘어, 제작자의 연출 의도를 명시적 데이터로 보존하면서도 공정 전반의 안정성과 예측 가능성을 확보하는 데 기술적 차별성을 가진다.

1) 제작자 의도 보존을 위한 데이터 기반 확정적 제어

기존의 인공지능 기반 리프레임 기능은 확률적 추론에 기반하므로, 피사체가 복수로 존재하거나 미학적 여백이 중요한 장면에서 제작자의 의도를 안정적으로 반영하는 데 한계를 지닌다. 이에 반해 본 연구는 제작자가 타임라인에 직접 설정한 마커 메타데이터를 파싱하여 제어 신호로 활용하는 확정적 제어 방식을 채택한다. 이 방식은 기획 단계에서 정의된 하이라이트 구간과 구도를 자동화 공정에서도 동일하게 재현할 수 있도록 하며, 인공지능 판단의 불확실성으로 인해 발생하는 사후 수정 비용을 구조적으로 제거한다.

2) 모바일 최적화 자막 동기화: 하드 컷 메커니즘

자막 공정에서 본 연구가 제안하는 하드 컷 알고리즘은 기존의 선형적 타임라인 배치 방식과 구별되는 접근을 취한다. 일반적인 방식이 개별 자막의 시작과 종료 시점에만 초점을 맞춘다면, 본 알고리즘은 자막 간의 경계(Boundary)를 프레임 단위로 재정의한다. 자막의 시간적 정렬 및 동기화 연구에서 지적된 프레임 연산 오차 문제를 해결하기 위해[9], 다음 자막 시작 직전 프레임(t-1)에서 이전 자막의 소스 텍스트 프로퍼티를 강제로 초기화함으로써, 모바일 환경에서 빈번하게 발생하는 자막 중첩 및 고스트 현상(Ghosting Effect)을 효과적으로 제거한다. 이는 시청자의 인지 부하를 줄이고, 정보 전달의 명확성을 향상시키는 모바일 최적화 동기화 기법이다[5].

3) 공정 안정성 확보: CUSTOM_RATIO 모드와 Stable Preview

본 시스템의 또 다른 핵심 차별성은 편집 과정과 결과 프리뷰 간의 일관성을 확보함으로써 공정 안정성을 향상시킨다는 점에 있다. 기존의 자동 리프레임 기술이 렌더링 이후에야 결과를 확인할 수 있는 사후 검증 방식에 가까웠다면, 본 연구는 CUSTOM_RATIO 모드를 통해 타겟 해상도(9:16) 내에 가변적 비율 가이드 박스를 생성한다. 이를 통해 제작자는 편집 단계에서부터 최종 출력물의 구도를 실시간으로 확인할 수 있으며, 가로형 소스 영상에서 세로형 결과물로 변환되는 과정에서 발생하는 시각적 정보 손실을 능동적으로 통제할 수 있다. 이러한 안정적인 프리뷰(Stable Preview) 환경은 기존의 인터랙티브 영상 재사용 연구[6]가 지향하는 작업의 연속성을 실무적으로 구현하여 전체 공정의 신뢰도를 향상시킨다.

4) 통합 워크플로우를 통한 자산 관리 최적화

마지막으로 본 연구는 애프터이펙트 내부 DOM에 직접 접근하여 프로젝트 패널(Project Panel)의 구조화와 결과물 분리 작업을 자동으로 수행한다. 이는 단순히 컴포지션을 생성하는 수준을 넘어, 생성된 쇼츠 단위의 컴포지션을 사전에 정의된 출력 폴더(Output Folder)로 자동 분류하고, 일관된 명명 규칙을 적용함으로써 프로젝트 자산을 체계적으로 관리하는 것을 목표로 한다.

이러한 자산 관리 자동화는 다수의 쇼츠 콘텐츠를 반복적으로 생산하는 환경에서 빈번하게 발생하는 프로젝트 파일의 파편화(Fragmentation)를 효과적으로 방지하며, 특정 클립의 수정, 교체, 재활용이 요구되는 사후 편집 단계에서도 작업자의 탐색 비용을 크게 절감한다. 특히 동일한 소스 영상으로부터 다양한 목적의 숏폼 콘텐츠를 재가공하는 OSMU(One Source Multi Use) 제작 환경에서 본 시스템은 자산의 추적성과 관리 효율성을 동시에 확보할 수 있는 실무적 장점을 제공한다.

더 나아가, 본 연구에서 제안하는 자동화 구조는 개별 기능의 단순 결합이 아닌, 작업 절차를 명시적으로 정의하고 반복 수행이 가능한 ‘스마트 프로시저(Smart Procedure)’ 개념에 기반한 워크플로우 관리 방식으로 설계되었다[5]. 이는 작업자의 숙련도나 프로젝트 규모에 관계없이 일관된 결과를 도출할 수 있는 공정 안정성을 보장하며, 일회성 자동화 도구에 그치지 않고 반복 제작 환경에서도 지속적으로 적용 가능한 콘텐츠 제작 워크플로우 모델을 제시한다.


Ⅲ. 시스템 설계 및 구현

본 장에서는 제안 시스템의 세부 구성 요소를 설명하기에 앞서, 전체 워크플로우의 흐름을 개념적으로 정리한다. 본 시스템은 제작자의 연출 의도가 마커 및 자막과 같은 사전 정의된 데이터로 입력되고, 이를 기반으로 구간 분할, 리프레임, 자막 처리가 순차적으로 수행되는 결정적 자동화 구조를 따른다.

3-1 시스템 아키텍처 및 모듈 계층 구조

본 시스템은 어도비 애프터이펙트의 ExtendScript 엔진을 기반으로 설계되었으며, 숏폼 콘텐츠 제작 공정 전반을 자동화하기 위해 4개의 핵심 모듈 계층으로 구성된다.

첫째, 데이터 입력 및 파싱 계층(Data Parsing Layer)은 외부 자막 데이터(SRT)와 타임라인 내 마커에 포함된 메타데이터를 분석하여 내부 처리에 적합한 정규화된 데이터 객체로 변환한다.

둘째, 코어 프로세싱 엔진(Core Engine)은 파싱된 데이터를 기반으로 각 쇼츠 단위 콤포지션의 인(In)·아웃(Out) 포인트를 산출하고, 자막의 하드 컷 타이밍을 프레임 단위로 연산한다.

셋째, DOM 인터페이스 계층(DOM Interface Layer)은 애프터이펙트의 DOM에 직접 접근하여 프로젝트 아이템, 콤포지션 및 레이어 객체를 생성하고, 위치·스케일 등 속성 값을 프로그램적으로 제어한다.

넷째, 사용자 인터페이스 계층(UI Layer)은 ScriptUI를 활용하여 제작자가 주요 기능을 직관적으로 제어하고, 작업 결과를 실시간으로 확인할 수 있는 인터페이스를 제공한다.

이와 같은 계층적 아키텍처는 기능 간 결합도를 낮추고 모듈 간 책임을 명확히 분리함으로써, 대규모 프로젝트 환경에서도 안정적인 데이터 처리와 유지보수를 가능하게 한다[3].

3-2 마커 기반 확정적 구간 분할 알고리즘

본 연구의 구간 분할 알고리즘은 인공지능 기반의 확률적 추론 방식이 아닌, 제작자가 편집 과정에서 직접 설정한 마커(Marker) 메타데이터를 기준으로 구간을 확정하는 결정적 자동화 방식에 기반한다. 이를 통해 자동화 과정에서도 제작자의 편집 의도를 명시적으로 반영할 수 있도록 설계하였다.

1) 메타데이터 파싱 및 유효성 검사

getSelectedMarkerKeyIndices() 함수를 통해 선택된 마커의 타임코드(Tm)와 지속 시간(Dm)을 추출한다. 이때 마커 주석 내에 포함된 LEN 속성을 분석하여, 만약 별도의 종료 마커가 없을 경우 수식 (1)을 적용하여 시스템이 자동으로 구간을 확정한다.

Tend =Tstart +Dtarget (1) 
2) 콤포지션 자동 생성 및 자산 분류

생성된 클립은 원본의 프레임 레이트와 픽셀 종횡비를 완벽히 상속받는다. app.project.items.addComp()를 통해 생성된 신규 콤포지션은 시스템이 사전에 구축한 _Shorts_Generated 폴더로 자동 이동되며, makeNameWithTimecode() 로직에 의해 [Index]_[Title]_[Timecode] 형식의 파일명이 부여된다. 이는 사후 편집 과정에서 원본 소스의 구간을 추적·대조하는 시간을 유의미하게 단축시키고, 자산 탐색 및 재활용 효율을 향상시킨다.

3-3 다중 모드 리프레임 엔진의 수학적 구현

리프레임 엔진은 소스 해상도(W_s, H_s)를 타겟 해상도(W_t, H_t)로 변환하기 위한 스케일(S)과 좌표(X, Y)를 연산한다. 본 연구에서는 결과 프레임(타겟) 내에서 피사체 구도 유지와 정보 손실 최소화를 위해 FILL_VERTICAL, FIT_HORIZONTAL, CUSTOM_RATIO의 3가지 모드를 제공한다.

1) FILL_VERTICAL 모드

화면의 세로를 가득 채우는 방식으로, 수식 (2)를 적용한다.

S=Htarget Hsource  ×100(2) 

이때 좌우 정보의 손실을 방지하기 위해 앵커 포인트(Ap)를 중앙(Ws/2,Hs/2)으로 강제 정렬한다.

2) FIT_HORIZONTAL 모드

상하 여백이 발생하더라도 가로 정보를 모두 노출하는 방식으로, 수식 (2)를 적용한다.

3) CUSTOM_RATIO 및 가이드 박스 알고리즘

본 연구의 독창적 기법인 computeCustomGuideBox()는 타겟 해상도 내에서 특정 비율 가이드(R)를 생성하기 위해 보이지 않는 Null Object를 생성한다. 이 객체는 수식 (3)에 따라 크기가 결정되며, 리프레임의 시각적 경계선 역할을 수행하여 제작자가 구도를 정교하게 조정할 수 있는 기준점을 제공한다

Wguide=Htarget×R(3) 

3-4 하드 컷 자막 동기화 알고리즘 설계

자막의 가독성을 극대화하기 위해 본 연구는 프레임 단위의 ‘하드 컷’ 로직을 구현하였다. 기존의 자막 생성 방식이 자막의 시작 시간(tstart)과 종료 시간(tend)을 독립적으로 처리하는 것과 달리, 본 알고리즘은 연속된 자막 객체 CnCn+1 사이의 경계를 프레임 단위로 결합한다.

시스템은 $C_{n}$의 종료 프레임을 $C_{n+1}$의 시작 프레임(tstart)보다 정확히 1프레임 앞선 tstart-1로 강제 지정한다. addSubtitleAnimation() 함수는 해당 프레임에서 소스 텍스트(Source Text) 프로퍼티에 빈 문자열을 삽입하거나, 레이어의 인·아웃 포인트를 재설정한다. 이 메커니즘은 모바일 환경에서 빈번하게 발생하는 자막 중첩 및 렌더링 과정에서의 투명도 잔상을 효과적으로 제거하여, 자막의 시각적 명확성과 가독성을 안정적으로 확보한다[2],[9].

3-5 사용자 인터페이스(GUI) 설계 및 주요 기능 제어

본 시스템은 제작자의 작업 효율성과 직관적인 공정 제어를 위해 어도비 애프터이펙트 내부 패널로 상주하는 ScriptUI 기반의 인터페이스를 제공한다. GUI의 구조는 데이터 로드, 출력 설정, 세부 파라미터 조정, 실행의 논리적 제작 순서에 따라 수직적 계층 구조로 배치되었다.

1) 데이터 입력 및 관리 영역(Markers & SRT)

패널 최상단의 마커 영역(그림 1의 ①)에는 타임라인에서 파싱된 마커 리스트가 시각화된다. 제작자는 Only selected markers 옵션을 통해 특정 마커만 선택하여 원하는 구간의 쇼츠를 선별적으로 생성할 수 있으며, Refresh 버튼을 통해 타임라인의 변경 사항을 실시간으로 동기화한다. 또한, 자막 데이터 경로 설정 섹션(그림 1의 ②)은 외부 SRT 데이터의 경로를 지정하여 본 연구의 하드 컷 알고리즘과 결합할 수 있는 인터페이스를 제공하며, 이는 영상 데이터와 자막 데이터의 물리적 결합을 일원화한다.

Fig. 1.

GUI configuration of the proposed short-form video automation panel

2) 출력 환경 및 안정적 프리뷰(Stable Preview)

출력 환경 설정 섹션(그림 1의 ③)에서는 생성될 클립이 저장될 폴더명과 타겟 해상도(Target Res)를 설정한다. 여기서 본 연구의 핵심인 ‘안정적 프리뷰(Stable Preview)’ 시스템이 구현된다. 제작자가 Preview 버튼을 실행하면 runPreview() 로직이 작동하여 실제 클립을 생성하기 전, 9:16 비율의 가이드 라인을 타임라인에 오버레이(Overlay)하여 보여준다. 이는 ‘사전 검증-사후 생성’의 워크플로우이라는 선순환 구조의 워크플로우를 완성하여 공정의 신뢰성을 극대화하는 역할을 수행한다.

3) 레이아웃 및 리프레임 정밀 제어(Text & Reframe)

텍스트 및 리프레임 제어 영역은 모바일 시각 최적화를 위한 정밀 파라미터 입력부로 구성된다.

• Text (Y / Size) 제어

텍스트 위치 설정 섹션(그림 1의 ④)에서는 타이틀(TITLE), 캡션(CAPTION), 자막(SUBTITLE)의 수직 위치와 크기를 픽셀 단위로 개별 설정할 수 있어 모바일 UI 환경에서의 가독성을 최적화한다.

• Reframe 제어

리프레임 설정 섹션(그림 1의 ⑤)은 FILL_VERTICAL, FIT_HORIZONTAL, CUSTOM_RATIO 모드를 선택할 수 있는 드롭다운 메뉴를 제공한다. 이를 통해 제작자는 콘텐츠의 특성과 출력 환경에 따라 적절한 화면 구성 방식을 유연하게 선택할 수 있다. 특히 Nudge X/Y 입력 필드는 자동화 이후 발생할 수 있는 미세한 구도 오차를 제작자가 직접 수동으로 보정할 수 있도록 지원하여, 자동화 공정의 안정성과 결과물의 완성도를 동시에 확보한다.

4) 자막 최적화 및 폰트 엔진 설정(Subtitles & Fonts)

패널 하단의 세부 설정 영역(그림 1의 ⑥)은 최종 콘텐츠의 가독성과 브랜드 일관성을 제어한다. 자막 섹션에서는 한 줄당 글자 수(Chars/line), 최대 줄 수(Max lines) 등을 설정하여 시각적 간섭을 제어함으로써 모바일 소형 스크린에서의 정보 전달력을 높인다. 또한, 폰트 섹션(그림 1의 ⑦)에서는 시스템 폰트의 PostScript 이름을 직접 입력하게 함으로써 프로젝트별로 일관된 브랜드 아이덴티티를 유지할 수 있는 환경을 지원한다.

5) 제작 공정의 가시화 및 예외 처리(Visualizing Process & Exception Handling)

본 시스템은 자동화 공정의 신뢰성을 확보하고 제작자의 의도를 실시간으로 반영하기 위해 시각적 검증 도구와 대화형 예외 처리 메커니즘을 제공한다.

제작자가 'Preview' 버튼을 실행하면 그림 2와 같이 실제 9:16 타겟 해상도 가이드라인과 현재 설정된 기술 파라미터(Mode, Nudge 값 등)가 타임라인 위에 오버레이(Overlay)된다. 이는 실제 클립을 생성하기 전, 제작자가 리프레임 구도와 자막 위치를 확정적으로 검증할 수 있게 하여 무분별한 렌더링으로 인한 시간 낭비를 방지한다.

Fig. 2.

Overlay screen of 9:16 guide and parameters via Stable Preview

그림 3은 전체 자동화 공정의 기초가 되는 타임라인 작업 화면이다. 타임라인에 마커를 배치함으로써 쇼츠 클립의 분할 시점을 직관적으로 결정할 수 있으며, 마커 주석(Comment) 내에 입력된 파라미터를 통해 각 클립의 길이와 개별 속성을 세밀하게 제어한다. 시스템은 이 마커들을 파싱하여 리스트 형태로 구조화함으로써, 다수의 구간이 혼재된 복잡한 영상 소스 환경에서도 제작 구간을 일관되고 체계적으로 관리할 수 있도록 지원한다. 이는 수동 분할 과정에서 발생할 수 있는 관리 오류를 줄이는 데 기여한다.

Fig. 3.

Timeline workspace via marker and metadata settings

그림 4 알림창은 자동화 실행 과정에서 제작자의 의사를 명확히 확인하는 인터페이스를 제공한다. 코드상에 구현된 DUPLICATE_POLICY 로직에 따라 제작자는 기존 작업을 유지하거나 최신 설정으로 갱신할 수 있으며, 이러한 선택적 상호작용은 의도치 않은 데이터 덮어쓰기를 원천적으로 방지한다. 이를 통해 자동화 공정에서도 작업 흐름의 안정성과 결과물 관리의 신뢰성이 효과적으로 확보된다.

Fig. 4.

Exception handling dialog for preventing duplicate composition generation


Ⅳ. 결과 분석 및 실험 평가

4-1 실험 환경 및 데이터셋 구성

본 시스템의 성능과 효율성을 객관적으로 검증하기 위해 하드웨어는 AMD Ryzen 5 8400F 6-Core CPU와 64GB RAM 환경에서 실험을 진행하였으며, 소프트웨어는 Adobe After Effects 25.6 버전을 사용하였다. 실험은 동일한 시스템 환경에서 반복 수행하여 외부 요인에 의한 성능 편차를 최소화하였다.

실험 데이터셋은 16:9 비율의 FHD(1920×1080) 해상도로 제작된 10분 내외의 영상 콘텐츠 5종으로 구성하였으며, 토크 영상과 편집 요소가 혼합된 일반적인 숏폼 전환 사례를 기준으로 선정하였다. 각 영상에는 평균 15개의 마커 데이터와 이에 대응하는 SRT 자막 파일을 사전에 구성하여 자동화 공정의 입력값으로 활용하였으며, 이를 통해 마커 기반 분할, 리프레임, 자막 동기화 기능이 복합적으로 작동하는 실험 환경을 재현하였다.

4-2 제작 효율성 분석(정량적 평가)

본 시스템의 제작 시간 단축률(Time-saving)을 평가하기 위해, 숙련된 영상 편집자 3인이 동일한 원본 소스로 1분 내외의 숏폼 클립 10개를 제작하는 비교 실험을 수행하였다. 각 편집자는 수동 방식과 제안 시스템을 각각 사용하였으며, 순수 편집 소요 시간만을 측정하였다.

실험 결과, 단일 클립 제작 시에는 초기 설정 시간으로 인해 두 방식 간 차이가 크지 않았으나, 제작 수량이 증가할수록 수동 방식은 작업 시간이 선형적으로 증가한 반면 제안 시스템은 마커 기반 일괄 처리로 제작 시간을 효과적으로 단축하였다.

결과적으로 10개의 클립을 일괄 제작할 경우, 수동 방식은 구간 컷 편집, 해상도 변경, 수동 리프레임, 자막 타이핑 및 위치 조정을 포함하여 총 2,700초(45분)가 소요되었다. 반면, 본 연구에서 제안한 자동화 패널을 활용할 경우 데이터 파싱부터 최종 콤포지션 생성까지 총 375초(6분 15초)가 소요되었다. 이는 수동 방식 대비 약 86.1%의 제작 시간 단축 효과를 의미하며, 특히 대규모 숏폼 콘텐츠 재가공 공정에서 생산성 향상이 가능함을 보여준다.

그림 5표 1의 정량적 분석 결과를 시각화한 것으로, 제안 시스템이 모든 제작 단계에서 수동 방식 대비 일관된 시간 단축 효과를 보임을 확인할 수 있다. 특히 구간 분할 및 콤포지션 생성 단계에서는 자동화에 따른 효율 개선이 가장 크게 나타났으며, 전체 제작 시간 또한 반복 작업에 비례하여 증가하는 수동 방식과 달리 효과적으로 관리됨을 알 수 있다.

Fig. 5.

Comparison of processing time per production stage between the manual workflow and the proposed system

Comparison of processing time per task: manual vs. proposed system(unit: seconds)

그림 6은 클립 수가 증가할수록 수동 방식의 제작 시간은 급격히 누적되나, 제안 시스템은 완만한 증가폭을 유지함을 보여준다. 이는 대량 제작 환경에서 자동화의 효율성이 극대화됨을 시사하며, 일정한 품질과 리드타임 확보에 유리한 구조임을 입증한다.

Fig. 6.

Trend of total production time according to the number of generated clips

4-3 사용자 만족도 및 실무 효용성 평가

1) 설문 조사 개요

본 연구의 실무 효용성을 검증하기 위해 현업 영상 편집 전문가 5인을 대상으로 만족도 설문 조사를 실시하였다. 설문 대상자는 숏폼 콘텐츠 제작 경험을 보유한 실무자로 구성하여 제안 시스템이 실제 제작 환경에서 어느 정도의 효용성을 가지는지를 평가하는 데 초점을 두었다. 평가 항목은 시스템 편의성, 기술적 정확성, 자막 가독성, 실무 활용성의 4개 카테고리로 구성하였으며, 총 7개 문항을 통해 자동화 패널 사용 전후의 작업 흐름 차이, 자막 동기화 정확성, 반복 작업 부담 감소 여부 등 본 연구에서 제안한 핵심 기능의 실무적 효과를 종합적으로 분석하였다. 모든 문항에는 5점 리커트 척도(Likert Scale)를 사용하였으며, 각 문항은 제안 시스템 사용 경험을 기준으로 응답하도록 설계하였다.

Results of user satisfaction and practical utility evaluation

2) 설문 결과 분석

설문 분석 결과, 제안 시스템은 전반적으로 높은 만족도를 기록하였다. 특히 시스템 편의성(4.85점)과 자막 가독성(4.85점) 항목이 가장 높은 평가를 받았는데, 이는 직관적인 GUI 구성과 자동화된 데이터 연동 방식이 별도의 추가 학습 과정 없이도 실무에 즉시 적용 가능함을 시사한다.

기술적 측면에서는 하드 컷 자막 알고리즘을 통한 자막 경계 제어와 Nudge 기능을 활용한 미세 구도 조정이 안정적이고 정밀한 결과물을 제공한다는 점에서 긍정적인 평가를 받았다. 또한 실무 활용성(4.8점) 항목을 통해 반복적인 제작 공정의 부담을 효과적으로 경감시키고, 장시간 편집 작업에서 발생하는 작업 피로도를 유의미하게 감소시키는 효과가 있음을 확인할 수 있었다.

특히 본 설문은 단순한 기능 만족도 측정이 아니라, 자동화 패널이 기존 수동 워크플로우 대비 실제 작업 흐름에 어떠한 변화를 유발하는지를 확인하는 데 초점을 두었다. 이에 각 문항은 개별 기능의 완성도뿐만 아니라, 반복 작업 감소, 작업 안정성, 전반적인 편집 경험의 변화와 같은 실무적 관점에서의 체감 효과를 반영하도록 구성되었다. 이러한 설계는 자동화 도구의 기술적 성능과 실제 제작 환경에서의 활용 가능성을 함께 평가하기 위한 목적에 부합한다.

다만 본 설문 조사는 제한된 수의 숙련된 실무자를 대상으로 수행되어, 표본 규모 측면에서 결과를 모든 제작 환경이나 사용자 집단으로 일반화하는 데에는 일정한 한계가 존재한다. 본 연구는 통계적 유의성 검증을 목적으로 한 대규모 사용자 연구가 아니라, 실제 제작 현장에서의 기술 구현 가능성과 워크플로우 자동화 도구의 실무적 효용성을 검증하는 데 초점을 둔 연구로서, 정성적 평가와 과정 중심의 비교 실험 방식을 채택하였다.


Ⅴ. 결 론

5-1 연구의 요약 및 기여도

본 연구에서는 숏폼 콘텐츠 소비의 폭발적 증가에 따른 제작 현장의 병목 현상을 해결하기 위해, 어도비 애프터이펙트 스크립트 기반의 통합 제작 자동화 패널을 설계하고 구현하였다. 본 시스템은 제작자의 연출 의도를 데이터 기반으로 파싱하여 구간 분할, 리프레임, 자막 생성을 일괄 처리하는 확정적 자동화 워크플로우를 구축하였다.

연구의 핵심 기여도는 다음과 같다. 첫째, 마커 메타데이터를 활용한 일괄 콤포지션 생성 로직을 통해 대규모 콘텐츠 재가공 시 발생하던 휴먼 에러를 제거하고 프로젝트 관리의 효율성을 극대화하였다. 둘째, 프레임 단위의 연산을 수행하는 하드 컷 자막 알고리즘을 제안하여 기존 SRT 기반 처리에서 발생하던 자막 중첩 및 잔상 현상을 효과적으로 완화하고, 모바일 환경에서의 가독성을 향상시켰다. 셋째, ‘안정적 프리뷰(Stable Preview)’ 시스템을 도입하여 제작자가 최종 결과물을 사전에 검증할 수 있는 신뢰성 높은 작업 환경을 제시하였다.

학술적 관점에서 본 연구의 의의는 콘텐츠 제작 자동화를 단순한 반복 작업 대체의 문제로 다루는 기존 접근에서 벗어나, 제작자의 연출 의도를 명시적 데이터로 구조화하여 워크플로우 전반을 확정적으로 제어하는 자동화 모델을 제시했다는 점에 있다.

기존의 자동화 연구들이 인공지능 기반의 확률적 추론이나 사후적 영상 분석에 주로 의존해 왔다면, 본 연구는 제작 과정에서 이미 생성된 마커 메타데이터를 의도 정보로 간주하고 이를 자동화의 핵심 제어 신호로 활용함으로써, 자동화 환경에서도 연출 의도의 보존 가능성을 이론적으로 확장하였다. 또한 자막 동기화 문제를 프레임 단위의 경계 재정의 관점에서 접근함으로써, 시간 기반 영상 데이터 처리에서 반복적으로 발생해 온 미세한 오차 누적 문제를 구조적으로 해결할 수 있는 결정적 동기화 모델을 제안하였다.

본 연구에서 제안한 워크플로우 자동화 모델은 이러한 의도 기반 제어 개념을 바탕으로, 타임라인 기반 편집 환경에서 반복 제작이 요구되는 콘텐츠 제작 공정에 일반화하여 적용 가능하다. 본 모델은 동일하게 정의된 의도 데이터 입력을 바탕으로 안정적이고 예측 가능한 결과를 산출하는 워크플로우 자동화를 지향한다.

이와 같은 접근은 영상 편집 자동화를 결과 중심의 처리 문제가 아닌, 제작 워크플로우 설계 문제로 재정의한다는 점에서, 향후 콘텐츠 제작 자동화 및 워크플로우 연구 분야에 개념적 틀을 제공할 수 있을 것으로 기대된다.

5-2 연구의 시사점 및 실무적 효용성

실험 결과, 동일한 반복 제작 조건 하에서 10개 클립을 일괄 제작하는 경우, 본 시스템은 수동 방식 대비 총 소요 시간을 약 86%(2,700초→375초) 단축하였다.

또한 그림 6에서 확인할 수 있듯이, 제작 수량이 증가할수록 반복 작업이 누적되는 수동 방식과 달리 제안 시스템은 추가 공정 시간을 효과적으로 제어하여 대량 생산 환경에서의 실무적 효용성이 확대됨을 확인하였다. 이는 동일한 유형의 반복 제작이 요구되는 환경에서 미디어 제작사의 생산 단가를 낮추고 고품질 콘텐츠를 보다 신속하게 배포할 수 있는 표준화된 워크플로우의 가능성을 제시했다는 점에서 산업적 당위성을 가진다. 사용자 만족도 조사에서도 조작 편의성과 자막 가독성 부문에서 높은 평가(평균 4.8점 이상)를 얻어, 실무 도입 시 편집자의 작업 피로도를 유의미하게 감소시킬 수 있음을 입증하였다.

5-3 한계점 및 향후 연구 과제

본 연구는 제작자의 확정적 의도를 반영하는 데 집중하였으나, 향후 연구에서는 인공지능 기반의 객체 추적(Object Tracking) 및 장면 전환 탐지(SBD) 기술과의 유기적 연동을 통해 자동화의 범위를 더욱 확장할 필요가 있다. 인공지능이 피사체의 위치를 추론하고 본 시스템의 ‘Nudge’ 로직이 이를 미세 조정하는 하이브리드형 리프레임 엔진으로 발전시킨다면, 제작자의 개입을 최소화하면서도 미학적 완성도를 유지하는 차세대 영상 제작 자동화 모델이 될 것으로 기대된다.

Acknowledgments

본 연구는 교육부와 경기도의 재원으로 지원을 받아 수행된 경기 지역혁신중심 대학지원사업(경기도RISE사업)의 연구결과임.

References

  • J. E. Cutting, J. E. DeLong, and C. E. Nothelfer, “Attention and The Evolution of Hollywood Film,” Psychological Science, Vol. 21, No. 3, pp. 432-439, 2010. [https://doi.org/10.1177/0956797610361679]
  • Adobe. After Effects Scripting Guide [Internet]. Available: https://ae-scripting.docsforadobe.dev/, .
  • W. Chmiel, J. Derkacz, S. Jȩdrusik, P. Kadłuczka, Z. Mikrut, and M. Niemiec, ... and M. Turek, “Workflow Management System with Smart Procedures,” Multimedia Tools and Applications, Vol. 81, pp. 9505-9526, 2022. [https://doi.org/10.1007/s11042-021-11658-6]
  • S. J. Yong, H. G. Park, Y. H. You, and I-Y. Moon, “Automatic Generation of Video Metadata for the Super-Personalized Recommendation of Media,” Journal of Information and Communication Convergence Engineering, Vol. 20, No. 4, pp. 288-294, December 2022. [https://doi.org/10.56977/jicce.2022.20.4.288]
  • E. Apostolidis and V. Mezaris, “Fast Shot Segmentation Combining Global and Local Visual Descriptors,” in Proceedings of the 2014 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Florence: Italy, pp. 6583-6587, May 2014. [https://doi.org/10.1109/ICASSP.2014.6854873]
  • Q. Li, X. Chen, B. Wang, J. Liu, G. Zhang, and B. Feng, “Shot Boundary Detection Based on Global Features and the Target Features,” Symmetry, Vol. 15, No. 3, 565, February 2023. [https://doi.org/10.3390/sym15030565]
  • Y.-Z. Xue, H. Du, Z. Liu, and Z.-Y. Zhang, “Video Retargeting Using Optimized Crop-and-Scale,” Journal of Shanghai University (English Edition), Vol. 15, pp. 331-334, 2011. [https://doi.org/10.1007/s11741-011-0746-2]
  • L. Baraldi, C. Grana, G. Borghi, R. Vezzani, and R. Cucchiara, “Shot, Scene and Keyframe Ordering for Interactive Video Re-use,” in Proceedings of the 11th Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications - Volume 4: VISAPP, Rome: Italy, pp. 626-631, 2016. [https://doi.org/10.5220/0005768706260631]
  • O. Saz, S. Deena, M. Doulaty, M. Hasan, B. Khalip, R. Milner, ... and T. Hain, “Lightly Supervised Alignment of Subtitles on Multi-Genre Broadcasts,” Multimedia Tools and Applications, Vol. 77, No. 23, pp. 30533-30550, May 2018. [https://doi.org/10.1007/s11042-018-6050-1]

저자소개

최현주(Hyunjoo Choi)

2026년:중앙대학교 예술공학부 (학사과정)

※관심분야:미디어아트(Media Art), 애니메이션(Animation), 실감콘텐츠(Immersive Content), 에듀테크(Educational Technology) 등

정재필(Jaepil Jeong)

2012년:중앙대학교 시각디자인전공 (미술학사)

2019년:중앙대학교 첨단영상대학원 3D애니메이션제작전공 (영상학제작석사)

2017년: 세계은행(World Bank) 3D교육컨설던트

2018년~2019년: (주)세븐슬로스 아트팀장

2020년: 백석문화대학교 만화애니메이션학부 조교수

2021년~현 재: 중앙대학교 예술공학부 조교수

※관심분야:애니메이션(Animation), 시각디자인(Visual Design), 실감콘텐츠(Immersive Content) 등

Fig. 1.

Fig. 1.
GUI configuration of the proposed short-form video automation panel

Fig. 2.

Fig. 2.
Overlay screen of 9:16 guide and parameters via Stable Preview

Fig. 3.

Fig. 3.
Timeline workspace via marker and metadata settings

Fig. 4.

Fig. 4.
Exception handling dialog for preventing duplicate composition generation

Fig. 5.

Fig. 5.
Comparison of processing time per production stage between the manual workflow and the proposed system

Fig. 6.

Fig. 6.
Trend of total production time according to the number of generated clips

Table 1.

Comparison of processing time per task: manual vs. proposed system(unit: seconds)

Task / Production Stage Manual Method Proposed System Reduction Rate (%)
Segment Partitioning & Comp Generation 450 15 96.7%
Reframing & Layout Adjustment 900 120 86.7%
Subtitle Generation & Sync Correction 1,350 240 82.2%
Total Execution Time 2,700(45min) 375(6min 15s) 86.1%

Table 2.

Results of user satisfaction and practical utility evaluation

Category No. Evaluation Items Score
Usability 1 Is the UI structure intuitively designed according to the workflow? 4.8
2 Is the process of loading and updating marker and SRT data convenient? 4.9
Technical Accuracy 3 Does the automated reframe result well-preserve the core composition of the subject? 4.6
4 Does the Nudge function work precisely for fine coordinate adjustment? 4.7
Legibility 5 Has the Hard Cut algorithm effectively resolved afterimages or overlapping between subtitles? 4.8
6 Are the text position and size adjustment functions optimized for mobile viewing environments? 4.9
Practical Utility 7 Has the fatigue occurred during work significantly decreased compared to the existing manual method? 4.8
Total Average 4.79