웹툰 원작 TV 드라마의 텍스트 기반 관객 감정 분석: <경이로운 소문>을 중심으로
Copyright ⓒ 2023 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
초록
텍스트 감정 분석과 분류는 다양한 도메인에서 이루어지고 있다. 본 논문에서는 같은 이야기지만 서로 다른 미디어에서 큰 호응을 얻은 작품 <경이로운 소문 (The Uncanny Counter)>에 대해 텍스트 기반 감정 분석을 적용하여 비교 분석한다. 먼저, GoEmotions-Korean 감정 모델을 통해 28가지 감정을 분류하였고, 이를 긍정과 부정의 두 가지 극성으로 나누었다. 다음으로, 웹툰 독자와 TV 드라마 시청자들의 반응이 어떤 요인으로 긍정 또는 부정적으로 나타났는지를 비교 분석하였으며, 분석 결과는 다음과 같은 세 가지 특성을 보여 주었다. 첫째, 청중들의 기대감과 관련된 감정이 원작 웹툰과 TV 드라마에 대해 공통적으로 높게 나타났다. 둘째, 스토리 전개 속도를 고려했을 때, 원작 웹툰보다 TV 드라마에서 부정적 감정이 더 많이 추출되었다. 셋째, <경이로운 소문> TV 드라마의 경우, 부정적 반응을 촉발한 원인으로 두 가지 – 느린 이야기 전개 속도와 원작과는 다른 내용 추가 –가 주요하게 작용했음을 알 수 있었다.
Abstract
Text-based emotion analysis and classification are widely conducted in various domains. In this study, we compare and analyze a cross-media story - <The Uncanny Counter>, the same story gaining high popularity from different media, by applying text-based emotion analysis. First, 28 emotions were classified through the GoEmotions-Korean emotion model and divided into two polarities - positive and negative. Next, we compared and analyzed the responses from the readers and viewers. The analysis results demonstrated the following three characteristics. First, emotions associated with the audience's expectations were prevalent in the original webtoon and TV drama. Second, considering the speed of story development, more negative emotions were extracted from the TV drama than the original webtoon. Third, in the case of <The Uncanny Counter>, it was found that two factors mainly prompted adverse reactions to the TV drama - the slow pace of story development and the addition of content different from the original.
Keywords:
Webtoon, Storytelling, Emotion analysis, Sentiment analysis, The Uncanny Counter키워드:
웹툰, 스토리텔링, 감정 분석, 감성 분석, 경이로운 소문Ⅰ. 서 론
오늘날 이야기를 표현할 수 있는 미디어 또는 플랫폼은 전통적 텍스트 외에도 웹툰, TV 드라마, 영화, 비디오 게임 등 다양하다. 예를 들면, J. K. 롤링의 소설 <해리 포터> 시리즈는 전 작품이 영화화되었을 뿐 아니라 비디오 게임과 테마 파크 등을 통해 온/오프라인에서 이야기와 세계관을 공유한다. 마블과 DC로 대표되는 슈퍼히어로 코믹스 또한 각자의 유니버스 (Universe)라는 개념으로 만화, 애니메이션, 영화, 비디오 게임이라는 서로 다른 매체에서 플롯과 캐릭터를 공유한다. 이와 같이 다양한 미디어를 통해 하나의 공통된 스토리를 '재매개' 또는 '재생산'하는 크로스미디어 스토리텔링 (crossmedia storytelling)[1]과 트랜스미디어 스토리텔링 (transmedia storytelling)[2]은 디지털 플랫폼에서 스토리 기반 콘텐츠 생성을 위한 중요한 개념이다.
크로스미디어 또는 트랜스미디어 스토리텔링을 '스토리텔링' 중심의 관점에서 볼 때 고려해야 할 요소가 많겠지만, 그 중 공통된 주요 특징 중 하나는 이야기 속의 ‘감정 (Emotions)’이라고 볼 수 있다. 독자는 이야기 속 등장인물 (특히 주인공)과 공감하면서 스토리 진행과 함께 감정의 변화를 겪는다. 독자가 주인공과 공감할수록 독자는 이야기의 흥미를 느낄 수 있으며, 그 밖에 서스펜스나 반전에 따른 놀라움과 같은 서사 관련 감정[3]을 느끼면서 이야기에 몰입할 수 있다. 서사 감정 또는 독자가 느끼는 이야기 감정을 분석하는 기술인 텍스트 기반 서사 감정 분석은 서사 생성과 이해에서 긴요하게 사용되는 요소이며, 텍스트 기반 감정 분석 기술의 발달과 함께 다양한 연구가 시도되고 있다[4]-[6].
본 논문에서는 같은 이야기지만 서로 다른 미디어에서 큰 호응을 얻은 작품 <경이로운 소문 (영어 제목: The Uncanny Counter)>에 대해 텍스트 기반 감정 분석을 적용하여 비교 분석한다. <경이로운 소문>은 2018년 8월에 연재된 웹툰 원작으로 시즌 1과 시즌 2가 많은 인기를 얻으며 연재되었으며, 2023년 1월인 현재 프리퀄에 해당하는 시즌 0가 연재되고 있다. 시즌 1에 해당하는 내용이 TV 드라마로 제작되어 2020년과 2021년에 방영이 되었으며, 스토리에서 원작 웹툰과 일부 차이점이 있다. TV 드라마로 각색된 <경이로운 소문> 전반부는 전반적으로 큰 인기를 얻었지만, 후반부에서 웹툰과는 다른 전개를 진행하면서 웹툰 독자들로부터 다소 안 좋은 평가를 받기도 하였다. 매체의 특성 (웹툰 vs. TV 드라마)에 따른 차이가 분명하기 때문에 직접적 비교는 불가능하며, 스토리 관점에서 차이가 나는 부분을 중심으로 분석한다.
본 논문에서는 원작 웹툰이 연재되었던 플랫폼에서 독자들의 댓글과 TV 드라마가 연재될 때 방송에 대한 실시간 채팅 데이터를 추출한 후, 독자 및 시청자 반응에 대한 감정을 긍정과 부정의 두 가지 극성으로 분석한다. 특히, 이야기 전개 차이가 명확한 부분과 그렇지 않은 부분을 기준으로 관객들의 감정을 비교한다.
Ⅱ. 관련 연구
2-1 크로스미디어와 트랜스미디어 스토리텔링
디지털 플랫폼이 대중화되면서 크로스미디어와 트랜스미디어 스토리텔링은 하나의 현상으로 자리잡고 있다. 먼저, 동일한 이야기를 서로 다른 미디어를 통해 표현하고 전달하는 크로스미디어 스토리텔링은 "성공한 원천 콘텐츠를 다른 미디어 장르로 재매개 (remediation)"[1]하는 것을 특징으로 한다. 다음으로, 트랜스미디어 스토리텔링의 특성은 서로 다른 미디어간의 경계선을 초월하여 "영화나 소설 같은 전통적인 단일 미디어의 경계선을 넘어 하나의 스토리 세계 내에서 복수의 미디어가 서로 결합, 융합되는 현상"[2],[7]으로 설명한다. 예를 들어 <미생>[1]이나 <경이로운 소문 (The Uncanny Counter)>과 같이 인기 웹툰의 드라마화 현상이나 <어벤저스> 시리즈의 성공으로 대표되는 마블의 MCU (Marvel Cinematic Universe)[2]는 각각 크로스미디어와 트랜스미디어 스토리텔링의 대표적 예시라고 할 수 있다.
'미디어간 교차'를 의미하는 크로스미디어와 '미디어의 초월'을 의미하는 트랜스미디어는 '미디어 전환'을 통한 '콘텐츠 확장' 이라는 공통된 특성을 공유하며, 두 용어 간의 명확한 정의와 차이점에 대해서는 학자들에 따라 다소 다른 의견이 존재한다. 본 논문은 “매체”의 차이라는 관점과 스토리의 내용적 측면에서 유사성과 차이점에 따른 독자와 시청자의 감정을 비교 분석한다.
2-2 텍스트 기반 감정 분석
텍스트로부터 긍정과 부정 (그리고 필요시 중립)을 판별하는 감성 분석 (Sentiment Analysis)은 금융, 경제, 정치, 사회 문제 뿐만 아니라 스토리텔링을 포함한 다양한 도메인에서 활발하게 적용되고 있다[8],[9]. 감성 분석은 기본적으로 '좋아요'와 '싫어요'로 대표되는 이진 분류 (Binary Classification)를 기반으로 하며, 다양한 종류의 텍스트 분석을 통해 글쓴이의 주관적 의견을 분석하는 오피니언 마이닝 (Opinion Mining)의 일종이다[10]. 이와 다르게 보다 다양한 감정 (예를 들면, 기쁨, 슬픔, 분노, 공포, 놀람, 혐오와 같은 6~8가지 기본 감정 또는 그 이상의 복잡한 감정)을 분류하고 인식하려는 시도 또한 딥러닝 알고리즘의 발달과 함께 증가하고 있으며, 특히 텍스트 기반 감정 인식 (Textual Emotion Recognition; TER) 기술에 대한 연구가 감성 컴퓨팅과 자연어 처리 분야에서 다양하게 시도되고 있다[11].
본 논문은 크로스미디어 스토리텔링의 개념을 기반으로 인기 원작 웹툰을 TV 드라마로 각색하여 두 개의 서로 다른 미디어에서 모두 인기를 얻은 사례를 중심으로 각각 독자 및 청중의 감정 분석을 시도하고, 감정 분석의 결과를 긍정과 부정의 두 가지 극성으로 나누어 결과를 분석한다.
Ⅲ. 데이터 수집 및 모델 설정
3-1 스토리 선정
분석을 위한 스토리로서 선정한 작품은 원작과 다른 미디어로 제작되고, 원작과 재매개 작품 모두 대중들에게 긍정적인 호응을 받은 작품을 대상으로 선택했다. 스토리텔링은 만화, 웹툰, 소설, 영화 등 다양한 장르를 통해 이루어진다. 본 논문에서는 원작의 장르를 웹툰으로 선정하였으며, 그 이유는 최근 디지털 콘텐츠의 이용자 수 증가와 함께 웹툰이 다양한 연령대의 사람들이 즐기는 하나의 컨텐츠로 자리잡았으며, 웹툰이나 웹소설 원작의 재매개가 활발하게 진행되기 때문이다.
한국콘텐츠진흥원에서 제공하는 <2021 만화 이용자 실태조사> 보고서에 따르면 최근 3년간 디지털만화인 웹툰의 이용 현황의 빈도가 꾸준히 증가하고 있음을 알 수 있다[12]. 웹툰의 경우 책으로 연재되는 만화나 소설에 비해 상대적으로 독자들의 반응을 확인하기 쉽다. 또한, 독자들이 감상한 웹툰의 에피소드마다 독자들의 반응에 해당하는 댓글이나 별점 등을 통해 리뷰 데이터가 있고, 수집하고자 하는 데이터를 찾아 데이터셋으로 만들기에 적합한 플랫폼이 존재한다.
웹툰에서 드라마로 성공한 원작을 재매개하여 인기를 얻은 작품들로는 <이태원 클라쓰 (웹툰:2016, 드라마: 2020)>, <경이로운 소문 (웹툰: 2018, 드라마: 2020>, <스위트홈 (웹툰: 2017, 드라마: 2020>, <여신강림 (웹툰: 2018, 드라마: 2020)>, <지옥 (웹툰: 2019, 드라마: 2021)> 등이 있으며, 본 논문에서는 2020년~2021년 사이에 방영된 드라마 <경이로운 소문>과 그의 원작인 웹툰 <경이로운 소문>을 대상으로 감정 분석을 진행하였다.
다음 웹툰(현재 카카오웹툰)에서 인기를 끌었던 웹툰 <경이로운 소문>은 '장이' 작가가 2018년 8월부터 매주 연재한 작품이다. 웹툰은 시즌1과 시즌2 총합 124화로 완결되었으며, 장르는 판타지, 액션, 미스터리, 스릴러이다. 웹툰 <경이로운 소문>은 사후세계를 주제로 독특한 설정을 보이는 작품으로, 간단한 줄거리는 다음과 같다: '융'이라 불리는 저승세계의 영혼 '융인' 중에서 생전의 악행에 대한 심판이 두려운 나머지 융을 도망쳐 나온 악한 영혼인 마귀들은 이승에서 영원히 살고자 사람 몸에 들어가 기생한다. 누군가의 몸에 기생 중인 마귀는 곧바로 숙주를 조종할 수 없지만, 인간을 부추겨 살인을 저지르고 죽은 자의 영혼을 흡수할수록 더욱 악하고 강력한 마귀가 된다. 이러한 마귀들이 활개를 치고 다니자 융인들은 자신들의 힘으로 마귀를 잡아올 수 없음을 느끼고 혼수상태에 빠진 이승의 사람들과 계약을 맺어 특별한 능력을 갖는 '카운터'를 만들어 대응한다. 각각의 카운터는 특별한 초능력을 갖으며, 이승과 저승의 연결점인 '땅'에서는 더욱 강해진다는 설정이다.
원작 웹툰을 TV 드라마로 제작한 동명의 작품 <경이로운 소문>은 OCN과 넷플릭스(Netflix) 등 케이블 방송국과 다양한 스트리밍 서비스 플랫폼에서 방영되었다. 총 16부작 (에피소드당 러닝 타임은 약 60~70분)으로 각색된 드라마는 OCN에서 2020년 11월 28일부터 2021년 1월 24일까지 방영했으며, 2020년동안 OCN에서 방영한 작품들의 첫 회 중에서 가장 높은 시청률을 기록하였고, 역대 OCN 방영 드라마 중 최고 시청률 (11.0%)을 달성한 드라마가 되었다.
첫 방영부터 지속적으로 시청률을 상승시켜 오던 드라마 <경이로운 소문>은 원작 웹툰과 비교적 유사한 전개로 방영을 진행하다가 중반 이후 스토리 면에서 원작 웹툰에 없던 내용이 몇 가지 추가된다. 가장 큰 차이점 중의 하나는 주요 등장인물 중 한 명인 기모탁 (유준상 역)의 파트너 형사와의 로맨스가 추가된 점인데, 원작에서는 평범한 외모의 중년 남자로 묘사된 김길수 캐릭터가 TV 드라마에서는 기모탁의 옛 연인인 여자 형사 김정영 캐릭터로 바뀌어서 등장한다. 이는 판타지 장르의 특성에 충실한 원작과 다양한 관객층을 만족시키기 위한 TV 드라마 특성의 차이 중 하나라고 볼 수 있다.
스토리의 차이점 외에 스토리 전개 속도 면에서도 차이가 있다. TV 드라마가 인기를 끌면서 10화에서부터 원작과 다른 이야기를 추가하면서 전개 속도를 늦추는데, 이 시기에 시청자들의 반응을 감정 분석하면 스토리 차이 및 이야기 전개 속도에 대하여 시청자들의 감성 반응을 확인할 수 있다. 본 논문에서는 웹툰 원작에 대한 댓글과 드라마 시청자들의 실시간 반응을 감정 분석한 후, 각각 어떤 감정이 발생했는지를 비교 분석한다. 또한, 이야기가 진행하면서 각 에피소드별 감정 분석을 통해 특정 감정의 증감 양상과, 전체적으로 긍정적인 감정과 부정적인 감정의 비율 변화 등을 분석한다.
3-2 데이터셋
웹툰과 TV 드라마에 대한 독자와 청중의 반응을 감정 분석하기 위해서 먼저 텍스트로 이루어진 데이터셋이 필요하다. 본 논문에서는 감정 분석을 위해 드라마에 대한 시청자 반응인 '네이버 실시간 톡(Talk)'[13]의 채팅 내용과 웹툰에 대한 독자들의 감상인 ‘다음 웹툰’ 댓글을 크롤링하여 데이터셋을 구축하였다.
네이버 실시간 톡은 시청자들이 드라마 <경이로운 소문>을 실시간으로 보면서 다른 시청자들과 대화를 나눌 수 있도록 네이버에서 2015년에 시작한 서비스로서 코로나19로 인해 사회적으로 단절되는 일상이 지속되자 더 많은 시청자들이 이용하게 되었다. 서비스 사용자들은 시청중인 드라마에 대해 다른 시청자들과 대화를 나누기도 하고, 방영 내용이나 이전 스토리 등 궁금한 내용에 대해 물어보며 궁금증을 해소하기도 한다. 통신 서비스의 발전은 더 많은 시청자들이 모바일 환경에서도 방송을 시청할 수 있게 하였고, 여기에 신속하게 소통까지 가능하게 되었다. 특히 젊은 세대의 시청자들이 증가하면서 한편으로는 시청자의 반응을 확인할 수 있는 지표로 활용되기도 한다. 본 논문에서는 이를 이용하여 드라마 <경이로운 소문>에 대하여 네이버 실시간 톡 서비스로 시청하는 시청자들의 대화 내용을 드라마 1화부터 10화까지 추출하였다. 해당 데이터셋에는 각 채팅마다 채팅을 입력한 계정의 이름과 채팅이 올라온 시간을 포함한다. 채팅의 경우 방영 시간 외에도 타인과 채팅이 가능하지만, 드라마 시청자들의 반응을 대상으로 하기 때문에 실시간 방영 중의 채팅만을 감정 분석의 대상으로 삼았다. 총 433,066 문장의 '경이로운 소문(드라마)'에 대한 실시간 Talk 데이터를 수집하였으며, 그 중 정규 편성된 생방송 시간에 해당하는 데이터는 300,938 문장(69.49%)이고, 나머지 132,128 문장은 재방송 시간에 생성되었다. 재방송 시간에 생성된 데이터는 스포일러를 포함하거나 광고, 도배성 채팅이 강하기 때문에 분석 데이터에서 제외하였다
네이버 실시간 톡 데이터셋과 비교 대상인 다음 웹툰 댓글 데이터셋은 드라마의 원작인 웹툰 <경이로운 소문>의 독자들의 댓글을 회차별로 모았다[14]. 다음 웹툰은 어떤 댓글에 본인을 포함한 다른 독자들이 달 수 있는 답글 기능이 제공된다. 또한, 댓글에서 스포일러가 될 수 있는 댓글의 경우, 스포일러를 원하지 않는 사람을 위해 해당 댓글을 가려 두는 블라인드 기능을 제공하고 있다. 만약 해당 댓글을 읽고자 한다면 직접 가려진 부분을 클릭해야만 댓글의 내용을 확인할 수 있다. 다음 웹툰 댓글 데이터셋은 일반 댓글과 그에 추가된 답글을 포함하고 있으며, 블라인드 처리된 댓글도 포함하고 있다. 이외에도 해당 댓글들이 어느 회차에서 추출되었는지에 대한 정보로 에피소드 값과 연구에는 사용되지 않았지만 댓글에 대한 다른 독자들의 반응인 좋아요/싫어요 개수와 답글의 개수 정보도 담고 있다. 웹 크롤러(Web crawler)를 이용하여 2021.02.20일 기준 시즌1의 60화와 시즌2의 44화, 그리고 에필로그 에피소드를 포함하여 총 105개의 에피소드를 크롤링하였으며, 그 결과 총 34,594개의 댓글 데이터를 수집하였다.
추가적으로, TV 드라마 <경이로운 소문>의 대본 데이터셋이 있다. 온라인 영상 스트리밍 서비스인 넷플릭스에서 시·청각장애인을 위해 제공하는 화면 해설 및 자막을 이용하여 수기로 인물의 이름을 함께 표시한 데이터셋이다. 대본에 포함된 화면 해설은 주변 환경음이나 인물의 표정 등을 묘사하는 구체적인 내용이 포함되어 있다. 본 연구에서는 비교 목적으로 1화만을 사용하였다.
3-3 감정 학습 모델
텍스트 감정 분석을 위해 본 논문에서 사용한 모델은 GoEmotions-Korean[15]이다. 해당 모델의 기반이 되는 GoEmotions[16]는 해외 소셜 뉴스 웹사이트인 레딧(Reddit)에서 크롤링한 58,000개의 Reddit comments 말뭉치로서, 텍스트에 대해 중립(neutral)을 포함한 28가지 감정 카테고리로 분류한다. 모델 훈련에는 43,410개의 훈련(train) 예제와 5,426개의 검증(validation) 예제, 그리고 5,427개의 테스트(test) 예제를 사용했다. GoEmotions의 경우 추출되는 감정의 종류가 다양하므로 텍스트에서 표현되는 감정을 보다 세밀하게 파악할 수 있다.
본 논문에서 다루는 데이터셋은 한국어 기반 텍스트로 구성되어 있어 GoEmotions를 한국어 데이터셋에서 적합하게 동작할 수 있도록 훈련한 모델인 GoEmotions-Korean을 사용한다. 이 모델은 GoEmotions 데이터셋을 구글 번역기를 통해 한국어로 번역하여 KoELECTRA[17]로 학습한 모델이다. 여기서 KoELECTRA의 기반이 되는 ELECTRA는 generator에서 나온 토큰을 기준으로 "진짜(real)" 토큰인지 아니면 "가짜(fake)" 토큰인지를 판별하는 방법으로 학습하는 모델이며, 모든 입력 토큰에 대해 학습할 수 있는 장점이 있어 BERT와 비교했을 때 더 우수한 성능을 보인다. KoELECTRA의 경우 Base와 Small 의 두 가지 종류 모델을 제공하며, 본 논문에서는 KoELECTRA-Base로 학습을 진행하였다.
GoEmotions-Korean을 이용하여 데이터셋 분석을 수행하면 추출한 감정의 종류와 각각의 감정이 텍스트에서 얼마만큼 추출되었는지 점수로 계산하여 출력된다. 이 결과는 다중 레이블로 표현되므로 하나의 텍스트 데이터에서 여러 개의 감정이 존재하는 경우에도 감정을 추출하여 각각의 점수를 확인할 수 있다는 장점이 있다. 감정 추출 및 표현에 대한 예로 아래의 그림 1은 다음 웹툰 <경이로운 소문> 24화의 댓글을 GoEmotions-Korean으로 분석하여 출력한 결과의 일부를 가져온 값이다.
그림 1에서 출력 리스트는 하나의 댓글과 그 댓글에 추가된 다른 댓글들에 대해 감정 분석을 시행한 결과 중 하나이다. 하나의 텍스트에서 단일 감정이 추출되었을 경우에는 그림 1의 예시와 같이 [joy], [excitement], [amusement] 등 각각의 감정과 해당 감정의 비율을 표시한다. 또한, 하나의 문장에서 여러가지 감정이 추출될 수도 있는 것을 고려하여 다중 레이블로 추출된 결과로서 ['admiration', 'approval'], ['admiration', 'amusement'] 등의 예시와 같이 추출된다. 다중 레이블에 표시된 감정은 사전순으로 나열되며, 해당 점수 또한 동일하게 표시된다. 위와 같이 상세하게 추출된 감정을 이용하여 텍스트에서 표현된 감정을 보다 상세하게 파악할 수 있다.
3-4 감정 극성 분류
본 논문에서는 드라마 시청자와 웹툰 독자들의 반응에 대해 감정 분석을 수행한 결과로 추출된 감정을 보다 직관적으로 이해하기 위해 긍정과 부정의 두 가지 극성으로 나누었다. 감정 분석을 시행할 경우 일반적으로 가장 빈번하게 추출되는 감정 중 하나로 중립이 있으나 중립은 긍정 또는 부정으로 분류할 수 없으므로 분류 작업에서 제외하였다. 중립을 제외하고 가장 잦은 빈도로 추출된 감정을 기준으로 내림차순 정렬을 진행한 후 긍정적 또는 부정적 감정이 특정 회차에서 얼마나 추출되었는지를 분석하였다.
감정 극성을 긍정 또는 부정으로 분류하는 기준은 기본적으로 GoEmotions 모델에서 제공하는 감정 카테고리 (그림 2 참조)를 기반으로 하였다. GoEmotions-Korean에서 제시한 극성 분류는 중립을 제외한 27가지 감정을 긍정 (12가지), 부정 (11가지), 그리고 모호한 감정 (4가지)으로 분류한다. 이 중에서 4가지 모호한 감정 – 혼동(Confusion), 호기심 (Curiosity), 깨달음 (Realization), 그리고 놀람(Surprise) - 에 대해서 혼동은 부정의 감정으로, 그리고 호기심, 깨달음, 놀람의 감정은 긍정 극성의 감정으로 각각 분류하였으며, 최종적으로 중립을 제외하고 15가지의 긍정 극성과 12가지의 부정 극성의 감정으로 분류하였다.
Ⅳ. 감정 분석 및 극성 분류
TV 드라마 <경이로운 소문>의 설정과 인물, 스토리 등 극적 요소는 이야기가 진행됨에 따라 원작인 다음 웹툰 <경이로운 소문>과 다소 차이가 있다. 이를 바탕으로 원작 웹툰의 독자들과 드라마의 시청자들의 반응인 댓글과 채팅에서 각각 감정을 추출하고 이를 분석하여 어떤 매체에서 보다 긍정적 또는 보다 부정적인지를 볼 수 있다.
4-1 <경이로운 소문> 1화 분석
드라마 <경이로운 소문> 1화에서 주인공 '소문'은 부모님을 불의의 사고로 잃고 할머니 할아버지와 함께 살아가는 신체 장애가 있는 고등학생으로, 단짝친구들과 함께 동네 맛집인 '언니네 국수'라는 가게에서 국수를 먹기 위해 기다린다. 소문 일행이 들어가려는 순간 국수 가게 사장과 직원들은 갑자기 영업을 마감하고 가게를 나서는데, 사실 이들은 마귀를 융으로 보내기 위한 카운터이다. 이들은 초인적 능력을 갖고 마귀를 쫓지만 역으로 카운터 '철중'이 마귀가 붙은 '지청신'에게 살해당한다. 철중이 사망하면서 철중의 영혼은 지청신에게 흡수되고 철중과 계약을 맺은 융인 '위겐'은 철중과의 연결이 끊어지면서 이승에 떨어진다. 영혼 상태인 위겐은 융으로 돌아갈 방법이 없어 소멸 위기에 처하게 되고, 이 때 의식이 있음에도 불가사의하게 융과 연결되어 있는 소문에게 들어가게 된다. 위겐과 연결된 소문은 머리가 곱슬거리게 변하게 되는 현상을 겪고, 이를 직접 본 친구들과 소문은 이상함을 감지한다.
드라마 <경이로운 소문>과 원작 웹툰 <경이로운 소문>의 1화의 경우 대략적인 작품의 소재와 컨셉에 대해 최소한의 정보만을 제공하면서 독자와 시청자의 호기심을 자극한다. 드라마 1화에서 일부 각색된 내용은 카운터들이 국수 가게의 사람들이라는 것을 의미하는 언니네 국수의 모습을 연출한 내용이다. 원작에서는 이에 대한 언급 없이 카운터들은 지청신을 추격하고 소문 일행은 자신들이 그리는 만화의 배경을 위해 주변을 탐문하며 사진을 촬영하는 내용으로 전개된다. 내용상 두 작품 거의 유사하게 전개되기 때문에, 두 작품의 매체는 다르지만 같은 전개일 때에 대한 반응을 비교할 수 있다. 논문에서는 네이버 실시간 톡과 다음 웹툰 댓글 데이터셋의 1화에 대한 감정 분석을 각각 진행하고 긍정 및 부정의 극성으로 나누어 그 비율을 비교하였다. 또한, 추가적 분석을 위해 넷플릭스에서 제공하는 화면 해설 및 드라마 대본도 함께 감정 분석과 극성 분류를 진행하였다.
드라마 1화의 대본에서는 전체 1,230개의 감정 텍스트가 추출되었으며, 이 중 중립으로 분류된 509개를 제외한 나머지 721개의 감정을 긍정과 부정의 극성으로 나누었다. 표 1은 특정 감정이 긍정 및 부정 감정 중 각각 몇 번째로 많이 추출되었는지에 대한 순위와 해당 감정이 데이터셋에서 추출된 감정 텍스트 개수를 포함한다. 여기서 순위는 GoEmotions 감정 데이터에서 명시된 28개 감정들 중에서 실제로 검출된 감정 중 중립을 제외한 순위를 의미하며, 해당 데이터셋에서 주가 되는 감정 극성을 판단하는 지표로 사용할 수 있다.
감정 분석을 진행한 결과, 표 1에서 나타낸 것과 같이 긍정 감정으로 분류된 상위 5개 감정은 호기심(curiosity, 1위:137개), 승인(approval, 4위: 65개), 놀람(surprise, 6위: 46개), 감탄(admiration, 8위: 37개), 흥분(excitement, 9위: 36개)으로 나타났다. 부정 감정의 상위 5개 감정은 분노(anger, 2위: 83개), 혼동(confusion, 3위: 81개), 짜증(annoyance, 5위: 48개), 부인(disapproval, 7위: 40개), 슬픔(sadness, 11위: 21개)이다. 전체적으로 긍정 극성의 감정과 부정 극성의 감정이 적절하게 섞여 있음을 알 수 있다. 드라마 1화의 내용을 고려할 때, 부정 감정이 추출된 원인으로는 주인공이 부모님을 잃게 되는 불행한 과거, 이로 인한 할머니의 치매, 철중의 죽음 등의 사건이 해당한다. 긍정 감정의 추출 원인으로는 주인공 소문을 따뜻하게 챙겨주는 할아버지, 소문과 함께하는 단짝 친구들, 갑작스러운 소문의 변화 등이 있다.
드라마 대본에서 나타난 감정 또는 감성과 이에 대한 독자의 감정 또는 감성 반응은 다르게 나타날 수 있으므로, 네이버 실시간 톡을 통해 나타난 TV 드라마 1화에 대한 시청자들의 감정 분석과 그에 대한 극성 분류를 시행하였다.
먼저, GoEmotions-Korean 모델을 통해 감정 분석을 시행한 결과로서 총 4,570개의 감정 텍스트가 추출되었으며, 이 중 중립으로 분류된 1,190개의 감정 부분을 제외한 나머지 3,380개의 감정 텍스트를 긍정 극성과 부정 극성으로 분류한 결과를 표 2에 나타내었다.
긍정 감정으로 분류된 상위 5개 감정으로는 즐거움(amusement, 1위: 1,018개), 감탄(admiration, 2위: 513개), 호기심(curiosity, 3위: 288개), 기쁨(joy, 5위: 185개), 승인(approval, 6위: 179개)으로 나타났다. 부정 감정으로 분류된 상위 5개 감정의 종류는 짜증(annoyance, 4위: 217개), 혼동(confusion, 8위: 154개), 분노(anger, 10위: 119개), 슬픔(sadness, 12위: 55개), 부인(disapproval, 14위: 37개)이다. 4위를 제외하고 1위부터 6위까지의 감정이 모두 긍정 감정으로 분석되었으며, 중립을 제외한 전체 감정 중 긍정 감정의 비율은 80.21%였다. 표 2에서 나타난 결과에 따르면 긍정으로 분류된 감정들이 전반적으로 상위권을 차지하고 있음을 확인할 수 있으며, 드라마 1화를 시청한 사람들이 작품의 스토리와 연출, 출연 배우 등을 모두 포함하여 드라마에 대해 많은 기대를 갖고 있음을 어느 정도 유추할 수 있다. 실제로 184개 채팅이 드라마 1화 방영 중 원작에 대해 궁금해하거나 원작을 드라마로 제작하는 것에 관하여 기대감을 표현한 것으로 집계되었으며, 드라마 1화에 대한 시청자들의 긍정적인 반응에는 스토리에 대한 흥미와 캐스팅 배우, 원작에 대한 좋은 인상이 주를 이루고 있었다. 부정 감정으로 분류된 채팅의 경우, 원작과 다소 다른 연출에 대해 부정적인 의견을 표하거나, 주인공 소문의 과거에 대해 안타까움을 느낀 시청자들의 채팅이 있었다.
시청자 감정과 독자 감정의 비교 분석을 위해 유사한 전개를 갖는 원작 웹툰의 댓글과 그 답글에 대한 감정 분석을 진행하였다. 감정 분석은 총 1,230개의 댓글 중 중립에 해당하는 509개의 댓글을 제외하고 나머지 721개의 댓글에 대해 진행하였으며, 표 3은 감정을 긍정 및 부정의 극성으로 분류하여 각각 상위 5개씩 순위와 개수를 나타낸다.
표 3에서 긍정으로 분류된 상위 5개 감정은 즐거움(amusement, 1위: 119개), 감탄(admiration, 2위: 93개), 호기심(curiosity, 4위: 46개), 승인(approval, 5위: 31개), 흥분(excitement, 6위: 28개)이고, 부정으로 분류된 상위 5개의 감정은 혼동(confusion, 3위: 51개) 짜증(annoyance, 8위: 21개), 분노(anger, 10위: 13개), 부인(disapproval, 15위: 5개), 슬픔(sadness, 15위: 5개)으로 나타났다. 앞의 시청자 감정과 비교하면 긍정 감정의 amusement, admiration, curiosity가 동일한 순위로 가장 많이 추출되었으며, approval과 excitement가 각각 5위 내로 집계되었다. 또한, 중립을 제외한 전체 감정 중 긍정 감정의 비율이 79.3%로서 전체적으로 긍정의 감정 반응이 다수를 차지하고 있음을 볼 수 있으며, 웹툰이 드라마에 비해 긍정 감정의 비율이 근소하게(0.9%) 낮음을 볼 수 있다. 이에 대한 이유로서 드라마는 출연 배우의 팬들과 원작 웹툰을 본 독자들이 시청자로 참여한 경우가 많으며, 드라마에서는 원작 내용을 아는 시청자들 뿐만 아니라 원작을 모르는 시청자들도 이후 스토리에 대한 기대감을 가질 수 있었기 때문에 비교적 긍정적인 반응이 더 많았다고 생각된다. 원작 웹툰에서 1화의 경우 새롭고 온전하게 작품을 보이기 때문에 긍정 감정을 차지하는 댓글은 작가의 이전 작품을 본 독자들의 기대감과 1화의 내용이 독자의 호기심을 자극하여 추출된 감정이 주를 이루었다. 작품에 대한 앞으로의 기대감을 표현한 댓글도 다수 있었으나 스토리의 중요한 요소들을 보여주면서도 이에 대한 설명이 부족했던 1화를 감상하고서 이해하지 못한 독자들이 혼동을 느끼고 설명을 원하는 댓글도 많이 추출되었기 때문에 드라마에 비해 상대적으로 부정으로 분류되는 감정이 많았다고 볼 수 있다. 이에 대한 근거로서 표 3에서 추출된 감정 중에서 극성이 부정으로 분류되는 '혼동(confusion)'이 상위권(부정 감정 중에서는 1위, 전체 감정 중에서는 3위)에 속하는 것을 확인할 수 있다.
4-2 스토리 전개에 대한 차이점 분석
<경이로운 소문> TV 드라마의 경우, 스토리가 전개되면서 기존 원작 웹툰과 다소 다른 내용 및 설정으로 전개되었는데, 이에 따라 발생한 사람들의 반응 차이를 분석하였다. 원작 웹툰과 방영중인 드라마의 스토리 전개를 맞추기 위해 드라마의 1화부터 10화까지의 전개가 웹툰의 1화부터 24화까지이야기 전개와 진행도가 유사한 점을 고려하여 드라마 1화부터 24화까지의 다음 웹툰 댓글 데이터셋과 1화부터 10화까지의 네이버 실시간 톡 데이터셋을 각각 감정 분석을 진행하여 비교하였다.
다음 웹툰 1화부터 24화까지의 데이터셋을 대상으로 총 9,951개의 댓글 중 중립으로 분류된 1,606개의 댓글을 제외한 8,345개의 댓글에 대하여 감정 분석을 진행하였다. 그림 3은 중립을 포함하여 총 26가지로 추출된 감정 그래프로 추출된 감정의 종류와 각각의 추출 개수를 나타낸다. GoEmotions 감정 데이터셋에 포함된 28개 감정 중 긍정에서는 자부심 (Pride)이, 부정에서는 비통 (Grief)의 독자 감정 반응이 검출되지 않았으며, 표 4는 감정의 극성을 분류한 결과를 나타낸다. 특이한 점으로 긍정 감정 중 하나인 '즐거움(amusement)'이 다른 감정 분석 결과에서 가장 많이 추출되었던 중립(neutral)보다 더 많이 추출되어 1위로 집계된 것을 볼 수 있다.
그림 3을 통해 웹툰 원작에서는 긍정으로 분류되는 감정이 주로 상위권을 차지하고 있음을 알 수 있다. 중립을 제외한 감정의 극성을 분석하면 1위부터 10위까지 감정 중 7가지 감정이 긍정 감정으로 나타났으며, 추출된 모든 감정 중 긍정 감정이 차지하는 비율이 79.4%로서 긍정 감정이 많은 비율을 차지한다. 추출된 상위 다섯개 긍정 감정의 종류는 즐거움(amusement, 1위: 2061개), 감탄(admiration, 2위: 1456개), 흥분(excitement, 3위: 567개), 놀람(surprise, 5위: 446개), 기쁨(joy, 6위: 424개)이다. 이 결과를 토대로 많은 독자들이 웹툰의 스토리 전개에 대해 즐거움과 기대감을 표현했음을 유추해볼 수 있다. 부정 감정으로 추출된 상위 감정 5개는 짜증(annoyance, 4위: 475개), 분노(anger, 9위: 355개), 혼동(confusion, 10위: 290개), 슬픔(sadness, 12위: 199개), 실망(disappointment, 18위: 88개)이다.
원작 웹툰에 대한 독자 반응과 드라마 시청자들의 반응을 비교하기 위해 TV 드라마 <경이로운 소문>의 1화부터 10화까지 방영본을 기준으로 네이버 실시간 톡 데이터셋에 대해 감정을 분석하였다. 그림 4는 감정 분석을 통해 추출된 감정의 종류와 그 개수를 나타내며, 검출이 안 된 비통 (Grief)의 감정을 제외한 27가지의 감정을 보여준다. 표 5는 이에 대한 감정의 극성을 분류하여 순위로 나타낸 결과를 보여준다. 개수를 고려하지 않을 경우, 웹툰과 비교했을 때 10위권 이내로 나타난 부정감정의 개수가 조금 더 많은 것을 확인할 수 있다.
네이버 실시간 톡의 경우, 전체 99,683개 구문 중에서 중립을 제외한 67,996개 텍스트를 대상으로 분석을 진행하였으며, 원작 웹툰과 비교하여 10배가량 더 많은 데이터가 수집되었다. 분석된 전체 감정 중 긍정 감정은 66.6%였으며, 이는 웹툰의 결과와 비교했을 때 12.8% 낮은 비율이다. 또한, 드라마 1화에서 감정 분석을 진행했을 때 얻은 부정감정의 비율이 19.8%이었으나 10화까지의 부정 감정이 33.4%로 나타났으며, 이는 1화에 비해 부정이 13.6% 가량 증가한 비율이다. 특히 '짜증(annoyance)' 감정은 6.4%에서 11.6%로, '분노(anger)' 감정은 3.5%에서 6.9%로서 다른 부정 감정들과 비교하여 상위권을 유지했으며, 방영 회차마다 진행한 결과를 통해 부정감정이 이전부터 지속적으로 증가한 것을 볼 수 있었다.
방영 초반과 비교하여 긍정의 감정이 낮게 나타나고 부정의 감정이 점진적으로 증가한 이유로 다양한 이유가 존재할 수 있지만, 분석 결과 가장 큰 이유 중 하나는 두 매체간 스토리 전개 속도였다. TV 드라마의 경우, 초반에는 스토리 전개 속도가 웹툰의 전개 속도에 비해 매우 빠르게 진행되었으나, 9화부터 원작과 달리 스토리 전개가 늘어나면서 답답한 전개가 이어졌다. 드라마에 대해 긍정적인 기대를 하던 시청자들의 불만이 증가하면서 이에 대해 문제를 제기하는 채팅이 증가한 것을 확인할 수 있었으며, 이에 대한 감정 분석 결과에도 부정 극성의 감정 증가가 확인되었다.
Ⅴ. 결 론
본 논문은 <경이로운 소문>에 대한 원작 웹툰 독자들의 반응과 TV 드라마 시청자 반응에 대한 텍스트 감정을 분석하여 매체에 따른 관객의 반응 차이를 비교 분석하였다. 1화를 기준으로, 시청자와 독자의 감정은 긍정 비율이 약 80%로 두 매체에서 모두 높았으며, 스토리에 대한 기대감과 호평을 나타내는 긍정적인 표현이 부정적인 표현보다 약 4배 정도 많았다. 하지만, TV 드라마의 경우 원작 웹툰과 다른 이야기가 추가적으로 전개되면서 이야기 진행 속도가 느려지게 되었고, 원작 웹툰보다 긍정 감정의 비율이 점진적으로 감소하였다.
본 논문에서 감정 모델로 사용한 GoEmotions-Korean 감정 모델은 중립을 포함하여 총 28가지의 감정 분류 기능을 제공한다. 감정으로 분류할 클래스가 많은 경우 세밀하게 분류할 수 있는 장점이 있지만, 이에 따라 많은 양의 데이터셋을 필요로 하며, 분류되는 감정 중 '승인(approval)', '깨달음(realization)', '부인(disapproval)'과 같이 서사 감정으로 사용하기에는 모호한 감정들이 존재한다. 향후 연구로는 감정 분석 모델을 서사 감정 연구에 적합하게 개선한 후, <경이로운 소문> 외의 다른 작품에 대한 감정 분석을 진행하여 이야기의 어떤 요소들이 관객 또는 독자로부터 긍정 또는 부정적 반응을 불러일으키는지를 조사할 예정이다.
Acknowledgments
이 논문은 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임 (No. 2021R1A2C1012377). 또한, 2021학년도 홍익대학교 학술연구진흥비에 의하여 지원되었음.
References
- M. Kim, “A Case Study of Cross-Media Storytelling: Remediation of Webtoon <Misaeng> to Drama Series <Misaeng>,” The Journal of the Korea Contents Association, Vol. 15, No. 8, pp. 130-140, August 2015. [https://doi.org/10.5392/JKCA.2015.15.08.130]
- H.-Y. Cho “Study on Application Patterns of Transmedia Storytelling with Focus on Media Extension Using Webtoons,” Journal of the Korea Entertainment Industry Association, Vol. 12, No. 3, pp. 309-322, April 2018. [https://doi.org/10.21184/jkeia.2018.4.12.3.309]
- K. Oatley, “A taxonomy of the emotions of literary response and a theory of identification in fictional narrative,” Poetics, Vol. 23, No. 1-2, pp. 53-74, January 1995. [https://doi.org/10.1016/0304-422X(94)P4296-S]
- H.-Y. Yu, M.-H. Kim, and B.-C. Bae, “Emotion and Sentiment Analysis from a Film Script: A Case Study,” Journal of Digital Contents Society, Vol. 18, No. 8, pp. 1537-1542, December 2017. [https://doi.org/10.9728/dcs.2017.18.8.1537]
- S.-H. Park, B.-C. Bae, and Y.-G. Cheong, “Emotion Recognition from Text Stories Using an Emotion Embedding Model,” in Proceedings of the IEEE International Conference on Big Data and Smart Computing (BigComp), Busan, pp. 579-583, February 2020. [https://doi.org/10.1109/BigComp48618.2020.00014]
- J.-H. Lee, H.-J. Kim, and Y.-G. Cheong, “A Multi-modal Approach for Emotion Recognition of TV Drama Characters Using Image and Text,” in Proceedings of the IEEE International Conference on Big Data and Smart Computing (BigComp), Busan, pp. 420-424, February 2020. [https://doi.org/10.1109/BigComp48618.2020.00-37]
- S. Lee, “Concept and Properties of Transmedia Storytelling,” The Journal of the Korea Contents Association, Vol. 9, No. 12, pp. 193-200, December 2009. [https://doi.org/10.5392/JKCA.2009.9.12.193]
- A. Yadav and D. K. Vishwakarma, “Sentiment analysis using deep learning architectures: a review,” Artificial Intelligence Review, Vol. 53, No. 6, pp. 4335-4385, August 2020. [https://doi.org/10.1007/s10462-019-09794-5]
- A. J. Reagan, L. Mitchell, D. Kiley, C. M. Danforth, and P. S. Dodds, “The emotional arcs of stories are dominated by six basic shapes,” EPJ Data Science, Vol. 5, Article number 31, November 2016. [https://doi.org/10.1140/epjds/s13688-016-0093-1]
- B. Liu, Sentiment Analysis and Opinion Mining, Springer, 2012. [https://doi.org/10.1007/978-3-031-02145-9]
- J. Deng and F. Ren, “A Survey of Textual Emotion Recognition and Its Challenges,” in IEEE Transactions on Affective Computing, Vol. 14, No. 1, pp. 49-67, January 2021. [https://doi.org/10.1109/TAFFC.2021.3053275]
- Korea Creative Content Agency, A 2021 Survey of Cartoon Users [Internet]. Available: https://welcon.kocca.kr/ko/info/trend/1951080
- Naver TV, The Uncanny Counter TALK [Internet]. Available: https://tv.naver.com/cjenm.thecouter/talks
- Daum Webtoon, The Uncanny Counter WEBTOON [Internet]. Available: http://webtoon.daum.net/webtoon/view/AmazingRumor
- GoEmotions-Korean [Internet]. Available: https://github.com/monologg/GoEmotions-Korean
- GoEmotions [Internet]. Available: https://github.com/google-research/google-research/tree/master/goemotions
- KoELECTRA [Internet]. Available: https://github.com/monologg/KoELECTRA
- GoEmotions: A Dataset for Fine-Grained Emotion Classification [Internet]. Available: https://ai.googleblog.com/2021/10/goemotions-dataset-for-fine-grained.html
저자소개
2018년~2022년:홍익대학교 게임학부 게임소프트웨어전공
2022년~현 재: 컴투스 제작4본부 FUTURE스튜디오 K클라이언트팀 클라이언트프로그래머
※관심분야:인터랙티브 스토리텔링, 게임 인공지능
2015년~2020년:홍익대학교 게임학부 게임소프트웨어전공
2020년~2022년:홍익대학교 일반대학원 (공학석사)
2022년~현 재: 크래프톤 Special Project II 재직 (Machine Learning 연구원)
※관심분야:인터랙티브 스토리텔링, 게임 인공지능, NPC, 대화 시스템, 인디 게임
1993년:고려대학교 전자공학과
1998년:고려대학교 전자공학과 대학원 (공학석사)
2009년:노스캐롤라이나주립대학교 전산학과 (공학박사)
2009년~2011년: 삼성전자 종합기술원
2011년~2014년: 코펜하겐IT대학 방문연구원/시간 강사
2014년~2015년: 성균관대학교 BK연구교수
2015년~현 재: 홍익대학교 게임학부 조교수
※관심분야:인터랙티브 스토리텔링, 게임 인공지능, HCI