Korea Digital Contents Society

Journal Archive

Journal of Digital Contents Society - Vol. 20 , No. 8

[ Article ]
Journal of Digital Contents Society - Vol. 20, No. 8, pp. 1553-1565
Abbreviation: J. DCS
ISSN: 1598-2009 (Print) 2287-738X (Online)
Print publication date 31 Aug 2019
Received 23 Jul 2019 Revised 06 Aug 2019 Accepted 26 Aug 2019
DOI: https://doi.org/10.9728/dcs.2019.20.8.1553

제19대 대통령 선거의 SNS 가짜뉴스(fakenews) 네트워크 분석
조하진 ; 김경호*
제주대학교 언론홍보학과

An Analysis of the Social Media Fake News Network in the 19th Presidential Election
Hajin Cho ; Gyongho Kim*
Department of Journalism and Public Relations, Jeju National University, Jeju University Road 1, Jeju, Korea
Correspondence to : *Gyongho Kim Tel: +82-64-754-2944 E-mail: kimgyongho@hotmail.com


Copyright ⓒ 2019 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
Funding Information ▼

초록

본 연구는 트위터 검색을 통해 제19대 대통령 선거에 SNS(Social Network Services)를 통한 가짜뉴스(Fakenews)가 어떠한 네트워크 구조를 가지고 있는지 알아보고자 한다. 노드엑셀(NodeXL)을 사용하여 트위터 콘텐츠를 분석하였다. 가짜 뉴스들 사이의 밀도, 거리, 중심성 등을 분석 하고, 후보자 관련 가짜 뉴스 네트워크 구조에서 후보자별 차이점을 알아보고자 하였다. 그 결과, 문재인 후보자 가짜뉴스 노드간 거리가 홍준표, 안철수, 유승민 후보보다 더 가깝게 위치해 있었다. 또한 문재인 가짜뉴스 네트워크 분석 그래프의 경우 타 후보에 비해 링크 간격이 매우 촘촘하게 연결되어 있는 것으로 나타났다. 이는 문재인 후보자 가짜 뉴스 트위터리안(Twitterian)들이 타 후보들보다 더 많이 가짜 뉴스에 긴밀하게 연결되어 있다는 점을 보여준다.

Abstract

This study investigated the network structure of the fake news via SNS in the 19th presidential election in South Korea through Twitter search. We analyzed the contents of Twitter using NodeXL. We analyzed the density, distance, and centrality among fake news, and tried to find out the differences among candidates in the structure of fake news networks. As a results, the distance between the candidate Moon Jae-in's node was located closer than Hong Joon-pyo, Ahn Cheol-su, and Yoo Seung-min's distance between fake news. In addition, Moon Jae-in analysis graph in the case of a fake news network other than for the gap turned out to be very tightly connected links. This showed that Moon Jae-in's fake news twitterian were more closely linked to fake news than other candidates.


Keywords: The 19th Presidential Election in South Korea, Fake news, Twitter, Social media network analysis, NodeXL
키워드: 제19대 대선, 가짜뉴스, 트위터, SNS 네트워크 분석, 노드 엑셀

Ⅰ. 서 론

2017년 영국의 사전출판사 콜린스는 올해의 단어로 ‘가짜뉴스’(fake news)를 선정하면서, “언론 보도를 가장해 퍼지는 거짓되고 선정적인 정보”(false, often sensational, information disseminated under the guise of news reporting)를 가짜뉴스라고 정의했다. 즉, 언론보도를 가장한 허위의 선정적인 정보가 가짜뉴스라는 것이다. 이러한 가짜뉴스는 최근 몇 년 사이 그 수가 급격히 증가했고, 2017년을 기준으로 1년 사이 가짜뉴스 단어의 사용 빈도는 무려 365%를 기록했다[1]. 2016년 미국 대통령 선거에서는 페이스북과 트위터가 중심이 된 SNS를 통해 유통된 가짜뉴스가 선거의 주요 쟁점이 되었고, 실제 선거결과에도 영향을 미쳤을 것으로 받아들여지고 있다. 2017년 박근혜 전 대통령 탄핵으로 치러진 제19대 대통령 선거에서도 한국 국민의 32.3%가 가짜 뉴스를 받아본 경험이 있는 것으로 조사됐다[2]. 이처럼 가짜뉴스는 소셜미디어의 확산과 진화를 바탕으로 글로벌 차원의 쟁점으로 발전하고 있다.

이러한 보고를 토대로 미루어 짐작하면 가짜 뉴스는 소셜미디어를 통해 급격히 전파된 것으로 보인다. 이에 본 연구는 노드 엑셀이라는 프로그램을 활용하여 트위터 상의 가짜뉴스가 어떠한 네트워크 구조를 지니고 있는지 알아보고자 한다. 노드 엑셀은 사회관계망 전문 분석 프로그램으로 엑셀 프로그램과 연동하여 사용되는 프로그램으로 비교적 사용 방법이 간단하다는 장점이 있다. 노드 엑셀을 활용하여 가짜 뉴스가 어떠한 소셜미디어 네트워크 구조를 지녔는지 시각화하여 가짜 뉴스 사이의 차이점을 비교할 수 있다. 이를 통해 소셜미디어 가짜뉴스 네트워크의 특성을 이해하고, 소셜미디어를 통해 가짜 뉴스가 어떻게 생산되고 확산되는지 알아보는 것은 사회적으로 중요한 시사점이 될 것이다.

가짜 뉴스와 관련된 기존의 연구는 가짜 뉴스의 정의, 가짜뉴스의 생산자와 가짜뉴스를 접한 수용자에게 미치는 영향, 가짜 뉴스와 진짜 뉴스의 구별방법, 관련된 사회적, 법적, 제도적 영향력 등에 집중되어 있다. 소셜미디어에서 가짜 뉴스가 어떻게 퍼지는지 네트워크에 대한 분석은 미비하다. 이에 본 연구는 트위터 검색을 통해 소셜미디어에서 한국 제19대 대통령 후보자 가짜 뉴스가 어떻게 전파되었는지 알아보고자 한다. 이를 위해 트위터 콘텐츠를 활용하여 가짜 뉴스사이의 밀도, 중심성, 거리 등을 분석하고자 한다. 더 나아가 대통령 후보자 관련 가짜 뉴스가 어떠한 네트워크 구조를 지니고 있고 후보자간 어떤 차이점이 존재하는지 비교하고자 한다.


Ⅱ. 본 론
2-1 가짜 뉴스(Fake News)와 선거

컴퓨터에서 이용자들이 원하는 정보에 접근하기 위해서는 웹에 나타나는 정보를 클릭해야 한다. 가짜뉴스는 이용자로 하여금 수백만의 클릭 수를 유도 한다. 이용자의 수백만의 클릭 수는 웹사이트나 가짜 뉴스를 생산한 사람들에게 적게는 일이천 원에서 많게는 수천만 원에 이르기까지의 광고 수익을 제공하게 된다[3]. 반면 정치 분야에서의 가짜 뉴스는 선거 후보자의 이미지를 실추시키는 등 부정정인 영향을 끼치게 된다. 이러한 가짜 뉴스에 관련된 연구는 2016년 미국 대통령선거를 시점으로 활발하게 늘어나기 시작 했고, 한국에서도 이러한 경향은 지속되고 있다. 이에 문헌고찰을 통해 가짜 뉴스의 역사와 정의를 알아보고자 한다. 가짜 뉴스는 최근 들어 많이 나타난 것처럼 보이지만, 꽤 오래전부터 우리 곁에 가까이에 존재해 왔다. 6세기경 비잔틴 역사가인 프로코피우스(Procopius)는 자신의 공식 역사에서 황제를 입양한 후 유스 티 누안 황제의 명성을 훼손시키기 위해 그의 사망까지 비밀로 유지한 아네도타(Anecdota)로 알려진 모호한 정보를 쏟아냈다. 1522년 교황청 선거를 조작하기 위하여 피에트로 아레티노(Pietro Aretino)는 그의 메디치 후원자를 제외하고 모든 후보자에 대해 악의적인 소네트(10개의 음절로 구성되는 시행 14개가 일정한 운율로 이어지는 14행시)를 썼고 로마 광장에 이를 붙여 이는 공개적인 풍자문(pasquinade)이 되었고 이것이 가짜 뉴스의 근원이 되어 가짜 뉴스로 발전했다[4].

2016년 미국 대통령 선거뿐만 아니라 2017년 한국의 제19대 대통령 대선에서도 가짜 뉴스에 대한 관심이 증대되는 것은 물론 가짜 뉴스의 정의에 대해서도 국내 외에서 다양한 논의들이 오가고 있다. 2017년 2월 14일 한국언론학회와 한국언론진흥재단에서 주최한 'Fake news(가짜 뉴스) 개념과 대응 방안' 토론에서 황용석 건국대학교 교수는 가짜 뉴스라 함은 “오락적 기능보다 허위정보를 전달해 수용자가 현실을 오인하게 만들면서 경제, 정치적 이득을 취하려는 기만적이고 전략적인 커뮤니케이션 행위”라고 정의하였다[5]. 또한 황용석 교수는 가짜 뉴스의 개념이 오보, 패러디, 루머, 풍자적 페이크 뉴스와 혼동되어 사용되고 있어 가짜 뉴스의 개념을 좀 더 명확하게 해야 한다고 지적하였다. 안명규[6]는 가짜 뉴스에 대한 전통적 개념으로 “언론사를 사칭하거나 언론사가 아닌 웹사이트 등에서 기사 형식을 교모하게 이용하여 인터넷과 SNS 등을 통해 유통 전파되는 허위 콘텐츠”로 정의할 수 있다고 하였다. 탐비니[7]는 가짜 뉴스는 선거나 국가 안보를 저해하려는 고의적 오해를 불러일으키는 시도가 집단적 사고로 발전한 것이라고 정의하고, 가짜 뉴스의 세부 범위를 설정하였다. 그 내용은 첫째, 후보자 또는 선거를 훼손하기 위해 잘못된 정보를 배포함, 둘째, 금융 이익을 위해 잘못된 정보를 제공함, 셋째, 패러디, 넷째, 진실성 없는 언론의 소문 배포, 다섯째, 이데올로기적으로 반대되는 뉴스의 배포, 여섯째, 정통적 권위에 도전하는 뉴스로 정하였다. 황용석이 패러디 개념이 가짜 뉴스 개념과 혼동되어 사용된다고 말한 것과 다르게 탐비니는 패러디는 가짜 뉴스의 한 범위라고 이야기함으로써 가짜 뉴스의 범위를 좀 더 광범위하게 설정한 차이를 가진다고 볼 수 있다.

가짜 뉴스 확산의 원인에 대해 김미경[8]은 선택적 노출과 확증편향으로 인해 일어난다고 설명한다. 미디어의 종류와 유형이 다양해짐에 따라 본인이 원하는 뱡향과 일치하는 미디어에 대한 선택이 강해지고 이는 선택적 노출에 대한 기회 역시 강화되었다[9]. 미디어와 본인이 원하는 방향에 대한 콘텐츠에 대한 선택적 노출은 본인이 선호하는 결론에 이르게 하고자 방어적 목적 또는 지향적 목적 추구가 일어나고 이는 확증 편향으로 이어진다는 것이다[10]. 이에 결과적으로 확증 편향에 대해 본인이 원하는 방향을 강화하고자 기존 태도를 유지할 수 있는 정보에 대해 선택적으로 반응하게 된다고 이야기했다.

가짜뉴스의 영향력에 대한 연구도 있다. 미국에서 앨코트와 겐츠코프[11]는 그들의 연구에서 트럼프를 지지하는 가짜 뉴스는 소셜미디어 상에서 3천만이 넘는 공유를 이끌어냈으며, 클린턴을 지지하는 가짜 뉴스의 소셜미디어 공유는 8백만의 공유를 이끌어냈다고 했다. 선거가 끝난 후 선거자들에게 페이스북에 올라와있던 가짜뉴스를 얼마큼 기억하느냐하는 질문에 대한 결과는 다음과 같았다. 트럼프 가짜 뉴스의 경우 0.92%가 가짜 뉴스를 기억하였고, 클린턴 가짜 뉴스의 경우 0.23%가 이를 기억하였다. 이러한 결과로 볼 때 소셜미디어라고 하는 것은 선거에 중요한 매체이기는 하지만, 선거기간동안 막대한 영향을 미칠 수 있는 우월한 매체는 아니라는 점을 보여주었다. 또한 그들의 연구에서 하나의 가짜 뉴스가 선거 결과를 바꾸려면 가짜 뉴스의 영향력이 TV광고 캠페인 36개에 버금가는 설득 효과가 필요하다며 가짜 뉴스의 영향력에 관하여 이야기하였다. 또한 가짜 뉴스는 유동층을 통한 선거 결과를 바꾸기에는 무리가 있지만 기존 정치 편견을 지닌 사람들을 강화하기에는 효과적이라고 이야기했다. 이처럼 가짜 뉴스의 소셜미디어 공유가 선거 결과를 바꾸기에는 무리가 있다는 의견도 있지만, 가짜 뉴스가 개인의 선거 결정에 영향을 미칠 수 있다는 의견도 있다. 최재원[12]은 가짜 뉴스가 개인의 선거 후보자 결정에 있어서 영향을 미칠 수 있는 증거라고 주장하였다. 그의 연구에서 가짜 뉴스가 선거 후보자 결정에 영향을 미칠 수 있다는 것을 증명하기 위해 2016년 미국 대선 당시 페이스 북 검색 상위 20위권의 뉴스 중 좋아요+공유+댓글수를 집계하여 나타난 결과, 진짜 뉴스의 경우는 약 736만 건, 가짜 뉴스의 경우는 871만 건, 를 근거로 가짜 뉴스가 개인의 선거 후보자 결정에 있어서 영향을 미칠 수 있다고 하였다.

미국에서 뿐만 아니라 한국에서도 가짜 뉴스의 영향력에 대해 조사한 연구결과가 있다. 노성종, 최지향, 민영[13]은 제19대 대통령 선거에서 실제적으로 활용된 가짜 뉴스의 조건과 그 영향력을 온라인 패널조사를 통해 조사했다 . 다당 구도에서 진행된 제19대 선거에서 이념적 성향은 크게 영향을 미치지 않았다. 그러나 대통령 후보자에 대한 호감도는 가짜 뉴스에 영향을 주는 것으로 드러났다. 문재인 후보나 안철수 후보의 경우 후보에 대한 호감도가 증가할수록 해당 후보에 해당된 비방 관련 가짜뉴스의 효과는 감소하는 경향을 보였으며 홍준표 후보의 경우 호감도의 정도가 증가할수록 해당 후보에 대한 우호적 가짜 뉴스의 효과는 증가했다. 가짜 뉴스의 영향력 중에서 소셜미디어 유저의 어떠한 요인이 커뮤니케이션에 영향을 미치는지 연구한 결과도 있다. 김미경[14] 소셜미디어 가짜 뉴스에 대한 소셜미디어 유저의 요인이 커뮤니케이션에 어떠한 영향을 미치는지에 대해 연구했다. 진짜 뉴스와 가짜 뉴스 유형별 노출 집단이 보이는 편향과 관여 차이를 살펴본 결과 진짜 뉴스 노출 집단이 가짜 뉴스 노출 집단 보다 확증 편향 차이를 나타냈다. 또한 진짜 뉴스 노출 집단이 가짜 뉴스 노출 집단보다 신념과 가치 관여 차이를 드러냈으며, 진짜 뉴스 노출 집단이 가치 관여가 더 크게 나타났다. 궁극적으로 진짜 뉴스 노출 집단이 본인의 의견에 대한 일관성을 지속적으로 유지하려고 했다. 또한 진짜 뉴스 노출 집단과 가짜 뉴스 노출 집단 사이의 커뮤니케이션 행동 차이를 연구한 결과 진짜 뉴스 노출 집단이 가짜 뉴스 노출 집단에 비해 소셜미디어를 통해 공유와 의견 동조를 하고자 하는 경향이 많이 보였다.

그 밖에 가짜 뉴스에 관한 보고와 연구는 중앙선거관리위원회[15] 제19대 대통령선거 사이버 위법게시물 사이트별 삭제 요청 현황 자료, 박성은, 김유정[16], 이지은, 전소연[17] 등의 연구가 있다. 먼저 중앙선거관리위원회 제19대 대통령선거 사이버 위법게시물 사이트별 삭제 요청 현황 자료에 따르면 19대 대선의 가짜 뉴스는 2017년 5월 10일을 기준으로 4만 222건에 달하는 것으로 나타났다[15]. 18대 대선 기간 전체의 적발횟수 7,201건[18]에 비해서 5.58배나 증가한 것이다. 이러한 4만 222건에 대한 내역을 상세하게 살펴보자면 허위사실 공포 63%(25,111건), 여론조사 공포 30%(12,083건), 기타 4%(1,761건) 후보자 비방 2%(839건), 지역비하 모욕 1%(428건) 순으로 드러났다. 기타 4%(1,761건) 삭제 요청에 대한 세부 내용으로는 선거운동금지자의 선거운동, 단체의 선거운동, 허위논평 · 보도 등 금지, 투표의 비밀보장, 재외투표소의 설치 · 운영, 매수 및 이해유도죄, 선거의 자유방해죄, 성명 등의 허위표시죄 등이다. 박성은, 김유정[16]에 따르면 한국의 가짜 뉴스는 극단적 정치 이념을 지닌 것이 다른 나라와는 다른 특징이라고 보았다. 온라인상에서 일어나는 가짜 뉴스의 3분의 1이 진보와 보수가 대립되는 정치색이 매우 강한 성향을 가진다고 하였다. 이에 박아란 한국언론진흥재단 연구위원은 “타협 여지가 전혀 없는 보수, 진보 간의 싸움으로 정치 성향이 가짜 뉴스의 단골 소재가 됐다”며 “딱히 이런 상황에 사람들이 관심이 커졌다기 보다는 이를 가짜뉴스의 소재로 활용해 극단적인 의견 대립을 형성하는 것”[16]이라고 분석했다. 이지은, 전소연[17]은 전자투표시스템 관련 가짜 뉴스가 온라인 뉴스 플랫폼 신뢰도와 수용자의 선거참여 의도와 관련이 있는지를 확인하기 위해 온라인 실험 서베이를 실시하였다. 그 결과 인터넷 신문, 네이버 포털사이트, 페이스북 집단으로 분류되어 가짜 뉴스에 노출되었던 이용자들은 각 뉴스 서비스에 대한 신뢰 하지 않는 것은 물론 타 뉴스 서비스에 대해서도 부정적으로 생각 하는 결과로 나타났다. 또한, 수용자의 선거참여의도의 경우 전자투표시스템 관련 가짜 뉴스가 보인 뉴스 서비스에 따라 선거 참여 태도와 의도의 변화의 폭에 차이가 있는 것으로 나타났다. 이는 인터넷 뉴스서비스가 지니고 있던 신뢰도가 타 뉴스 서비스 제공자(네이버 포털사이트, 페이스북)에 비해 높기 때문에 나타나는 결과로 말할 수 있다. 가짜 뉴스에 대한 신뢰와 관련하여 최근 더불어 민주당 김성수 의원과 녹색 소비자 연대가 함께 실시한 ‘모바일 동영상 서비스에 대한 소비자 인식 조사’가 있다[19]. 모바일 동영상 서비스, 유투브 등을 통해 사실 불명확한 정보를 얻거나 가짜 뉴스를 접한 적이 있는가하는 질문에 대해 81.5%가 '본 적이 있다'고 응답했다. 가짜 뉴스와 관련하여 본인의 '모바일 동영상 정보에 대한 사실 판단 능력'에 대해 대다수의 응답자 93.2%가 스스로를 '보통 이상'으로 평가했으나 '가짜 뉴스 등 허위정보 테스트'를 실시한 결과 응답자들의 정답률은 58.5%에 불과하다. '모바일 동영상 서비스'에 대한 신뢰도를 어떻게 평가하느냐에 대한 질문에 대해 '모바일 매체의 영향력(49.7%)을 많이 본다는 응답이 제일 많았고 그 뒤를 이어 '좋아요, 공감 수 등 이용자들의 평가(47.1%), 정보 제공자 혹은 정보 공유자에 대한 신뢰(39.4%) 등을 활용하는 것으로 드러났다.

2-2 가짜 뉴스의 대상과 유통 경로

소셜미디어를 통해 발생하는 가짜 뉴스의 대상도 시대의 흐름에 따라 변화한다. 최재원[20]은 2014년부터 2017년까지 가짜 뉴스 대상의 인물 언급량 추이를 분석하였는데 그 결과, 연예인에서 정치인으로 변화되는 성향이 있다는 것을 보여주었다. 2017년의 경우 가짜 뉴스 대상 인물 언급량 추이보고 결과는 다음과 같다. 박근혜가 6,358건으로 가장 많았으며 문재인 5,778건, 도널드 트럼프 5,563건, 반기문 3,611건 손석희 2,621건순으로 나타났다. 박근혜 정부 탄핵 및 조기 대선과 관련된 가짜 뉴스들의 증가폭이 크게 나타난 것을 보여주었다. 헌법재판소 탄핵 인용 결정 전 3일간 가짜 뉴스의 건수는 1,111건, 결정 후 3일간 건수는 590건으로 2배의 차이를 보이는 결과를 보여주었다. 또한 그는 가짜 뉴스를 백색테러와 연관 짓기도 하는데 이는 온라인상의 가짜 뉴스가 테러와 같은 파급력을 갖고 있다는 점을 보여주는 것이라 주장하였다.

가짜 뉴스의 유통 경로에 대한 보고 및 연구는 다음과 같다. 중앙선거관리위원회에서 조사한 위법게시물 총 40,222건 중 가장 많은 비중을 차지한 유통 경로는 네이버 밴드로 조사되었다. 제19대 대통령 선거 사이버 위법게시물 상위 10개 사이트에 대해서 네이버 밴드 30%(11,891)건, 페이스북 21%(8,384건), 트위터 20%(7,936건), 다음 카페 5%(2,219건), 카카오스토리 4.6%(2,028건), 네이버 블로그 3%(1,253건), 디시인사이드 2%(1,010건), 다음아고라 2%(916건), 다음 블로그 2%(651건) 순으로 나타났다. 기타 사이트의 경우 전체 40,222건의 7%(2,793건)로 나타났다. 가짜뉴스의 유통경로와 관련된 국내 연구는 최재원[20]의 연구가 있다. 그의 연구에 따르면 가짜 뉴스는 인터넷을 통해 손쉽게 널리 전파되는데, 국내에서는 메신저 앱과 페이스 북이 가짜 뉴스의 유통 경로로 불린다고 하였다. 또 다른 연구에서는 카카오톡, 라인 등 모바일 메신저가 가짜 뉴스의 주된 경로로 지적했다[21]. 폐쇄적 플랫폼인 모바일 메신저를 활용하여 선거 정보를 접하면 접할수록 가짜 뉴스에 대한 효과가 증가하는 것을 알 수 있다.

가짜 뉴스의 유통과 관련하여 네트워크 분석을 시도한 연구도 있다. 손승혜, 이귀옥, 홍주현, 최지향, 정은정[22]은 트위터에서 가짜뉴스가 어떻게 유통되고 있는지 네트워크 분석을 통해 알아보았다. 그 결과 전통적 미디어에서는 오피니언 리더들의 의견이 영향력이 강하지만 트위터에서는 오피니언 리더가 아닌 트위터 자체를 활발하게 하는 일반인들이 유력자로 대두되었다. 빈출 단어쌍의 경우 가짜 뉴스 자체 정보 보다는 사람들이 관심을 가질 수 있는 정치/사회적 이슈들이 많이 빈출돼 사람들과 함께 정치적/ 사회적 이슈를 공유하는 차원에서 가짜 뉴스를 배포하는 것으로 나타났다. 궁극적으로 가짜 뉴스는 정치적/사회적 의견을 가진 트위터리안들이 자신의 의견을 표현하기 위해 사람들이 관심을 갖는 정치/사회적 주제를 활용한다고 이야기할 수 있다.

가짜 뉴스의 유통에 있어 소셜미디어 유저들의 개인적 성향이 어떻게 가짜 뉴스에 영향을 미치는지 실험한 연구결과도 있다. 박인호, 박현순, 이형민[23]에 의하면 정치적 성향에 대한 믿음이 강한 사람은 정치적 성향에 대한 믿음이 약한 사람에 비해 자신이 지지하는 후보에 우호적인 가짜 뉴스를 더 잘 믿는 경향이 있다는 사실을 발견했다. 또한 개인의 정치적 성향(진보와 보수)에 따라 가짜 뉴스에 대한 믿음이 달라지는 가에 대한 질의에 대해 별다른 차이점을 발견하지 못하였지만, 보수를 지지하는 사람이 진보를 지지하는 사람보다 가짜 뉴스를 더 많이 확산하는 것으로 드러났다.

2-3 트위터와 선거

최은정, 최세원, 이시연, 김명주[24]에 따르면 SNS에서의 관심도가 높은 후보일수록 선거결과에 긍정적인 영향을 미친다고 이야기하였다. 이는 상위 관심도를 지닌 후보자가 경쟁 후보자보다 검색의 과정에서도 우위를 점하는 것을 일컫는다. 또한 이 연구에서는 당선자의 후보 데이터를 긍정 부정의 척도에 따라 빈도분석으로 분석한 결과 당선자의 경우 긍정적인 표현이 많이 표현되어있는 것으로 나타났다. 이와 유사한 최민재, 이홍천, 김위근[25]의 SNS가 정치적 의사결정에 어떠한 영향을 미치는 가에 대한 연구가 있다. 이 연구에서는 트위터를 활용한 유권자가 다른 유권자들보다 높은 투표율을 보였으며, 당선된 후보에게 더 많은 투표를 한 결과를 보여주었다. 트위터를 활용한 유권자들은 트위터를 통해 선거 관련 정보를 남들 보다 비교적 많이 접하며, 공유하는데도 적극적이라고 했다. 따라서 SNS 활용이 후보자에 대한 인지, 지지, 이미지, 능력인식, 선택 등에 영향을 미친다고 주장하였다. 배정환, 손지은, 송민[26]은 텍스트 마이닝을 활용하여 2012년 대통령 선거에 관한 트위터를 분석하였다. 그들의 연구에서 트위터 상의 대통령 선거 관련 토픽이 신문기사에 어떻게 드러났는지를 비교 분석하였다. 분석 결과 대선 관련 이슈가 신문기사보다 트위터 상에서 빨리 퍼지는 것을 알 수 있었다. 이는 대선 이슈들에 대한 세부 사건에 변화 관찰의 경우에는 신문기사가 유리한 반면 해당 토픽의 영향력 변화를 전반적으로 관찰하기 위해서는 트위터가 적절하다는 점을 시사한다. 또한 트위터 이용자 네트워크 분석을 통해 살펴본 결과 대통령 후보자의 네트워크 상당 부분이 각 성향에 맞는 이용자 집단들로 확인되었다. 장우석, 류석진[27]은 SNS의 정치적 효과가 실제적으로 어떻게 이는지 트위터를 통해 알아보고자 하였다. 그들은 트위터의 팔로우와 지지자의 리트윗 활동이 선거결과에 영향을 미친다고 하였다. 또한 후보자의 트위터 활동 기간이 득표율과 선거 당락에 중요한 영향을 미치는 것을 증명하였다. 이 연구에서 유권자의 리트윗 활동은 선거표 획득에 직접적 영향을 미치지만 당선에는 간접적 영향을 미친다는 점을 보여주었다. 도묘연[28]은 SNS 이용자의 어떠한 특성이 선거 참여에 영향을 미치는지 알아보기 위해 연구하였다. 이 연구는 SNS가 시민들의 참여를 이끌어 내는데 중요한 역할을 한다는 것을 전제로 하였다. 그 결과 SNS 정보의 신뢰성과 네트워크의 공개성이 선거 참여에 있어서 중요한 요소인 것이 밝혀졌다. 이와 더불어 소득이 선거 참여에 중요한 영향을 미치는 것으로 나타났다. 2012년 제18대 대선 트위터 소통 네트워크를 분석한 연구도 있다. 박세정, 박지영, 임연수, 박한우[29]는 제18대 대통령선거 당시 1차 TV 토론회를 통한 트위터 소통 네트워크를 연구하였다. 그 결과 ‘박근혜’를 언급한 트위터리안은 네트워크 거리가 짧았다. 이는 비교적 비슷한 정치 성향을 지닌 트위터리안으로 구성되어져 있음을 의미한다. 또한, ‘토론’, ‘문재인’을 언급한 트위터리안은 네트워크 거리가 가장 먼 것으로 나타났다, 이는 트위터리안들에서 ‘문재인’이 관심의 대상이건 아니건 지지층이 광범위에 존재한다는 것을 의미한다. 1차 TV 토론에서 ‘이정희’ 후보와 ‘박근혜’ 후보 간의 열띤 토론이 화재의 중심으로 자리 잡으면서 일어난 현상이라고 해석하였다


Ⅲ. 연구문제와 연구방법

본 연구에서는 SNS를 통해 제19대 대선 관련 가짜 뉴스가 어떤 식으로 트위터에 전파 되었는지를 알아보기 위해 트위터 검색을 활용하여 네트워크 구조를 밝혀내고자 하였다. 이와 더불어 SNS 가짜 뉴스의 네트워크가 후보자 간 어떠한 차이를 보이는지 알아보고자 하는데 목적을 두었다.

3-1 연구 문제

본 연구의 연구문제는 아래와 같이 두 가지로 설정하였다

연구문제 1. 트위터 상의 후보자 관련 가짜 뉴스는 어떠한 네트워크를 가지고 있는가?

트위터 서치 네트워크 검색을 활용하여 트위터 상의 가짜 뉴스가 어떠한 네트워크를 이루고 있는지를 조사 하였다. 결과 도출을 위해 가짜 뉴스들 사이의 밀도, 거리, 중심성 등을 분석 하였고, 연구결과 연구문제 1) 에 결과를 정리하였다.

연구문제 2. 트위터상의 후보자 관련 가짜뉴스의 네트워크 구조에 대하여 후보자별 차이점이 존재하는가?

제19대 대통령 후보자의 가짜 뉴스와 관련된 트윗에 대한 매개자가 누구인지 확인하기 위해서 매개 중심성(Betweenness Centrality) 값을 기준으로 각 노드의 색깔과 크기를 변경되도록 그래프를 설정하였다. 그래프를 분석하기 위해서 그래프의 레이아웃을 프루터만 레인골드(Fruchterman-Reingold)로 설정하였다. 프루터만 레인골드 시각화 알고리즘은 노드들 사이의 간격을 임의로 설정하여 노드끼리 한곳에 뭉쳐있거나 노드의 선이 겹치는 현상을 미연에 방지해 연결망을 보기 좋게 만드는 장점이 있다[30].

3-2 SNS 가짜 뉴스 키워드 선정

제19대 대통령 대선과 관련하여 SNS 가짜 뉴스 네트워크 연구 기간은 대통령 대선 선거 운동기간인 2017년 4월 17일부터 선거투표일인 2017년 5월 9일까지이다. 본 연구의 분석을 위한 도구로 노드엑셀(NodeXL)을 활용하였다. 가짜 뉴스 키워드 선정은 중앙선거관리위원회 사이버선거범죄대응센터 발표[31]를 활용하였다. 1번 문재인 후보의 경우 가짜 뉴스에 대한 키워드를 금괴 200t, 문재인 부친 인민군 상좌, 문재인 세월호 자문변호사(세월호 자문변호사), 문준용 특혜채용, 문재인 투표조작, 권양숙 친척 특혜 채용, 문재인 금괴, 문재인 치매설 등의 키워드로 설정하였다. 그리고 각 키워드별로 노드엑셀 프로그램을 이용하여 관련 트위터를 찾기 위한 네트워크 검색을 실시하고 SNS 네트워크 분석을 실시하였다. 기호 1번 문재인 후보의 경우 키워드를 문재인 치매설과, 문제인 치매 중 문재인 치매설로 설정하였다. 그 이유는 실제 검색결과 문제인 치매설을 키워드로 두고 검색하였을 경우 가짜 뉴스에 해당 되는 글들이 검색 되었지만 문재인 치매를 키워드를 두는 경우 아래 예와 같은 문재인 후보의 치매국가책임제와 연관한 트윗이 거의 대부분을 차지하며 가짜뉴스와 관련 없는 검색결과를 나타냈기 때문이다.

(예) RT @kimtaenyeon: 저도 치매 걸린 장모님 모시고삽니다. 문재인 후보처럼요. 그래서 치매국가책임제가 얼마나 필요하고 절실한지 누구보다 잘 압니다. 인간으로서 최소한의 존엄을 지킬 수 있도록 국가가 책임지는 일보다 더 중요한일이 어디 있겠습니까?

기호 2번 홍준표 후보의 경우 사전투표 홍준표 승리, 여의도 연구소 여론조사, 주기철 목사 생가 7억 원 기부, 홍준표 대형교회 안수집사 등의 키워드를 활용하여 트위터 상의 가짜뉴스를 수집하고자 하였다. 그러나 트위터 상 가짜 뉴스를 수집하기 위한 ‘사전투표 홍준표 승리’ 키워드는 제외 되었다. 그 이유는 실제 키워드 검색 결과 투표 독려와 홍준표 막판 결집을 막겠다는 문재인 후보의 사전투표율 25% 달성이라는 목표를 독려는 아래 예와 같은 트윗이 대부분으로 가짜뉴스와 관련이 없는 것으로 나타났기 때문이다. 이에 실제적으로 연구에 적용 된 가짜 뉴스 검색어는 여의도 연구소 여론조사, 주기철 목사 생가 7억 원 기부, 홍준표 대형교회 안수집사 등의 키워드이다.

(예) RT @desertcockkiry: 문재인 후보는 홍준표 막판 결집을 문재인 대세론으로 제압하기로 전략을 세웠고, 구체적인 방법으로 사전투표율 25%라는 목표를 정함. 그것의 독려 방법은 꾸준한 포지티브, 문재인 프리허그, 문재인 타임지 집중홍보였고…


Fig. 1. 
Example of Yoo Seung-min candidate fake news

(예) RT @Edward_B_Lee: 방관은 악의 승리를 꽃피운다. -에드먼드 버크- 15시 기준 63.7% 투표율 높은 것 아닙니다. 사전투표율 높아 거품 낀 착시현상입니다. 남은 5시간 꼭 투표하시고 독려도 하세요. 제 고향 대전·충남 어르신들은 대…

3번 안철수 후보에 대해서는 안랩개표기, 재외국인 출구조사, 안철수 딸 미국 시민권자, 안철수 딸 원정출산 LA 한인투표소 출구조사 등의 키워드를 활용하여 가짜뉴스의 네트워크를 찾고자 하였다.

RT @nabiwahighhill: 왜 안철수가'딸재산'공개 안했나했더니, 딸이'월세 최대 1600만원' 최고급 아파트 거주했단다. 딸은"시민권자와 영주권자, 취업비자 소지자에게 주어지는 미국사회보장번호를"취득했단다

4번 유승민 후보의 경우, 유담 성추행자 일베 등의 키워드를 설정하여 가짜뉴스의 네트워크를 살펴보았다.

5번 심상정 후보의 경우, 특정 지을만한 가짜뉴스가 발견되지 않아서 심상정 후보의 트위터 상의 가짜뉴스에 대해서는 조사를 실시하지 않았다.

3-3 네트워크 분석 주요 개념 및 분석지표

장윤재, 조성겸[32]는 사회과학자들이 소셜미디어 데이터 자료 수집을 어떻게 진행하였는가에 대해 조사하고 어떠한 데이터 수집 방향이 연구의 신뢰성을 향상시킬 수 있는지에 대해 연구했다. 최근 사회과학자들의 소셜미디어 데이터 수집은 API를 이용하여 자료 수집을 하거나 직접 검색을 통해 연구에 활용하는 것으로 나타났다. 두 가지 방법에 대해 신뢰성을 비교한 결과 API를 이용해 자동수집한 자료가 트위터를 접접 검색해 자료를 수집하는 자료보다 신뢰성이 더 높다는 것을 밝혀냈다. 이에 본 연구에서는 소셜미디어 네트워크 분석을 위하여 노드엑셀(NodeXL)을 활용하였다. 노드엑셀(NodeXL)은 한센, 슈나이더만과 스미스[33]에 의해 고안된 프로그램으로 초심자 및 전문가가 소셜미디어 네트워크를 좀 더 쉬운 방향으로 분석하는데 도움을 주고자 개발된 것이다. 노드엑셀에서 활용되는 주요 분석 개념의 기본인 버텍스(vertex)는 전체 네트워크의 개체를 뜻하는 것이고 각각의 엣지(edge)와 링크(link)는 두개의 버텍스(vertex)의 현존하는 관계성을 대표하는 것이다. 노드(node)는 트위터 데이터에서 트위터 상의 사용자를 일컬으며, 링크(link)는 트위터의 멘션(mention)과 답장(replies to)를 말한다. 연결 정도 중심성은 특정한 노드와 연결된 전체 링크수를 뜻한다. 그 이외의 용어는 [표 1]을 통해서 정리하였다.

Table 1. 
Explanation of NodeXL graphic matrix
Classification Definition
Edges Unique Edges Only one connection between two nodes
Edges with Duplicates Two or more redundant connections between two nodes
Self-Loops The number of edges connected only to the node itself
Reciprocated
Vertex Pair Ratio
The number of pairs of nodes connected bidirectionally in the directional graph divided by the number of all pairs of nodes
Reciprocated Edge Ratio The number of edges connected bidirectionally in a directional graph divided by the total number of edges
Connected Components Connected
Component
Independent group of interconnected nodes that are not connected to other nodes outside the group
Single-Vertex Connected Components A component has only a single node
Maximum Vertices in a Connected Component Number of component nodes with the largest number of nodes
Maximum Edges in a Connected Component Number of component edges with the most number of edges
Maximum
Geodesic Distance
The shortest path distance of all node pairs having interconnectivity in the graph
Average Geodesic
Distance
The average value of the shortest path distance values of all pairs of nodes having interconnectivity in the graph
Graph Density The total number of edges in the graph divided by the maximum theoretically possible number of edges.
Duplicate edges and self-loops are excluded in the calculation
* Source : NodeXLKorea (2015). <Catching up on NodeXL>. p.136~138

또한 트위터 네트워크의 경우 다음의 여섯가지로 유형을 나눌 수 있다[34]. 첫 번째 트위터 네트워크 유형은 폴로라이즈드 크라우드(Polarized Crowd)이다. 이 유형은 2개의 큰 그룹을 형성하며 정치적 주제나 두 가지 입장으로 극단적으로 나눠서 다뤄지는 양극화 주제에서 많이 다뤄진다. 정보의 다양한 출처를 지니고 있지만 양극화된 두 그룹간의 상호관계는 거의 없다. 두 번째 트위터 네트워크 유형은 타이트 클라우드(Tight Crowd)이다. 타이트 클라우드는 2~ 6개의 중간 규모의 그룹을 형성하며 취미나, 전문적 주제 혹은 국제회의와 같이 서로간 강력하게 연결되어 있으며, 서로간의 정보, 아이디어와 의견 등을 교환한다. 세 번째 트위터 네트워크 유형은 브랜드 클러스터(Brand Cluster)이다. 브랜드 클러스터는 많은 작은 그룹들로 이뤄져 있으며, 공공 이벤트, 브랜드, 인기있는 주제 등을 다룬다. 인기있는 다양한 주제들이 다양한 파편으로 존재하며 대중적 관심을 불러 일으키지만 연결성은 매우 적은편이다. 네 번째 트위터 네트워크 유형은 커뮤니티 클러스트(Community Clusters)이다. 커뮤니티 클러스트는 많은 소규모 그룹과 중규모 그룹을 띄고 있다. 국제적 이벤트나 대중적인 주제에 대해서 다뤄지고 대부분 커뮤니티 클러스터는 다른 그룹과 연결되어 있지 않다. 다섯 번째 클러스터는 브로드캐스트 클러스터(Broadcast Network)이다. 브로드캐스트 클러스터는 하나의 큰 그룹과 소규모의 작은 그룹으로 형성되어 있으며, 뉴스 미디어나 영향력이 큰 유명인에 의거하여 일어난다. 여섯 번째 트위터 네트워크 유형은 서포트 네트워크(Support Network)이다. 서포트 네트워크는 하나의 큰 그룹과 작은 소규모의 그룹이 형성되어 있으며 고객들의 요청이나 불평 거리를 담당하는 정부 기관이나 회사 고객센터와 같은 곳이 해당된다.


Ⅳ. 연구결과
4-1 연구문제1

각 후보자별 소셜미디어 네트워크 분석의 결과는 다음과 같다. 먼저 문재인 후보에 대해 노드 엑셀을 활용하여 가짜 뉴스 관련 키워드에 대한 검색결과를 도출하였다. 문재인 후보의 경우 총 11,810개의 트윗이 검색 되었다. 제일 많은 비중을 차지한 것이 멘션(mentions) 94.57%(11,810개), 트윗(tweet) 4.91%(613개), 답멘션(replies to) 0.46%(57개), 팔로우(follows) 0.06%(8개) 순으로 나타났다. 관계성(relationship)은 나타나지 않았다. 그래프 노드 수(Vertices 수)는 총 5,290개, 총 링크 수(Edges 수)는 10,921개이다. 총 엣지 값(Total Edges)과 유니크 엣지(Unique Edges)값을 비교한 결과 유니크 엣지 값이 10,653개로 많은 차이가 나지 않았다. 이러한 결과는 특정 노드 간의 연결성이 높다기 보다는 다양한 사용자들이 연결성을 가지고 있음을 의미하는 것으로 간주할 수 있다. 컴포넌트(Connected Components)는 총135그룹이고 이중 단일 컴포넌트(Single-Vertex Connected Components)는 총124그룹으로 나타났다. 이러한 결과는 다른 노드와 관계없이 독자적으로 고립된 노드가 총 124개인 것을 나타 낸다. 더 나아가 최대 지름 값(Maximum Geodesic Distance)은 10, 평균 지름 값(Average Geodesic Distance)은 3.18로 나타났다. 평균 지름 값이 3.18로 나타난 결과는 평균 세 사람을 거치면 트위터 네트워크가 연결될 수 있다는 뜻으로 노드간의 연결성이 그다지 높지 않다는 것을 알 수 있다. 트위터 상에서 많이 나타난 단어로는 '친척' 10,548회, ‘국민의당’ 8,961회, ‘권양숙 여사’ 7889회, ‘특혜’ 5,953회 등 으로 나타났다. 트위터 상에서 두 단어가 같이 나타난 횟수는 ‘권양숙 여사, 친척’ 7,844회, ‘친척, 특혜’ 5756, ‘특혜, 채용’ 4,801회, ‘고용정보원, 권양숙 여사’ 4,528회 등으로 나타났다. 다음으로 기호 2번 홍준표 후보에 대해서 노드엑셀을 활용하여 가짜 뉴스 관련 키워드에 대한 결과를 도출하였다. 총 1,859개의 트윗이 검색되었다. 그 중 멘션(mentions)이 가장 높은 비율을 차지하는 88.65%(1,648개)의 결과 값을 나타냈으며 다음으로 트윗(tweet)이 11.19%(208개)를 차지하였다. 답멘션(replies to)은 0.11%(2개), 관계성(relationship) 0.05%(1개) 로 나타났다. 그래프 노드 수(Vertices 수)는 총 1,408개, 총 링크 수(Edges 수)는 1,859개이다. 총 엣지 값(Total Edges)에서 유니크 엣지(Unique Edges)값이 1,715개로 많은 차이를 보이지 않았다. 이는 특정 노드 간의 연결성이 높다기 보다는 다양한 사용자들이 연결성을 가졌음을 의미한다. 컴포넌트(Connected Components)는 총137그룹이고 이중 단일 컴포넌트(Single-Vertex Connected Components)는 총123그룹으로 나타났다. 이는 다른 노드와 관계없이 독자적으로 고립된 노드가 총 123개임을 보여주는 결과로 볼 수 있다. 더 나아가 최대 지름 값(Maximum Geodesic Distance)은 8, 평균 지름값(Average Geodesic Distance)은 3.19로 나타났다. 평균 지름 값이 3.19라고 하는 것은 평균 세 사람을 거치면 트위터 네트워크가 연결될 수 있다는 뜻으로 노드간의 연결성이 그다지 높지 않다는 것을 의미한다. Twitter Search Ntwrk Top Items 시트로 이동하여 가장 많이 나타난 URL과 해시 태그(#)를 확인하였다. 그 결과 가장 많이 등장한 단어는 ‘홍준표’2,136개, ‘안수 집사’ 1,496개,‘광성교회’ 1,412개 등이 많이 보이는 단어로 집계되었다. 두 단어가 동시 출현하는 경우는 ‘광성교회, 안수집사’ 795회, ‘홍준표, 후보는’ 520회, ‘홍준표, 후보가’ 517회, ‘후보는, 광성교회’ 515회, ‘후보가, 안수집사’ 510회로 집계 되었다. 마찬가지로 기호 3번 안철수 후보의 경우도 후보자 관련 키워드를 검색하여 가짜뉴스에 대한 트위터 네트워크 분석을 통해 결과를 도출하였다. 분석결과 총 1,002개의 트윗이 검색 되었다. 멘션(mentions)의 경우 95.52%(960개)로 가장 많은 비율을 차지하였고 다음으로 트윗(tweet) 3.58%(36개), 답멘션(replies to) 0.9%(9개)의 순으로 나타났다. 관계성(relationship)은 검색되지 않았다. 3번 안철수 후보에 대해서는 안랩개표기, 재외국인 출구조사, 안철수딸 미국 시민권자, 안철수 딸 원정출산 LA 한인투표소 출구조사 등의 키워드를 활용하여 가짜뉴스의 네트워크를 찾고자 하였다. 그 결과 그래프 노드 수(Vertices)는 총 855개 , 총 엣지 수(Total Edges)는 1,005개이다. 총 엣지(Total Edges)값에서 유니크 엣지(Unique Edges)값이 974개로 많은 차이를 보이지 않았다. 이러한 결과는 특정 노드 간의 연결성이 높다기 보다 다양한 사용자들이 연결성을 가졌음을 나타내는 것을 의미한다. 컴포넌트(Connected Components)는 총16그룹이고 이중 단일 컴포넌트(Single-Vertex Connected Components)는 총10그룹으로 나타났다. 이러한 결과는 다른 노드와 관계없이 독자적으로 고립된 노드가 총 10개임을 의미한다. 더 나아가 최대 지름값(Maximum Geodesic Distance)은 11, 평균 지름값(Average Geodesic Distance)은 3.28로 나타났다. 또한 트위터 상에서 많이 나타난 단어로는 '영주권자' 896회, '취업비자' 894회, '주어지는' 894회, '시민권자와' 889회 같은 단어들이 주로 많이 트윗에서 발견되었다. 트위터 상에서 두 단어가 같이 나타나는 경우는‘시민권자와, 영주권자’ 889회, ‘영주권자, 취업비자’ 889회, ‘최고급, 아파트’ 858회 등으로 나타났다. 기호 4번 유승민 후보의 경우 가짜 뉴스를 “유담 성추행범 일베설”로 선택하여 분석하였다. 총 1,113개의 트윗이 검색 되었다. 멘션(mentions)의 경우 91.82%(1,022개)로 제일 많은 결과물이 도출되었고, 그 뒤로 트윗(tweet) 8.09%(90개), 답멘션(replies to) 0.09%(1개)의 순으로 결과가 나타났다. 관계성(relationship)은 검색되지 않았는데, 이는 안철수 가짜뉴스 네트워크 검색에서와 동일한 현상으로 드러났다. 그래프 노드 수(Vertices)는 총 1,045개 , 총 엣지 수(Total Edges)는 1,114개이다. 총 엣지(Total Edges) 값에서 유니크 엣지(Unique Edges) 값이 1,094로 차이가 나지 않는 것을 볼 때 이는 특정 노드 간의 연결성이 높다기보다 다양한 사용자들끼리 연결성을 가졌음을 시사한다. 컴포넌트(Connected Components)는 총55그룹이고 이중 단일 컴포넌트(Single-Vertex Connected Components)는 총39그룹으로 나타났다. 따라서 다른 노드와의 연결성 없이 고립된 노드는 총 39개임을 알 수 있다. 최대 지름값(Maximum Geodesic Distance)은 10, 평균 지름값(Average Geodesic Distance)은 3.4이다. 유승민 가짜뉴스 네트워크 분석에서 트위터에 많이 나타난 단어로는 '유담' 722회, ‘성추행범은’ 571회, ‘성추행범’ 533회 등이났다. 트위터에 두 단어가 함께 등장한 횟수는 ‘유담, 씨’ 526회, ‘씨, 성추행범은’ 526회, ‘성추행범은, 예상대로’ 526회, ‘예상대로, 일베였습니다’ 526회 등으로 나타났다.

Table 2. 
Fake news network for candidates
Classification Moon Jae-in Hong Joon-pyo Ahn Cheol-su Yoo Seung-min
Node 5290 1408 855 1045
Unique Edges 10653 1715 974 1094
Edges with Duplicates 268 144 31 20
Total Edges 10921 1859 1005 1114
Self-Loops 424 208 36 90
Connected Component 135 137 16 55
Single-Vertex Connected Components 124 123 10 39
Maximum Vertices in a Connected Component 5119 1220 834 970
Maximum Edges in a Connected Component 10744 1649 984 1037
Maximum Geodesic Distance 10 8 11 10
Average Geodesic Distance 3.185053 3.191283 3.280431 3.467567

4-1 연구문제2

제19대 대통령 후보자 가짜 뉴스와 관련하여 트위터 네트워크 구조가 어떠한 구조로 되어 있는지 트위터 서치 네트워크를 통해 알아보았다. 제19대 대통령 후보자의 트위터 서치 네트워크 구조를 [그림 2]과 [그림 3], [그림 4], [그림 5]와 같이 시각화하여 나타냈다. 이러한 결과 값은 분석 프로그램인 노드엑셀 프로그램을 활용하였다. 아래 [그림 2], [그림 3], [그림 4], [그림 5]에서 나타내는 그래픽은 매개중심성과 관련한 것이다.


Fig. 2. 
Moon Jae-in candidate’s fake news network graphic


Fig. 3. 
Hong June-pyo candidate’s fake news network graphic


Fig. 4. 
An Chul-su candidate’s fake news network graphic


Fig. 5. 
Yoo Seung-min candidate’s fake news network graphic

매개중심성이 작을수록 노드의 색이 주황색으로 표시되고 매개중심성이 클수록 파란색으로 나타 난다. 또한, 매개중심성이 작을수록 노드의 크기가 작고 매개중심성이 클수록 노드의 사이즈가 크게 보인다. 따라서 노드의 크기가 크고 색깔이 파란색에 가까울수록 다른 노드들 사이에서의 중심적 역할을 한다고 해석할 수 있다.

문재인 후보 가짜뉴스 네트워크는 비교적 대규모 크기로 분류한다. 커다란 군집이 중앙 방향으로 모여져있고 노드간의 연결거리 및 밀도도 타 후보자 가짜뉴스 네트워크에 비해 비교적 촘촘하다. 연구문제 1에서 살펴보았듯이 문재인 후보의 노드가 5,290로 유통되는 정보의 양도 정보의 종류도 다양하다.

이에 비하여 홍준표, 안철수, 유승민 후보 가짜뉴스 네트워크는 비교적 중규모에 해당된다. 홍준표 후보 가짜뉴스 네트워크 노드 1,408, 안철수 후보 가짜뉴스 네트워크 노드 855, 유승민 후보 1,045로 의견이 양이 전체적으로 많지 않고 노드 들간의 연결성도 문재인 후보 가짜뉴스 네트워크에 비해 떨어지는 것을 알 수 있다.

다시 말하자면, 평균적으로 문재인 후보자의 가짜뉴스 노드간 거리가 홍준표, 안철수, 유승민 후보보다 거리가 더 가깝게 위치해 있는 것을 알 수 있다. 이는 문재인 후보 가짜뉴스 트위터리안들이 타 후보 가짜뉴스 트위터리안들보다 더 많이 가짜뉴스에 긴밀하게 연결되었다고 볼 수 있다. 이는 평균 연결거리에서도 알 수 있는데, 문재인 후보의 평균 연결고리는 3.18로 나타났다. 이러한 결과는 평균 3.18명을 거치면 서로 연결될 수 있다는 뜻이다. 문재인 후보의 노드 연결성이 4명의 대통령 후보자중 제일 높은 것으로 나타났다. 다음으로 홍준표 3.19, 안철수 3.28, 유승민 3.46 순으로 나타났다.

특히 유승민 후보의 노드 연결성 간격이 제일 벌어져있음을 알 수 있다. 트위터 네트워크 그래프에서 링크간 간격에도 차이를 보인다. 문재인 가짜뉴스 네트워크 분석 그래프의 경우 홍준표, 안철수, 유승민 후보의 가짜뉴스 네트워크 분석 그래프와 달리 링크 간격이 매우 촘촘하게 연결되어 있다. 그 반면 홍준표, 안철수, 유승민 후보의 가짜뉴스 네트워크 분석 그래프는 간격이 벌여져있어 비교적 엉성하게 보인다. 이는 문재인 가짜뉴스 관련 트위터리안들이 다른 후보자 트위터리안들보다 더 촘촘한 관계를 이루고 있다는 것을 의미한다고 말 할 수 있다.

문재인 후보 가짜뉴스 네트워크는 트위터 네트워크 유형중 브로드캐스트 클러스터(Braodcast Cluster)에 해당된다. 브로드캐스트 클러스터는 높은 중심성을 지니고 있으며 잘알려진 @Al Jazeera(알자지라)와 같은 매스미디어나 유명인들이 이러한 유형된다. 브로드캐스트 클러스터는 네트워크를 지니지 않은 일반 트위터리안들도 쉽게 접근할 수 있으며 이는 전통적인 매스미디어와 닮아 있다[35]. 문재인 가짜뉴스 네트워크의 경우 일반 트위터리안들도 쉽게 접근할 수 있으며 이는 매스미디어의 '청중'에 해당한다고 할 수 있다. 문재인 가짜뉴스 네트워크는 매개중심성이 가장 높은 보라색을 중심으로 네트워크가 펼쳐져있으며 매개중심성이 높은 보라색의 경우 네트워크 구조상 가장 중요한 역할을 담당하고 있다.

홍준표, 안철수, 유승민 후보의 가짜뉴스 네트워크는 트위터 네트워트 유형중 문재인 후보 가짜뉴스 네트워크와 마찬가지로 브로드캐스트 클러스터에 해당된다. 일반적으로 브로드캐스트 클러스터의 경우 팔로워수를 많이 보유한 정치, 경제, 사회 등 전문가 등이 이러한 유형에 해당한다[36]. 홍준표 후보 가짜뉴스 네트워크의 경우에는 매개중심성이 파란색, 분홍색, 보라색 3개의 매개중심성을 지니고 있어서 문재인, 유승민, 안철수 가짜뉴스 네트워크 그래프보다 중심 네트워크 수가 가장 많은 것으로 나타났다. 안철수, 유승민 후보의 가짜뉴스 네트워크는 보라색, 파란색의 두개의 매개중심성을 지니고 있는 거으로 드러났다. 유승민 후보 가짜뉴스 네트워크의 경우 가짜 뉴스에 대한 영향력을 많이 발휘한 하나의 트윗 계증은 저명한 1인 미디어 크리에이터 및 시사평론가인 것으로 드러났다. 시사평론가의 트윗 계정이 가장 많이 리트윗된 콘텐츠의 내용은 가짜 뉴스의 하나로 유승민 후보의 딸 유담 성추행범이 일베(일간베스트) 회원이라는 설이었다. 소셜미디어는 누구나 동등하게 참여할 수 있지만 소셜미디어 상에서 누구나 동일한 역할을 하는 것은 아니다[37]. 특정 노드는 다른 노드에 영향을 줄 수 있으며 영향력이 큰 특정 노드를 파워 트위터리안(power twitterian) 혹은 SNS 유력자(SNS infliencer)로 불린다[38][39]. 앞서 언급한 유승민 후보 가짜 뉴스 네트워크 중심에 있던 저명한 1인 미디어 크리에이터 트윗 계정도 이러한 파워 트위터리안에 해당된다.


Ⅴ. 결 론

본 연구는 두 가지 연구문제에 대한 분석을 통해 제19대 대통령 선거에 SNS(Social Network Services)를 통한 가짜뉴스(Fakenews)가 어떠한 네트워크 구조를 가지고 있는지를 알아보고자 하였다. 첫째로 트위터 서치 네트워크 검색을 활용하여 소셜미디어의 가짜 뉴스가 어떤 식으로 트위터에 퍼트려지는지 가짜 뉴스들 사이의 밀도, 거리, 중심성 등을 분석하고자 하였다. 다음으로 각 후보자별 가짜 뉴스 네트워크가 어떠한 차이를 가지고 있는지 밝히고자 하였다. 이에 대한 연구결과를 간략하게 정리하면 다음과 같다. 평균적으로 문재인 후보자의 가짜뉴스 노드간 거리가 홍준표, 안철수, 유승민 후보보다 거리가 더 가깝게 위치해 있음을 알 수 있었다. 이러한 결과는 문재인 후보 가짜뉴스 트위터리안들이 타 후보 가짜뉴스 트위터리안들보다 더 많이 가짜뉴스에 긴밀하게 연결되었다는 결과를 나타낸다. 또한, 문재인 가짜뉴스 네트워크 분석 그래프의 경우 홍준표, 안철수, 유승민 후보의 가짜뉴스 네트워크 분석 그래프와 달리 링크 간격이 매우 촘촘하게 연결되어 있었다. 그 반면 홍준표, 안철수, 유승민 후보의 가짜뉴스 네트워크 분석 그래프는 사이 간격이 벌여져있어 문재인 후보에 비해 비교적 엉성하게 나타났다. 후보자별 가짜 뉴스 네트워크의 차이는 문재인 가짜뉴스 네트워크 그래프가 매개 중심성이 가장 높은 것으로 나타났다. 다음으로 홍준표 가짜 뉴스가 3개의 매개중심성을 나타냈으며, 유승민과 안철수 가짜뉴스는 2개의 매개중심성을 가진 것으로 나타났다. 또한 본 연구는 가짜 뉴스가 어떻게 트위터 상에서 유통되는지에 대해 알아보고자 새로운 프로그램인 노드엑셀을 활용하고 연구 결과를 도출하려고 시도한 점에서 의의를 가진다. 한편 본 연구는 다음과 같은 제한점도 있다. 첫째, 이번 연구의 연구 기간은 제19대 대통령 선거운동 기간은 4월 17일부터 투표일인 5월 9일까지의 기간이었으나, 이 기간 동안 중앙선거관리위원회에서는 제19대 대통령선거 사이버 위법게시물을 총 40,222건 삭제하였다[40]. 본 연구가 진행된 기간 중 지속적으로 중앙선거관리위원회에서 각 후보자들의 가짜 뉴스를 모니터링을 통해 삭제하였다는 점이다. 특히, 본 연구의 검색 및 분석 모델은 트위터였는데, 대통령 선거 사이버 위법게시물 총 40,222건 중 트위터에서만 7,936건(19.73%)을 삭제되었다. 따라서 선거기간동안에 일어난 전체 게시물의 트위터 네트워크 분석이 불가능하였다. 이번 연구는 중앙선거관리위원회에서 선거기간동안 삭제한 7,936건을 제외한 트위터 게시물 총 16,396개를 대상으로 연구를 실시하였기 때문에 전체 게시물을 다뤘다고 이야기하기에는 한계가 있다. 따라서 앞으로 진행될 연구에서는 선거기간동안의 가짜뉴스 네트워크 분석 뿐 만 아니라 연구기간을 확장하여 장기간 가짜뉴스 네트워크 분석을 하는 연구 혹은 SNS 가짜뉴스 유통경로를 밝히는 연구를 비롯한 연구가 수행될 필요가 있다. 둘째, 본 연구에서 사용한 소셜네트워크 분석 프로그램인 노드엑셀이다. 노드엑셀의 경우 트위터 서치 네트워크 검색도구라는 점이다. 트위터 서치 네트워크 검색을 함에 있어 한번에 18,000개의 트윗을 검색할 수 있다. 이는 노드엑셀 프로그램의 한계라고 말 할 수 있다. 가짜 뉴스에 대한 소셜네트워크 분석이라 할지라도 부분적인 트위터 서치 네트워크에 국한되었다는 점을 인지해야할 것이다.

셋째, 이번 연구는 소셜미디어 네트워크 분석을 통해 가짜 뉴스의 유통 경로에 대해 알아보았지만, 가짜 뉴스를 퍼트린 소셜미디어 계정이 가짜 계정인지 진짜 계정인지에 대한 언급이 미비하다. 가짜 뉴스의 확산은 소셜미디어 가짜 계정에서 시작되는 경우가 대부분이다[41]. 본인의 개인정보를 활용하여 한 명의 이용자가 하나의 아이디를 활용하는 것이 일반적이나 가짜 이메일, 타인의 휴대전화번호 도용 등을 통해 가짜 계정을 늘리는 것은 매우 쉬운 일이다. 2016년 미국 대선의 경우 러시아와 관련된 가짜 뉴스들이 트위터 가짜 계정을 활용하여 유통되었으며, 가짜 계정을 통한 가짜 뉴스임이 밝혀져 수만개의 트윗이 삭제되었다. 트위터는 향후 가짜뉴스와 관련하여 진행될 연구에서는 트위트 네트워크 분석 뿐만 아니라 트위터 계정의 가짜 계정에 대한 추가적인 연구도 필요할 것이다.

제19대 대통령 선거 가짜 뉴스에 대한 논란은 현재시점까지도 계속되고 있다. 온라인을 통해 문재인 후보 치매설을 제일 먼저 배포한 20대 A씨에게는 벌금 300만원이 선고되었고[42], 문준용 특혜 채용과 관련된 가짜뉴스에서는 국민의당 당원 이유미가 구속되어 국민의당 전체로 책임론이 가해지고 있다[43]. 이러한 가짜뉴스에 대한 관심은 제19대 문재인 정권 국민인수위원회 광화문 1번가에는 가짜 뉴스에 대한 처벌법을 만들어 주었으면 좋겠다는 국민들의 청원이 이어지고 있다[44]. 이러한 시점에서 제19대 대통령 선거에 대한 트위터 가짜뉴스 네트워크 분석한 이번 연구는 향후 SNS 선거 네트워크 및 정치참여 연구에 대한 연구 범위를 증대시켰다는 점에서 그 의의를 찾을 수 있을 것이다. SNS 이용이 참여 민주주의를 증대시키지만 동시에 가짜 뉴스의 유통 경로로 활용될 수 있음을 다시 한 번 상기시키는 것이다. 앞으로 SNS 가짜뉴스에 유통에 대한 법적 근거 마련뿐만 아니라 이론적 근거를 마련하는데 본 연구가 도움이 될 수 있을 것이다.


Acknowledgments

이 논문은 2019학년도 제주대학교 교육·연구 및 학생지도비 지원에 의해서 연구되었음을 밝힙니다.


참고문헌
1. Flood, A., Fake news is 'very real' word of the year for 2017, The Guardian, [Internet]. Available: https://www.theguardian.com/books/2017/nov/02/fake-news-is-very-real-word-of-the-year-for-2017, Nov., 2017.
2. S. W. Oh, and A. R. Pak, "Media Issue: Perception of fake news from the public", Media Issue, 3(3), p2-12, March, 2017.
3. Fan, C., Classifying Fake News, [Internet]. Available : http://www.conniefan.com/wp-content/uploads/2017/03/clssfying-fake.news.pdf, (2017).
4. Darnton, R., The True History of Fake News, The New York Review of Books, [Internet]. Available : http://www.nybooks.com/daily/2017/02/13/the-true-history-of-fake-news/, Feb., 2017.
5. M. K. Jeong, "Fake News" if you do not see it in my mind? Conceptualization of fake news comes first, [Internet] Available : http://www.mediatoday.co.kr/news/articleView.html?idxno=135117, Feb., 2017.
6. M. K. Ahn, " The conditions of a good election report in the case of deliberation", in, 2017 Jeju Journalism Society Debate '19th Presidential Election', Fair Report and Jeju Press Release, Jeju, p11-28, (2017).
7. Tambini, D, Fake News: Public Policy Responses. Media Policy Brief 20, London, Media Policy Project, London School of Economics and Political Science, (2017).
8. M. K. Kim, "Influence of Confirmation Bias and Involvement on Social Media Communication Behavior of News-Exposed Group: Comparison of Real News and Fake News", Korean Communication Seminar Materials, p37-43, (2017).
9. Bennett, L., & Iyengar, S., “A new era of minimal effects? The changing foundations of political communication”, Journal of Communication, 58(4), p707-731, (2008).
10. Hart, W., Albarracín, D., Eagly, A. H., Brechan, I., Lindberg, M. J., & Merrill, L., “Feeling validated versus being correct: a meta-analysis of selective exposure to information, Psychological bulletin, 135(4), p555, (2009).
11. Allcott, H., & Gentzkow, M., (2017), Social Media and Fake News in the 2016 Election, Technical report, National Bureau of Economic Research, [Internet]. Available : https://web.stanford.edu/~gentzkow/research/fakenews.pdf.
12. J. W. Choi, Fake news is more like 'Likes', 'Sharing' and 'Comments' on Facebook than real news. Huffington Post, [Internet]. Available : http://www.huffingtonpost.kr/2017/03/17story_n_15420932.html, Mar., 2017.
13. S. J. Roh, J. H. Choi, and Y. Min, “Correlates of fake news effects : Identifying facilitating and constraining factors on fake news exposure and acceptance in the 2017 Korean presidential election”, Journal of Cybercommunication Academic Society, 34(4), p99-149, (2017).
14. M. K. Kim, "Influence of Confirmation Bias and Involvement on Social Media Communication Behavior of News-Exposed Group: Comparison of Real News and Fake News", Korean Communication Seminar Materials, p37-43, (2017).
15. The National Election Commission, Status of requests for deletion by type of cyber illegal posting in the 19th presidential election, Request for information disclosure by the National Election Commission, [Internet]. Avaliable : https://open.nec.go.kr/?MID=appReqInfo, (2017).
16. S. E. Park, and Y. J. Kim, Laughed at the approval rating and cried in fake news. Yonhap News, [Internet]. Avaliable : http://www.yonhapnews.co.kr/bulletin/2017/04/11/0200000000AKR20170411083900797.html, Apr., 2017.
17. J. E. Lee, and S. Y. Jeon, "The effect of fake news related to electronic voting system on the reliability of online news platform and intention to participate in election", 2017 Korean Journal of Public Relations Spring Conferences and Courage: Media and Journalism First Steps for Restoring Authenticity, Jeju, p113, May, 19, 2017.
18. H. S. Jeong, The 19th presidential election faked 30,000 articles ... 'Mayu', 'Ilbe', Comment -> Band, Peebuk, Twitter SNS move. Joongang Ilbo, [Internet]. Avabilable : http://news.joins.com/article/21518811, Apr., 2017.
19. S. U. Kim, 2 out of 5 I feel it's difficult to distinguish fake news ... What's the solution? Kim Sungsoo's office press release, [Internet]. Available : https://blog.naver.com/PostView.nhn?blogId=kss_0909&logNo=221374738898&categoryNo=19&parentCategoryNo=&from=thumbnailList, (2018).
20. J. W. Choi, Fake news is more like 'Likes', 'Sharing' and 'Comments' on Facebook than real news. Huffington Post, [Internet]. Available : www.huffingtonpost.kr/2017/03/17story_n_15420932.html, Mar., 2017.
20. S. H. Son, G. O. Lee, J. H. Hong, J. H. Choi, and E. J. Jeong, “How Does Twitter Distribute Fake News? - Analysis of distribution patterns, influencers, and frequently-used words of ‘traffic regulation amendment’ and ‘September 9th war in Korean peninsula’ news”, Cyber Communication Studies, 35(4), p203-251, (2018).
21. S. J. Roh, J. H. Choi, and Y. Min, “Correlates of fake news effects : Identifying facilitating and constraining factors on fake news exposure and acceptance in the 2017 Korean presidential election”, Journal of Cybercommunication Academic Society, 34(4), p99-149, (2017).
22. S. H. Son, G. O. Lee, J. H. Hong, J. H. Choi, and E. J. Jeong, “How Does Twitter Distribute Fake News? - Analysis of distribution patterns, influencers, and frequently-used words of ‘traffic regulation amendment’ and ‘September 9th war in Korean peninsula’ news”, Cyber Communication Studies, 35(4), p203-251, (2018).
23. I. H. Park, H. S. Park, and H. M. Lee, "Who speread fake news? The Impact of Individual Political Tendency on Spread of Fake News", Korea Rearch Institute of Public Relations, p71-78, (2018).
24. E. J. Choi, S. W. Choi, S. Y. Lee, and M. J. Kim, "Analysis of the effect of the mention in SNS on the result of election", Journal of digital convergence, 15(2), p191-197, Feb., 2017.
25. M. J. Choi, H. C. Kim, and W. G. Kim, "The Effects of the Uses of Social Network Service on the Voter’s Political Decision Making: A Case of Seoul Mayor by-election 2011", Journal of Research in Media Science, 12(2), p502-553, (2012).
26. J. H. Bae, J. E. Son, and M. Song, "Twitter Analysis of 2012 Korean Elections Using Text Mining", Intelligent Information Research, 19(3), p141-156, (2013).
27. W. S. Jang, and S. J. Ryu, "Political Effect of Social Network Campaign - Twitter Big Data Analysis of the 19th general election", Korean Political Science Review, 47(4), p93-112, (2013).
28. M. Y. Doh, "Analysis of SNS Users' Characteristics and Participation Behavior: A Case of the 18th Presidential Elections", International Politics Research, 18(1), p175-195, (2015).
29. S. J. Park, J. Y. Park, Y. S. Lim, and H. W. Park, (2016), "Expanding the presidential debate by tweeting: The 2012 presidential election debate in South Korea", Telematics and Informatics, 33(2), p557-569.
30. H. G. Ham, Data analysis & journalism, Comonemedia, (2018).
31. H. S. Jeong, The 19th presidential election faked 30,000 articles ... 'Mayu', 'Ilbe', Comment -> Band, Peebuk, Twitter SNS move, Joongang Ilbo, [Internet]. Avabilable : http://news.joins.com/article/21518811, Apr., 2017.
32. Y. J. Jang, and S. G Cho, "A Comparative Analysis of Data Gathering and Sampling Methods for Social Data", Social Science Research, 25(2), p3-25, (2014).
33. Hansen, D., Shneiderman, B., & Smith, M. A., Analyzing social media networks with NodeXL: Insights from a connected world, Morgan Kaufmann, (2010).
34. Smith, M., A., Rainie, L, Shneiderman, B., & Himelboim, I., Mapping Twitter Topic Networks: From Polarized Crowds to Community Clusters, Pew Research Internet Project, http://www.pewinternet.org/2014/02/20/mapping-twitter-topic-networks-frompolzrized-crowds-to-community-clusters/, (2014).
35. Himelboim, I., Smith, M. A., Rainie, L., Shneiderman, B., & Espina, C., “Classifying twitter topic-networks using social network analysis”, Social Media+ Society, 3(1), (2017).
36. Smith, M., A., Rainie, L, Shneiderman, B., & Himelboim, I., Mapping Twitter Topic Networks: From Polarized Crowds to Community Clusters, Pew Research Internet Project, http://www.pewinternet.org/2014/02/20/mapping-twitter-topic-networks-frompolzrized-crowds-to-community-clusters/, (2014).
37. J. S. Lim, and Y. S. Hyun, “Drama and SNS influencers”, Korean Journal of Media Studies, 59(6), p417-445, (2015).
38. S. H. Kang, et al., Digital Media and Culture in Korean Society, Korean Journal of Communication, Communication Books, (2011).
39. H. W. Kim, and D. S. Park, "Living as a Social Network Residents: A Simultaneous Approach to SNS User Experience", Journal of Korean Media, 57(2), p287-315, (2013).
40. The National Election Commission, Status of requests for deletion by type of cyber illegal posting in the 19th presidential election, Request for information disclosure by the National Election Commission, [Internet]. Avaliable : https://open.nec.go.kr/?MID=appReqInfo, (2017).
41. M. Y. lm, KISA REPORT, 7, p1-6, [Internet]. Available : http://www.kisa.or.kr/public/library/IS_View.jsp?mode=view&p_No=158&b_No=158&d_No=353&cPage=&ST=TC&SV=.
42. Y. H. Gu, Moon Jae-in nominated a suspicion of dementia blogger penalty of 3 million won. Newsis, [Internet]. Available : http://news.naver.com/main/read.nhn?mode=LSD&\mid=sec&sid1=102&oid=003&aid=008029367, Jun., 2017.
43. M. J. Kim, 'Moon Jun - yeong' s preference manipulation manipulation 'is the reason of the people, and finally the arrest, Newsis, [Internet]. Availabel : http://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=100&oid=079&aid=002983937, Jun., 2017.
44. Gwanghwamun 1st Street, Fake news is a crime, Gwanghwamun 1st Street, [Internet]. Available : https://www.gwanghwamoon1st.go.kr/policyHot/policyHotView.php?seq=3,2017.

저자소개

조하진(Hajin Cho)

2012년 : 미국 플로리다 대학교 대학원(석사-PR)

2019년 : 제주대학교 언론홍보학과 박사과정 수료

※관심분야:정부PR, 소셜미디어 등

김경호(Gyongho Kim)

1998년 : 미국 남일리노이대학교 대학원(저널리즘 석사)

2001년 : 미국 남일리노이대학교 대학원(저널리즘 박사)

2002년~ 현재 : 제주대학교 언론홍보학과 교수

※관심분야:저널리즘, 뉴미디어, 선거방송토론회, 표현의 자유와 인격권 등