Korea Digital Contents Society

Journal Archive

Journal of Digital Contents Society - Vol. 21 , No. 6

[ Article ]
Journal of Digital Contents Society - Vol. 21, No. 6, pp. 1159-1169
Abbreviation: J. DCS
ISSN: 1598-2009 (Print) 2287-738X (Online)
Print publication date 30 Jun 2020
Received 27 Apr 2020 Revised 15 Jun 2020 Accepted 25 Jun 2020
DOI: https://doi.org/10.9728/dcs.2020.21.6.1159

빅데이터를 활용한 도덕기반 텍스트분석 : 입시 기사를 중심으로
김효은1 ; 김바로2, *
1한밭대학교 인문교양학부 교수
2중앙대학교 인문콘텐츠연구소 HK연구교수

Text analysis of moral foundations using big data : focusing on entrance exam articles
Hyo-eun Kim1 ; Ba-ro Kim2, *
1Professor, Department of Humanities, Hanbat National University, Daejeon 34158, Korea
2Research Professor, Humanities Research Institute, Chung-Ang University, Seoul 06974, Korea
Correspondence to : *Baro Kim E-mail: ddokbaro@gmail.com


Copyright ⓒ 2020 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
Funding Information ▼

초록

본 논문은 빅데이터를 활용하여 입시 관련 기사 텍스트에 나타나는 도덕판단의 유형을 분석하고자 했다. 이를 위해서 1)하이트의 도덕기반사전을 기반으로 한국어 맥락을 반영한 도덕기반사전 베타버전을 구성했다. 2) 한국어판 도덕기반사전을 바탕으로 디지털 분석에 사용 가능한 한국어판 도덕기반 형태소사전을 구축했다. 3) 사람들의 도덕기반단어 사용 양상과 이에 따른 가치 판단에 대해, 빈도분석, 상관관계분석, 사회연결망분석을 통해 살펴보았다. 4) 마지막으로 그 함의를 검토한 결과, 집단주의적, 전통적 도덕기반으로 여겨지는 권위 도덕기반과 충성 도덕기반 관련 단어를 사용하는 비율이 높았다.

Abstract

This paper aims to analyze the types of moral judgment from the news articles on entrance exam, an educational issue that has recently become an issue. Based on the Graham and Haidt’s moral foundation dictionary, we analyize the construct a Korean version of moral foundation dictionary to use as a frame reflecting Korean context. The types of moral foundation-related words that describe the issues and their values ​​are judged through frequency analysis, correlation analysis, and social network analysis. Among twelve moral foundations, as a result, authority-related and loyalty-related words were appeared the most relative to other moral foundations. Finally we reviewed implications and limitations of our study.


Keywords: Moral foundation dictionary, Entrance exam, Frequency analysis, Correlation analysis, Social network analysis
키워드: 도덕기반사전, 도덕기반 형태소사전, 입시, 빈도분석, 상관관계분석, 사회연결망분석

I. 서 론

본 논문의 목표는 빅데이터를 활용하여 입시관련 기사 텍스트에 나타나는 도덕판단의 유형을 분석하는 것이다. 언어는 사고의 틀을 반영하며 그 안에 담긴 개념과 태도를 파악할 수 있다. 도덕판단의 유형 파악을 위해 도덕기반이론(Moral foundation theory: MFT)[1]에서 제시한 도덕기반사전(Moral Foundation Dictionary: MFD)을 기본적으로 사용하되 한국어 맥락을 반영하여 입시 기사 속 도덕판단 유형을 분석한다. 이를 통해 도덕기반이론 및 사전의 주된 적용영역이었던 정치[2][3] 외에 도덕기반이론을 활용할 수 있는 가능성을 열 수 있다.

도덕기반사전을 활용하여 텍스트를 분석하는 선행연구[4][5]에서 잘 드러나듯 재난, 경제정치적 격변, 사회갈등과 같은 도메인(domain) 에서 사람들의 이해득실과 그에 수반되는 정서가 극명히 드러날 때 도덕감정이 잘 드러나는 텍스트가 생산된다. 이에 본 연구는 최근의 입시관련 기사를 수집하여 텍스트에 드러난 도덕판단 유형 패턴을 살펴보고자 했다. 최근의 입시기사는 한국인의 입시 관련 도덕감정이 내재되어 있다고 판단했다. 그래서 특정한 날짜 이후의 기사 안의 도덕기반 유형 분석은 구체적으로 빈도분석, 상관관계분석, 사회연결망분석을 수행하였다.


II. 본 론
2-1. 도덕기반이론

본 논문이 활용하는 도덕기반사전(MFD)의 이론적 토대는 도덕기반이론이다. 도덕기반이론은 모든 문화권에서 공통적으로 가치를 두는 다섯 유형의 도덕성이 있다고 보며 최근 여섯 유형으로 확장하였다.[6] 도덕기반은 인간이 생존을 위해 진화해온 일종의 모듈(module)이며, 인류학적, 심리학적, 신경과학의 연구성과들에 의해 정당화되었다.

문화마다 각 도덕기반의 비중이 다르게 나타나는[5] 다섯영역은 배려(care), 공정성(faireness), 권위(authority), 충성(loyalty), 순수(purity)이며, 여섯째 영역인 자유(liberty) 도덕기반이 최근 추가되었다. 각 도덕기반은 표 1에서 볼 수 있는 것처럼 해당 도덕기반을 준수하는 긍정적(virtue) 측면과 위배하는(vice) 부정적 측면으로 나뉜다.

Table 1. 
Evolutionary drivers and moral sentiments corresponding to the moral foundations
배려/피해
care/harm
공정/부정
fairness/cheating
충성/배신
loyalty/betrayal
권위/불복종
authority/subversion
순수/타락
purity/degradation
적응 도전
adaptive challenge
아이들을 보호하고 보살핌
protecting and caring for children
쌍방향의 관계에서 이득을 얻음
benefit from bi-directional relationships
단결력 있는 연합을 구성함
forming a cohesive unity
위계 서열 내에서 이득을 얻는 관계를 다짐
build relationships that benefit from hierarchies
오염을 피함
avoid contamination
본래적 동인
original triggers
자식이 고통스러워하거나 필요함을 표현함
expressing the child's pain or need
부정행위, 사기
cheating, fraud
집단에 대한 위협이나 도전
threats or challenges to the group
지배와 복종의 표시
domination and submission
쓰레기, 병걸린 사람
gargabe, sick person
통용적 동인
commontriggers
새끼 바다표범, 귀여운 만화캐릭터
seal, cute cartoon character
결혼에서의 정절, 고장난 자동판매기
ending machines for fidelity and trouble in marriage
스포츠 팀, 국가
sports team, country
상사, 존경받는 전문가
superior, respected expert
금기 사상(공산주의, 인종차별)
taboo ideas (communism, racism)
특징적 감정
characteristict emotions
동정심
sympathy
분노, 감사, 죄책감
anger, thanks, guilty
집단에 대한 긍지, 배신자에 대한 격분
pride for the group, outrage against the traitor
존경, 두려움
respect, fear
구토감
vomitting
관련 덕목
relevant virtues
배려, 친절
caring, kind
공평성, 정의, 신뢰
caring, kind
충성심, 애국심, 자기희생
loyalty, patriotism, self-sacrifice
복종, 경의
obedience, respect
절제, 순결, 경건, 청결
abstinence, purity, godliness, cleanliness

도덕기반이론은 이성중심적인 서구의 개인주의적인 가치(자유, 정의, 권리)가 반영하지 못하던 아시아의 집단주의적 가치(충성, 권위, 순수)들을 포함하여 기존의 ‘서양적이고, 고학력자 중심의, 산업화하고, 부유한 미국 민주당 지지자들’(Western, Educated, Industralized, Rich, Democratic) 중심의 가치관을 넘어선 틀을 마련했다[7]고 평가받으며 도덕성을 분석하는 틀로 인정되어왔다.

2-2. 도덕기반사전

본 연구는 다양한 도덕적 맥락을 반영하기 위해 북미에서 만들어진 도덕기반사전의 번역 및 확장버전인 여섯 유형의 도덕기반, 즉 총 열두 유형(여섯기반 * 긍정/부정 감성)의 도덕분류를 활용한다. 각 도덕기반의 긍정-부정의 두 속성은 한 동전의 양면처럼 기능했던 반면, 텍스트분석에 사용하는 도덕기반사전(MFD)에서는 긍정-부정을 독립적인 도덕기반단어 유형들로 포착한다.

도덕기반사전은 본래 교회 설교문구를 연구하는 데 사용한 단어들로, 텍스트 안의 도덕적 어휘들을 파악하기 위해 만들어졌다.[8] 도덕기반사전에는 각 도덕기반을 준수함을 나타내는 단어들과 위배하는 단어들이 포함되어 있다. 도덕기반사전은 도덕판단 유형을 개념 및 속성으로 파악하여 질적, 양적으로 적용하기 위한 유용한 도구로 사용될 수 있다. 그런데 원 버전은 영어로만 가능하므로 그 적용이 제한적이다. 따라서 연구를 위해 먼저 오리지널 버젼의 도덕기반사전(MFDO:MFD original)[9]을 한국어로 번역하고 역번역(back-translation)을 통해 원어-번역어의 대응을 확인하여 한국어 번역판 (표 2)을 준비하였다[10].

Table 2. 
Korean translation of moral foundation dictionary
배려/피해
care/harm
공정/부정
fairness/cheating
충성/배신
loyalty/betrayal
권위/불복종
authority/subversion
순수/타락
purity/degradation
1 배려 care 3 공정 fairness 5 충성 loyalty 7 권위 authority 9 순수 purity
혜택, 공감, 돌봄, 동정, 방어, 방패, 배려, 보호, 안전, 연민, 우호, 은신처, 평화

benefit, empathy, care, compassion, defense, shield, care, protection, safety, compassion, friendship, hiding place, peace
공정, 공평, 관대한, 균형, 동등, 동일한, 맞먹다, 선입견 없는, 정당한, 정정당당, 타당한, 편견 없는, 평등, 호혜

fair, equity, generous, balance, equal, equal, equal, without prejudice, just, fair and square valid, unbiased, equal, reciprocity
가족, 공동 사회, 공동체, 구성원, 국가, 길드, 내부자, 동료, 동맹국, 동무, 애국자, 연대, 연합하다, 조국, 조화, 주민, 집단, 집단지지자, 충실한, 파벌, 함께, 합동의

family, community, community, member, country, guild, insider, fellow, ally, companion, patriot, solidarity, unite, motherland, harmony, inhabitants, collective, collective, supporters, faithful, factions, together, joint,
계층, 공경, 등급, 따르다, 명령, 명예, 법률, 순종, 숭배, 신분, 아버지, 어머니, 의무, 전통, 존경, 주교, 준수, 중산층, 지도자, 지위, 지휘, 직무, 직위, 참다, 우상, 카스트, 통제, 패권, 합법, 항복, 허가, 허용

hierarchy, honor, grading, follow, command, honor, law, obedience, worship, identity, father, mother, duty, tradition, respect, respectful, bishop, observance, middle class, leader, status, command, duty, position, Bear, idol, caste, control, supremacy, legality, surrender, permit, allowance
거룩, 건전, 결백, 결혼 안 한, 겸손, 경건, 교회, 깨끗한, 똑바른, 맑은, 살균 성스런, 성자, 순결, 순수, 숫처녀, 신성, 아가씨, 예의, 완전, 새 것, 자제, 절제, 진실, 처녀, 처녀성, 티 하나 없이 깔끔

holiness, health, innocence, unmarried, humility, godliness, church, clean, straight, clear, sterilized, sacred, saint, chastity, purity, virgin, deity, lady, courtesy, perfection, new, restraint, temperance , Truth, virgin, virginity, clean
2 피해 harm 4 불공정 cheating 6 배신 betrayal 8 불복종 subversion 10 타락 degradation
공격, 다치게 하다, 다친, 망치다, 버리다, 살인, 살인자, 상처, 손상, 시달리다, 싸우다, 싸움, 위험에 빠트리다, 으스러뜨리다, 위해, 잔인한, 잔혹한, 전멸, 전쟁, 죽이다, 착취, 취한, 퇴짜놓다, 파괴, 파멸, 폭력, 폭행, 피해

attack, injure, injured, hammer, throw away, murder, killer, wound, injure, damage, suffer, fight, fight, endanger, crush, for, brutal, brutal, wipeout, war, kill, exploitation , Drunk, dismiss, destruction, ruin, violence, assault, damage
배제, 부당한, 부도덕한, 분리, 불균형, 불평등, 선호, 정직하지 못한, 제외, 차별, 편견

exclusion, unfair, immoral, separation, imbalance, complaint preference, dishonest, exclusion, discrimination, prejudice
반역죄, 배반, 배신, 버리다, 버림받은, 범법자, 변절, 불충실, 사기꾼, 속이다, 외국의, 이민, 적, 첩자, 탈영병, 탈영, 테러

treason, betrayal, betrayal, abandonment, forsaken, transgression, apostasy, unfaithfulness, cheaters, deception, foreign, immigration, enemies, spies, deserters, desertions, terrorism,
거절, 막다, 무법의, 반대, 반란을 일으킨 사람, 반역자, 반체제 인사, 반항, 불법적인, 불복종, 순종하지 않는, 이단자, 전복, 탈주자, 폭동, 항의

Refusal, Stop, Outlaw, Opposition, Revolter, Rebel, Dissident, Rebellion, Illegal, Disobedience, Disobedience, Heretic, Overthrow, Breakout, Riot, Protest
더럽히다, 매춘부, 먼지, 무절제, 문란한, 변색, 병든, 부랑자, 불경(한), 비참한, 신성모독적인, 쓰레기, 얼룩, 역겨운, 오물, 오점, 왜곡, 외설적인, 음란, 음탕, 전염, 정숙하지 못한, 죄, 죄악, 죄인, 질병, 타락, 티, 혐오, 환자, 흠

filthy, prostitute, dust, intemperate, disorderly, discoloration, sick, bum, blasphemous, trash, stain, disgusting, filth, blemish, distortion, obscene, obscene, lustful, Contagion, unseemly, sin, sin, sinner, disease, exploitation, blemish,corruption, disgust, patients, flaw

2-3. 연구가설

한국에서 입시는 교육 뿐만 아니라 사회, 문화, 정책 등의 제반분야에 큰 영향을 미친다. 한국에서의 입시는 생계유지의 초석, 지위상승의 일환으로 여겨지며 다른 국가에 비해 상대적으로 더 민감하게 다루어진다. 도덕기반이론이 인간생존에 관련된 모듈이듯, 입시라는 주제는 거의 모든 사람들과 직간접적으로 연결되어 있고 그에 대한 유발적 감정과 도덕적 태도가 산출될 수 밖에 없다.

본 연구는 도덕적 태도를 가진 입시 기사를 수집하기 위하여 ‘입시’ 키워드로 자료를 시범적으로 모아본 결과 특정한 연구주제가 되기 어려울만큼 도덕적 가치 담론과 관련없는 어휘들이 대다수를 차지하였다. 예컨대 ‘입시’로 검색하면 ‘학원’, ‘미래 교육’, ‘대학’ 등이 가장 많이 검색되며 도덕이나 가치판단과 상관없는 무도덕적인(amoral) 텍스트들이 다수 수집된다. 일반적인 분석과 대조적으로 도덕기반이론으로 도덕적 태도를 분류해보려는 연구는 사회갈등과 같은 도메인(domain) 에서 사람들의 이해득실과 그에 수반되는 복합적인 정서가 드러나는 텍스트가 수집되도록 키워드를 선택해야 한다. 도덕기반으로 텍스트분석 작업을 주로 해온 후버 등[11]은 인종갈등이나 미투와 같은 사회갈등 관련 사건들을 키워드로 도덕적 가치판단을 분석하였다. 이 연구에서는 ‘입시’와 함께 여러 키워드를 테스트해본 결과 ‘조국’을 추가 키워드로 최종 선택하여 도덕감정이 잘 산출되는 데이터를 확보하였다. 이는 어디까지나 데이터의 질적 수준을 담보하여 수집하기 위한 키워드이며 본 연구의 주제와 혼동하거나 한 개인에 대한 데이터로 잘못 해석되어서는 안된다는 점을 주지해야 한다.

한국에서 ‘입시’는 생존 및 사회적 지위와 직간접적으로 연관되어 있으며 여러 종류의 도덕감정이 수반된다는 특성에 기인하여 기사 또한 이러한 특성들로부터 예외일 수 없다. 이러한 점에 입각하여 본 논문이 세운 가설은 다음과 같다. 가설 1: 수집된 기사 텍스트에서 ‘권위’ 기반 관련 어휘, 그리고 ‘공정성’ 기반 관련 어휘의 출현 비중이 여타의 유형들보다 상대적으로, 의미 있게 높을 수 있다. 가설 2: 두 기반 간의 관계가 다른 기반 간의 관계보다 더 밀접할 수 있다. 만약 이 두 가설이 맞다면 도덕기반이론에서 ‘권위’는 집단주의적 가치 관련 도덕기반이며 ‘공정성’은 개인주의적 가치 관련 도덕기반이므로 두 대조되는 문화적 배경이 혼재되어 있을 가능성이 있다. 분석에서는 각 도덕기반들 간의 연관성이나 도덕기반 관련 어휘들의 사용 패턴을 더 자세히 검토할 것 이다.


III. 연구 방법
3-1. 데이터 수집 및 형태소 추출

본 연구는 2019년 5월 이후부터 11월 18일까지의 기간 동안 ‘입시’를 키워드로 21,470건의 언론기사를 수집했다. 텍스트 데이터는 언론기사에 한정하였다. SNS(사회네트워크서비스)의 경우 그 특성이 완전히 다르며 본 연구는 공적 텍스트, 즉 언론기사 전반의 경향성만을 보고자 하였다. 언론기사는 다양한 입장을 막론하고 전체의 어휘패턴을 보고자 하는 것이 목적이며 언론사들의 입장들이 본 연구의 분석에 교란요인(confounding factors)이 되지 않도록 정치적입장 별 분류는 하지 않았다.

본 분석에서는 보수/진보/중립 성향의 다양한 미디어들을 모두 연결하고 있는 뉴스 포탈 중 하나인 네이버를 이용했다. 또한 포털로 인한 공정성의 문제를 최대한 방지하기 위하여, 뉴스의 메인 페이지의 배치, 읽은 수, 덧글수 등의 요인을 배제하고 모든 미디어의 기사를 수집했다.[10]

수집한 데이터는 Google에서 무료로 제공하는 클라우드에서 동작하는 Python 기반 개발 도구인 구글 Colab 환경을 사용하였으며, Ubuntu 18.04.3 LTS 상에서 작동하는 Python 3.6.9로 수행하였다. 한국어형태소 분석기는 python-mecab-ko[12]을 사용하여 형태소 단위로 분리했다.


Fig. 1. 
Research method conceptual diagram

3-2. 형태소를 활용한 한국어 도덕기반사전의 확장

본 연구는 도덕기반사전 오리지널 버전의 한국어번역 물론 한국어판을 그대로 사용하지 않고 한국어 맥락에 맞추어 확장하였다. 번역 과정에서 원어의 함의가 언어·문화 등의 차이로 인하여 온전히 번역될 수 없는 한계가 있기에 한국어와 한국문화 등의 요소를 반영하여 한국형 도덕기반사전으로 재구성할 필요가 있다.

다만 한국어 기사에서의 도덕기반 유형을 적절히 그리고 시간 효율적으로 반영하기 위해서는 무작위적 추가가 아닌 해당 주제 관련 기사의 어휘 중에 도덕기반사전에 포함된 단어목록과의 유사어가 존재하는지 검토하여 추가할 필요가 있다. 또, 보다 다양한 도덕기반 어휘를 반영하기 위해 국내외에서의 도덕기반사전 활용 연구[13]에서 반영되지 않은 여섯 번째 도덕기반(자유/억압)의 관련 단어들 또한 추가할 필요가 있다.

이를 위해 Mecab형태소 분석기를 이용해서 기사 데이터들로부터 추출된 육만여개의 형태소들을 연구자와 세 명의 대학생 주석자(annotator)들이 열두 유형의 도덕기반사전을 기반으로 열두 범주의 라벨을 붙였다. 이를 위해 주석자들은 도덕기반이론과 도덕기반사전에 대해 학습하였으며 형태소에 라벨을 붙이는 과정에서 토론을 통해 개념 라벨링에 대한 의견 불일치의 경우 조정하고 불확실할 경우 특정유형에 라벨링하는 것을 유보하였다. 형태소 단위로 분리한 데이터를 토대로 도덕기반사전 한국어 번역판 (KMFD-O)을 보완하여 확장버전을 마련하였다[10]. 확장버전의 한국어 도덕기반사전을 확장 전과 후를 비교한 표는 아래와 같다. 열두 도덕기반 관련 단어는 153개가 추가되어 총 369개로 늘어났다.

Table 3. 
Extended version of Korean moral foundation dictionary
배려/피해
care/harm
공정/부정
fairness/cheating
충성/배신
loyalty/betrayal
권위/불복종
authority/subversion
순수/타락
purity/degradation
자유/억압
liberty/oppression
1 배려 care 3 공정 fairness 5 충성 loyalty 7 권위 authority 9 순수 purity 11 자유 liberty
혜택, 공감, 돌봄, 동정, 방어, 방패, 배려, 보호, 안전, 연민, 우호, 은신처, 평화, 혜택, 동감, 측은지심, 염려, 보살피다

benefit, empathy, care, compassion, defense, shield, care, protection, safety, compassion, friendship, hiding place, peace, benefit, sympathy, compassion, concern, care
공정, 공평, 관대한, 균형, 동등, 동일한, 맞먹다, 선입견 없는, 정당한, 정정당당, 타당한, 편견 없는, 평등, 호혜, 권리, 옳다, 균등, 고른(형용사), 무차별, 페어플레이, 정의로운

fair, equity, generous, balanced, equal, equal, equal, without prejudice, just, right-wing, fair, unbiased, equal, reciprocity, right, equal, even (adjective), indiscriminate, fair play, justice
가족, 공동 사회, 공동체, 구성원, 국가, 길드, 내부자, 동료, 동맹국, 동무, 애국자, 연대, 연합하다, 조국, 조화, 주민, 집단, 집단지지자, 충실한, 파벌, 함께, 합동의, 애국, 친한, 가까운, 이사회, 멤버, 통합, 충성

family, community, community, member, country, guild, insider, fellow, ally, companion, patriot, solidarity, unite, motherland, harmony, inhabitants, collective, collective supporters, faithful, factions, together, joint, patriotic, Close, close, board, members, integration, loyalty
계층, 공경, 등급, 따르다, 명령, 명예, 법률, 순종, 숭배, 신분, 아버지, 어머니, 의무, 전통, 존경, 존경심을 보이는, 주교, 준수, 중산층, 지도자, 지위, 지휘권 , 직무, 직위, 참다, 우상, 카스트, 통제, 패권, 합법, 항복, 허가, 허용, 자리, 법적, 굴복, 승인, 자격, 대표, 간부, 고위급, 고위, 고위직, 권한, 지휘, 계급, 권위

hierarchy, honor, grading, follow, command, honor, law, obedience, worship, identity, father, mother, duty, tradition, respect, respectful, bishop, observance, middle class, leader, status, command, duty, position, Bear, idol, caste, control, supremacy, legality, surrender, permit, allowance, position, legal, submission, approval, qualification, representation, executive, senior, senior, senior, authority, command, rank, authority
거룩, 건전, 결백, 결혼 안 한, 겸손, 경건, 교회, 깨끗한, 똑바른, 맑은, 살균한, 성스러운, 성자, 순결, 순수, 숫처녀, 신성, 아가씨, 예의, 완전, 새것 같은, 자제, 절제, 진실, 처녀, 처녀성, 티 하나없이 깔끔한, 온전한, 고상한, 얌전한, 새롭다, 진실, 독실, 순수, 성녀, 무결, 절제, 죄없는, 무죄, 가지런한, 겸허, 고결, 깔끔, 숭고, 무균, 성인군자, 청렴, 청렴결백, 청빈

holiness, health, innocence, unmarried, humility, godliness, church, clean, straight, clear, sterilized, sacred, saint, chastity, purity, virgin, deity, lady, courtesy, perfection, new, restraint, temperance , Truth, virgin, virginity, clean, innocent, noble, gentle, new, truth, solitary, pure, lady, integrity, moderation, innocent, innocence, neat, modesty, integrity, neat, sublime, aseptic, adult Gunja, integrity, integrity, integrity
개방, 개인, 광복, 독립, 민주주의, 억압없는, 열린, 유토피아, 이상, 자율, 자주성, 주체성, 창의

open, personal, liberation, independence, democracy, unrepressed, open, utopia, ideal, autonomy, independence, subjectivity, creativity
2 피해 harm 4 불공정 cheating 6 배신 betrayal 8 불복종 subversion 10 타락 degradation 12 억압 suppression
공격, 다치게 하다, 다친, 망치다, 버리다, 살인, 살인자, 상처, 상처를 입히다, 손상, 시달리다, 싸우다, 싸움, 위험에 빠트리다, 으스러뜨리다, 위해, 잔인한, 잔혹한, 전멸, 전쟁, 죽이다, 착취, 취한, 퇴짜놓다, 파괴, 파멸, 폭력, 폭행, 피해, 학대, 킬러, 해를 입히다, 짓밟다, 방치, 약점을 잡다, 유기, 유린, 진압, 막다, 가학, 가해, 데미지, 욕보이, 모욕, 학살, 해악

attack, injure, injured, hammer, throw away, murder, killer, wound, injure, damage, suffer, fight, fight, endanger, crush, for, brutal, brutal, wipeout, war, kill, exploitation , Drunk, dismiss, destruction, ruin, violence, assault, damage, abuse, killer, harm, trample, neglect, catch weakness, abandonment, trampling, suppression, prevent, sadism, abuse, damage, libel, insult , Slaughter, harm
배제, 부당한, 부도덕한, 분리, 불공평한, 불균형, 불평등, 선호, 정직하지 못한, 제외, 차별, 편견, 편견이 아주 심한 사람, 편애, 특례, 특혜

exclusion, injustice, immoral, separation, unequal, imbalance, unfair, preference, dishonest, exclusion, discrimination, prejudice, very biased person, favoritism, exception, preference
반역죄, 배반, 배신, 버리다, 버림받은, 범법자, 변절, 불충실, 사기꾼, 속이다, 외국의, 이민, 적, 첩자, 탈영병, 탈영, 테러, 기만, 추방, 협작꾼, 스파이, 분열, 이탈, 간첩, 이단자

treason, betrayal, betrayal, abandon, forsaken, transgressor, apostasy, unfaithfulness, cheater, deceive, foreign, immigration, enemy, spy, deserter, desertion, terrorism, deception, deportation, conspiracy, spy, division, departure, espionage , Heretics
거절, 막다, 무법의, 반대, 반란을 일으킨 사람, 반역자, 반체제 인사, 반항, 불법적인, 불복종, 순종하지 않는, 이단자, 전복, 탈주자, 폭동, 항의, 저항, 반란, 동요시키는, 선동, 시위, 쿠데타, 혁명, 거스르, 항쟁, 하극상, 항거

Rejection, stop, outlaw, opposition, revolter, rebel, dissident, rebellion, illegal, disobedience, disobedience, heretic, overthrow, escaper, riot, protest, resistance, revolt, agitation, agitation, Protests, coups, revolutions, protests, protests, climaxes, protests
더럽히다, 매춘부, 먼지, 무절제한, 문란한, 변색, 병든, 부랑자, 불경(한), 비참한, 신성모독적인, 쓰레기, 얼룩, 역겨운, 오물, 오점, 왜곡, 외설적인, 음란한, 음탕한, 전염, 정숙하지 못한, 죄, 죄악, 죄인, 질병, 착취, 타락, 티, 혐오, 환자들, 흠, 구토, 부패, 불결, 간통, 창녀, 음행, 방탕한, 변색, 사악, 흠집, 변태, 가식, 가짜, 간음, 결함, 썩어빠진, 때묻다, 속물, 상스러운, 탐욕

filthy, prostitute, dust, intemperate, disorderly, discoloration, sick, bum, blasphemous, trash, stain, disgusting, filth, blemish, distortion, obscene, obscene, lustful, Contagion, unseemly, sin, sin, sinner, disease, exploitation, corruption, tee, disgust, patients, hmm, vomiting, decay, filth, adultery, whore, fornication, prodigal, discoloration, evil, blemish, pervert, Pretense, Fake, Adultery, Defect, Rotting, Smear, Snobbish, Sick, Greed
감옥, 구속, 규제, 닫힌, 독재, 박해, 사슬, 속박, 식민지, 종속, 짓누름, 타율, 타의, 탄압, 간섭, 감시, 강요, 강제, 검열, 얽누(르), 옭아매, 박탈

jail, restraint, regulation, closed, dictatorship, persecution, chain, bondage, colony, subordination, crushing, batting, consensus, oppression, interference, surveillance, coercion, coercion, censorship, entanglement, leash, deprivation

Table 4. 
Comparison between Eng-Kor. MFD
도덕기반
Moral Foundation
배려
care
피해
harm
공정
fairness
불공정
cheating
충성
loyalty
배신
cheating
권위
authority
불복종
suversion
순수
purity
타락
degradation
자유
liberty
억압
suppression
총수
total
원 버전
original version
14 29 14 12 22 17 33 16 27 32 0 0 216
추가단어
added voca.
4 17 8 4 8 8 14 11 22 22 13 22 153
추가버전
modified version
18 46 22 16 30 25 47 27 49 54 13 22 369

이 확장버전은 베타버전이며 차후 다른 도메인의 텍스트자료의 검토를 통해 지속적으로 계속 확장할 예정이다.

3-3. 디지털 분석을 위한 한국어 도덕기반 형태소 사전

한국어판 도덕기반사전과 한국어판 도덕기반 형태소사전을 분리한 또 다른 이유는 도덕기반사전은 개념어 형태로 구성되어 있기에 디지털 분석 기법을 적용하기에는 제한적이기 때문이다. 예를 들어서, 한국어판 도덕기반사전의 충성 유형 중 하나인 “가까운”은 인간으로서는 “가까워”, “가까울”과 같은 변형 형태에서도 같은 의미로 인지할 수 있지만, 컴퓨터는 기본적으로 서로 다른 형태를 가지고 있는 다른 형태소로 인식한다. 따라서 “가까운”의 변형인 “가까우/형용사”, “가까워/동사”, “가까이/명사” 등의 다양한 변형들도 “가까운”과 같은 의미라는 것을 컴퓨터에게 알려줄 필요가 있다. 이에 3-2에서 형태소 단위에 부착한 도덕기반 유형 분류 데이터를 토대로 한국어판 도덕기반 형태소 사전을 구축했다[10]. 그 예는 다음과 같다.

Table 5. 
Example of Korean moral foundation morphological dictionary
형태소
morpheme
품사
parts of speech
도덕기반유형
MF types
형태소
morpheme
품사
parts of speech
도덕기반유형
MF types
결백
innocent
NNG 9 공평
equity
NNG 3
결함
flaw
NNG 10 교회
church
NNG 9
겸손
humble
NNG 9 구성원
member
NNG 5
겸허
modest
NNG 9 구속
restraint
NNG 12
공격
attack
NNG 2 구토
vomiting
NNG 10
공동체
community
NNG 5 국가
country
NNG 5
공정
fair
NNG 3 굴복
submission
NNG 7
공정성
fairness
NNG 3 권리
right
NNG 3

마지막으로 한국어판 도덕기반 형태소사전을 수집한 기사 데이터에 적용하여 입시와 관련한 도덕판단 양상을 탐색했다. 도덕판단 양상 탐색을 목적으로 도덕기반 개별 단위별 분석을 위해서 개별 도덕기반 형태소들의 출현 빈도를 분석하고, 단일 도덕기반 간의 상호 관계성을 분석하기 위하여 상관관계 분석을 수행하였으며, 전체 도덕기반의 상호 관계성을 파악하기 위하여 사회네트워크 분석을 수행했다.


IV. 텍스트 안의 도덕기반 분석 및 결과
4-1. 도덕기반단어 출현빈도 분석

한국형 도덕기반 형태소사전을 토대로 입시 관련 기사 데이터에서 도덕기반 관련 형태소의 출현 양상을 분석했다. 그 결과는 아래의 표 6에 나타나 있다.

Table 6. 
Morpheme appearance rate and frequency of each type of moral foundation
도덕 기반

moral foundation
긍부정

positivie/negative
형태소 개수

morphological count
형태소 출현 빈도

morphological frequency
비율

ratio
도덕 기반 당 비중

percent of Moral foundation
형태소 출현

신문기사 건수

percent of
Morality Per Party
비율

rratio
출현기사 당
형태소 개수 평균

average number of
morphemes per appearance
배려
care
긍정
positive
18 26540 8% 14% 6442 9% 4.119
피해
harm
부정
negative
46 21834 6% 4823 7% 4.527
공정
fairness
긍정
positive
22 16190 5% 9% 4351 6% 3.720
불공정
cheating
부정
negative
16 14716 4% 4214 6% 3.492
충성
loyalty
긍정
positive
30 63986 19% 20% 10519 15% 6.073
배신
betrayal
부정
negative
25 3348 1% 1074 2% 3.117
권위
authority
긍정
positive
47 98176 29% 33% 13106 19% 7.471
불복종
subversion
부정
negative
27 15126 4% 3994 6% 3.787
순수
purity
긍정
positive
49 15170 4% 7% 4595 7% 3.301
타락
degradation
부정
negative
54 11378 3% 3144 5% 3.618
자유
liberty
긍정
positive
13 40238 12% 16% 9411 14% 4.275
억압
suppression
부정
negative
22 13316 4% 3275 5% 4.065
총합
total
474 긍정
positive 78%
부정
negative 22%
긍정
positive 69%
부정
negative 31%

먼저, 기사에서 추출된 형태소에서 각 도덕기반 관련 형태소가 차지하는 비율을 보자. 가장 큰 비중을 차지하는 형태소의 도덕기반유형은 권위 기반으로 그 비율은 29%이며, 두 번째로 높은 비중은 충성 기반 관련 형태소로 19%이다. 열두 개의 세부적 유형 분류가 아니라 여섯 유형의 큰 범주의 도덕기반 분류로 봐도 각기 33% (권위/불복종 기반), 20% (충성/배신 기반)으로 그 비중과 순서가 유사하다. 다만 여섯 도덕기반으로 보았을 때 여섯 번째 자유/억압 기반의 비중이 세 번째로 높았다는 점은 주지할만하다.

비록 한국판 도덕기반 형태소사전에 등록된 형태소의 개수가 도덕기반별로 상이하지만, 각 도덕기반별 기사에서의 형태소 출현빈도에는 사실상 영향을 주지 않는다. 형태소 개수는 피해, 권위, 타락, 순수 순으로 높지만, 형태소 출현빈도는 권위, 충성, 자유, 피해 순서로 높으며, 이러한 현상은 각 도덕기반 형태소의 출현 신문기사 건수의 순서에서도 드러난다.

분석에 앞서 세웠던 가설에서 권위기반의 높은 출현빈도는 빈도분석 결과와 일치하였는데 이는 수집 데이터가 고위 계층의 힘을 이용한 입시 관련 이슈였다는 점에서 예상 가능한 점이다. 반면 가설과 달리 공정성 도덕기반 관련 단어를 사용해 서술한 빈도는 형태소 출현빈도뿐만 아니라 형태소 출현 신문기사 건수 그리고 출현기사에서의 형태소 개수 평균에서도 상대적으로 낮은 빈도(5%)를 보였다. 또한, 해당 이슈에 대한 세간의 부정적 평가를 고려하건대 부정 속성을 지니는 도덕기반 단어가 상당할 것이라고 예상할 수 있다. 그런데, 긍정 기반과 부정기반의 비율은 형태소 출현빈도에서 약 4:1, 형태소 출현 기사 건수에서는 약 3:1의 비중으로 도덕기반의 위배와 관련한 부정기반 형태소들은 상대적으로 적게 사용되었다. 이러한 경향성은 개인 의견 표출이 아닌 공적 기사가 가진 특성으로 보이며 해당 입시 이슈에 대해 긍정적 반응이 더 많다는 해석을 할 수는 없다. 본 연구는 감성 분석은 목표로 하지 않고 도덕기반사전의 도덕관련 어휘만을 기본 프레임으로 사용하는 제한된 범위를 가지고 있기에 소략하도록 한다.

4-2. 도덕기반 간 상관관계 분석

상술한 빈도분석은 기본적인 현상을 보여주지만, 현상의 배경이나 속성을 살펴보는 데는 제한적이다. 이에 표출된 도덕기반 현상의 이면을 보기 위하여, 기사에 출현하는 도덕기반 형태소의 빈도수를 토대로 도덕기반 간의 상관 분석을 수행하였다. 그 결과는 다음과 같다.

상관성을 높은 수치에서 낮은 순서대로 보자. 권위-충성(0.43), 자유-충성(0.35), 피해-억압(0.35), 피해-충성(0.33), 권위-자유(0.33), 배려-피해(0.32), 권위-순수(0.32), 배려-자유(0.30), 피해-권위(0.30)의 순서대로이다. 이를 앞 절의 기술통계와 비교하여 검토해보자. 기술통계에서 권위 기반과 충성 기반은 가장 높은 관련 단어 사용빈도를 보였는데 상관관계에서 이 두 기반은 상관관계가 상대적으로 가장 높은 것으로 드러났다.

개별적인 도덕기반 간의 상관관계를 살펴보면, 빈도분석에서 첫 번째로 높은 비율을 보인 권위 기반이 두 번째로 높은 빈도를 보인 충성 기반과 긴밀한 연결 관계를 나타내었다. 이러한 결과는 한국 사회에서 입시가 개인의 자아실현과 같은 현대화된 모습이기보다는 전통적인 내집단 연계의 형태로 남아있음을 보여준다. 두 번째로 높은 비율을 보인 충성 도덕기반은 도덕기반 설명에서 ‘loyalty(충성)’와 ‘ingroup(내집단)’ 개념을 교환가능하게 함께 사용하는데, 충성이라는 가치가 가족이나 소속과 같은 내집단을 위주로 이루어진다는 의미이다. 권위-충성 간 상대적으로 높은 상관성은 권위 기반 즉 자리나 지위 같은 가치가 내집단을 중심으로 한다는 의미로 입시 또한 계층을 세습하려는 성향으로 묘사된다는 점을 보여준다.

Table 7. 
Correlation between moral foundation morphemes
도덕 기반
MF
배려
care
피해
harm
공정
fairness
불공정
cheating
충성
loyalty
배신
betrayal
권위
authority
불복종
subversion
순수
purity
타락
degradation
자유
liberty
억압
suppression
배려
care
1.00***
피해
harm
0.32*** 1.00***
공정
fairness
0.16*** 0.16*** 1.00***
불공정
cheating
0.14*** 0.15*** 0.22*** 1.00***
충성
loyalty
0.37*** 0.33*** 0.24*** 0.17*** 1.00***
배신
betrayal
0.11*** 0.22*** 0.13*** 0.08*** 0.23*** 1.00***
권위
authority
0.28*** 0.30*** 0.28*** 0.18*** 0.43*** 0.23*** 1.00***
불복종
subversion
0.18*** 0.29*** 0.21*** 0.13*** 0.25*** 0.19*** 0.27*** 1.00***
순수
purity
0.26*** 0.25*** 0.20*** 0.15*** 0.32*** 0.14*** 0.32*** 0.21*** 1.00***
타락
degradation
0.12*** 0.19*** 0.12*** 0.17*** 0.14*** 0.07*** 0.14*** 0.15*** 0.20*** 1.00***
자유
liberty
0.30*** 0.27*** 0.16*** 0.11*** 0.35*** 0.19*** 0.33*** 0.24*** 0.26*** 0.09*** 1.00***
억압
suppression
0.22*** 0.35*** 0.13*** 0.15*** 0.26*** 0.17*** 0.24*** 0.24*** 0.17*** 0.14*** 0.26*** 1.00***
p-value: **, "<0.05",신뢰가능; ***, "<=0.01",완전신뢰

이러한 연관성은 선행연구와 일관적이다. 하이트의 한 연구[14]는충성과 권위를 상호 묶인 개념이라는 점을 보였는데, 본 연구의 연결망 분석에서 드러난 권위-충성 간의 긴밀한 연결성은 하이트가 수행한 선행연구가 한국의 한 사례에도 적용된다는 한 근거자료가 된다. 가설에서 예상했던 바와 달리 낮은 단어사용빈도를 보였던 공정성 기반은 가장 높은 빈도를 보인 권위 기반과 어느 정도의 상대적 관련성(0.28)을 보이며 같은 부류의 도덕기반인 불공정과의 상관성(0.24)보다 약간 더 높은 관련성을 보인다.

이는 기술통계에서 공정성 기반이 상대적으로 꽤 낮은 빈도와 하위비율을 차지하지만 기사가 권위 관련 단어를 사용하여 해당 내용을 서술하는 맥락에서 공정 관련 어휘들이 의미 있게 사용된다는 점을 보인다고 할 수 있다. 그러나 공정성 기반과 권위 기반과의 상관성은 공정성 기반과 충성 기반의 상관성(0.43)과 비교하면 꽤 낮은 편에 속한다. 해당 주제에 관해 기사들은 기본적으로 권위 기반 어휘들을 가장 의미 있게 사용하며 이와 관련하여 가족이나 소속집단(ingroup)과 관련한 충성기반 단어들이 가장 긴밀한 맥락을 구성한다고 볼 수 있다.

4-3. 도덕기반 간 사회네트워크 분석

개별적인 도덕기반 유형 관련 단어의 성향성과 더불어 전체적인 도덕기반간의 상관관계를 함께 조망하기 위하여, Gephi에서 사회네트워크 분석을 수행했다. Gephi는 데이터 시각화 도구로서, 0.9.2 버전을 사용했고, 군집화 알고리즘은 Gephi에서 제공하는 Modularity[15][16]를 참조했다.

기본적인 상관관계는 앞 절에서 살펴본 상관분석의 결과와 같다. 다만 사회네트워크분석 기법을 통해서, 기사에 출현한 도덕기반 관련 단어들을 군집화하여 관계적 측면을 분석하고 이를 직관적으로 살펴볼 수 있는 시각화를 제시하고자 했다. 군집분석은 각 개체의 유사성을 측정하여 유사도가 높은 대상집단을 분류하고 군집에 속한 개체들의 유사성과 다른 군집에 속한 개체 간의 상이성을 규명하는 분석방법이다. 도덕기반 텍스트 데이터가 유사성이 높은 몇 개의 군집으로 분할되면, 이 군집을 통해 개체 중심의 빈도분석에서 얻을 수 없는 다른 관점에서의 정보를 도출할 수 있다.


Fig. 2. 
Social network between moral foundation and cluster analysis

본 연구에서는 군집분석을 위해 연구자가 유의미하다고 생각하는 단위로 도덕기반을 군집화하였다. 전체 도덕기반의 수가 크게는 여섯 개이고 긍정 및 부정 가(價)를 포함하여 총 열두 개인 점을 고려하여, 도덕기반을 세 개의 그룹으로 나누는 것이 적절하다고 판단하고 이를 위해서 설정값(resolution value)을 0.5로 설정하였다.

도덕기반을 군집화하면, 단순히 개별 도덕기반간의 관계에서 벗어나 전체적인 도덕기반 간 관계를 살펴볼 수 있다. 예를 들어 빈도 분석이나 상관관계 분석에서 드러난 것처럼 권위-충성 기반은 각기 관련 단어 출현빈도도 높고 두 기반 간의 연결성은 개별 간의 상관관계에서는 가장 강하다. 따라서 각 기반의 개별속성을 해석하는 데 있어 의미있는 개체로 간주한다. 그러나 다른 한편으로 권위와 충성 기반은 전체적인 도덕 기반 간 네트워크 안에서는 서로 다른 집단으로 분류된다. 이러한 현상은 사회네트워크 분석에서는 개별 요소 간의 관계뿐만이 아니라, 다른 요소들과의 상호 관계 속에서의 개별 요소들의 위상을 보여주기 때문이다.

먼저, 군집화 결과는 위 그림에서 같은 색으로 연결된 부분으로 세 종류의 군집으로 분류되며 다른 색깔로 시각화하였다. 군집화 결과로서 가장 높은 비율을 차지하고 있는 첫 번째 도덕기반 집단은 (피해-공정-불공정-배신-권위-불복종)이다. 그다음으로 높은 비율의 집단은 (배려-순수-충성) 집단, 그리고 마지막으로 (자유-타락-억압) 집단이다. 첫 번째 도덕기반 집단을 살펴보자. 기본적으로 본 논문에서 수집한 주제의 기사들은 공정성에 대한 문제 제기와 관련이 되기에 공정성 관련 단어 출현빈도는 낮게 나타나더라도 공정 기반을 중심으로 이에 상응하는 부정 속성인 피해-불공정이 나타나는 것은 자연스럽다고 볼 수 있다.

그런데 권위가 배신 기반이나 불복종 기반과도 같은 집단으로 분류되는 점은 이번 사건에서 상류층에 대한 기대가 배신당하고, 그로 인하여 상류층에 대한 권위가 실추되고 불복종이 이루어지는 현상을 암시하고 있다고 생각된다. 권위-배신-불복종 집단에 대한 해석의 타당성을 검토하기 위해 도덕기반 관련 형태소 출현빈도 상위 순위에 든 형태소를 검토하였다. 이 해석은 빈도나 상관관계를 보아서는 드러나지 않는다. 배신이나 불복종 기반은 기반 관련 단어출현 빈도로만 보면 전체적으로는 각기 1%와 4%로 최하위에 속하여 많은 단어가 출현하지 않는다. 또, 권위-배신 기반 간, 권위-불복종 기반 간의 상관관계도 각기 0.23, 0.27로 상대적으로 높지 않다. 그러나 전체로 보았을 때 도덕기반별 단어 중 출현 단어가 소수여서 빈도가 하위에 속한다 할지라도 그 형태소 개별적으로는 출현빈도가 상위에 있을 가능성이 있고 이 경우 도덕기반 속성에서 한 집단으로 묶일 수 있다.

이 가능성을 검토하기 위해 도덕기반 별 빈도가 아닌 형태소별 빈도와 함께 살펴볼 필요가 있다. 형태소별 빈도 상위 15%인 50개 형태소를 순위별로 살펴본 것이 아래 표 8이다. 형태소 ‘불법’은 네 번째 도덕기반 중 부정적 속성인 불복종 기반(유형 8)에 속하는 형태소이다. 이를 불복종 기반 전체단어들을 묶은 빈도와 비교해보면 유형 8 기반 전체 형태소는 하위권이지만, ‘불법’이라는 형태소 개별로 보면 총 474개의 도덕기반 관련 형태소들 중 출현빈도가 17번째로 상위 3.5퍼센트에 속한다. 이러한 요소가 권위-배신-불복종을 하나의 집단으로 묶이게 한 요소일 수 있다.

Table 8. 
Frequency of each MF morphem
빈도순
order of frequency
도덕기반 관련 형태소
moral fondation
related morphemes
도덕기반 유형
MF types
긍정/부정
positive/negative
출현빈도
frequency
1 대표 representative NNG 7 긍정positive 38892
2 가족 family NNG 5 긍정positive 25366
3 국가 country NNG 5 긍정positive 13912
4 열린open VV+ETM 11 긍정positive 12930
5 함께together MAG 5 긍정positive 11920
6 평화peace NNG 1 긍정positive 8872
7 이상ideal NNG 11 긍정positive 8298
8 따르follow VV 7 긍정positive 7916
9 특혜preference NNG 4 부정negative 7186
10 자리position NNG 7 긍정positive 7174
11 공정fair NNG 3 긍정positive 6608
12 개인individual NNG 11 긍정positive 5238
13 독립independe NNG 11 긍정positive 5224
14 가짜 fake NNG 10 부정negative 5072
15 아버지 father NNG 7 긍정positive 4632
16 불법 illegal NNG 8 부정negative 4576
17 진실truth NNG 9 긍정positive 4484
18 전쟁 war NNG 2 부정negative 4414
19 공감empathy NNG 1 긍정positive 4246
20 자격 qualification NNG 7 긍정positive 3818
21 보호 protection NNG 1 긍정positive 3814
22 규제 regulationNNG 12 부정negative 3730
23 강제 forced NNG 12 부정negative 3224
24 고위 senior NNG 7 긍정positive 3188
25 새로운 new VA+ETM 9 긍정positive 3010
26 통합 integration NNG 5 긍정positive 3010
27 제공 provided NNG 7 긍정positive 2868
28 따른 followVV+ETM 7 긍정positive 2648
29 막 block VV 8 부정negative 2640
30 공격 attackNNG 2 부정negative 2532
31 혁명 revolution NNG 8 부정negative 2424
32 명예 honor NNG 7 긍정positive 2418
33 제외 exlcusion NNG 4 부정negative 2356
34 열리 open VV 11 긍정positive 2340
35 피해damage NNG 2 부정negative 2336
36 안전 safety NNG 1 긍정positive 2310
37 배제 exclusion NNG 4 부정negative 2268
38 법률 law NNG 7 긍정positive 2226
39 평등 equity NNG 3 긍정positive 2208
40 어머니 mother NNG 7 긍정positive 2170
41 시위protest NNG 8 부정negative 2158
42 의무duty NNG 7 긍정positive 2130
43 문화culture NNG 1 긍정positive 2060
44 광복liberation NNG 11 긍정positive 1932
45 주민resident NNG 5 긍정positive 1906
46 폭력violence NNG 2 부정negative 1866
47 혜택benefit NNG 1 긍정positive 1736
48 권한authority NNG 7 긍정positive 1726
49 정당political party XR 3 긍정positive 1706
50 신분status NNG 7 긍정positive 1598

또한, 474개 중 상위 140개에서 권위와 한 집단으로 묶인 배신(유형 6) 기반의 출현 단어들은 ‘분열’, ‘적’, ‘이탈’, ‘기만’ 등이었다. 또, 140개 내의 불복종 (유형 8) 기반의 출현 단어들은 ‘불법’, ‘혁명’, ‘시위’, ‘선동’, ‘저항’ 이었다. 이 단어들은 권위-배신-불복종 기반이 한 집단으로 묶인 해석과 관련한 키워드로 보인다.

두 번째 집단인 배려-순수-충성 집단은 가족이나 소속집단을 중심으로 하는 충성 기반을 중심으로 ‘공감’과 ‘보호’와 같은 단어로 대표되는 배려 기반과 ‘결백’과 ‘겸손’ 같은 단어로 대표되는 순수 기반이 제시되고 있다. 이는 두 가지 측면으로 해석될 수 있다. 한 측면은 가족을 사적인 집단으로 상정하고 사적인 집단인 가족에 대해서는 공감과 보호를 하는 옹호적인 측면을 보여주고 있다는 점이다. 또다른 측면은 가족을 공적인 집단으로 보고 결백과 겸손의 순수 분류를 요구하는 양면적인 양태를 보인다. 또한, 이러한 현상은 연구 대상이 된 신문기사의 특성상 기계적인 중립을 유지하기 위한 옹호 입장의 논리가 반영된 결과일 수도 있다.

마지막으로 자유-억압-타락 기반은 그 구성원 모두가 비교적 높은 출현빈도를 보이지는 않지만, 개인의 가치를 높이 보는 ‘자유’ 기반을 중심으로 혐오와 부패로 대표되는 ‘타락’ 기반과 강요로 대표되는 ‘억압’ 기반이 연결됨으로 인하여, 개인의 자유에 대한 부정적인 정서를 표출하고 있다. 그런데 자유-억압-타락 관련 어휘는 해당 사건에서 큰 비중을 차지하지 않고 있다. 이는 ‘권위’ 분류나 ‘충성’ 분류보다 개인의 가치를 높이 보는 ‘자유’ 분류가 한국 사회, 최소한 해당 사안에서는 크게 드러나지 않았음을 알려주고 있다. 이는 최소한 기사의 서술이 개인주의적, 서구적 가치보다는 집단주의적, 아시아적 가치의 태도지향이 있다[17]는 점을 보인다.


V. 결론

이 연구는 입시 관련 기사들의 도덕판단 유형을 분석하기 위하여, MFD오리지널-한국어버젼 도덕기반사전과 MFD오리지널-한국어버젼 도덕기반 형태소 사전을 구축하고, 이를 기반으로 빈도분석, 상관관계 분석, 사회네트워크 분석을 통해 경향성을 살펴보았다. 도덕기반 단어 출현빈도에 대한 분석 결과 기사들은 주로 ‘권위’ 기반, 그리고 그 다음으로는 ‘충성’ 기반의 틀로 사안을 파악한다는 점을 보았다. 반면 가설과는 달리빈도가 낮았던 ‘공정’ 기반은 피해, 불공정, 배신, 권위, 불복종 기반과 유사한 속성집단으로 분류되어 어휘출현의 맥락이 부분적으로 연관되어 있음을보여준다. 지금까지의 검토는 다음의 세 가지 시사점을 드러낸다.

첫째, 높은 빈도를 보인 권위(authority) 기반과 관련하여 한국에서 입시는 단순히 생계나 직업을 선택하기 위한 수단으로서만이 아니라 소위 ‘자리’와 같은 계층의 문제로 보여진다. 둘째, 두 번째로 높은 빈도를 보인 충성 및 내집단 기반이 권위 기반과 밀접한 연결망을 가진다는 점은 시사적이다. 이는 집단 구성이 능력 위주의 현대적 방식이 아니라 가족이나 소속집단 위주로 이루어짐을 암시한다. 셋째, 높은 빈도를 보일 것으로 예상했던 공정성 기반단어가 낮은 출현빈도를 보인 점은 관련 기사들이 정의의 문제로 보지 않는다고 해석할 수 있다. 이와 더불어, 각 도덕기반의 부정적 단어들은 긍정적 단어에 비해 출현빈도가 현저하게 낮다는 점은 기사의 공적 특성에 기인하는 것으로 보인다.

이 논문은 선행연구에서 주로 정치영역의 이슈들을 분석하는 데 사용되었던 도덕기반이론을 ‘입시’라는 한국에서 중요한 주제에 적용하여 응용영역을 넓히고 기사의 서술 속에서 도덕적 성향을 검토하고자 하였다. 해당기사 데이터들이 어떤 도덕기반단어에 기반을 두는지에 대한 빈도분석은 ‘무엇(what)’의 측면에 대해 검토한 것이며, 상관관계분석과 네트워크 군집분석은 ‘어떻게(how)’ 그런 빈도가 보이는지를 부분적으로 드러내었다고 할 수 있다. 이러한 결과는 국내외에서 아직 연구되지 않은 분야의 주제에 대해 도덕기반사전을 활용해 텍스트분석을 했다는 점에서 의미가 있다. 또 한국적 맥락이 들어간 한국형 도덕기반사전이 베타버전으로나마 구성되어 도덕성 관련 분석에 더욱 적절한 단어목록이 제시되었다고 할 수 있다. 더 나아가 정책입안자나 교육자들이 한국에서의 교육 및 입시 관련 사안에 대해 사람들의 가치판단을 파악하고 정책을 결정하기 위한 참고자료로 사용할 수 있다.


Acknowledgments

이 논문은 2019년 대한민국 교육부와 한국연구재단의 인문사회분야 신진연구자지원사업의 지원을 받아 수행된 연구임(NRF-2019S1A5A8033706)


참고문헌
1. Haidt, J., & Joseph, C. “Intuitive ethics: How innately prepared intuitions generate culturally variable virtues”, Daedalus, 133(4), pp. 55-66, Fall 2004
2. Lee, J., Cho, K., “Differences in moral foundations between liberals and conservatives”, The Korean Journal of Social and Personality Psychology, 28(1): pp. 1-26, Feb 2014
3. Jeong, E., et al., “Difference between moral value judgment of progress and conservative”, The Korean Journal of Social and Personality Psychology, 25(4), pp. 93-105., Nov 2011
4. Garten, J., Reihane B., Joe Hoover, Kate M. Johnson, andDehghani, "Morality between the lines: Detecting moral sentiment in text" in Proceedings of IJCAI 2016 workshop on Computational Modeling of Attitudes, New York:NY, 2016.
5. Kaur, R. and Sasahara, K., “Quantifying moral foundations from various topics on twitter conversations.” in 2016 IEEE International Conference on Big Data, Washington, D.C.:DC, pp. 2505–2512, 2016
6. Graham et al., "Moral foundations theory: The pragmatic validity of moral pluralism", Advances in experimental social psychology, vol. 47, pp. 55-130. Academic Press, April 2013
7. Haidt, J., The righteous mind: Why good people are divided by politics and religion, Reprint edition. New York:NY, Vintage, 2012.
8. Graham, J., Haidt, J., & Nosek, B. A., “Liberals and conservatives rely on different sets of moral foundations,” Journal of personality and social psychology, 96(5), pp. 1029, May 2009.
9. MFDO:MFD original. Available: https://moralfoundations.org/wp-content//uploads/files/downloads/moral%20foundations%20dictionary.dic. Accessed 1 May 2020.
10. All data already opened. Available: https://osf.io/deg8f/. Accessed 1 May 2020.
11. Hoover, Joe, et al., “Moral Foundations Twitter Corpus: A collection of 35k tweets annotated for moral sentiment,” Social Psychological and Personality Science 1948550619876629, pp. 1-15, February 2020
12. python-mecab-ko-1.0.8. Available: https://github.com/jonghwanhyeon/python-mecab-ko. Accessed 1 May 2020.
13. Oh, C., “Discourse on voter mobilization of Korean political parties through moral-based theory”,  in 2016 the latter part of Sociological Conference for The Korean Sociological Association, Seoul, pp. 456-474., 2016.
14. Haidt, J., “Morality”, Perspectives on Psychological Science, 3(1), pp. 65–72, Jan 2008
15. Vincent D Blondel, Jean-Loup Guillaume, Renaud Lambiotte, Etienne Lefebvre, “Fast unfolding of communities in large networks”, Journal of Statistical Mechanics: Theory and Experiment, 2008(10), October 2008, ArXiv ePrint: 0803.0476
16. Lambiotte, R., Delvenne, J. C., & Barahona, M., “Laplacian dynamics and multiscale modular structure in networks”, arXiv preprint arXiv:0812.1770., 2008
17. Hofstede, Geert., Culture's consequences: Comparing values, behaviors, institutions and organizations across nations. Thousand Oaks, CA, Sage publications, 2001.

저자소개

김효은(Hyo-eun Kim)

2007년 : 워싱턴대학교(센루이스) 대학원 (인지과학 석사)

2006년 : 이화여자대학교 대학원 (철학박사-심리철학)

2011년 ~ 2012년 뉴욕대학교 철학과 객원학자

2013년 ~ 2013년 한국고등과학원 초학제연구단 주니어 펠로우

2014년~ 2015년 인제대학교 인간환경미래 연구원 전임연구원

2016년~ 현 재: 한밭대학교 인문교양학부 교수

※관심분야:도덕감정, 의식, 지각, 부작위 등

김바로(Ba-ro Kim)

2011년 : 북경대학교 역사학과 (역사학 석사)

2017년 : 한국학중앙연구원 한국학대학원 인문정보학 (철학박사-디지털인문학)

2018년~현 재: 중앙대학교 인문콘텐츠연구소 HK+사업단(어젠다:인공지능인문학) HK연구교수

2019년~현 재: 한국외국어대학교 강사

※관심분야: 디지털인문학, 인공지능인문학, 인문데이터