언론에서 나타난 한국 사회의 미래 질병 위험 이슈 분석: 토픽 모델링 분석을 중심으로
Copyright ⓒ 2024 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
초록
본 연구는 언론에서 나타난 한국 사회의 미래 질병 위험 이슈를 분석함으로써, 국내에서 주목받았던 미래 질병 위험과 시간에 따른 위험 요인의 변화를 파악하여, 향후 중점적으로 대응해야 할 미래 질병 위험을 식별하기 위해 수행되었다. 이를 위해 2010년부터 2023년 2월까지 보도된 54,096건의 미래 질병 위험 관련 뉴스 기사를 대상으로 토픽 모델링 분석을 수행한 결과, 총 15개의 토픽과 5개 차원의 이슈를 도출하여, 예방 중심의 보건 정책 강화, 정신 건강 지원 체계 구축, 취약 계층 복지 확대, 환경 보건 위험 관리 강화, 국제협력을 통한 글로벌 건강 문제 해결 등의 정책적 시사점을 제시하였다.
Abstract
This study conducted an analysis to identify future disease risks that require a focused response, considering the future disease risk issues reported in the media of the Korean society. By understanding the future disease risks garnering domestic attention and their time series changes, this research aims to pinpoint the disease risks that should be prioritized in the future. The study conducted topic modeling analysis on 54,096 news articles related to future disease risks reported from 2010 to February 2023, thereby identifying a total of 15 topics and five issue dimensions, which led to several policy implications, including strengthening preventive health policies, building mental health support systems, expanding welfare for vulnerable populations, enhancing management of environmental health risks, and addressing global health issues through international cooperation.
Keywords:
Future Disease, Risk Issue, News Data, Topic Modeling, Latent Dirichlet allocation키워드:
미래 질병, 위험 이슈, 뉴스 데이터, 토픽 모델링, 잠재 디리클레 할당Ⅰ. 서 론
2020년, 세계보건기구(World Health Organization, WHO)는 다가오는 10년간 긴급히 대처해야 할 주요 건강 문제들을 강조하며, 세계 각국과 지역, 국제기구 간의 협력을 통한 즉각적인 투자의 필요성을 제시하였다. WHO는 이 시기의 주요 과제로서, 기후 위기에 따른 건강 문제, 분쟁 지역에서의 의료 서비스 제공, 건강 불평등, 의약품 접근성, 전염성 질환의 확산, 팬데믹 예방 및 대비, 유해 물질 및 식품, 보건 인력 투자, 청소년 건강과 안전, 공중보건 정책에 대한 신뢰, 신기술 활용, 항생제 내성, 위생 문제 등 13가지 과제를 제안했다[1].
WHO는 2019년에도 전 세계 인구의 건강에 영향을 미칠 수 있는 여러 문제들을 발표하였으나, 2020년에 발표된 과제들은 2019년 과제들과 다소 차이를 보였다. 특히, WHO는 2019년에 ‘대기오염과 기후변화’라는 용어를 사용하였으나, 이를 2020년에는 ‘기후 논쟁에서 건강 증진’으로 변경하며, 기후 변화와 관련된 이슈들을 강조하였다[2]. 이러한 변화는 보건 정책에 영향을 미치는 질병 위험 이슈가 시간에 따라 조금씩 변화할 수 있음을 시사한다. WHO는 미래의 건강 위험 요소들을 발표하면서, 공중보건이 각국의 정치적 결정에 영향을 받으며, WHO가 진행 중인 활동들과 함께 보건 문제 해결을 위한 방안들을 마련하고 있다고 밝혔다. 이와 같은 맥락에서 볼 때, 국가의 보건 사업은 미래의 건강 위험 요소를 바탕으로 구체화되며, 이러한 위험 요소들을 기반으로 보건 정책의 전반적인 방향과 전략을 설정할 수 있다.
미국과 영국에서도 국가 보건 정책의 미래 우선순위와 방향을 체계적으로 설정하는 사례를 찾아볼 수 있다. 미국 질병통제예방센터(Centers for Disease Control and Prevention, CDC)는 2022년부터 2027년까지의 전략 계획을 발표했으며, 이 계획에서는 과학과 건강 형평성 향상, 건강, 안전, 보장의 공평한 보호를 포함하는 통합된 미래 비전을 제시하였다[3]. 또한 이 계획에는 기후와 건강, COVID-19, 모성 건강, 흡연, 건강 불평등 감소 등의 이슈가 포함되어 있으며, 이는 미국의 주요 정책 과제뿐만 아니라 WHO의 주요 국제보건 의제에도 부합한다[4].
2023년 영국 보건안보청(UK Health Security Agency) 도 현재와 미래의 질병 위험으로부터 국민의 건강을 지키기 위한 2023년부터 2026년까지의 전략 계획을 발표하였다. 이는 보건안보청의 전신인 공중보건청(Public Health England)이 2019년에 발표한 2020년부터 2025년까지의 전략을 이어받는 것으로, 미래의 중요한 공중보건 이슈들을 주기적으로 파악하고 대응하는 업무의 연속성을 보여준다. 2023년부터 2026년까지의 전략에는 ‘건강 위협에 대한 준비’, ‘백신을 통한 건강 결과 개선’, ‘환경 위협으로부터의 건강 보호’ 등을 포함한 보다 포괄적인 용어를 사용하여 보건안보청이 대응하고자 하는 주요 우선순위를 제시하였다[5].
한국 내에서는 현재 보건정책이 미래 대비를 위한 체계적인 전략이나 사회환경 변화에 대한 분석보다는 현안에 대한 단기적 대응에 더 집중하고 있다. 공공보건의료 기본계획, 감염병 예방관리 기본계획, 국민건강증진종합계획, 질병관리청 백서 등 다양한 국가 대책 및 계획과 보고서가 법적 근거를 토대로 작성되었으나, 이러한 자료들은 기본 목적에 충실하면서도 국가의 미래 예측 및 수요와 사회환경 변화에 대한 검토가 부족하다.
따라서, 미래의 건강과 질병에 영향을 미칠 수 있는 이슈들을 탐색하고 이에 대비하는 보건정책 방향을 제시하는 것은 국내외적으로 지속되어야 할 중요한 과제이다. 급변하는 사회환경을 고려할 때, 이러한 미래 이슈 탐색은 일회성에 그치지 않고 최신 동향을 반영하여 주기적으로 수행되어야 하며, 미래 질병 위험 요인에 대한 사회적 의견을 수렴하여 보건의료정책 수립의 방향을 제시하는 것이 필요하다.
미래의 질병 위험 이슈를 탐색하는 방법의 한가지로, 언론 분석을 수행할 수 있다. 언론매체는 뉴스를 통하여 사회적 중요성이 있는 주제를 설정하고, 관련된 상황을 제시하며, 원인과 결과를 분석하여 사회적 문제의 해결 방안을 모색하는 기능을 담당할 수 있다. 또한 뉴스는 사회적 현상을 해석하고 다양한 견해를 나누는 공공의 장(Public Sphere) 역할을 함으로써, 사회적 이슈 분석에 있어서 중요한 자료가 된다[6]. 언론 분석은 비록 과거에 발생한 자료를 활용하는 것이지만, 과거에 제시 되었던 미래 질병 위험 주제를 살펴보고 주제별 현재 국가의 대비 수준과, 주제의 변화 과정을 살펴보는 것은 앞으로 발생할 위험 예측에 도움이 될 수 있을 것이다. 따라서 본 연구에서는 뉴스를 통해 과거 국내에서 주목받았던 미래 질병 위험을 탐색하고, 시간의 흐름에 따른 국내 이슈의 변화를 파악함과 동시에 향후 중점적으로 대응해야 할 미래 질병 위험을 식별하기 위한 기반 자료를 제공하고자 한다.
Ⅱ. 국내외 미래 위험 예측 및 토픽 모델링 선행연구 고찰
미래의 위험 요인을 탐색하는 연구는 최근 중요한 주제로 자리 잡고 있다. 특히 건강과 보건 분야에서 이러한 미래 위험 요인의 탐색은 광범위한 사회적 이슈와 연결되어 있다. 본 장에서는 최근의 선행 연구들을 통해 제시된 미래 위험 요인들을 살펴보고자 한다.
2018년 5월 설립된 국회미래연구원은 다양한 미래 연구를 수행하며 국가의 중장기 발전 전략을 모색해왔다. 이들이 수행한 ‘대한민국 미래전망 연구’에서는 성숙사회를 새롭게 정의하고, 미래를 Business As Usual(BAU), 선호미래, 회피미래의 세 가지 시나리오로 나누어 전망했다[7]. 이 연구는 미래를 6대 분야로 분류하고 2050년을 목표로 한 전망을 제시했다. 이 과정에서 30명의 전문가와 함께 각 분야의 트렌드를 분석하고, 내외부 전문가들의 논의를 통해 선호미래를 향한 시나리오를 제시하였다. 또한 선호미래 실현을 위한 2027년 최우선 정책과 2037년의 중장기 전략을 도출하였다.
국회미래연구원의 ‘2022년 주목할 15개 이머징 이슈’ 연구에서는 최근 20년간의 문헌을 분석하여 신규성, 확장성, 파급효과의 3가지 기준을 통과한 주요 키워드를 도출하면서 감염병 환자 수요 증가, 정신건강 악화에 대해 언급했다[8]. 이 연구는 머신러닝 기법을 활용하여 향후 5년 내에 중요해질 키워드를 예측하고, 분야별 전문가들의 의견을 수집하여 이머징 이슈를 선정했다.
국제적인 차원에서의 미래 위험 평가 연구를 살펴보면, 먼저 글로벌 리스크 인식조사를 통해 세계경제포럼에서 발간한 ‘글로벌 리스크 리포트’를 참고할 필요가 있다. ‘글로벌 리스크 리포트’에서는 전 세계에 영향을 미칠 위험 요인과 그 준비도를 조사하였으며, 다양한 분야의 위험을 단기와 장기 위험으로 구분하여, 전문가들에게 해당 위험 요인들의 영향을 평가하도록 했다[9]. 조사결과 단기적인 위험으로는 생활비 위기가, 장기적인 위험으로는 기후변화 완화 실패가 각각 1위로 평가되었다.
한편 과거부터 현재까지의 질병 추세를 분석하고, 미래에 중점을 두어야 할 질병의 종류와 부상을 조사한 연구도 있다[10]. The Lancet 저널에 게재된 이 연구는 1990년부터 2019년까지 204개국에서 발생한 369개 질병과 부상의 질병부담을 분석했다.
세계보건기구에서는 ‘이머징 트렌드 및 기술’ 발간물을 통해 세계 보건의 미래를 형성할 수 있는 15개의 새로운 기술 및 과학적 발전을 제시했다. 호라이즌 스캔 방법론을 이용하여 향후 20년간 국제 보건에 중요한 영향을 미칠 기술 및 발전을 소개하였으며, 전문가 그룹에게 익명으로 문제를 제안하도록 하여 미래에 영향을 미칠 이슈를 도출했다.
보건 분야에서는 보건 관련 이슈 및 트렌드를 분석하기 위해 머신러닝 기법인 토픽 모델링 분석 방법을 활용하고 있다. 조경원 등은 보건의료산업 연구동향을 파악하기 위해 보건의료산업학회지를 대상으로 토픽 트렌드를 분석했고[11], 조원광은 한국의 공중 보건 위기 초기 대응에서 나타난 특징과 함의를 도출하기 위해 메르스와 코로나19 초기 언론보도에 대해 토픽 모델링 분석을 수행했다[12].
본 논문에서 고찰한 국내외 선행 연구는 지역·국가별 특정 상황을 반영한 위험 요인 도출에 중점을 두기보다는 세계적인 이슈를 광범위하게 다루었다. 세계적 동향을 이해하는 것은 국내 상황을 분석하는 데 도움이 될 수 있으나, 국외 연구에서 도출된 모든 이슈가 국내 상황에 그대로 적용되지 않을 수 있음을 고려해야 한다. 또한 기존의 빅데이터를 활용한 토픽모델링 분석에서는 미래의 건강 위험 요인을 도출해내고자 한 연구가 많지 않다. 이에 따라, 국내의 뉴스 빅데이터를 활용하여 한국에서 시기별로 언급되어온 주요 미래 질병 위험 요인을 탐색하려는 시도가 필요하다.
Ⅲ. 연구방법
3-1 자료 수집
뉴스 분석에 있어서 토픽 모델링 방법은 유용하게 활용된다. 이는 머신러닝을 이용한 대규모 뉴스 데이터의 처리, 뉴스 내 잠재된 주제의 발견, 시간 순으로 정렬된 뉴스 데이터의 분석, 자동화된 키워드 및 뉴스 분류가 가능하기 때문이다. 이러한 기능 덕분에 토픽 모델링 방법은 방대한 뉴스 데이터를 효과적으로 분석하고 이슈를 추출하는데 적합한 도구로 사용될 수 있다[13].
본 연구에서는 2010년부터 2023년 2월까지 발표된 미래 질병 위험에 관한 뉴스 빅데이터를 세 시기로 나누어 수집한 뒤, 데이터 및 키워드의 정제 과정을 거쳐 토픽 모델링 분석을 통해 각 시기별 주요 이슈 및 변화를 분석함으로써 미래 질병 위험에 대한 시사점을 도출하고자 하였다.
2023년 2월 28일을 기준으로 한국언론진흥재단의 뉴스 빅데이터 분석 플랫폼인 빅카인즈(BIGKinds)에 등록된 모든 언론 매체를 대상으로 뉴스 데이터를 수집하였다. 수집된 언론 매체는 총 54개로, 이는 중앙지 11개, 지역지 28개, 경제지 8개, 전문지 2개, 방송국 5개로 구성되어 있다.
미래 질병 위험에 관한 뉴스 분석은 2010년 1월 1일부터 2023년 2월 28일까지의 기간 동안 수행되었으며, 이 기간을 세 구간으로 나누어 분석하였다. 세 번째 구간은 코로나19 국내 첫 확진자 발생 일자인 2020년 1월 20일을 기준으로 하여 2020년 1월 1일부터 2023년 2월 28일까지로 설정하였으며, 첫 번째 및 두 번째 구간은 2020년 1월 1일을 기점으로 하여 각각 5년 간격(첫 번째 구간은 2010년 1월 1일부터 2014년 12월 31일까지, 두 번째 구간은 2015년 1월 1일부터 2019년 12월 31일까지)으로 정의하였다.
뉴스 수집을 위한 검색 조건은 미래, 질병, 위험에 관련된 키워드를 중심으로 OR 연산자를 사용하여 유사 키워드를 결합하고, 이들을 AND 연산자로 결합하여 최종적인 검색식을 구성하였다. 관련성이 낮은 뉴스를 제외하기 위해 인터뷰, 신년사, 수상 소식, 운세 등의 키워드를 포함하는 뉴스는 NOT 연산자를 사용하여 검색에서 제외하였다. 최종적으로 설정된 검색식은 [(미래 OR 새로운 OR 새롭게 OR 이머징 OR 전례없는 OR 전례 없는 OR 전례없이 OR 전례 없이) AND(보건 OR 질병 OR 건강) AND(위험 OR 위기 OR 이슈) NOT(인터뷰 OR 신년사 OR 시정 OR 도정 OR 운세 OR 드라마 OR 장관상 OR 정부포상 OR 국민훈장 OR 최우수상)]이다.
2010년부터 2023년 2월까지의 기간 동안 수집된 미래 질병 위험 관련 뉴스 데이터는 총 77,043건이었다. BIGKinds 플랫폼의 중복 및 예외 기사 필터링 기능을 활용하여 중복되거나 연구 목적에 부합하지 않는 기사를 제외한 후, 연구 팀은 추가적으로 각 기사를 검토하여 특정 주식, 보험, 상품 광고, 신년사, 특정 후보의 선거 공약 등 연구 목적에 맞지 않는 기사를 추가로 제외하였다. 이 과정을 거쳐 22,947건의 기사를 제외하고 최종적으로 54,096건의 기사가 분석에 사용되었다.
3-2 분석 방법
이 연구에서는 텍스트 집합에서 다수의 토픽이 존재하며, 각 키워드가 특정 토픽에 속할 확률을 가정하는 LDA(Latent Dirichlet Allocation, 잠재 디리클레 할당) 기법을 채택하여 토픽 모델링 분석을 수행하였다. 이 방법은 텍스트 내에서 토픽별로 키워드와 문서를 분류하는 데 유용하다[14].
분석 도구로는 한국어 형태소 분석에 특화된 넷마이너(NetMiner) 소프트웨어와 파이썬으로 작성된 ‘토픽 모델링 플러그인’ 스크립트가 활용되었다. 이 도구를 통해 1) 빈도분석 및 TF-IDF 분석을 기반으로 한 용어 사전의 구축, 2) 실루엣 계수를 활용한 토픽 모델링의 최적화 검증, 3) 토픽별 키워드 및 뉴스의 분류, 4) 토픽명의 결정을 위한 토픽별 뉴스 원문 및 키워드의 검토 과정을 진행하였다.
먼저, 키워드의 정제를 위해 빈도 및 TF-IDF 분석을 통해 정의어, 유사어, 제외어 사전을 생성하고, 이를 토픽 모델링 분석에 적용하였다. 정의어 사전은 고유명사를 정확히 추출할 수 있도록, 유사어 사전은 비슷한 의미의 다양한 단어를 하나로 통합할 수 있도록, 제외어 사전은 분석 목적에 부합하지 않는 용어를 배제할 수 있도록 구성되었다. 이 사전들은 TF-IDF 값 0.6을 기준으로 업데이트되며, 공백으로 구분된 단어는 별도의 단어로 처리되었다. 최종적으로 연구팀의 회의를 거쳐 사전에 포함될 단어들을 선정하였다.
토픽 모델링의 최적화를 위한 파라미터 결정에는 실루엣 계수가 활용되었다. 실루엣 계수는 특정 키워드가 속한 클러스터 내 다른 키워드들과의 근접성 및 다른 클러스터와의 거리를 수치적으로 나타내는 지표로, -1부터 +1 사이의 값으로 표현되며, +1에 가까울수록 토픽 모델링의 분류가 잘 이루어졌음을 의미한다. 실루엣 계수를 활용한 토픽 모델링 선행연구 방법을 반영하여 α값을 0.01에서 0.1까지, β값을 0.01에서 0.02까지 변화시키며, 토픽 수를 5에서 10까지 설정하여 총 120가지 시나리오에 대해 실루엣 계수를 계산하였다[15]-[17]. 계산 결과, 각 기간별로 최적화된 파라미터 설정 값이 도출되었다. 1기는 α값 0.06, β값 0.02, 토픽 수 5개일 때, 2기는 α값 0.04, β값 0.01, 토픽 수 5개일 때, 3기는 α값 0.02, β값 0.01, 토픽 수 5개일 때 실루엣 계수가 +1에 가장 근접하게 나타나, 해당 파라메타 값을 반영하여 토픽 모델링 분석을 수행하고, 토픽의 시계열 비중 변화를 선형예측 회귀분석으로 나타냈다.
토픽별 키워드 및 뉴스 분류 후에는 키워드와 관련된 주요 뉴스를 선정하고, 토픽별로 뉴스 원문 및 키워드를 검토하여 최종적으로 토픽명을 확정하였다. 이 과정에서 한국보건사회연구원 연구위원 1명, 부연구위원 2명, 연구원 1명, 한국과학기술정보연구원 연구원 1명 등 보건분야 및 토픽 모델링 전문가 5명의 토의를 통해 각 토픽에 대해 가장 적절한 명칭을 부여하였다.
Ⅳ. 연구 결과
시기별로 도출된 미래 질병 위험 관련 토픽, 비중 및 보도의 증감 결과는 다음과 같으며, 토픽별로 도출된 주요 키워드는 출현확률(Probability) 상위 10개의 키워드를 시각화하여 그래프로 제시하였다.
4-1 제1기(2010년 1월 ~ 2014년 12월) 분석 결과
[토픽 1]에는 ‘환자’, ‘치료’, ‘질병’, ‘병원’, ‘건강’, ‘위험’, ‘수술’, ‘발생’, ‘예방’, ‘사람’ 등이 주된 키워드로 도출되었다. 이 키워드 및 키워드 관련 뉴스를 바탕으로 이 토픽의 명칭을 ‘만성질환 발생 위험 증가와 예방 전략’으로 명명했다. 해당 토픽은 2,409건이 보도되었으며, 전체 토픽 중 23.92%를 차지한다. 이 토픽의 보도 비중은 시간이 지남에 따라 감소하는 경향(y = -0.0011x + 0.2799)을 보였다.
[토픽 2]에서는 ‘사람’, ‘사회’, ‘생각’, ‘대한민국’, ‘건강’, ‘정신’, ‘세계’, ‘마음’, ‘시작’, ‘어린이’ 등이 중요한 키워드로 드러났다. 이에 따라 이 토픽의 명칭을 ‘한국사회의 다양한 정신건강 문제’로 설정하였다. 이 토픽은 총 1,754건의 뉴스 보도를 포함하며, 전체에서 17.42%의 비중을 차지한다. 보도 비중은 시간에 따라 증가하는 추세(y = 0.0007x + 0.1514)를 보인다.
[토픽 3]에서는 ‘교육’, ‘지역’, ‘지원’, ‘사업’, ‘학교’, ‘사회’, ‘청소년’, ‘안전’, ‘학생’, ‘건강’ 등의 키워드가 도출되었으며, 이를 기반으로 ‘위기 아동·청소년을 위한 사회안전망 부족’이라는 토픽명을 정의하였다. 이 토픽은 1,984건의 뉴스 보도를 포함하며, 전체 분석 대상 중 19.70%를 차지한다. 보도 비중은 점차 증가하는 경향(y = 0.0008x + 0.169)을 나타냈다.
[토픽 4]는 ‘기업’, ‘산업’, ‘시장’, ‘세계’, ‘대한민국’, ‘경제’, ‘성장’, ‘정보’, ‘미래’, ‘환경’ 등이 핵심 키워드로 확인되었다. 이 키워드들을 바탕으로 ‘기후변화 대응 및 녹색성장에 대한 요구 증가’라는 토픽명을 지정하였다. 이 토픽은 총 2,380건의 보도를 포함, 전체의 23.63%를 차지한다. 보도 비중은 증가하는 경향(y = 0.0005x + 0.2219)을 보였다.
4-2 제2기(2015년 1월 ~ 2019년 12월) 분석 결과
[토픽 1]에서 주요하게 도출된 키워드는 ‘질병’, ‘병원’, ‘치료’, ‘건강’, ‘위험’, ‘발생’, ‘의료’, ‘수술’, ‘예방’, ‘검사’ 등이었다. 이러한 키워드와 관련 뉴스를 기반으로, 해당 토픽의 명칭을 ‘질병 예방과 진단을 위한 미래기술의 발전’으로 결정하였으며, 이와 관련된 뉴스는 전체 토픽 중 20.87%에 해당하는 3,908건이 보도되었다. 해당 토픽의 보도 비중은 시간이 지남에 따라 감소하는 경향(y = -0.0006x + 0.2256)을 보였다.
[토픽 2]에서는 ‘사람’, ‘사회’, ‘생각’, ‘여성’, ‘대한민국’, ‘세계’, ‘이야기’, ‘동물’, ‘건강’, ‘정신’ 등이 주요 키워드로 나타났다. 이 키워드들을 바탕으로, ‘한국사회의 다양한 갈등 해결과 건강한 관계 맺기’로 토픽명이 지정되었으며, 총 2,944건의 보도가 이 토픽에 속하였다. 이는 전체의 15.72%를 차지하며, 보도 비중은 제2기 내에서 점차 증가하는 추세(y = 0.0001x + 0.1562)를 나타냈다.
[토픽 3]의 분석에서는 ‘지원’, ‘지역’, ‘사업’, ‘보험’, ‘교육’, ‘사회’, ‘복지’, ‘건강’, ‘센터’, ‘안전’ 등이 핵심 키워드로 확인되었다. 이에 따라 토픽명을 ‘취약계층 지원 및 복지사각지대 발굴의 중요성’으로 설정하였으며, 이는 4,653건의 보도로 전체 토픽 중 24.85%를 차지했다. 보도 비중은 시간에 따라 증가하는 경향(y = 0.0014x + 0.2081)을 보였다.
[토픽 4]에서는 ‘산업’, ‘기업’, ‘시장’, ‘정보’, ‘대한민국’, ‘투자’, ‘서비스’, ‘성장’, ‘세계’, ‘제품’ 등이 주된 키워드로 드러났다. 이를 근거로 ‘4차 산업혁명에 따른 의료기술의 변화’라는 토픽명이 정해졌으며, 3,878건의 보도가 포함되었다. 이는 전체 토픽의 20.71%를 차지하며, 보도 비중은 감소하는 경향(y = -0.0001x + 0.213)을 나타냈다.
4-3 제3기(2020년 1월부터 2023년 2월) 분석 결과
[토픽 1]에서는 ‘사람’, ‘건강’, ‘질병’, ‘치료’, ‘위험’, ‘환자’, ‘여성’, ‘발생’, ‘운동’, ‘병원’ 등이 주요 키워드로 도출되어, ‘생활습관 및 예방적 건강관리의 중요성’으로 토픽명을 정의하였다. 이 토픽은 3,934건의 보도를 포함하며, 전체 토픽의 15.55%를 차지한다. 보도 비중의 시계열적 변화는 증가 추세(y = 0.0022x + 0.1221)를 나타낸다.
[토픽 2]에서는 ‘코로나바이러스감염증’, ‘백신’, ‘감염’, ‘확진’, ‘방역’, ‘접종’, ‘환자’, ‘상황’, ‘바이러스’, ‘의료’ 등이 주요 키워드로 나타나, 키워드와 관련 뉴스를 참고하여 토픽을 ‘코로나19로 인한 의료시스템 위기상황과 감염병 대응 역량 강화 필요성’으로 명명하였다. 이 토픽에는 5,014건의 보도가 있으며, 전체의 19.82%를 차지하고, 시간에 따른 보도 비중은 감소 추세(y = -0.0017x + 0.2306)를 보인다.
[토픽 4]에서는 ‘지원’, ‘교육’, ‘지역’, ‘사회’, ‘복지’, ‘안전’, ‘학교’, ‘코로나바이러스감염증’, ‘도시’, ‘학생’ 등이 주요 키워드로 도출되었으며, ‘포스트 코로나 시대의 학생 교육 및 정서 건강 관리’로 토픽명을 지정하였다. 총 5,640건의 보도가 이 토픽을 다루었으며, 이는 전체의 22.30%에 해당한다. 보도 비중은 증가하는 추세(y = 0.0029x + 0.1771)를 보인다.
[토픽 4]에서는 ‘기업’, ‘산업’, ‘시장’, ‘경제’, ‘코로나바이러스감염증’, ‘투자’, ‘대한민국’, ‘가능’, ‘환경’, ‘보험’ 등이 핵심 키워드로 도출되어, ‘지속가능한 미래를 위한 산업계의 환경 문제 대응’으로 토픽명을 부여하였다. 이 토픽에 대한 보도는 5,427건으로, 전체에서 21.45%를 차지하며, 보도 비중은 증가 추세(y = 0.0013x + 0.1949)를 나타낸다.
Ⅴ. 요약 및 시사점
5-1 요약
2010년부터 2023년 2월까지 보도된 54,096건의 미래 질병 위험에 관련된 뉴스 기사를 대상으로 한 토픽 모델링 분석을 통해, 국내 언론이 다룬 미래 질병 위험에 대한 주요 이슈들을 탐색하였다.
분석 기간을 세 구간으로 나누었고, 제1기(2010년부터 2014년까지)에서는 ‘만성질환 발생 위험 증가와 예방 전략’, ‘한국사회의 다양한 정신건강 문제’, ‘위기 아동·청소년을 위한 사회안전망 부족’, ‘기후변화 대응 및 녹색성장에 대한 요구 증가’, ‘저출산·고령화로 인한 사회보장재정 부담’ 등의 토픽이 도출되었다. 제2기(2015년부터 2019년까지)에서는 ‘질병 예방과 진단을 위한 미래기술의 발전’, ‘한국사회의 다양한 갈등 해결과 건강한 관계 맺기’, ‘취약계층 지원 및 복지사각지대 발굴의 중요성’, ‘4차 산업혁명에 따른 의료기술의 변화’, ‘국제 협력이 요구되는 다양한 사회문제 대두’와 같은 토픽이 확인되었다. 제3기(2020년부터 2023년 2월까지)에서는 ‘생활습관 및 예방적 건강관리의 중요성’, ‘코로나19로 인한 의료시스템 위기상황과 감염병 대응 역량 강화 필요성’, ‘포스트 코로나 시대의 학생 교육 및 정서 건강 관리’, ‘지속가능한 미래를 위한 산업계의 환경 문제 대응’, ‘포스트 코로나 시대의 세계 질서 변화와 국제 협력’ 등의 주제가 주목받았다.
본 연구에서는 각 시기별로 도출되었던 총 15개의 토픽을 연구진 회의를 통해 ➀예방적 건강관리, ➁정신건강을 위한 사회 안전망 구축, ➂취약계층 복지 강화, ➃기후변화와 환경 문제, ➄글로벌 협력과 변화의 5개 차원의 공통된 이슈로 재분류하였다[18].
첫 번째로, ‘예방적 건강관리’ 차원에는 제1기의 ‘만성질환 발생 위험 증가와 예방 전략’, 제2기의 ‘질병 예방과 진단을 위한 미래기술의 발전’ 및 ‘4차 산업혁명에 따른 의료기술의 변화’, 그리고 제3기에는 ‘생활습관 및 예방적 건강관리의 중요성’의 토픽을 포함하였다. 두 번째로, 정신건강을 위한 사회 안전망 구축 차원에서는 제1기에 ‘한국사회의 다양한 정신건강 문제’, 제2기에는 ‘한국사회의 다양한 갈등 해결과 건강한 관계 맺기’, 그리고 제3기에는 ‘포스트 코로나 시대의 학생 교육 및 정서 건강 관리’ 의 토픽을 분류하였다. 세 번째로, 취약계층 복지 강화 차원에는 제1기의 ‘위기 아동·청소년을 위한 사회안전망 부족’과 ‘저출산·고령화로 인한 사회보장재정 부담’, 제2기의 ‘취약계층 지원 및 복지사각지대 발굴의 중요성’이 포함되었다. 네 번째로, 기후변화와 환경 문제 차원에서는 제1기의 ‘기후변화 대응 및 녹색성장에 대한 요구 증가’와 제3기의 ‘지속 가능한 미래를 위한 산업계의 환경 문제 대응’ 토픽이 포함되었다. 마지막으로, 글로벌 협력과 변화 차원에서는 제2기의 ‘국제 협력이 요구되는 다양한 사회문제 대두’와 제3기의 ‘코로나19로 인한 의료시스템 위기상황과 감염병 대응 역량 강화 필요성’, ‘포스트 코로나 시대의 세계 질서 변화와 국제 협력’ 이 포함되었다.
5-2 시사점
첫 번째 이슈인 ➀예방적 건강관리는 2010년 이후 지속적으로 사회적 관심을 받아왔다. 특히, 제3기 동안 ‘생활습관 및 예방적 건강관리의 중요성’에 대한 토픽이 증가하는 추세를 보임으로써, 예방적 건강관리에 대한 사회적 관심이 지속적으로 증가할 수 있음을 시사하였다. 관련 주요 뉴스에서는 고혈압, 암, 비만, 심혈관질환, 당뇨병 등 다양한 만성질환의 위험성과 예방법, 치료법에 대한 정보가 대두되었으며, 만성질환의 유병률 증가에 따른 개인 및 사회적 부담을 줄이기 위해 관련 질병의 예방을 위한 국민의 생활습관 개선 및 정책 마련이 요구될 것이다.
제2기의 ‘질병 예방과 진단을 위한 미래기술의 발전’에 관한 뉴스들은 현대 의료 기술이 질병 예방과 진단에 어떻게 활용될 수 있는지에 대한 중점적인 논의를 제공한다. 최신 레이저 백내장 수술, 유전자 검사를 통한 맞춤형 진료 확대 등과 관련된 연구는 의료기술 및 의과학 연구의 발전이 질병 예방과 진단에 어떻게 기여할 수 있는지를 보여주며 이에 대한 추가적인 국가적 지원과 자원 투입이 필요함을 시사한다.
또한, 제2기의 ‘4차 산업혁명에 따른 의료기술의 변화’와 관련된 뉴스들은 4차 산업혁명의 트렌드, 사물인터넷(IoT)의 가능성, 개인정보 암호화 및 활용, 맞춤형 헬스케어, 바이오헬스 기술의 성장 가능성, 미래 기술 예측 등을 다루며, 미래 질병 위험 관리 및 예방에 대한 새로운 접근법을 제공한다. 특히 맞춤형 헬스케어, 바이오헬스 기술과 ICT의 융합은 질병 관리와 예방을 위한 새로운 방법론을 제시하므로, 이러한 기술의 적극적 활용을 위해 바이오 헬스 산업의 육성 및 연구 개발 지원이 요구된다.
또다른 이슈인 ➁정신건강을 위한 사회 안전망 구축은 이모든 시기에 걸쳐 지속적으로 중요한 이슈로 부각되었다. 정신건강 악화는 선행연구에서도 미래 위험 요인으로 언급된 바 있다. 본 연구의 뉴스 기사 분석 결과에서는, 제1기 동안 ‘한국사회의 다양한 정신건강 문제’와 관련된 뉴스 보도를 통해 사회 범죄, 고독사, 중독 문제, 청소년 우울증, 자살, 어린이 정서학대 등 사회적 문제들이 주요 토픽으로 다뤄졌다. 이는 개인적 차원을 넘어 사회적 차원에서 정신건강 문제가 심각하게 인식되고 있음을 나타낸다. 제2기에는 ‘한국사회의 다양한 갈등 해결과 건강한 관계 맺기’ 토픽이 중요하게 다루어졌다. 이 기간 동안의 뉴스들은 사회적 갈등, 세대 간의 의사소통 문제, 개인 및 집단 간의 건강한 관계 형성, 정신건강에 대한 인식 향상에 중점을 두었다. 저출산, 남녀 갈등, 인간과 동물·자연과의 관계, 1인 가구 증가로 인한 고독 문제 등 다양한 주제가 다루어졌다. 이러한 뉴스들은 사회적 갈등 해결과 건강한 관계 형성을 위한 다양한 방안 및 정책 제안을 포함하며, 다양성을 존중하고 포용하는 정책과 집단 간 커뮤니케이션 활성화 정책의 필요성을 시사한다.
제3기에서 ‘포스트 코로나 시대의 학생 교육 및 정서 건강 관리’ 토픽에 대한 뉴스는 코로나19로 인한 학생들의 학습환경 변화와 이로 인해 영향을 받은 학생들의 정서건강 관리에 초점을 맞추었다. 사회적 격리와 온라인 수업의 확대로 학생들의 정서적 스트레스가 증가하고 사회적 상호작용이 감소하였음이 나타났으며, 이는 학생들의 교육과 정서 건강을 지원하기 위한 지속적인 대책의 필요성을 강조한다.
➂취약계층 복지 강화 이슈 토픽인 제1기의 ‘위기 아동·청소년을 위한 사회안전망 부족’과 관련된 뉴스는 아동 및 청소년의 안전과 건강 증진을 위한 지역사회 안전망 구축에 초점을 맞추었다. 위기 청소년의 건강한 성장 지원과 자살 예방 사업 등을 통한 노력이 주요하게 다루어졌으며, 학교 폭력 대응도 중요한 토픽으로 포함되었다. 위기 상황에 처한 청소년들을 위한 체계적인 지원이 그들의 심리적 건강뿐만 아니라, 향후 성인이 되어서의 건강에도 영향을 미칠 수 있음을 강조하였으며, 지역사회, 학교, 정부 간의 협력을 통한 효과적인 안전망 구축의 중요성을 언급하였다. ‘저출산 ·고령화로 인한 사회보장재정 부담’과 관련된 뉴스들은 저출산 및 고령화 대응책, 보험료 문제, 노후 복지, 의료비 부담 등의 이슈를 다루었다. 이는 기초생활보장 대상의 확대, 국민연금의 개선 등을 통해 사회보장재정 부담에 대응할 필요성을 제시하며, 고령화 사회 진입에 따른 국가 및 국민의 재정 부담 증가와 의료비 부담 증가에 대응하기 위한 복지 및 보험 체계의 선제적 정비를 강조한다. 제2기의 ‘취약계층 지원 및 복지사각지대 발굴의 중요성’과 관련된 뉴스들은 취약계층 지원 및 사회 안전망 강화에 중점을 둔다. 정부와 지역사회가 협력하여 위기가구를 지원하고, ‘찾아가는 동 주민센터’와 같은 지역 기반 복지 거점의 설정, 재난취약가구에 대한 안전점검 및 정비사업 등이 주요 보도 내용으로 나타났다. 이러한 뉴스들은 아동·빈곤위기 가정등을 포함하여 다양한 취약계층을 발굴하고 복지사각지대를 해소하는 것이 미래의 질병 위험에 대비하는 중요한 전략임을 시사한다.
➃기후변화와 환경 문제와 관련하여 제1기와 제3기에서는 기후변화와 환경 문제에 대한 뉴스가 지속적으로 증가하는 추세가 나타났다. 특히, 제3기의 ‘지속가능한 미래를 위한 산업계의 환경 문제 대응’ 토픽에서 관련 뉴스 수가 시간이 지남에 따라 증가하였으며, 기후변화와 환경 문제가 건강에 광범위한 영향을 미칠 수 있음이 알려지고 이에 대한 사회적 관심이 높아지고 있는 현상을 보여주었다. 제1기의 ‘기후변화 대응 및 녹색성장에 대한 요구 증가’와 관련된 뉴스들은 저탄소 녹색성장, 미래 신산업의 메가트렌드, 세계 녹색시장 선점, 탄소 정보 공개 프로젝트 등을 다루며, 기후변화의 심각성과 경제적 영향, 기업들의 녹색성장 준비 상황을 주제로 삼고 있다. 이러한 뉴스는 기후변화가 미래 질병에 미치는 위험과 녹색성장 및 저탄소 정책의 필요성을 강조한다. 제3기의 ‘지속가능한 미래를 위한 산업계의 환경 문제 대응’에 속하는 뉴스들은 포스트 코로나 시대의 혁신 트렌드, 헬스케어 및 바이오산업의 팬데믹 대응, 환경과 경제의 지속가능성, 에너지 산업의 디지털화, ESG 투자, 액화수소 미래 에너지, 친환경 미래산업 등의 이슈를 다룬다. ‘지속가능한 미래’ 및 ‘지속가능한 발전 목표’(SDGs)의 개념은 건강과 밀접한 관련이 있으며, ‘기후변화 대응’은 SDGs의 중요한 목표 중 하나이다. 산업 활동에 의한 탄소 배출이 기후변화의 주요 원인으로 지목되면서, 국내외에서는 기후변화에 대응하기 위한 산업계의 환경 인식 제고와 대응 노력을 지속적으로 강화할 필요가 있다.
마지막 이슈인 ➄글로벌 협력과 변화와 관련해서는 제2기와 제3기에 걸쳐 관련 토픽이 중요하게 다루어졌다. 제2기에서는 ‘국제 협력이 요구되는 다양한 사회문제 대두’와 관련된 뉴스들이 주목받았으며, 이는 정부의 경제·사회정책, 국제협력, 환경문제 해결을 위한 노력 등에 초점을 맞추고 있다. 경제 협력, 평화 협정, 포용적 국가 실현, 미세먼지 해결 등의 다양한 이슈에서 국제협력을 통한 공동의 문제 해결의 중요성과 국내 정부의 적극적인 역할이 강조되었다. 제3기에서는 코로나19 팬데믹이라는 전례 없는 글로벌 위기를 맞이하여, 팬데믹 대응과 관련된 국제 협력의 중요성이 크게 부각되었다. ‘코로나19로 인한 의료시스템 위기상황과 감염병 대응 역량 강화 필요성’, ‘포스트 코로나 시대의 세계 질서 변화와 국제 협력’의 토픽에서는 팬데믹 대응, 포스트 코로나 이후의 방역 정책, 경제·사회·정치 변화, 국제사회의 연대, 백신 접근성 문제 해결을 위한 정부 역할, G20 국가들의 코로나 및 기후위기 극복 노력 등이 주요하게 다루어졌다. 이러한 뉴스들은 미래의 팬데믹 상황에 대비한 국제적 대응 역량 강화와 국제 협력의 중요성을 재확인시키며, 글로벌 위기 상황에서의 연대와 협력을 통한 문제 해결의 필요성을 강조했다. 이 토픽들은 국제 협력이 다양한 글로벌 이슈와 위기 상황에 대응하는 데 있어 핵심적인 역할을 하며, 지속 가능한 미래를 위한 글로벌 공동체의 노력이 중요함을 시사한다. 팬데믹과 같은 글로벌 위기를 넘어서, 경제, 환경, 사회 등 다양한 분야에서의 국제 협력은 더욱 강화되어야 할 것이다.
본 논문에서는 뉴스 빅데이터 분석을 통해 과거에 대두되었던 미래 질병 위험 요인을 확인하고자 하였다. 토픽모델링의 특성상 최종 토픽을 도출하는데 연구자의 주관적인 해석이 작용하였지만, 모델링을 통해 추출된 키워드 및 우선 순위 뉴스 도출을 통해서 토픽 선정의 근거를 최대한 확보하였다. 또한 기존에 국내 뉴스를 활용하여 미래 위험을 도출하기 위한 시도가 많지 않았고, 본 연구를 통해 10여년에 걸친 미래 위험 요인의 흐름을 파악할 수 있었다는 점에서 본 연구의 가치가 있다고 할 수 있을 것이다. 빅데이터의 시대인 만큼 텍스트 데이터는 기하급수적으로 발생하고 있고, 이러한 정보를 활용하여 향후 다양한 연구에서 토픽모델링을 활용하고 미래 질병 위험도 지속적으로 예측하려는 시도가 필요할 것이다.
Acknowledgments
본 논문은 2023년 한국보건사회연구원(KIHASA)에서 수행된 연구로서, 연구보고서 2023-30 ‘한국의 미래 질병 위험에 대한 인식과 대비’ 연구 결과의 일부를 수정 및 보완한 것임.
References
- World Health Organization. Urgent Health Challenges for the Next Decade [Internet]. Available: https://www.who.int/news-room/photo-story/photo-story-detail/urgent-health-challenges-for-the-next-decade, .
- World Health Organization. Ten Threats to Global Health in 2019 [Internet]. Available: https://www.who.int/news-room/spotlight/ten-threats-to-global-health-in-2019, .
- Centers for Disease Control and Prevention. Advancing Science and Health Equity [Internet]. Available: https://www.cdc.gov/about/priorities/?CDC_AAref_Val=https://www.cdc.gov/about/strategic-plan/index.html, .
- Centers for Disease Control and Prevention. Measures of Success [Internet]. Available: https://www.cdc.gov/about/priorities/measures-of-success.html?CDC_AAref_Val=https://www.cdc.gov/about/strategic-plan/measure-success.html, .
- UK Health Security Agency(HSA). UKHSA Strategies Plan 2023 to 2026 [Internet]. Available: https://assets.publishing.service.gov.uk/government/uploads/system/uploads/attachment_data/file/1173959/UKHSA_3_year_strategy.pdf, .
- T. Kim and S. Park, “An Analysis of Lifelong Education Topics by Using News Big Data,” Journal of Lifelong Education, Vol. 25, No. 3, pp. 29-63, September 2019. [https://doi.org/10.52758/kjle.2019.25.3.29]
- S. W. Park, T. G. Kim, S. H. Park, H. S. Park, Y. J. Yeo, H. S. Yoo, ... and M. S. Cho, A Forecasting Research on the Futures of Korea 2050, Seoul, National Assembly Futures Institute, 2022.
- S. W. Park, “15 Emerging Issues to Watch in 2022,” National Assembly Futures Institute, Futures Brief, Vol. 4, 2021.
- World Economic Forum, “Global Risks Report 2023 18th Edition,” January 2023.
- T. Vos, S. S. Lim, C. Abbafati, K. M. Abbas, M. Abbasi, M. Abbasifard, ... and Z. A. Bhutta, “Global Burden of 369 Diseases and Injuries in 204 Countries and Territories, 1990–2019: A Systematic Analysis for the Global Burden of Disease Study 2019,” The Lancet, Vol. 396, No. 10258, pp. 1204-1222, October 2020. [https://doi.org/10.1016/S0140-6736(20)30925-9]
- K. W. Cho, S. K. Bae, and Y. W. Woo, “Analysis on Topic Trends and Topic Modeling of KSHSM Journal Papers using Text Mining,” The Korean Journal of Health Service Management, Vol. 11, No.4, pp. 213-224, December 2017. [https://doi.org/10.12811/kshsm.2017.11.4.213]
- W. K. Jo, “Characteristics of South Korea’s Early Response to the Public Health Crisis and Their Implications: Topic Modeling of Early Media Coverage of MERS and COVID-19,” Korea Journal of Information Society, Vol. 22, No. 2, pp. 25-50, August 2021. [https://doi.org/10.52558/ISM.2021.08.22.2.25]
- D. M. Blei and J. D. Lafferty, Topic Models, in Text Mining: Classification, Clustering, and Applications, Boca Raton, FL: Chapman and Hall, ch. 4, pp. 71-94, 2009.
- D. Blei, “Probabilistic Topic Models,” Communications of the ACM, Vol. 55, No. 4, pp. 77-84, April 2012. [https://doi.org/10.1145/2133806.2133826]
- S. Han and T. Kim, “Analysis of Domestic Metaverse Education Research Trends From 2020 to 2022: Focusing on Topic Modeling,” Culture and Convergence, Vol. 45, No. 4, pp.123-141, April 2023.
- T. Y. Hwang and T. J. Kim, “Analysis of Korea-China Relations Issues Based on Topic Modeling: Focusing on News Big Data from 1990 to 2022,” The Journal of Peace Studies, Vol. 24, No. 1, pp. 91-114, March 2023.
- M. K. Ko and T. J. Kim, “ESG Issue Analysis Based on LDA: Focusing on Big Data News from 2009 to 2022,” Journal of Digital Contents Society, Vol. 24, No. 3, pp. 517-530, March 2023. [https://doi.org/10.9728/dcs.2023.24.3.517]
- S. Chae, J. Shin, J. Baek, S. Lee, and T. J. Kim, Awareness and Preparedness of Disease Risks in Korea’s Future, Korea Institute for Health and Social Affairs, Sejong, 2023-30, 2023.
저자소개
1999년:경북대학교 신문방송학과(문학사)
2012년:연세대학교 언론학과(언론학석사)
2019년:공주대학교 교육학과(교육학박사)
2020년~2021년: 한국청소년정책연구원 부연구위원
2021년~2023년: 한국과학기술정보연구원 박사후연구원
2023년~현 재: 국립기상과학원 인공지능기상연구과 연구원
※관심분야:국가 정책, 데이터 과학, 토픽 모델링 분석, 텍스트데이터 기반 이슈 및 트렌드 분석
2008년:연세대학교 정치외교학과
2015년:Texas A&M University (행정학석사)
2020년:Texas A&M University (보건학박사)
2020년~2022년: Houston Methodist Research Institute, Postdoctoral Fellow
2022년~현 재: 한국보건사회연구원 부연구위원
※관심분야:환경보건, 보건정책, 미래질병, 디지털헬스케어, 글로벌헬스
2019년:연세대학교 의료법윤리학협동과정 (보건학석사)
2019년~현 재: 한국보건사회연구원 연구원
2024년~현 재: 연세대학교 의료법윤리학협동과정 (보건학박사과정)
※관심분야:보건 정책, 정신건강증진, 미래질병 등
2021년:이화여자대학교 의과학과 보건학전공(보건학박사)
2022년~현 재: 한국보건사회연구원 부연구위원
※관심분야:환경보건, 기후변화, 국제보건, 헬스케어빅데이터
2005년:서울대학교 보건대학원(보건학 석사)
2014년:고려대학교 일반대학원(보건학 박사)
2020년~현 재: 한국보건사회연구원 연구위원
※관심분야:기후변화 건강적응, 자살예방, 정신건강 증진