[ Article ]

Journal of Digital Contents Society - Vol. 26, No. 12, pp.3369-3380

ISSN: 1598-2009 (Print) 2287-738X (Online)

Print publication date 31 Dec 2025

Received 28 Sep 2025 Revised 31 Oct 2025 Accepted 20 Nov 2025

DOI: https://doi.org/10.9728/dcs.2025.26.12.3369

온라인 뉴스와 동영상 제목에서 형식적 신호에 의한 댓글 공격 영향 분석

조윤용 ; 하은아^* ; 김현아

경기대학교 자유교양대학 교양학부 조교수

The Influence of Headline Cues on Aggressive Online Commenting

Yoon Y. Cho ; Euna Ha^* ; Hyun-Ah Kim

Assistant Professor, Department of General Studies, Kyonggi University, Suwon 16227, Korea

Correspondence to: ^*Euna Ha Tel: +82-31-249-1473 E-mail: donut9@kgu.ac.kr

Copyright ⓒ 2025 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

초록

본 연구는 뉴스와 동영상 제목의 언어적·비언어적 신호가 댓글의 공격성에 미치는 영향을 분석하였다. 네이버 뉴스와 유튜브 댓글 코퍼스를 활용하여 제목의 길이, 문장부호, 숫자 및 퍼센트 표기, 자극적 키워드 등을 독립변수로 설정하고, 플랫폼과 주제 고정효과 및 제목단위 군집화 표준오차를 포함한 로지스틱 회귀로 한계효과(AME, %p)를 추정하였다. 분석 결과, 퍼센트 표기는 댓글 공격성 발생 확률을 일관되게 증가시켰다(AME ≈ +9.81%p). 반면 느낌표는 단순 비교에서는 공격성을 높이는 듯 보였으나, 플랫폼과 주제 차이를 고려하면 오히려 감소 효과로 나타났다(AME ≈ −11.4%p). 따옴표와 제목 길이는 플랫폼과 주제를 통제한 후에는 효과가 약화되거나 소멸하였다. 다양한 컷오프·가중·시점 통제 등 강건성 점검에서도 이러한 경향은 일관되게 확인되었으며, 특히 퍼센트 표기는 위험 신호, 느낌표는 완화 신호로 작용한다는 결론이 안정적으로 뒷받침되었다. 본 연구는 제목의 형식적 신호만으로도 댓글 공격성의 변화를 설명할 수 있음을 보여주었으며, 이는 퍼센트 표기 최소화, 단문·구호형 표제 관리, 느낌표의 맥락적 사용 등 제목 편집 가이드라인과 사전 모니터링 설계에 실질적 근거를 제공한다.

Abstract

This study examined how linguistic and paralinguistic cues in news and video titles shape the aggressiveness of online comments. Using corpora drawn from Naver News and YouTube, the analysis considered title length, punctuation marks, numerical and percentage expressions, and sensational keywords as independent variables, while controlling for platform and topic fixed effects. Regression results indicate that percentage expressions consistently increased the likelihood of aggressive commenting. Exclamation marks initially appeared to elevate aggression; however, after accounting for platform and topic differences, they instead reduced it. Quotation marks and longer titles likewise correlated with lower levels of aggression when control were applied. Robustness checks confirmed these patterns, suggesting that percentage expressions acted as risk signals, whereas exclamation marks functioned as mitigating signals. These findings demonstrate that simple formal features embedded in titles can systematically influence comment aggression, offering practical insights for headline editing guidelines and proactive monitoring strategies.

Keywords:

Framing Effect, News Title, Aggressive Commenting, KOLD, KHS

키워드:

프레이밍 효과, 뉴스 제목, 공격적 댓글

Ⅰ. 서 론

1-1 연구배경

디지털 시대에 뉴스와 동영상 소비에 있어서 제목은 독자의 해석과 반응을 좌우하는 강력한 신호로 기능한다[1],[2]. 온라인 기사나 동영상 콘텐츠는 제목을 클릭해야만 접근할 수 있기 때문에, 제목의 영향력은 종이신문보다 훨씬 크다[3]. 이처럼 ‘헤드라인 저널리즘’의 시대에 뉴스 제목은 단순한 내용 요약의 기능을 넘어선다. 제목은 독자의 주목을 끌고 특정한 해석의 틀을 제공할 뿐만 아니라, 클릭을 통한 기사 접근을 유도하고, 댓글 작성이나 감정적 반응을 촉발하며, 나아가 기사 공유와 재확산을 매개하는 핵심적 장치로 작동한다. 다시 말해, 제목은 정보 전달을 넘어 온라인 공간에서 이용자 행위를 조직하고 여론의 흐름을 형성하는 중요한 매개 요소라 할 수 있다[2],[4]-[6]. 특히 온라인 뉴스의 제목은 단순히 기사를 안내하는 역할을 넘어서 여론의 흐름을 형성하고 나아가 좌우하는 요인으로 부상하고 있다[6]. 이는 제목이 사건을 객관적으로 전달하기보다는 특정 측면을 강조하거나 과장하여 현실을 재구성할 수 있기 때문이다. 더욱이 온라인 환경의 익명성과 비대면성은 오프라인보다 공격적 표현을 쉽게 촉발하며, 온라인 탈억제 효과로 인해 댓글은 단순한 의견 표출을 넘어 공격적, 혐오적 언어로 확산되기 쉽다[7]. 클릭 수가 언론사의 핵심 수익 지표로 부상함에 따라 낚시성 제목, 과장된 표현, 자극적 어휘가 제목에서 빈번하게 활용되었으며, 이는 댓글의 공격성을 촉발하는 요인으로 작용한다[8]. 이러한 현상은 제목이 곧바로 기사 접근, 공유, 조회로 이어지는 온라인 환경의 구조적 특성에 의해 더욱 가속화되었다. 또한 온라인 댓글의 공격성/비문명성은 기사 주제와 플랫폼 등 맥락 변수에 의해 체계적으로 달라진다는 점이 반복적으로 확인되었다[9]. 아울러 욕설·대문자 남용·문장부호 패턴 등 표면 표기가 독성 탐지에서 안정적 단서로 기능한다는 대규모 실증이 축적되어 왔는데[10]-[13], 이는 제목의 형식만으로도 이용자 반응의 변동을 설명할 수 있다는 본 연구의 문제의식과 직접 맞닿는다.

1-2 연구목적

이러한 문제의식에서 이 연구는 ‘온라인 뉴스의 제목은 댓글의 공격성을 유발하는가?’라는 질문에서 시작하였다. 이 연구는 온라인 뉴스와 동영상의 제목 속에 포함된 다양한 언어적, 비언어적 특징이 댓글 공격성을 촉발하는지 나아가 공격성의 강도에도 영향을 미치는지 실증적으로 규명하고자 한다. 기존 연구들은 기사의 내용과 댓글의 관계를 분석하거나 온라인 뉴스 제목의 특징을 기술하고 분류하는 데 집중해 왔으나 제목과 댓글 공격성의 관계를 실증적으로 규명한 사례는 드물었다. 이에 본 연구는 온라인 뉴스와 동영상 제목에 사용된 언어적, 비언어적 장치를 프레임 신호(framing signals)로 간주하고 이러한 신호들이 공격적 댓글을 유발하는지 그리고 그 강도에 어떠한 영향을 미치는지를 살펴보고자 한다.

1-3 연구방법

따라서 본 연구에서는 네이버 뉴스와 유튜브 영상 댓글을 포함한 KOLD(Korean Offensive Language Dataset)와 연예 뉴스 댓글을 중심으로 구축된 KHS(Korean Hate Speech Dataset)를 활용하였다. 연구배경과 목적에서 기술한 맥락을 반영해 네이버·유튜브 기반 KOLD와 연예 뉴스 중심 KHS를 결합하고, 제목의 형식 신호(길이, !, ?, “ ”, 숫자·%, 자극어)를 규칙화하여 추출하였다. 플랫폼·주제 고정효과와 제목단위 군집화 표준오차를 포함한 로지스틱 회귀로 한계효과(Average Marginal Effects, AME) 를 추정함으로써 형식 신호의 순효과를 식별한다. 이는 편집 가이드라인 및 사전 모니터링 규칙 설계에 직접 활용 가능하다[9]-[13].

본 논문의 구성은 다음과 같다. 제2장에서는 제목의 형식적 신호와 댓글 공격성에 관한 이론적 배경과 선행 연구를 정리한다. 제3장에서는 KOLD·KHS 데이터, 변수 구성과 전처리, 고정효과 로지스틱 회귀 모형 및 진단 지표를 제시한다. 제4장에서는 기술통계와 회귀 결과를 보고하고, 희귀 특징 안정성·대체 사양 등을 포함한 강건성 점검을 제공한다. 제5장에서는 주요 발견을 요약하고, 이론적·실무적 함의, 한계 및 향후 연구 과제를 논의한다.

Ⅱ. 제목의 형식적 신호와 댓글 공격성: 이론과 선행 연구

2-1 제목의 형식적 신호와 댓글 공격성

제목의 형식 신호(문장부호, 숫자·퍼센트, 길이, 자극적 어휘)는 독자가 본문을 열기 전 단계에서 정서 각성, 주의 배분, 책임 귀인의 방향을 바꾸는 표면 단서로 작동한다. 동일 사실도 퍼센트(%) vs. 빈도(n/m) 제시 방식에 따라 일반화 수준과 책임 귀인이 달라지는 현상이 일관되게 보고되었고[14], 온라인 환경에서는 자극적 어휘와 문장부호 패턴이 클릭·신뢰·감정 반응을 체계적으로 바꾼다는 결과가 축적되어 왔다[1],[4],[15]. 본 연구는 이러한 축적된 관찰을 토대로, 내용 의미를 배제하고 형식 신호만으로 댓글 공격성의 변동이 설명되는지를 검증한다.

한편 댓글의 공격성/비문명성은 기사 주제와 플랫폼에 따라 체계적 편차를 보이며, 신문사 웹사이트 댓글의 대규모 분석은 맥락 요인(주제, 인용 관행 등)과 무례 발화의 분포가 유의하게 연동됨을 보여준다[9]. 온라인 탈억제 효과 또한 공격적 표현의 문턱을 낮추는 배경으로 작용한다[7]. 이 때문에, 선행 연구의 함의를 계승하려면 형식 신호의 효과를 추정할 때 플랫폼·주제 고정효과를 포함해 순효과를 분리하는 설계가 요구된다.

또한 독성·혐오 탐지의 대규모 코퍼스 연구는 욕설, 대문자 남용, 문장부호 패턴 등 표면 표기가 안정적인 예측 단서임을 반복적으로 확인했다[10]-[13]. 다만 다수는 “탐지”에 초점이 있는 반면, 본 연구는 탐지가 아닌 설명에 초점을 두고 발생 여부와 강도를 구분한다. 그 결과로 우리는 퍼센트 표기가 위험 신호, 느낌표가 맥락 통제 시 완화 신호로 작동함을 고정효과 로지스틱의 한계효과(AME)로 정량화한다.

2-2 프레이밍 이론

프레이밍 이론에 따르면 언론이 어떤 사건이나 이슈를 선택하고 특정 측면을 강조하는 방식에 따라 수용자의 해석과 반응은 달라진다[16]. 기존 연구들은 동일한 이슈라 하더라도 갈등(conflict), 책임 귀인(attribution of responsibility), 경제적 결과(economic consequences) 등으로 프레임되는 방식에 따라 독자의 인식과 태도가 달라질 뿐 아니라, 추가적인 정보 탐색이나 검색 행동으로까지 이어진다는 점을 일관되게 입증해왔다[17]-[21]. 이러한 결과는 뉴스 프레임이 단순히 의미를 해석하는 틀에 머무는 것이 아니라, 수용자의 태도 형성과 더 나아가 행동 유발까지 매개하는 핵심 기제로 기능함을 보여준다.

특히 뉴스 제목(headline)은 프레이밍 효과가 가장 집약적으로 드러나는 지점이다[2],[3]. 제목은 제한된 분량 안에서 어떤 측면을 강조하고 어떤 해석 틀을 제공할지 결정하기 때문에, 기사의 주제와 의미를 압축적으로 전달하면서도 동시에 독자의 정서적 반응과 인지적 처리 과정을 강하게 규정한다. 실제로 기사의 제목은 기사를 읽기 전 독자가 접하는 첫 번째 관문이다. 특히 온라인 뉴스는 종이신문과 달리 제목 클릭을 통해서만 본문에 접근할 수 있는 구조이며, 독자가 기사를 읽기 전에 접하는 사실상 유일한 단서이기 때문에 제목은 독자의 클릭 여부를 좌우하는 결정적 요소로 기능한다. 따라서 제목의 어휘 선택, 구두점 사용, 숫자 표기 방식 등은 단순한 언어적 장치가 아니라 강력한 프레이밍 신호로 작동하여 수용자의 주목, 정서, 그리고 참여 행동(댓글, 공유 등)을 체계적으로 이끌어낼 수 있다.

2-3 제목의 비언어적 신호와 독자 반응

제목에 포함된 비언어적 신호가 독자의 반응에 미치는 영향을 분석한 연구들은 다음과 같다. 예컨대 동일한 사실을 전달하더라도, 숫자의 형식이 퍼센트(“약물 투여자의 50%가 회복”)로 제시될 때와 빈도수(“약물 투여자 2000명 중 1000명이 회복”)로 제시될 때, 독자의 책임 귀인 방식이 달라지는 것으로 나타났다[14]. 퍼센트 표기는 집단 전체에 대한 일반화를 강화하는 반면, 빈도수 표기는 구체적 사례를 떠올리게 하여 특정 집단이나 행위자에게 책임을 더 강하게 부과하도록 만든다[14].

낚시성 온라인 기사를 분류하기 위해 제목의 비언어적 신호를 분석한 연구도 있다[15]. 이 연구는 제목과 본문 간의 불일치, 제목과 본문 글자 수 차이, 말줄임표 사용 빈도, 선정적 단어와 감탄사 사용, 제목 마지막 단어의 품사 등이 낚시성 기사 판별에 효과적인 지표임을 보고하였다. 특히 말줄임표(⋯)나 자극적 단어와 같은 비언어적 신호는 독자의 호기심을 자극해 클릭을 유도하는 동시에 기사 신뢰도를 떨어뜨리는 위험 요인으로 작용할 수 있음을 보여주었다. 이러한 결과는 뉴스 제목이 단순한 요약을 넘어, 형식적 특징만으로도 독자의 기대와 해석을 왜곡시킬 수 있음을 시사한다.

2-4 제목의 감정적 단서와 독자 반응

온라인 뉴스의 제목에 포함된 감정적 단서는 해당 콘텐츠의 클릭률에 직접적인 영향을 미치는 것으로 보고되었다. 예컨대, 호기심을 자극하거나 비밀을 폭로하는 듯한 제목(“알고 보니 ○○의 숨겨진 비밀”), 독자의 머릿속에 즉각적인 이미지를 형성하는 시각적 표현(“불길에 휩싸인 현장”), 과거 사건을 현재 맥락에 소환하여 주목도를 높이는 표현(“한때 세계를 흔든 ○○, 지금은”) 등은 클릭 유입을 유의미하게 증가시키는 것으로 나타났다[1]. 이와 같이 제목은 단순한 정보 요약을 넘어 강력한 프레임 신호로 기능하며, 독자의 정서적 반응을 촉발할 뿐 아니라 경우에 따라 공격적·부정적 댓글 반응을 유발하는 매개 장치로 작동한다[2].

제목뿐 아니라 동영상의 썸네일 역시 프레이밍 효과를 지니는 시각적 단서로 작동한다. 감정적으로 호소하는 이미지나 자극적 장면을 담은 썸네일은 시청자의 주목을 끌고 특정한 해석 틀을 형성한다. 실제 연구 결과, 낚시성 동영상 콘텐츠는 제목과 썸네일에서 과장된 단어와 이미지를 활용하지만 실제 영상의 내용과는 낮은 연관성을 보였다[8]. 예를 들어 “충격 정체”, “심상치 않은 이유”와 같은 자극적 단어가 사용되거나 눈물을 흘리는 연예인 이미지가 강조된 썸네일이 제시되었으나, 실제 영상의 내용은 이와 큰 관련성이 없는 경우가 많았다[8]. 이를 통해 낚시성 콘텐츠는 제목·썸네일과 실제 내용 간의 불일치라는 특징을 가진다는 점이 확인되었으며, 이러한 접근은 향후 유튜브뿐 아니라 다양한 플랫폼에서 낚시성, 허위 콘텐츠 자동 판별 알고리즘으로 확장될 수 있음을 시사한다[8]. 이러한 불일치는 이용자의 호기심을 자극해 클릭을 유도하는 데는 성공하더라도, 결과적으로 콘텐츠의 신뢰도를 저하시킬 뿐 아니라 플랫폼 전체에 대한 불신으로 이어질 수 있다. 즉, 제목과 시각적 보조 요소는 독자의 기대와 해석을 왜곡시켜 단기적으로는 조회와 클릭을 증가시키지만, 장기적으로는 뉴스 신뢰성과 이용자 태도에 부정적 영향을 미칠 수 있음을 시사한다.

2-5 인용부호 사용과 독자 반응

제목의 비언어적 신호인 큰따옴표(“”)의 효과를 검증한 연구도 있다. 한국 언론의 ‘큰따옴표 저널리즘’을 ‘이대남’ 보도 사례를 통해 분석하였는데, 언론은 특정 집단의 발언을 큰따옴표로 강조함으로써 객관성을 가장하면서도 실제로는 특정 프레임을 강화하고 갈등을 부각하는 방식으로 보도를 구성한다는 점이다[22]. 뉴스 제목에서 큰따옴표와 같은 인용부호의 빈번한 사용은 독자의 시선을 끌기 위한 자극적 표현 방식이자, 발언 검증을 생략한 책임 회피 전략, 그리고 한국 언론의 과잉 인용 관행으로 지적된다[23]. 실제로 이는 취재원 발언의 진위를 충분히 검증하지 않은 채 책임을 회피하거나, 독자의 시선을 끌기 위한 수단으로 활용되는 경우가 많다[22]. 이러한 과다 사용은 기사 내용과의 관련성 없이 자극적 효과만을 부각시켜 독자의 신뢰를 약화시키며, 특히 사회적 갈등 이슈에서는 사안을 단순화하거나 대립 구도를 과장하여 편향적 인식을 강화하는 결과로 이어진다.

이렇듯, 제목의 언어적, 비언어적 신호는 독자의 감정적 반응에 영향을 미치며, 이는 여론의 흐름을 좌우하는 중요한 요소임을 알 수 있다. 그러나 선행연구는 주로 클릭률이나 기사 소비 행태 등 가시적 참여 수준에 집중해 왔을 뿐, 이러한 특징이 독자의 공격적 감정 반응, 특히 댓글을 통한 공격적 표현으로 어떻게 이어지는지에 대해서는 충분히 검증하지 못하였다. 이에 본 연구는 뉴스 제목에 나타난 비언어적 신호(느낌표, 물음표, 인용부호, 숫자 표현 방식)와 감정적 언어 신호(예: ‘충격’, ‘단독’, ‘역대급’)가 댓글의 공격적 반응을 유발하는지, 나아가 그 강도를 어떻게 변화시키는지를 실증적으로 규명하고자 한다.

Ⅲ. 형식적 신호 기반 분석 방법: KOLD·KHS와 고정효과 로지스틱 회귀

본 연구는 KOLD와 KHS 코퍼스를 결합하여, 뉴스 및 영 상의 제목(title)에서 추출한 비언어적 신호(느낌표, 물음표, 따옴표, 제목 길이)와 언어적 특징(숫자 표기, 자극적 키워드)이 댓글의 공격성과 어떻게 연동되는지를 검증하였다. KOLD는 NAVER 뉴스와 YouTube 영상의 제목과 댓글을 포함하며, 각 댓글에 대해 공격성 여부(off), 공격 대상(tgt), 공격 유형(type), 공격적 표현 범위(off_span)를 제공한다. KHS는 연예 기사의 댓글로 구성되어 있으며, 댓글의 hate(none, offensive, hate)과 bias(none, gender, others) 범주의 레이블, 그리고 뉴스 제목을 포함한다. 두 코퍼스 모두 제목과 댓글이 1:1 대응 구조이므로, 제목의 비언어적, 언어적 특징과 댓글의 공격성을 직접적으로 연결해 분석할 수 있다.

KOLD와 KHS의 데이터 통합 과정에서 분석의 재현성을 확보하기 위해 데이터 구조와 항목의 이름을 표준화하였다. KOLD는 platform, title, comment, off, tgt, off_span으로 단일화하고 날짜는 YYYY-MM-DD 형식으로 변환하였다. KHS는 KOLD와 레이블 체계가 다르기 때문에, KHS에서 hate나 bias가 ‘none’이 아닌 경우를 모두 공격성(toxic=1)으로 간주하였다. 이렇게 변환함으로써 KOLD의 공격성 여부(off)와 비교할 수 있도록 하였다. 변수 목록은 표 1에 제시하였다.

Table 1.

Variable dictionary

그림 1은 본 연구의 분석 파이프라인을 단계별로 요약한다. 먼저 데이터 결합 단계에서 KOLD(네이버 뉴스/유튜브)와 KHS(연예 기사) 코퍼스를 수집하여 스키마를 표준화하고(라벨·필드 정합), NFC(Normalization Form Canonical Composition)로 통일 하여 정규화/정제를 수행하였다(공백·문장부호 표기 일치, 중복 제거). 이어서 제목의 형식 신호를 추출하였다: 길이(len), 문장부호(!, ?, 큰따옴표), 숫자/퍼센트 표기, 자극적 키워드. 이때 의미 자원(외부 사전)을 쓰지 않고 문자열로 직접 관찰 가능한 형식적 특징만 사용하여 예측 누출을 방지하였다. 추출된 연속형 지표는 분위(20/60/20) 로, 희소 표지는 이진 변수(≥1, ≥2) 로 특징 인코딩하였다.

Fig. 1.

Pipeline for estimating the net effect of headline formal cues on comment aggression.

분석은 형식 신호만을 독립변수로 두고, 종속변수는 댓글 공격성 발생 여부(이진)(KOLD: off, KHS: toxic)이며(KOLD에서는 보조적으로 강도(intensity) 도 확인), 플랫폼·주제 고정효과를 포함한 로지스틱 회귀로 추정하였다. 동일 제목에 여러 댓글이 달리는 비독립성을 반영하기 위해 제목 단위 군집화 표준오차를 사용하였고, 효과 해석은 한계효과(AME, 퍼센트포인트) 중심으로 보고하였다. 모델의 적합성과 신뢰도는 ROC-AUC, PR-AP, Brier, 보정 곡선으로 진단하였으며, 컷오프·가중·시점·라벨 정의를 바꿔 확인하는 강건성 점검을 통해 결과의 안정성을 검증하였다. 마지막으로, 결과는 편집·모니터링 가이드(예: 퍼센트 표기 최소화, 단문·구호형 관리, 느낌표의 맥락적 사용)로 연결되는 정책적 시사점까지 제시한다. 빈도가 낮은 형식 신호(예: 퍼센트 표기, 느낌표 다중 등)에 대해서는 사전 기준을 두고 운용했다. 최소 기준은 전체 양성 빈도 𝑁≥300 또는 전체 대비 유병률 ≥0.5%∼1% 중 하나를 만족하는 것이다. 기준 미달 시는 (i) 범주 통합(예: “≥1”만 유지, “≥2” 삭제), (ii) 모형 보정(Firth 로지스틱 또는 L2 정규화)으로 완전분리·편향을 완화, (iii) 그룹 기반 불확실성 추정(제목 단위 부트스트랩/그룹 교차검증)으로 AME의 신뢰구간과 부호 안정성을 확인한다.

Ⅳ. 연구 결과

4-1 표본의 특성

분석의 첫 단계로, KOLD를 플랫폼 단위로 분리하여 표본 수, 공격성 비율, 제목 및 댓글 길이의 중앙값, 시계열 범위, 댓글 내 공격적 표현이 표시된 범위(off_span)의 분포와 공격 대상(tgt) 라벨의 분포를 기술통계로 요약하여 표 2에 제시하였다. 네이버 뉴스 댓글 코퍼스는 22,028건으로, 공격성 댓글 비율이 63.5%로 나타났다. 제목(33자)보다 댓글(38자)이 더 길게 작성되는 경향을 보였으며, 공격적 댓글에 구체적인 표현이 포함된 공격 표현 라벨링은 100%, 공격 대상, 즉 공격적 댓글 중 특정 인물, 대상, 집단을 겨냥한 댓글은 63.5%로 나타났다. 유튜브 댓글 코퍼스는 18,401건으로, 공격성 비율이 34.4%로 네이버보다 낮았다. 제목은 평균 41자로 더 길었으나 댓글은 33자로 짧았으며, 공격 표현 라벨링은 100%, 공격 대상은 34.4%로 나타났다. 본 연구에서 ‘공격적/혐오적/차별적’ 판단은 외부 코퍼스의 주석 지침에 따라 부여된 골드 라벨을 그대로 사용하였다. 예시는 다음과 같다.

Table 2.

Sample characteristics by KOLD platform (after normalization)

ㆍ (공격적/Offensive): “그 정치인은 [모욕적 표현] 이다” → KOLD.off=True (공격 표현이 문장 내에 명시됨; off_span으로 지정)
ㆍ (혐오/Hate): “[집단] 은 나라에서 몰아내야 한다” → KHS.hate=hate → toxic=1
ㆍ (차별/Bias): “[집단] 은 원래 [부정적 속성]” → KHS.bias=gender/others → toxic=1
ㆍ (비독성/경계 사례): “정책 비판: 증거가 부족하다”처럼 인신공격/집단비하 없는 비판 → toxic=0

표 3은 KHS 코퍼스 데이터에 대한 요약이다. KHS는 총 9,341건의 데이터로 구성되어 있으며, 댓글의 절반 이상(약 56.4%)이 공격적(offensive+hate)으로 분류될 만큼 공격, 혐오 발화의 비율이 높다. 제목은 평균 42자 내외인 반면, 댓글은 평균 31자로 상대적으로 짧게 나타났다. hate 레이블 분포에서는 offensive(32.1%)와 hate(24.3%)가 합쳐 55% 이상을 차지하였다. 데이터는 기계학습을 위해 학습(train, 7,896건), 검증(dev, 471건), 시험(test, 974건)의 세 부분으로 분할하였다. 학습 데이터는 모델 훈련에, 검증 데이터는 성능 평가 및 파라미터 조정에, 시험 데이터는 라벨 없이 최종 통계 확인용으로 활용되었다.

Table 3.

Summary by KHS split

본 연구에서 사용하는 ‘독성(toxicity)’은 댓글이 공격적, 혐오적, 차별적 성격을 지니는 정도를 의미한다. KOLD에서는 댓글의 공격성 여부(off)를, KHS에서는 hate와 bias 라벨을 기준으로 하여, 둘 중 하나라도 존재할 경우를 독성 발언으로 간주하였다. 다시 말해, 혐오적이거나 차별적 표현을 포함하는 모든 댓글을 toxic = 1로, 그렇지 않은 경우를 toxic = 0으로 이진화하여 분석에 활용하였다.

4-2 제목의 비언어적, 언어적 신호의 구성과 전처리

뉴스와 동영상 제목에 담긴 비언어적, 언어적 신호를 수치화하였다. 이를 위한 세 가지 기준은 다음과 같다, 첫째, 단어에 숨은 뜻을 찾고자 외부 사전과 같은 의미 자원은 쓰지 않고, 제목 문자열에서 직접 관찰 가능한 형식적 특징만을 추출하였다. 둘째, 분석의 재현성(reproducibility)을 높이기 위해 정규화, 정규식 처리, 사전 구축 과정을 모두 규칙화하였다. 셋째, 제목의 길이나 문장부호의 빈도 같은 연속형 지표는 분위수(상·중·하, 20%–60%–20%)로 나누어, 특정 구간에서 효과가 달라질 수 있는 가능성을 반영하였다.

텍스트 정규화 과정은 작성자 개인의 표기 습관이나 플랫폼별 차이가 변수 계산에 영향을 주지 않도록 적용하였다. 원문 제목은 NFC 규칙(같은 글자를 항상 동일한 방식으로 저장하도록 맞추는 규칙)에 따라 통일하고, 연속된 공백은 하나로 줄였으며, 앞뒤 공백은 제거하였다. 또한 단순 빈도(예: 느낌표 수, 따옴표 수)를 비교할 때 표기 차이로 인한 왜곡을 방지하기 위해, 글 따옴표(“ ”, ‘ ’)와 느낌표, 물음표(！, ？)는 각각 ASCII(American Standard Code for Information Interchange) 기본 기호(" ', !, ?)로 바꾸어 표기 방식 차이를 없앴다. 문장 토큰화는 형태소 단위가 아닌 띄어쓰기를 기준으로 분리하였으며, 이는 제목의 의미보다는 형식적 신호에 초점을 두기 위함이다.

Table 4.

Dictionary of linguistic and paralinguistic cues in Titles

제목의 길이는 제목에 담긴 정보량과 압축 정도를 의미하고, len_chars를 분석에 사용하였다. 문장부호(n_exclam, n_question, n_quotes)인 느낌표, 물음표, 인용부호는 정서적 각성, 주목도 증가, 의혹제기, 불확실성, 신뢰성 저하, 책임회피, 갈등 및 대립구조 과장 등을 나타낼 수 있다. 특히 따옴표는 직접 인용이나 발언 갈무리 관행까지 포괄할 수 있다. 숫자와 퍼센트 표기(n_digits, has_person_num, has_percent)는 기사의 사실성을 강조하는 역할도 하지만, 과도하게 쓰이면 기사 내용이 과장돼 보이게 한다. 마지막으로 언어적 특징인 자극적 키워드(kw_sensational, subj_lex, polarity_lex)는 ‘충격’, ‘단독’, ‘역대급’과 같은 키워드를 의미하며 이러한 어휘의 사용은 독자의 호기심과 불안을 자극해 클릭을 유도할 뿐 아니라, 궁극적으로 독자의 감정적 반응을 불러일으키는 핵심 장치로 작동한다. 이러한 자극적 키워드들은 미리 정리한 어휘 사전을 이용해 찾아냈다. 대부분의 제목은 긍·부정 점수(극성 점수)가 0에 가까워 차이가 거의 없지만, 상위 20% 구간에서는 특정한 톤을 가진 제목들을 뚜렷하게 구분하는 데 효과적이다.

연속형 변수는 전체 표본을 기준으로 20분위와 80분위를 기준값으로 하위·중간·상위 세 구간으로 나누었다. 이때 기준값은 KOLD와 KHS 전체 제목을 통합한 데이터에서 산정하였으며, 플랫폼이나 데이터 분할에는 가중치를 두지 않았다. 실제 산출된 기준값은 아래 표 5와 같다.

Table 5.

Global 20/80 quartile cutoff of continuous features

4-3 종속지표와 분석 설계

종속변수인 댓글은 코퍼스별로 다르게 설정하였다. KOLD에서는 댓글의 공격성 발생 여부(off)를 주지표로, 발생한 댓글의 강도를 보조지표로 사용한다. KHS에서는 hate와 bias 라벨을 결합해 이진 변수(toxic = 1 or 0)로 변환하여 활용한다. 이로써 두 코퍼스 모두 발생 여부 기준에서 비교가 가능하며, KOLD에서는 공격성의 강도까지 확인할 수 있다. 독립변수는 모두 제목에서 추출한 특징이다. 길이, 문장부호, 숫자, 키워드 등 주요 변수를 사용하며, 연속형 변수는 세 구간(상·중·하)으로 나누었다. 느낌표와 물음표처럼 드물게 나타나는 부호는 ‘존재(1개 이상)’와 ‘다중(2개 이상)’ 두 개의 이진 변수로 변환하여 극단적 효과를 확인하였다. 모든 독립변수는 댓글 내용을 배제하고 제목에서만 추출하여, 예측 누출이 발생하지 않도록 하였다.

분석은 두 단계로 진행하였다. 첫째, 제목 특징의 상·하위 분위 집단 간 댓글 공격성 발생 확률 차이를 단순 비교하였다. 둘째, 회귀분석에서는 플랫폼과 주제의 고정효과를 포함하여 배경 요인을 통제한 상태에서 제목의 효과를 추정하였다. KOLD는 로지스틱 회귀를, KHS는 주제 고정효과를 제외한 동일한 절차를 적용하였다. 댓글이 기사·영상 단위로 묶여 독립적이지 않다는 점을 고려하여, 모든 회귀분석은 제목 수준에서 강건 표준오차를 사용하였다. 또한 댓글이 과도하게 많은 일부 제목이 결과를 왜곡하지 않도록, 필요 시 제목별 가중치를 균등화한 대체 추정을 수행하였다.

분석 결과는 발생확률 변화율(한계효과)을 중심으로 보고하였다. KOLD의 강도 지표는 연속값이므로, 회귀계수와 함께 상·하위 집단 간 평균 차이도 함께 제시하였다. 다중 검정에서 발생할 수 있는 오류는 FDR(False Discovery Rate)과 Holm 보정을 통해 관리하였으며, 데이터가 드문 경우에는 보정된 로지스틱 회귀로 결과를 교차 검증하였다. 또한 결과의 안정성과 재현성을 확보하기 위해 교차검증과 민감도 분석을 실시하였다. 교차검증은 제목 단위 그룹을 유지한 방식으로 과적합 가능성을 점검하였으며, 필요 시 정규화와 클래스 불균형 보정을 적용하였다. 민감도 분석은 입력 변수 구성, 라벨 정의, 분위 컷오프, 시간 통제, 표본 가중 등 다양한 측면에서 이루어졌고, 주요 계수의 방향과 크기가 설정을 달리해도 일관됨을 확인하였다. 마지막으로, 분석 절차와 컷오프 기준은 연구 전체에서 동일하게 적용하여 일관성을 유지하였으며, 결측값은 단순 배제 원칙을 따랐다.

4-4 제목의 언어적, 비언어적 신호의 플랫폼별, 주제별 차이

플랫폼 간 대비에서 가장 두드러진 차이는 제목의 길이와 인용부호 관행이다. NAVER 뉴스는 제목이 짧고, 따옴표를 활용하는 비율이 높다(77.3%). 면 YouTube는 제목이 길고(중앙 41자, 80분위 53자) 따옴표 사용이 낮다(23.9%). 물음표와 느낌표의 사용은 유튜브가 상대적으로 적극적이며(물음표 ≥1: 16.5% vs 13.4%, 느낌표 ≥1: 2.1% vs 1.2%), 숫자 노출과 선정적 키워드의 사용은 유튜브가 약간 높게 나타났다(선정적 키워드 존재율 4.2% vs 3.4%). 이러한 차이를 표 6에 요약하였다.

Table 6.

Platform-specific title features summary

기사(또는 영상)의 주제별 대비는 규칙 사전을 기반으로 정치, 사회, 연예, 기타로 구분하여 비교하였다. 정치, 사회 주제는 인용부호 활용이 높고(정치 73.9%, 사회 71.8%), 제목 길이가 짧은 편이며, 연예 기사는 제목이 길고(중앙 41자) 물음표와 느낌표가 두드러진다(물음표 ≥1: 15.7%, 느낌표 ≥1: 8.3%). 숫자 노출은 연예 기사에서 평균 1.06자로 높게 나타났고, 선정적인 키워드의 존재율도 연예 기사가 가장 높다(4.2%). 이는 연예 기사의 제목이 과장과 호기심을 유발하는 신호를 상대적으로 더 활용하는 경향을 시사한다. 요약값은 표 7에 정리하였다.

Table 7.

Topical title features summary

4-5 제목의 언어적, 비언어적 신호의 분위별 댓글 공격성

표 8은 제목의 형식적 특징이 댓글 공격성과 어떻게 연관되는지를 보여준다. 첫째, 가장 두드러진 차이는 따옴표의 사용이다. 따옴표가 많은 제목(상위 20%)은 따옴표가 없는 제목(하위 20%)보다 댓글에서 공격성이 약 28%p 더 높게 나타났다. 다만, 따옴표가 논란성 발언을 직접 드러내는 편집 전략과 함께 작동했을 가능성이 있어, 이후 플랫폼과 주제를 통제한 검증이 필요하다. 둘째, 제목 길이는 반대의 효과를 보였다. 긴 제목(상위 20%)은 짧은 제목(하위 20%)보다 공격성 비율이 약 9%p 낮았다. 이는 긴 제목이 맥락을 제공해주어 과격한 해석을 줄이거나, 짧은 제목에서 흔히 나타나는 자극적 요약이 적기 때문일 수 있다. 숫자 노출도 유사한 패턴을 보였다. 숫자가 많은 제목은 공격성이 약 5%p 낮았으며, 특히 퍼센트 표기나 인원 표시는 효과가 거의 없었다. 이는 숫자 자체보다 그것을 어떤 맥락에서 사용하는지가 더 중요함을 시사한다. 셋째, 문장부호와 자극적 키워드는 상대적으로 작은 효과만 보였다. 물음표와 느낌표가 있는 제목은 각각 약 4%p 안팎으로 공격성 비율을 조금 높였고, 자극적 키워드도 약 3%p 정도 상승에 그쳤다. 따라서 이들 특징은 방향성은 있으나, 플랫폼이나 주제를 통제하면 효과가 약해질 가능성이 크다.

Table 8.

Rate of aggression according to title features (top 20% vs. bottom 20% or 1 vs 0, KOLD)

표 9는 공격성이 발생한 댓글 안에서, 공격 표현의 강도(intensity)를 비교한 결과이다. 전반적으로 평균 강도 차이는 0.1%p 내외로, 제목에 따른 영향이 거의 없었다. 따옴표가 많은 제목이 없는 제목보다 강도가 약간(+0.13%p) 높았지만, 절대 크기는 공격성 발생 여부 차이에 비해 미약했다. 이는 KOLD의 라벨링이 짧은 표현 단위에 집중되어 있어, 댓글 전체 길이 대비 비율로 환산하면 차이가 희석된 결과로 해석된다. 느낌표, 물음표, 자극적 키워드, 숫자 사용 여부도 강도에는 거의 차이를 만들지 않았다. 요컨대 제목의 요소는 ‘공격성이 생기는지 여부’에는 영향을 주지만, ‘공격이 얼마나 길고 강한지’에는 거의 영향을 주지 않는다고 해석할 수 있다.

Table 9.

Offensive intensity according to title features (top 20% vs bottom 20%, off = true sample)

4-6 고정효과 회귀와 예측 성능

본 절에서는 뉴스와 동영상 제목에 포함된 형식적 신호가 댓글의 공격성 여부에 어떤 영향을 미치는지를 댓글 단위 로지스틱 회귀로 분석하였다. 분석 목적은 두 가지이다. 첫째, 기술통계에서 나타난 패턴이 단순히 플랫폼·주제 구성 차이 때문인지, 아니면 제목의 형식적 신호가 독립적으로 공격성 발생 확률을 변화시키는지를 검증하는 것이다. 둘째, 이러한 신호들이 공격적 댓글 생성 가능성에 미치는 순효과를 정량화하여 정책적·실무적 해석이 가능하도록 하는 데 있다.

이를 위해 네이버·유튜브 기반의 KOLD와 KHS 데이터를 정규화·결합한 뒤, 제목 길이, 문장부호(!, ?, “ ”), 숫자·퍼센트 표현, 자극적 키워드 등 형식적 신호만을 독립변수로 구성하였다. 분석은 플랫폼(네이버/유튜브)과 주제(정치/사회/연예/기타)의 고정효과를 포함한 로지스틱 회귀로 수행하였으며, 동일 제목에서 생성된 댓글 간 비독립성을 반영하기 위해 제목 단위 군집화 표준오차를 사용하였다. 모형식은 그림 2에 제시하였으며, 주요 결과는 표 10에 요약하였다. 해석은 회귀계수를 확률 변화로 변환한 한계효과(AME, %p) 기준으로 제시한다.

Fig. 2.

Logistic-regression model linking headline formal cues to comment aggression

Table 10.

Fixed effects logistic (OFF) — Key effects (AME, %p) and significance

로지스틱 회귀를 채택한 이유는 다음과 같다. (i) 종속변수가 이진이므로 선형확률모형(LPM)에서 발생하는 [0,1] 범위 이탈 및 분산 불균등 문제를 피할 수 있고, (ii) 플랫폼·주제 고정효과를 포함해 제목 신호의 순효과를 식별할 수 있으며, (iii) AME를 사용하여 “특정 신호가 포함되면 공격성 발생 확률이 몇 %p 변하는가”를 명료하게 해석할 수 있고, (iv) 퍼센트 표기, 느낌표 등 희귀하거나 편향된 분포를 가진 신호에 대해서도 비교적 안정적인 추정이 가능하기 때문이다.

데이터는 제목 단위로 구분해 80%는 학습, 20%는 홀드아웃 검증 표본으로 사용하였다. 예측 성능은 ROC-AUC, PR-AUC, Brier 점수, 신뢰도 곡선을 통해 평가하였다. 이를 통해 회귀식의 설명력뿐 아니라 형식 신호 기반 탐지 모형의 실제 예측 가능성을 함께 검증하였다.

분석 결과는 다음과 같다. 첫째, 숫자 정보는 강한 쌍봉형(U-shape) 효과를 보였다. 숫자가 많은 제목(상위 20%)에서는 공격성 발생 확률이 약 +8.5%p, 숫자가 거의 없는 제목(하위 20%)에서도 +5.4%p 증가하였다. 특히 퍼센트 표기(예: “N%”)는 +9.8%p로 가장 큰 효과를 보였다. 이는 정보량 과다(‘숫자 폭탄형’)와 정보량 부족(‘구호형’) 모두가 독자의 해석 부담 또는 대립적 반응 가능성을 높여 공격성을 유발할 수 있음을 시사한다.

둘째, 느낌표는 단순 비교에서는 공격성 비율을 높였으나(+4.4%p), 플랫폼과 주제를 통제한 회귀분석에서는 오히려 −11.4%p로 감소하였다. 이는 느낌표가 주로 유튜브와 연예 기사에서 사용되며, 해당 맥락 자체가 원천적으로 낮은 공격성 수준을 갖고 있기 때문에 나타난 결과로 해석된다.

셋째, 따옴표와 자극적 키워드는 플랫폼과 주제를 통제한 뒤에는 유의한 영향을 보이지 않았다. 앞서 관찰된 “따옴표 사용 시 공격성 증가” 현상은 실제로는 정치·사회 분야에서 인용을 강조하는 포털 뉴스 편집 관행과 결합된 결과임이 확인되었다.

넷째, 플랫폼과 주제 수준의 효과는 뚜렷하게 나타났다. 플랫폼별로는 유튜브가 네이버보다 공격성 발생 확률이 낮았으며, 주제별로는 사회 > 기타 ≈ 정치 > 연예 순으로 나타났다. 이러한 결과는 댓글 공격성의 절대 수준은 제목 신호보다 플랫폼·주제 구조에 더 크게 좌우됨을 의미한다.

제목의 형식적 신호는 단순한 표면적 장식 요소가 아니라, 독자의 주의, 감정, 해석 프레임을 조절하는 인지 및 정서적 신호로 기능한다. 퍼센트 표기는 사건을 집단 전체의 리스크로 일반화하는 인지적 경향을 강화해 편향 귀인(biased attribution)을 유발하고, 이는 공격적 반응으로 이어질 수 있다. 반면 느낌표는 주제·플랫폼 맥락과 강하게 결합해 단독 신호로는 공격성을 유발하지 않으며, 연예·유튜브 맥락에서는 친밀감·흥미를 강화하는 기능을 수행한다. 인용부호 또한 맥락적 편집 전략과 결합해 나타나는 효과가 크므로, 신호 자체의 효과와 맥락효과를 분리해야 한다.

이처럼 형식 신호는 독립적인 영향뿐 아니라 플랫폼·주제와의 상호작용을 통해 댓글 공격성의 방향과 강도를 체계적으로 조절하는 요소임이 확인되었다. 이는 향후 자동화된 위험 기사 탐지, 댓글 관리 정책, 제목 편집 가이드라인 등 다양한 실무 영역에서 활용 가능한 실증적 근거를 제공한다.

4-7 강건성 점검: 구현 선택에 따른 결론 유지 여부

동일 검증 표본에서 입력·모형 사양을 달리하여 결과의 안정성을 확인하였다. 우선 희귀 특징 분포는 플랫폼 수준(표 6)과 주제 수준(표 7) 모두에서 최소 유병률 기준(≥0.5–1%)을 충족했다. 예컨대 퍼센트 표기는 전체 KOLD에서 270/40,429(≈0.67%)이며, 주제별로는 ≈0.9–1.4% 범위에 위치한다(표 7). 느낌표(≥1)는 1.2–2.1%, 인원표현은 0.5–2.2% 수준으로 낮지만 기준 이내다.

대체 사양 측면에서, Firth 로지스틱 및 L2 정규화 로지스틱으로 재추정해도 핵심 효과의 부호와 방향은 동일했고, 완전분리 신호는 관찰되지 않았다. 또한 제목 단위 부트스트랩과 그룹 5-fold 교차검증에서 평균 한계효과(AME, %p) 의 부호 안정성이 확인되었으며, 크기 차이는 소수점 수준으로 정책적 결론에 영향이 없었다. 종합하면, 퍼센트 표기는 증가, 느낌표(≥1)는 감소라는 핵심 결론은 구현 선택에 관계없이 일관되게 유지되었다(효과 크기 요약은 표 10 참조).

요약하면, 본 연구의 핵심 결론인 퍼센트가 표기된 제목은 댓글 공격성을 높이고, 느낌표는 플랫폼과 주제를 통제하면 오히려 공격성을 낮추는 경향은 다양한 구현 선택에도 변함없이 확인되었다. 이는 뉴스와 영상 편집 과정에서 퍼센트 표기의 남용을 줄이고, 구호형, 단문형 표제와 같이 짧게 압축된 제목 사용을 관리할 필요가 있음을 시사한다. 플랫폼별로는 유튜브가 네이버보다 공격성 발생 확률이 낮았으며, 주제별로는 사회 > 기타 ≈ 정치 > 연예 순으로 나타났다. 이는 특정 주제 영역과 플랫폼 맥락이 댓글 공격성 수준을 결정하는 핵심 요인임을 보여준다. 또한 댓글 관리 시스템을 설계할 때에도, 제목에 포함된 단순한 표현 특징만으로도 일정 수준의 댓글을 걸러낼 수 있는 선별력을 확보할 수 있음을 보여준다.

Ⅴ. 결 론

온라인 뉴스와 동영상 플랫폼에서 제목은 독자가 콘텐츠를 접하는 첫 관문으로, 이용자의 관심을 끌고 특정한 해석의 틀을 제공한다. 그러나 제목 속에 사용된 다양한 형식적 신호가 실제로 독자의 반응, 특히 댓글 공격성에 어떤 영향을 주는지에 대한 실증 연구는 부족했다. 이에 본 연구는 뉴스 제목에 나타난 형식적, 언어적 신호가 댓글의 공격성 발생 여부와 강도에 어떠한 차이를 만들어내는지를 규명하고자 하였다.

본 연구는 세 가지 핵심 결론을 도출하였다. 첫째, 제목에 포함된 숫자 관련 신호-특히 퍼센트 표기-는 댓글 공격성 발생 확률을 일관되게 높이는 것으로 나타났다. 둘째, 느낌표는 단순 비교에서는 댓글 공격성을 증가시키는 것처럼 보였으나, 플랫폼과 주제를 통제한 이후에는 오히려 공격성을 낮추는 효과가 관찰되었다. 셋째, 따옴표와 제목 길이의 효과는 통제 이후 약화되었는데, 이는 표면적으로 보였던 효과가 사실상 기사 주제와 플랫폼에 따른 차이를 반영했음을 의미한다.

특히 따옴표 효과는 주제와의 상호작용 가능성이 크다는 점을 암시한다. 단순 비교에서는 따옴표 사용이 댓글 공격성과 함께 나타났지만, 통제 후 유의성이 사라진 것은 따옴표 자체보다는 사용 맥락에 따라 효과가 달라짐을 시사한다. 예컨대 정치·사회 기사에서는 논란이 되는 발언을 직접 인용하여 제목을 구성하는 경우가 많아 댓글의 공격성을 촉발할 가능성이 크다. 반면 연예 기사에서는 음악 제목이나 연예인의 일상적 발언을 강조하는 수준에 머무르는 경우가 많아 공격성과의 연관성이 약하다. 따라서 따옴표의 효과는 특정 주제 영역에서 강화되는 상호작용적 성격을 가지며, 향후 연구에서는 주제별·플랫폼별 따옴표 활용 맥락을 분리하여 분석할 필요가 있다

강건성 점검에서도 이 연구의 결론은 유지되었다. 분위수를 나누는 기준값, 시간 고정효과, 표본 가중 방식을 달리해도 퍼센트 표기의 증가 효과와 느낌표의 감소 효과는 일관되게 나타났다. 반면 강도(intensity)는 평균 0.1%p 내외의 미약한 수준이어서, 댓글 공격성 연구와 실무적 차원의 관리에서는 공격성 발생 여부를 중심으로 접근하는 것이 타당함을 확인했다.

본 연구의 의의는 첫째, 제목의 내용 정보를 사용하지 않고도 제목에 사용된 형식적 신호–언어적, 비언어적 신호-만으로 댓글 공격성의 체계적 변동을 설명할 수 있음을 보여주었다. 나아가 플랫폼과 기사 주제를 통제한 뒤 각각 분리하여 해석함으로써 방법론적 기여를 확보하였다. 둘째, 퍼센트 표기와 같은 수량화 신호가 지속적으로 나타나는 위험 요인임을 보여줌으로써, 표제 제작 단계에서 퍼센트 표기를 자제하거나 퍼센트가 표기된 표제를 우선 검토 대상으로 삼을 수 있는 정책적 근거를 제시하였다. 셋째, 단순한 상관관계와 구조적 효과를 구분하고, 예측 성능 지표와 보정 결과까지 함께 제시함으로써 학술적 타당성과 실무적 활용 가능성을 동시에 높였다.

본 연구에는 몇 가지 한계가 존재한다. 첫째, 규칙 기반 주제 분류는 오분류가 발생할 수 있다. 예컨대 “정부, BTS 군 면제 논란”과 같은 제목은 연예 기사로 분류될 수 있으나, 맥락은 정치·사회적 논란도 포함하고 있다. 이처럼 복합 주제를 담은 표제에서는 분류 기준의 경계에서 오류 가능성이 존재한다. 둘째, 분석 변수가 제목의 형식에 한정되어 있어 의미적 맥락이나 반어적 표현은 포착하지 못한다. 예를 들어 “좋~다”와 같이 겉보기에는 긍정 표현이지만 실제로는 비꼼을 담은 제목은 식별이 어렵다.

이러한 한계를 전제로, 향후 연구는 다음과 같이 확장할 수 있다. 첫째, 표제–본문–댓글 간의 삼중 연동을 분석하여, 표제가 본문 정보와 얼마나 일치 또는 불일치하는지가 댓글 공격성에 어떤 중개 효과를 가지는지 검토할 필요가 있다. 둘째, 사전 보정(calibration) 절차를 자동화하여 플랫폼별, 주제별로 신뢰도를 균형 있게 유지하는 임계값 운영 방안을 탐색할 수 있다. 예컨대 사회 분야에서는 보다 보수적인 임계값 설정이 요구될 수 있다. 셋째, 정책 시뮬레이션을 통해 퍼센트 표기 최소화, 숫자 나열 제한, 인용부호 사용 가이드라인과 같은 편집 규칙 변경이 댓글 공격성 발생에 미치는 영향을 정량적으로 추정할 필요가 있다. 넷째, 플랫폼 간 상호작용 효과를 포함하여 특정 신호의 효과가 플랫폼별로 달라지는지를 비교하는 연구도 유의미할 것이다.

본 연구는 뉴스 제목의 형식적 신호가 단순한 표현상의 장치가 아니라, 독자의 정서적 반응과 댓글 공격성에 체계적으로 영향을 미칠 수 있음을 실증적으로 보여주었다. 이러한 발견은 온라인 뉴스 편집 과정에서 표제 작성이 단순한 언어 선택을 넘어 사회적 파급력을 가진다는 점을 시사하며, 나아가 플랫폼 운영자와 언론사가 신뢰성 있는 정보 환경을 조성하기 위한 실질적 근거를 제공한다.

References

A. Banerjee and O. Urminsky, “The Language that Drives Engagement: A Systematic Large-Scale Analysis of Headline Experiments,” Marketing Science, Vol. 44, No. 3, pp. 491-732, May-Jun 2025. [https://doi.org/10.1287/mksc.2021.0018]
L. Guo, C. C. Su, and H.-T. Chen, “Do News Frames Really Have Some Influence in the Real World? A Computational Analysis of Cumulative Framing Effects on Emotions and Opinions about Immigration,” The International Journal of Press/Politics, Vol. 30, No. 1. pp. 211-231, October 2023. [https://doi.org/10.1177/19401612231204535]
S. Cho. “The Effects of Headline & Leadline in the Online Newspaper,” Korean Journal of Journalism & Communication, Vol. 49, No. 2. pp. 5-32, April 2005.
S. Pengnate, “Shocking Secret You Won’t Believe! Emotional Arousal in Clickbait Headlines,” Online Information Review, Vol. 43, No. 7, pp. 1136-1150, October 2019. [https://doi.org/10.1108/oir-05-2018-0172]
O. Hwang, “Analyzing the Use of Language for Online News Article Titles in the Age of Fake News,” Ratio et Oratio, Vol. 15, No. 1, pp. 187-219, April 2022.
J. H. Lee, “Implications and Theories of Headline Journalism: Focusing on Headlines of Newspapers and Portal Sites,” Locality & Communication, Vol. 19, No.1, pp. 249-280, February 2015.
J. Suler, “The Online Disinhibition Effect,” CyberPsychology & Behavior, Vol. 7, No. 3, pp. 321-326, 2004. [https://doi.org/10.1089/1094931041291295]
S. Lee, M. Jo, E. Chae, and H. Kim, “Analysis of Major Components of YouTube Fishing Content,” in Proceeding of the 29th Annual Conference of Korea Information Processing Society, Chuncheon, Gangwon, pp. 779-781, November 2022. [https://doi.org/10.3745/PKIPS.y2022m11a.779]
K. Coe, K. Kenski, and S. A. Rains, “Online and Uncivil? Patterns and Determinants of Incivility in Newspaper Website Comments,” Journal of Communication, Vol. 64, No. 4, pp. 658-679, August 2014. [https://doi.org/10.1111/jcom.12104]
E. Wulczyn, N. Thain, and L. Dixon, “Ex Machina: Personal Attacks Seen at Scale,” in Proceedings of the 26th International Conference on World Wide Web (WWW ’17), Perth: Australia, pp. 1391-1399, 2017. [https://doi.org/10.1145/3038912.3052591]
T. Davidson, D. Warmsley, M. Macy, and I. Weber, “Automated Hate Speech Detection and the Problem of Offensive Language,” arXiv:1703.04009, , 2017. [https://doi.org/10.48550/arXiv.1703.04009]
A.-M. Founta, C. Djouvas, D. Chatzakou, I. Leontiadis, J. Blackburn, G. Stringhini, ... and N. Kourtellis, “Large Scale Crowdsourcing and Characterization of Twitter Abusive Behavior,” in Proceedings of the 12th International AAAI Conference on Web and Social Media (ICWSM 2018), Stanford: CA, pp. 491-500, 2018. [https://doi.org/10.48550/arXiv.1802.00393]
M. Zampieri, S. Malmasi, P. Nakov, S. Rosenthal, N. Farra, and R. Kumar, “SemEval-2019 Task 6: Identifying and Categorizing Offensive Language in Social Media (OffensEval),” in Proceedings of the 13th International Workshop on Semantic Evaluation (SemEval-2019), Minneapolis: MN, pp. 75-86, 2019. [https://doi.org/10.18653/v1/S19-2010]
L. Lotto, A. Tasso, T. Gavaruzzi, A. Carnaghi, and R. Rumiati, “How Framing and Numerical Information Affect People’s Judgments When They Read a Newspaper Story,” New Ideas in Psychology, Vol. 32, pp. 33-41, 2013. [https://doi.org/10.1016/j.newideapsych.2013.09.001]
S. Heo and K. Sohn, “Feature Extraction to Detect Hoax Articles,” Journal of KIISE, Vol. 43, No. 11, pp. 1210-1215, November 2016. [https://doi.org/10.5626/jok.2016.43.11.1210]
R. M. Entman, “Framing: Toward Clarification of a Fractured Paradigm,” Journal of Communication, Vol. 43, No. 4, pp. 51-58, December 1993. [https://doi.org/10.1111/j.1460-2466.1993.tb01304.x]
S. Iyengar, Is Anyone Responsible?: How Television Frames Political Issues, Chicago, IL: University of Chicago Press, 1994.
E. Peters, D. Västfjäll, P. Slovic, C. K. Mertz, K. Mazzocco, and S. Dickert, “Numeracy and Decision Making,” Psychological Science, Vol. 17, No. 5, pp. 407-413, 2006. [https://doi.org/10.1111/j.1467-9280.2006.01720.x]
C. H. Vreese, “News Framing: Theory and Typology,” Information Design Journal, Vol. 13, No. 1, pp. 51-62, 2005. [https://doi.org/10.1075/idjdd.13.1.06vre]
J. S. Lee, J. Yu, J. Kang, and J. Kim, “The Influence of the Frame and Genre of Portal News Articles on the Type of Online Replies,” Korean Journal of Journalism & Communication, Vol. 54, No.2, pp. 116-137, 2010.
B. Jwa, H. J. Paek, and P. Seo, “Analysis of Online News and Comments about Anti-Smoking Policy,” Journal of Public Relations Vol. 18, No. 3, pp. 13-43, 2014. [https://doi.org/10.15814/jpr.2014.18.3.13]
S. Kim, “Current Status of Journalism Using Double Quotation Marks: Focusing on the Case of Reporting Men in Their 20s,” The Journal of the Korea Contents Association, Vol 24, No. 6, pp. 126-140, June 2024. [https://doi.org/10.5392/JKCA.2024.24.06.126]
J. W. Rhee, S. M. Yang, K. C. Kim, and H. Song, “Direct Quotations in Newspaper Headlines in the Coverage of the Local Election on May 31, 2006,” Korean Journal of Journalism & Communication, Vol 51, No. 3, pp. 64-90, 2007.

조윤용(Yoon Y. Cho)

2005년：University of Missouri (언론학 석사)

2012년：University of Oregon (커뮤니케이션학 박사)

2020년～현 재: 경기대학교 자유교양대학 교양학부 조교수

※관심분야：빅데이터, 소셜미디어, 미디어리터러시

하은아(Euna Ha)

2004년：서울대학교 대학원 (디자인학석사)

2014년：서울대학교 대학원 (디자인학박사)

2017년～현 재: 경기대학교 자유교양대학 교양학부 조교수

※관심분야：이러닝, 데이터 시각화, 디자인 마케팅, 브랜드

김현아(Hyun-Ah Kim)

2003년：경기대학교 전자계산학과 (이학석사)

2009년：경기대학교 전자계산학과 (이학박사)

2018년～현 재: 경기대학교 자유교양대학 교양학부 조교수

※관심분야：BPM, 빅데이터, 데이터 마이닝, 머신러닝, IoT, 이러닝, 딥러닝 강화학습

platform	N	off_rate	N_titles	median_title_ len	median_ comment_len	date_min	date_max	off_span_ coverage	tgt_coverage
Naver_news	22,028	0.635	22,028	33	38	2020-03-31	2022-03-31	1	0.635
YouTube	18,401	0.344	18,401	41	33	2020-08-25	2022-03-31	1	0.344
ALL	40,429	0.502	40,429	35	36	2020-03-31	2022-03-31	1	0.502

feature	name	definition
*keywords such as “shocking,” “exclusive,” “breaking,” “official,” “unprecedented,” or “record-high.”
len_chars	Character length	Total number of characters in the normalized title
len_tokens	Token length	Number of tokens, split by whitespace
n_exclam	Number of exclamation marks	Frequency of '!'
n_question	Number of question marks	Frequency of '?'
n_quotes	Number of quotation marks	Total number of " and ' (direct or indirect quotation signals)
n_digits	Number of digits	Count of numeric digits (0–9) in the title
latin_upper_share	Uppercase English letter ratio	Ratio of uppercase English letters among alphabetic characters
kw_sensational	Presence of sensational keyword	Binary (0/1). At least one from dictionary:
kw_sensational_hits	Count of sensational keywords*	Total number of matches from the sensational keyword dictionary
subj_lex	Subjectivity score	(positive + negative tokens) ÷ total tokens; based on small lexicon
polarity_lex	Polarity score	(positive − negative tokens) ÷ total tokens; based on small lexicon
has_person_num	Presence of person count expression	Binary (0/1). Regex match for expressions like ￦d+ people
has_percent	Presence of percentage expression	Binary (0/1). Regex match for ￦d+% or the word “percent”

feature	q20	q80
len_chars	29.0	47.0
len_tokens	6.0	10.0
n_exclam	0.0	0.0
n_question	0.0	0.0
n_quotes	0.0	4.0
n_digits	0.0	2.0
latin_upper_share	0.0	0.4
subj_lex	0.0	0.0
polarity_lex	0.0	0.0

platform	N	median_len	p80_len	share_ quotes>0	share_ question>0	share_ exclam>0	avg_digits	share_sensational_kw	share_ person_num	share_ percent
Naver_news	22,028	33	38	0.773	0.134	0.012	0.49	0.0342	0.022	0.011
YouTube	18,401	41	53	0.239	0.165	0.021	0.67	0.0423	0.005	0.010

topic	N	median_len	p80_len	share_ quotes>0	share_ question>0	share_ exclam>0	avg_digits	share_sensational_kw	share_ person_num	share_ percent
Miscellaneous	37,834	36	49	0.494	0.150	0.016	0.60	0.039	0.015	0.009
Politics	622	31	35	0.739	0.090	0.003	0.23	0.011	0.006	0.011
Social affairs	1,259	34	41	0.717	0.122	0.003	0.29	0.018	0.013	0.013
Entertainment	714	41	54	0.303	0.157	0.083	1.06	0.042	0	0.014

Corpus	Field	Description
KOLD	platform	Naver_news / YouTube
KOLD	date	Comment posting date (YYYY-MM-DD)
KOLD	title	Article/video titles
KOLD	comment	Comment text
KOLD	off	Aggressiveness (binary)
KOLD	tgt	Target category of the attack (Group/Individual/Unspecified/Other)
KOLD	type	Type of attack (if available)
KOLD	off_span	Span of the offensive expression
KOLD	title_len	Title length (characters)
KOLD	comment_len	Comment length (characters)
KHS	news_title	Entertainment article title
KHS	comment(s)	Comment text (same as comment)
KHS	hate	{none, offensive, hate}
KHS	bias	{none, gender, others}
KHS	toxic	toxic=1 (hate!≠'none') OR (bias!≠'none')
KHS	split	{train, dev, test}

split	N	toxic_rate	N_titles	median_title_ len	median_ comment_len	hate_dist	bias_dist
ALL	9,341		9,341	42	31	{"none": 0.436, "offensive": 0.321, "hate": 0.243}	{"none": 0.656, "others": 0.189, "gender": 0.155}
dev	471	0.684	471	43	30	{"offensive": 0.401, "none": 0.340, "hate": 0.259}	{"none": 0.726, "gender": 0.142, "others": 0.132}
test	974		974	42	31	{}	{}
train	7,896	0.586	7,896	42	31	{"none": 0.441, "offensive": 0.316, "hate": 0.242}	{"none": 0.652, "others": 0.192, "gender": 0.156}

feature	N_low(or 0)	off_rate_low(or 0)	N_high(or 1)	off_rate_high(or 1)	delta
len_chars_bin	9,885	0.473	6,951	0.380	-0.093
n_quotes_bin	19,015	0.378	552	0.658	0.279
n_digits_bin	28,742	0.527	5,417	0.480	-0.047
exclam_ge1 (1 vs 0)	39,315	0.501	1,114	0.546	0.044
question_ge1 (1 vs 0)	35,061	0.494	5,368	0.532	0.038
quotes_ge1 (1 vs 0)	19,015	0.378	21,414	0.612	0.234
kw_sensational (1 vs 0)	38,702	0.501	1,727	0.527	0.026
has_percent (1 vs 0)	40,159	0.503	270	0.496	-0.006
has_person_num (1 vs 0)	39,556	0.503	873	0.482	-0.022

feature	N_low(or 0)	intensity_low(or 0)	N_high(or 1)	intensity_high(or 1)	diff
len_chars_bin	5,125	0.0014	2,640	0.0013	-0.0001
n_quotes_bin	7,060	0.0011	363	0.0024	0.0013
n_digits_bin	8,960	0.0014	1,084	0.0015	0.0001
exclam_ge1 (1 vs 0)	9,796	0.0014	248	0.0011	-0.0003
question_ge1 (1 vs 0)	8,441	0.0014	1,603	0.0013	-0.0001
quotes_ge1 (1 vs 0)	7,060	0.0011	4,989	0.0018	0.0007
kw_sensational (1 vs 0)	11,733	0.0014	316	0.0013	-0.0001
has_percent (1 vs 0)	11,628	0.0014	421	0.0000	-0.0014
has_person_num (1 vs 0)	11,465	0.0014	584	0.0000	-0.0014

label	AME_pp	p_cluster
YouTube (baseline: NAVER)		0.0000
Exclamation mark ≥ 1	-11.40	0.0000
Digits: bottom 20% (vs. middle)	+5.36	0.0011
Topic: Social affairs		0.0021
Digits: top 20% (vs. middle)	+8.46	0.0033
Topic: Entertainment		0.0158
Percentage expression present	+9.81	0.0319
Topic: Politics		0.3979
Sensational keyword ≥ 1	+2.06	0.4519
Question mark ≥ 1	+0.65	0.6571
Title length: bottom 20% (vs. middle)	+0.57	0.6744
Person count expression present	+1.75	0.7291
Title length: top 20% (vs. middle)	+0.67	0.7772
Quotation mark ≥ 1	+6.46	1.0000