[ Article ]

Journal of Digital Contents Society - Vol. 27, No. 1, pp.81-92

ISSN: 1598-2009 (Print) 2287-738X (Online)

Print publication date 31 Jan 2026

Received 04 Nov 2025 Revised 08 Dec 2025 Accepted 05 Jan 2026

DOI: https://doi.org/10.9728/dcs.2026.27.1.81

검색증강 생성 구조를 활용한 뉴스 기사 기반 맞춤형 인공지능 학습 플랫폼 개발

노승아¹ ; 고예진¹ ; 김희윤¹ ; 정하은¹ ; 유견아²^{, *}

1덕성여자대학교 컴퓨터공학부 학사과정
2덕성여자대학교 컴퓨터공학부 교수

Development of a Personalized AI Learning Platform Based on News Articles Using the Retrieval-Augmented Generation Architecture

SeungA Rho¹ ; Yejin Go¹ ; Heeyun Kim¹ ; Haeun Chung¹ ; Kyeonah Yu²^{, *}

1Undergraduate Program, Department of Computer Engineering, Duksung Women’s University, Seoul 01369, Korea
2Professor, Department of Computer Engineering, Duksung Women’s University, Seoul 01369, Korea

Correspondence to: ^*Kyeonah Yu Tel: +82-2-901-8346 E-mail: kyeonah@duksung.ac.kr

Copyright ⓒ 2026 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

초록

본 연구는 뉴스 기사를 기반으로 한 학습 콘텐츠 생성을 자동화하기 위해, 기사 크롤링에서 유해 기사 필터링, 이슈 군집화, 맞춤형 글·퀴즈 생성까지의 전체 과정을 통합한 AI 학습 플랫폼을 제안하였다. 제안한 시스템은 RAG(Retrieval-Augmented Generation) 구조를 적용하여 생성 결과의 신뢰성을 확보하였으며, 학습자의 수준별 난이도 조절과 대화형 학습 기능을 결합함으로써 교육 친화적인 시사 학습 환경을 구현하였다. 시스템 구현에는 FastAPI, Spring Boot, React, GPT-4, Pinecone, Redis 등 다양한 기술 스택이 통합적으로 활용되었다. 파일럿 테스트 결과, 기사 이해도 및 학습 참여도가 향상되었으며, 사용자 설문에서도 높은 만족도와 재사용 의향이 확인되었다. 본 연구는 AI 기반 학습 지원 시스템이 시사 뉴스 학습의 접근성을 높이고, 학습자의 자율적 탐구와 피드백 중심 학습을 촉진할 수 있음을 보여준다.

Abstract

This study proposes an AI-based learning platform that automates the generation of educational content from news articles through an integrated pipeline that encompasses article crawling, harmful content filtering, issue clustering, and personalized text and quiz generation. The proposed system employs the retrieval-augmented generation architecture to ensure factual reliability while combining level-adjusted learning and interactive dialogue features to create an educationally adaptive current-affairs learning environment. The platform was implemented using FastAPI, Spring Boot, React, GPT-4, Pinecone, and Redis in an integrated manner. A pilot test demonstrated improvements in the article comprehension and learning engagement of users, and post-survey results indicated high satisfaction and willingness to reuse the service. The findings suggest that AI-driven learning support systems can enhance accessibility to current-affairs education and promote self-directed, feedback-oriented learning among students.

Keywords:

Artificial Intelligence Learning Platform, News Article Dataset, Personalized Learning, Retrieval-Augmented Generation, Text Clustering

키워드:

인공지능 학습 플랫폼, 기사 데이터셋, 개인화 학습, 검색증강 생성, 텍스트 군집화

Ⅰ. 서 론

최근 청소년들의 문해력 저하 현상이 사회적으로 심각하게 대두되고 있다. OECD가 발표한 국제 학업성취도 평가에 따르면, 한국 학생들의 읽기 영역 평균 점수는 지난 10년간 지속적으로 하락하고 있으며, 특히 비문해 수준 학생의 비율이 증가한 것으로 나타났다[1]. 디지털 네이티브 세대의 매체 활용 방식이 짧은 영상 중심으로 변화함에 따라, 장문의 텍스트를 읽고 핵심 정보를 스스로 구조화하는 능력이 약화되고 있다는 분석도 제기되고 있다[2]. 이러한 경향은 단순한 학습 효율 저하를 넘어 사회적 의사소통 능력과 비판적 사고력의 저하로 이어질 수 있다는 점에서 그 심각성이 크다.

문해력 향상을 위한 교육적 도구로 뉴스는 시의성, 정보성, 다양한 사회 맥락을 포함한다는 점에서 효과적인 학습 자료로 평가된다. 그러나 대부분의 뉴스 기사는 성인 독자를 대상으로 작성되기 때문에 어휘 난이도·문장 구조·배경지식 요구 수준이 높아, 초·중·고 학생이 직접 이해하기 어렵다는 한계가 있다. 기존의 뉴스 활용 학습 서비스들은 요약 제공이나 읽기 자료 추천에 초점을 맞추어 왔으나, 학습자의 인지 수준을 고려한 적응적 콘텐츠 제공이나 이해도 기반의 상호작용 피드백 기능은 상대적으로 부족하다. 또한 웹 기반에서 수집되는 실시간 뉴스에는 폭력·범죄·사건 사고 등 교육적으로 부적절한 내용이 포함될 가능성이 높아, 이를 선제적으로 걸러낼 수 있는 정교한 필터링 기술이 필수적이다.

최근 인공지능(AI) 기술의 발전은 이러한 문제를 해결할 가능성을 제시하고 있다. 특히 대규모 언어모델(LLM, Large Language Model)을 활용한 생성형 AI(Generative AI)는 기존 이러닝 시스템이 제공하기 어려웠던 학습자 맞춤형 기능을 자동으로 수행할 수 있다 [3]. 특히 검색증강 생성(Retrieval-Augmented Generation, RAG) 기반 기술은 외부 지식과 LLM을 결합하여 사실 기반의 신뢰도 높은 콘텐츠를 생성할 수 있어, 뉴스 기사와 같은 비정형 정보의 학습 콘텐츠화를 가능하게 한다.

그러나 현재 제안된 교육용 생성형 AI 시스템들은 주로 성인 사용자 또는 일반적인 정보요약 중심 기능에 머무르고 있으며, 학습자의 연령·수준에 맞춘 난이도 조절, 오답 기반 피드백, 학습 맥락 유지 등의 정교한 학습 지원 기능은 충분히 연구되지 않았다.

이를 해결하기 위해 본 연구는 뉴스 기사 기반의 개인화 학습을 지원하는 RAG 기반 AI 학습 플랫폼을 제안한다. 제안하는 시스템은 뉴스 기사를 자동 수집하고, 유해 기사 필터링을 거친 뒤, 주제별 이슈를 군집화하고 대표 제목을 생성하여 최신 시사 이슈를 학습자가 이해하기 쉬운 형태로 제공한다. 또한 사용자가 선택하거나 입력한 주제를 기반으로 의미적으로 유사한 기사를 검색하고, 그 결과를 LLM에 입력하여 맞춤형 학습용 글과 퀴즈를 자동 생성한다. 생성된 콘텐츠는 챗봇 기반 피드백 구조와 결합되어, 학습자가 수동적인 독자가 아닌 능동적 참여자로 학습에 참여하도록 유도한다.

본 논문은 다음과 같이 구성된다. 2장에서는 생성형 AI의 교육 분야 활용, 뉴스 기반 학습의 특징, 그리고 RAG 기반 콘텐츠 생성 기술에 대한 선행 연구를 검토한다. 3장에서는 제안 시스템의 전체 구조와 AI 서버의 주요 모듈 구성을 설명하고, 4장에서는 시스템 테스트 및 사용자 평가를 통해 학습 효과와 사용성, 참여도 향상을 검증하며, 마지막으로 5장에서 결론 및 향후 연구 방향을 논의한다.

Ⅱ. 관련 연구 및 기술 배경

서론에서 살펴본 바와 같이, 본 연구는 청소년의 문해력 저하 문제를 해결하기 위해 뉴스 기사를 기반으로 한 AI 학습 서비스를 제안한다. 이를 구현하기 위해서는 인공지능 기반 학습 기술, 뉴스 데이터를 활용한 교육적 접근, 그리고 RAG 구조를 통한 신뢰성 있는 콘텐츠 생성 기술에 대한 이해가 필요하다. 따라서 본 장에서는 먼저 생성형 AI가 교육 분야에서 어떻게 활용되고 있는지를 살펴보고, 이어서 뉴스 기반 학습 시스템의 기존 연구 동향을 검토한다. 마지막으로, 본 연구의 핵심 기술적 기반인 RAG 구조와 벡터 데이터베이스의 응용 사례를 분석함으로써 제안 시스템의 기술적 정당성을 확보하고자 한다.

2-1 생성형 AI와 교육 분야 활용

최근 대규모 언어모델의 발전은 교육 분야의 혁신을 이끌고 있다. GPT-4와 같은 생성형 AI는 학습자의 수준과 맥락에 따라 맞춤형 피드백과 학습 자료를 제공할 수 있어, 전통적인 이러닝 시스템의 한계를 보완하는 핵심 기술로 주목받고 있다. [4]에서는 생성형 AI가 학습자의 질문을 해석하고, 대화형 설명을 통해 학습 몰입을 유도할 수 있음을 보였으며, 특히 ChatGPT는 교사의 조력자 역할을 수행할 수 있는 잠재력을 입증하였다.

또한 [3]에서는 LLM을 활용한 학습의 효과를 종합적으로 검토하면서, 생성형 AI가 자기주도 학습과 문해력 향상에 긍정적 영향을 줄 수 있음을 보고하였다. 이러한 연구들은 AI가 단순 정보 제공을 넘어 학습자의 사고를 확장하는 인지적 파트너로 기능할 수 있음을 시사한다.

그러나 교육용으로 생성형 AI를 활용하기 위해서는 신뢰성 있는 데이터와 사실 검증, 그리고 교육 목적에 맞는 콘텐츠 통제(Content Filtering)가 병행되어야 한다. 이에 따라 AI 모델의 생성 결과 품질을 유지하기 위한 데이터 수집–정제–생성의 통합 구조 설계가 중요해지고 있다.

2-2 뉴스 기반 학습과 시사 교육 시스템

뉴스를 활용한 학습은 학습자의 비판적 사고력, 문해력, 시사 이해도 향상에 효과적이라는 점에서 여러 연구에서 검증되었다. 신문을 활용한 교육 프로그램(Newspaper in Education, NIE)이 청소년의 사회 참여와 뉴스 이해 능력을 증진시킨다고 보고된 바 있고[3], 또한 OECD의 PISA 결과에 따르면, 청소년 세대의 정보 탐색 및 텍스트 이해 능력은 학습 환경과 디지털 콘텐츠 소비 습관에 큰 영향을 받는 것으로 나타났다[1].

기존 뉴스 학습 플랫폼(예: Newsela[5], SmartNews Edu[6])은 기사 요약과 난이도 조정 기능을 제공하지만, 대부분 정적 콘텐츠 기반으로 학습자의 관심사나 수준에 따라 동적으로 콘텐츠를 구성하지는 않는다. 또한 웹 크롤링 과정에서 유해 기사나 선정적 내용이 포함될 수 있어, 자동 필터링 및 품질 관리 부재는 교육적 신뢰성을 저하시킬 수 있다. 이를 보완하기 위해 BERT 기반의 유해 기사 판별 연구[7] 등이 제안되었으나, 데이터 수집–필터링–생성까지 자동화된 통합 구조는 여전히 부족하다. 본 연구는 이를 해결하기 위해 뉴스 수집부터 필터링, 군집화, 학습용 콘텐츠 생성까지를 아우르는 자동화 AI 파이프라인을 제안한다.

2-3 RAG 기반 콘텐츠 생성과 벡터 데이터베이스 활용

대규모 언어모델은 방대한 텍스트를 학습했음에도 불구하고, 최신 정보 반영이나 사실 검증의 한계가 존재한다. 이러한 한계를 보완하기 위해 [8]에서 제안된 RAG 구조는 외부 데이터베이스에서 검색된 정보를 모델 입력에 포함시켜, 사실 기반의 생성을 가능하게 한다.

RAG 구조가 제안되기 이전에도, 검색 기반 정보를 언어모델의 생성 과정에 통합하려는 시도가 이루어져 왔다. 예를 들어, REALM 모델은 검색 모듈을 언어모델 학습 과정에 결합하여 외부 문서 검색을 포함한 자가 감독 학습을 수행함으로써 오픈 도메인 질의응답 성능을 크게 향상시킨 바 있다[9]. 또한 DPR(Dense Passage Retrieval)은 문장 표현을 쌍대 학습 방식으로 학습하여 전통적 키워드 기반 검색 방식(BM25)보다 의미적으로 더 적합한 문서를 안정적으로 검색할 수 있음을 보여주었다[10]. 이러한 연구들은 검색 모듈의 품질이 생성 성능 향상에 직접적으로 기여함을 보여주며, RAG 계열 모델의 기술적 기반을 형성하였다.

최근 Pinecone, FAISS 등 벡터 데이터베이스의 발전으로 문서 임베딩을 이용한 의미 기반 검색(Semantic Search)이 가능해졌으며, Sentence-BERT는 문장 간 의미 유사도를 효율적으로 계산하는 대표적 임베딩 기법으로 자리 잡았다[11]. 또한 한국어 환경에서는 KLUE 데이터셋이 자연어 이해 및 추론의 표준 벤치마크로 활용되고 있으며 한국어 의미기반 검색 성능에 중요한 역할을 하고 있다[12].

본 연구는 이러한 기술적 배경을 토대로, RAG 구조를 기반으로 한 Pinecone 벡터 DB와 GPT-4의 결합을 통해 학습자의 주제와 수준을 반영하는 맞춤형 기사·퀴즈 생성 시스템을 구현하였다. 이를 통해 최신 이슈를 반영한 사실 기반 콘텐츠 생성이 가능해졌으며, 단순 요약을 넘어 개인화된 학습용 글·퀴즈 생성으로 확장할 수 있었다. 제안 시스템은 LLM의 생성 능력과 벡터 기반 검색의 정확성을 결합하여 실시간 의미 중심 학습 환경을 제공한다는 점에서 기존 교육용 뉴스 시스템과 차별성을 갖는다.

2-4 유해 기사 필터링을 위한 AI 기반 분류 연구

웹 크롤링을 통해 수집된 뉴스 데이터에는 범죄, 폭력, 혐오 표현 등 교육적으로 부적합한 내용이 포함될 가능성이 높다. 이러한 유해성 판단 문제는 자연어 처리 분야의 텍스트 분류 연구에서 활발하게 다뤄지고 있으며, 특히 댓글·SNS 데이터를 중심으로 한 한국어 유해성 탐지 연구들이 존재한다.

‘BEEP! 코퍼스’는 한국어 온라인 뉴스 댓글을 대상으로 독성 표현을 라벨링하고, BERT 기반 분류 실험을 통해 한국어 유해성 탐지 모델의 기초 성능을 제시한 연구이다[13]. 이는 한국어 환경에서 공격적 표현을 체계적으로 정의하고 벤치마크를 구축한 초기 연구로 평가된다. 한편, K-HATERS 코퍼스는 19만 건 이상의 뉴스 댓글을 수집하여 유해성 등급을 부여한 대규모 한국어 독성 데이터셋이며, 한국어에서 문제적 표현을 유형별로 분류하는 라벨 체계를 제안함으로써 보다 세밀한 유해성 판단이 가능하도록 하였다[14]. 또한 KOLD(Korean Offensive Language Dataset)는 온라인 발화를 대상으로 공격적 언어를 폭넓게 수집·정제하여 구축된 한국어 유해 표현 벤치마크로, 여러 BERT 계열 모델을 활용한 비교 실험을 통해 한국어 유해성 탐지 연구의 평가 기준을 제시하였다[15].

이와 같이 기존 연구들은 한국어 유해 표현을 효과적으로 식별하기 위한 데이터셋 구축과 모델 성능 평가를 주요 기여로 하는 벤치마크 중심 연구이며, 대부분 댓글이나 짧은 온라인 발화와 같은 단문 텍스트에 초점을 맞추고 있다. 그러나 본 연구와 같이 수백~수천 자 분량의 뉴스 기사 전체를 단위로 교육적 부적합 여부를 판단하는 모델은 기존 문헌에서 충분히 다루어지지 않았다. 특히 뉴스 기사는 문장 구조, 맥락 정보, 주제 일관성 등이 댓글과 크게 달라 단문 기반 유해 표현 분류 모델을 그대로 적용하기 어렵다.

본 연구는 이러한 한계를 보완하고자, 한국어 뉴스 기사 전체를 입력으로 하여 유해 기사 여부를 판별하는 KLUE-BERT 기반 분류 모델을 구축하였으며, 크롤링 단계에서 유해 기사를 자동으로 차단하는 필터링 파이프라인을 설계하였다. 이를 통해 기존 연구들이 댓글 중심으로 국한되었던 유해성 탐지를 뉴스 도메인으로 확장하고, 교육 콘텐츠 생성에 활용 가능한 실질적 필터링 구조를 제안한다는 점에서 차별성을 가진다.

Ⅲ. 제안 시스템의 설계 및 구현

3-1 전체 시스템 구성

본 연구에서 제안하는 시스템은 인공지능을 활용하여 학습용 콘텐츠를 자동으로 생성하고, 사용자의 이해도를 기반으로 피드백을 제공하는 개인화 학습 지원 시스템이다. 시스템은 그림 1과 같이 사용자 인터페이스(UI), 메인 서버(Main Server), AI 서버(AI Server)의 세 부분으로 구성된다. 각 구성 요소는 독립적으로 동작하지만, REST API를 통해 유기적으로 연결되어 있다. 이러한 구조적 분리는 서버별 역할을 명확히 하여 시스템의 확장성과 유지보수성을 확보할 수 있도록 한다.

Fig. 1.

Overall system architecture

사용자 인터페이스는 React.js를 기반으로 구현되며, 사용자가 관심 있는 주제를 입력하거나 선택하고, 생성된 콘텐츠 및 퀴즈를 확인할 수 있다. 반응형 디자인을 적용해 다양한 디바이스에서 동일한 경험을 제공한다.

메인 서버는 Spring Boot 프레임워크를 기반으로 구축되었으며, 사용자 인증, 마이페이지, 리워드 등 일반적인 서비스 기능을 담당한다. 또한 사용자 요청을 AI 서버로 전달하고, AI 서버에서 생성된 콘텐츠를 사용자에게 반환하는 통신 중개 역할을 수행한다.

AI 서버는 FastAPI 기반으로 구현되었으며, 그림 2와 같이 데이터 수집 모듈, 유해 기사 판별 모듈, 이슈 군집화 모듈, 정보 검색 및 생성 모듈, 챗봇 모듈 등 5개의 모듈로 구성된다. 뉴스 데이터의 수집부터 콘텐츠 생성 및 사용자 피드백 처리까지의 전 과정을 담당하며, 다섯 개 주요 모듈 중, 상위 3개는 뉴스 데이터를 수집·정제·분석하여 학습용 콘텐츠의 기반 데이터를 구축하는 기사 데이터 파이프라인을 구성하고 하위 2개는 개인화된 콘텐츠가 생성되고 피드백이 제공되는 사용자 상호작용을 담당한다. AI 서버 모듈들의 세부 구현에 대해서는 다음 절들에서 다룬다.

Fig. 2.

Five modules of the AI server

주요 서버 간 상호작용 구조는 사용자의 입력, 로그인, 학습 결과 요청은 UI에서 메인 서버로 REST API를 통해 전달되며, 메인 서버는 결과(요약문, 퀴즈, 피드백 등)를 JSON 형태로 반환한다. 메인 서버와 AI 서버 간에는 AI 연산이 필요한 요청이 전달되며, 예를 들어 사용자가 주제를 선택하면 RAG 기반 콘텐츠 생성을 요청하고 AI 서버가 결과를 반환한다.

3-2 기사 데이터 파이프라인 구성

본 시스템은 최신 뉴스를 자동 수집해 의미 기반 벡터로 변환하고 저장한다. 전체 과정은 (1) 기사 데이터 수집, (2) 유해 기사 필터링, (3) 벡터화 및 저장 단계로 구성된다.

1) 데이터 수집

네이버 뉴스 섹션으로부터 사회, 문화, 과학 분야의 최신 기사를 자동 수집하였다. 해당 페이지는 무한 스크롤과 “더보기” 버튼으로 구성되어 있어, 단순 HTML 파싱만으로는 모든 기사 접근이 어렵다. 이에 따라 Selenium을 이용하여 브라우저를 자동 제어하고, 반복적인 스크롤 및 버튼 클릭을 수행하여 페이지가 완전히 로드되도록 하였다. 로드된 페이지는 BeautifulSoup으로 파싱하여 기사 링크를 추출하고, 각 기사 페이지에 Requests 라이브러리를 통해 접근하여 본문, 작성일, 이미지 설명, 원문 링크 등 주요 정보를 수집하였다.

2) 유해 기사 필터링

수집된 기사는 데이터베이스 저장 이전에 다음 절에 자세히 설명되는 유해 기사 필터링 시스템을 거쳐 교육용으로 부적합한 콘텐츠를 제거하여 이후 단계에서 불필요한 데이터가 포함되지 않도록 하였다.

3) 벡터화 및 저장 단계

필터링된 기사는 LangChain의 OpenAI Embeddings(text-embedding-3-large) 모델을 이용하여 의미 기반 고차원 벡터로 변환하였다. 본 임베딩 모델은 문장 간 의미적 유사도를 반영할 수 있어 단순 키워드 일치가 아닌, 의미적 연관성에 기반한 검색과 추천에 활용 가능하다. 변환된 벡터와 함께 기사 제목, URL, 작성 시각, 대표 이미지, 이미지 설명, 원문 링크 등의 메타데이터를 Pinecone 벡터 데이터베이스에 저장하였다. 이와 같은 과정을 통해 구축된 기사 데이터셋은 학습자의 관심사와 수준에 부합하는 맞춤형 뉴스 콘텐츠 및 퀴즈 생성을 위한 핵심 기반으로 활용된다.

3-3 유해 기사 필터링 모델

본 절에서는 웹에서 수집된 기사 중 교육 목적에 부적합한 콘텐츠를 자동으로 식별하기 위해 구축한 유해 기사 필터링 모델의 학습 구조와 구현 과정을 기술한다. 학습 보조 시스템은 다양한 온라인 뉴스를 학습 콘텐츠의 기반으로 활용하므로, 폭력적이거나 선정적인 기사가 포함될 경우 학습자의 집중도 저하 및 부정적 인식 형성을 초래할 수 있다. 따라서 본 연구에서는 기사 본문을 자동 분석하여 “유해” 여부를 분류하는 인공지능 모델을 설계하였다. 모델은 한국어 자연어 이해를 위해 사전학습된 KLUE-BERT를 기반으로 한 이진 분류 구조를 채택하였다. KLUE-BERT는 문맥 내 단어 간 의미 관계를 세밀하게 반영할 수 있어, 문장 내 잠재적 유해 표현을 효과적으로 탐지할 수 있다.

1) 데이터 구성 및 전처리

모델 학습을 위해 총 5,000개의 뉴스 기사를 확보하였다. 이 중 일반 뉴스 3,000개, 유해 뉴스 2,000개로 구성되었으며, 유해 뉴스는 살인, 폭행, 성범죄 등 부적절한 내용을 포함한 기사를 중심으로 수집하였다. 각 데이터는 제목과 본문을 모두 활용하여 문맥적 의미 기반의 분류가 가능하도록 하였다. 수집된 기사에는 광고 문구, 특수문자, 기자 서명 등 불필요한 정보가 포함되어 있었다. 이를 정제하기 위해 HTML 태그 제거, 중복 기사 제거, 본문 내 노이즈 문장 삭제를 수행하였다. 또한 50자 이하의 짧은 문서는 의미 있는 학습 데이터로 보기 어려워 제외하였다. 이후 학습용 데이터 80%, 검증용 데이터 20%로 분할하였는데 분할 과정에서는 클래스 비율을 유지하기 위해 ‘stratified split’을 적용하였다.

2) 토크나이징 및 데이터셋 구성

텍스트 데이터는 KLUE-BERT 사전학습 토크나이저를 사용하여 토큰 단위로 분리하고 정수 ID로 변환하였다. 최대 입력 길이는 512 토큰으로 제한하였으며, 짧은 문장은 패딩을 적용하여 동일한 입력 크기를 유지하였다. 학습 데이터셋은 PyTorch의 Dataset과 DataLoader를 활용하여 구성하였으며, 배치 크기는 16으로 설정하였다. 각 에포크마다 데이터를 무작위로 셔플하여 과적합을 방지하고 일반화 성능을 향상시켰다. 이와 같은 BERT 기반 토크나이징 및 입력 구성 방식은 뉴스 기사와 같이 문장 구조가 다양하고 문체적 변동이 큰 한국어 데이터 처리에 효과적인 것으로 보고된 바 있다[16].

3) 모델 아키텍처 및 학습

모델은 KLUE-BERT를 기반으로 한 BertForSequenceClassification 구조를 사용하였으며, 내부에 포함된 선형 분류기를 통해 입력된 기사를 “일반”과 “유해”로 분류한다. 사전학습된 KLUE-BERT는 문맥 내 단어 간 의미 관계를 정교하게 반영할 수 있어, 텍스트의 유해 여부를 효과적으로 판단할 수 있도록 하였다. 이러한 구조는 실제 응용 시스템에서도 안정적인 성능을 보이는 것으로 보고된 바 있으며[17], 본 연구에서는 이를 교육용 기사 데이터 필터링에 맞게 최적화하였다.

학습에는 AdamW 옵티마이저를 사용하였다. AdamW는 기존 Adam 대비 weight decay를 적용하여 모델이 과적합되는 것을 방지하며, 학습 안정성을 높인다[18]. 또한 학습률 스케줄러를 사용하였으며, 초기에는 비교적 높은 학습률로 손실을 빠르게 감소시킨 후, 이후 점진적으로 학습률을 낮추어 안정적인 수렴을 유도하였다. 총 5 에포크 동안 파인튜닝을 수행하였으며, 각 배치마다 Cross Entropy Loss(CE Loss)를 계산하여 모델 파라미터를 갱신하였다.

학습이 완료된 모델은 기사 본문을 입력받아 유해 여부를 예측하며, 유해 기사로 판정된 데이터는 이후 벡터화 및 데이터베이스 저장 단계에서 자동으로 제외된다. 이를 통해 Pinecone 벡터 데이터베이스에는 교육 목적에 적합한 기사만 저장되며, 학습 콘텐츠의 품질과 신뢰도를 동시에 확보할 수 있다.

3-4 최근 이슈 추출 및 대표 제목 생성

수집된 뉴스 기사는 단순 나열 시 학습자가 핵심 이슈를 파악하기 어렵다. 본 연구에서는 기사 데이터를 의미 기반으로 군집화하고, 각 군집의 대표 제목을 자동으로 생성함으로써 주요 뉴스를 요약 형태로 제공하였다. 전체 과정은 (1) 데이터 전처리 및 임베딩, (2) 군집화 및 평가, (3) 대표 제목 생성의 세 단계로 구성된다.

1) 데이터 전처리 및 임베딩

기사 본문은 형태소 단위로 분리하고 불필요한 요소를 제거하였다. 한국어 형태소 분석기 Okt(KoNLPy)를 사용하여 명사, 동사, 형용사, 숫자 등 핵심 품사만을 추출하고, 조사·부사 등 불필요한 품사는 제거하였다. 또한 동사와 형용사는 원형으로 복원하여 어휘 일관성을 확보하였다.

전처리된 문장은 SBERT(Sentence-BERT)를 이용해 문장 단위의 의미 임베딩으로 변환하였다. 군집화 단계에서는 대규모 뉴스 데이터를 주제별로 묶는 것, 즉 벡터간의 상대적 거리 구조가 더 중요하므로 상대적으로 저차원인 SBERT로 문장 간 의미 유사도를 효율적으로 계산해 유사한 주제를 다루는 기사들이 벡터 공간상에서 가깝게 위치하도록 한다. 이를 통해 이후 군집화 단계에서 의미적으로 관련된 기사들을 효과적으로 묶을 수 있다.

2) 군집화

벡터화된 기사들은 DBSCAN 알고리즘을 통해 군집화되었다. DBSCAN은 사전에 군집 수를 지정할 필요가 없고, 데이터 밀도를 기반으로 군집을 형성하며, 밀도가 낮은 데이터는 잡음으로 처리할 수 있다는 장점이 있다[19]. 뉴스 데이터는 특정 주제에 기사가 몰려 있는 반면, 일부 주제는 소수만 존재하는 등 불균형적 분포를 가지므로, DBSCAN은 이러한 특성을 자연스럽게 처리할 수 있다.

3) 대표 제목 생성

각 군집의 대표 제목은 LangChain 프레임워크와 ChatOpenAI GPT-4를 활용하여 생성하였다. 군집에 속한 기사 제목들을 입력으로 제공하면 GPT-4가 이를 종합하여 핵심 이슈를 대표하는 한 줄 요약을 생성한다.

예를 들어, 한 군집에 “[속보]사전투표율 69.35% 돌파”, “순창군 사전투표율 전국 1위, 역대 최고 사전투표율 기록”과 같은 제목들이 포함된 경우, GPT-4는 이를 종합하여 “전북 순창군, 사전투표율 69.35%로 전국 1위”과 같은 대표 제목을 생성한다. 이러한 방식으로 군집 내 공통 주제를 추출함으로써, 복잡한 뉴스 데이터를 직관적이고 교육 친화적인 형태로 요약할 수 있다.

3-5 개인화 학습 및 피드백 제공

본 연구에서 제안하는 시스템은 사용자의 관심사와 학습 수준에 맞춘 개인화 학습 경험을 제공하는 것을 목표로 한다. 단순히 동일한 학습 자료를 일괄적으로 제공하는 방식이 아니라, 사용자가 선택하거나 입력한 주제에 따라 맞춤형 글과 퀴즈를 자동으로 생성하며, 이를 세션 단위로 관리하여 지속적인 학습과 피드백이 가능하도록 설계하였다.

먼저 사용자는 시스템이 제시하는 대표 주제 중 하나를 선택하거나, 직접 관심 있는 최근 이슈를 입력할 수 있다. 이를 통해 학습자는 개별적 관심사에 따라 다양한 시사 주제를 탐색할 수 있으며, 자기 주도적 학습을 경험하게 된다. 이러한 방식은 학습 동기와 몰입도를 높이고, 학습자가 능동적으로 자료를 탐색하도록 유도한다.

입력된 주제는 OpenAI Embeddings를 활용하여 의미 기반 벡터로 변환된다. 변환된 벡터는 Pinecone 벡터 데이터베이스를 통해 질의되어, 의미적으로 가장 유사한 상위 문서들이 검색된다. 검색된 문서는 곧바로 생성 단계에 사용되지 않고, 품질 향상을 위해 전처리 과정을 거친다. 특히 문장 단위로 기사 작성 일자를 포함시켜 시간 정보를 명확히 반영함으로써, 모델이 과거와 현재 사건을 혼동하는 문제를 최소화하였다.

전처리된 문서는 RAG 구조의 생성(Generation) 단계에서 GPT-4 모델의 입력으로 사용된다. 이때 단순한 입력-출력 형태가 아닌, 프롬프트 엔지니어링 기법을 적용하여 (1) 글의 형식과 스타일을 정의한 시스템 프롬프트, (2) 이전 생성 결과 예시, (3) Retrieval 단계에서 확보한 문서를 함께 제공하였다. 이러한 구조를 통해 모델은 실제 기사 내용을 기반으로 하면서도 사용자의 주제와 수준에 맞춘 맞춤형 글과 퀴즈를 생성할 수 있었다.

생성된 결과물은 Redis를 이용하여 세션 단위로 저장된다. 이를 통해 사용자는 동일 세션 내에서 이전 대화를 이어가며 학습을 지속할 수 있고, 챗봇과의 상호작용에서도 문맥이 유지된다. 또한 다수의 사용자가 동시에 접속하는 환경에서도 대화 이력 관리가 안정적으로 이루어져 시스템의 확장성과 신뢰성을 확보하였다.

본 시스템의 구현에는 GPT-4(ChatOpenAI), LangChain 프레임워크, Pinecone 벡터 데이터베이스, OpenAI Embeddings, Redis ChatMessageHistory 등이 사용되었다. 이러한 구성요소를 기반으로 RAG 구조를 통합 구현함으로써, 사용자의 관심사와 수준에 최적화된 학습 자료 생성과 지속적인 피드백 제공이 가능하게 되었다. 특히, 벡터 기반 검색, 프롬프트 엔지니어링, 세션 관리 기능의 결합은 사실 기반의 개인화 학습 경험을 실현하는 핵심 요소로 작용하였다.

Ⅳ. 실험 결과

본 장에서는 제안된 시스템의 성능과 학습 효과를 다각도로 검증한 결과를 제시한다. 먼저, AI 서버의 핵심 구성요소인 유해 기사 필터링 모델과 이슈 군집화 모듈의 성능을 평가하여 자동화 처리 과정의 정확성과 신뢰성을 검증하였다. 또한 실제 애플리케이션 실행 화면을 통해 시스템의 주요 기능과 사용자 인터페이스를 확인하고, 학습자들의 사용 데이터를 기반으로 뉴스 이해도 및 참여도 향상 여부를 분석하였다. 마지막으로 시스템의 실사용 경험을 평가하기 위해 실시한 사용자 만족도 조사 결과를 제시한다.

4-1 AI 모듈 성능 평가

1) 유해 기사 필터링 모델 성능 평가

학습된 모델의 성능은 검증용 데이터셋을 활용하여 정확도(Accuracy)와 손실(Loss)을 기준으로 평가하였다. 그림 3(a)는 학습 과정에서의 손실 변화를, 그림 3(b)는 정확도 변화를 각각 나타낸다. 에포크가 진행됨에 따라 Training Accuracy와 Validation Accuracy 모두 안정적으로 상승하였으며, 손실값은 꾸준히 감소하였다. 두 지표 모두에서 학습과 검증 간의 큰 차이가 나타나지 않아 모델이 과적합되지 않고 안정적으로 수렴했음을 확인할 수 있다. 최종적으로 모델은 Train Accuracy 97.26%, Validation Accuracy 95.79%를 달성하였다.

Fig. 3.

Training and validation performance of the harmful news classification model

이러한 결과는 KLUE-BERT 기반 구조가 한국어 기사 내 문맥적 유해 표현을 효과적으로 인식할 수 있음을 보여준다. 학습된 모델은 시스템 전체 파이프라인 내에서 첫 번째 자동 필터링 단계로 작동하여, 이후의 군집화 및 생성 단계에서 부적절한 데이터가 활용되는 것을 원천적으로 차단한다. 이를 통해 학습 콘텐츠의 품질을 보장하고, AI 생성 결과의 교육적 신뢰성을 높이는 핵심 구성 요소로 기능한다.

2) 이슈 군집화 성능 평가

임베딩된 기사 벡터는 DBSCAN 알고리즘을 이용하여 군집화하였다. 뉴스 데이터의 불균형적 분포 특성상, DBSCAN은 주제별 밀도 차이를 자연스럽게 반영할 수 있다. DBSCAN의 핵심 파라미터인 eps 값은 데이터 포인트 간 최대 거리를 결정하며, 군집 형성에 큰 영향을 미친다. 값이 너무 작으면 의미 있는 군집이 과도하게 분리되고, 값이 너무 크면 서로 관련 없는 기사들이 하나의 군집으로 합쳐질 수 있기 때문에, eps를 0.1~1.0까지 변화시키며 성능을 비교하였다(그림 4). 평가 지표로는 Homogeneity와 ARI(Adjusted Rand Index)를 사용하였다.

Fig. 4.

Clustering performance comparison with varying DBSCAN epsilon values

Homogeneity는 각 군집이 단일 주제를 얼마나 잘 반영하는지를 평가하고, ARI는 전체 군집 구조의 정확도를 판단할 수 있어, 두 지표를 함께 활용하면 의미 있는 군집 형성과 전체 구조적 품질을 동시에 검증할 수 있다[20].

평가용 데이터셋은 크롤링한 기사들에 대해 DBSCAN의 eps 값을 임의로 조정하며 1차 군집화를 수행한 뒤, 연구자가 각 군집을 수작업으로 검토 및 정제하여 동일 이슈에 속하는 기사들을 하나의 군집으로 통합하는 방식으로 구축하였다. 실제 주제 레이블이 부여된 60개 뉴스 데이터가 사용되었으며, 각 기사는 7개의 주제 중 하나에 속하도록 구성되었다. 실험 결과, eps=0.6일 때 Homogeneity와 ARI가 모두 높은 값을 유지하면서 Noise Ratio 또한 과도하게 증가하지 않아, 군집의 품질과 안정성 측면에서 가장 적절한 균형을 보였다. 따라서 본 연구에서는 0.6을 최적의 파라미터로 선정하여 뉴스 데이터의 의미적 유사도를 잘 반영하는 군집 구조를 얻을 수 있었다.

4-2 앱 실행 결과

구현된 시스템의 주요 동작 과정은 그림 5와 같다. 시스템은 사용자가 메인페이지에서 이슈를 선택하거나 직접 입력하여 맞춤형 학습용 글을 생성하고, 이를 바탕으로 다양한 학습 활동(사전, 챗봇, 퀴즈)을 수행할 수 있도록 구성되어 있다.

Fig. 5.

User flow for core system functions

그림 6(a)는 시스템의 메인페이지 화면을 나타낸다. 사용자가 메인페이지에서 검색란을 통해 원하는 주제를 직접 입력하거나, 뉴스 기사 군집화 결과인 이슈 리스트 중 하나를 선택하면 맞춤형 글이 자동 생성된다. 이슈 리스트는 AI 서버에서 주기적으로 업데이트된다.

Fig. 6.

App interface screens*These are screenshot of the app in Korean.

그림 6(b)는 맞춤형 글의 생성이 완료된 페이지, (c)는 피드백 화면을 보여준다. AI 서버는 사용자가 선택한 주제에 대해 RAG 파이프라인을 활용해 어린 학생이 이해하기 쉬운 형태의 글을 생성한다. 오른쪽에는 사전(Dictionary), 챗봇, 퀴즈 기능이 탭 형태로 제공된다. 사용자는 단어의 뜻을 즉시 검색하거나, 챗봇을 통해 글의 내용을 질문하거나 추가 정보를 요청할 수 있다. 또한 퀴즈 탭에서는 객관식·주관식 문제를 통해 글 내용을 복습하고, AI의 자동 채점과 피드백을 받을 수 있다. 이와 같이 시스템은 단순한 기사 요약이나 생성 기능을 넘어, 사용자가 직접 상호작용하며 학습할 수 있는 통합형 학습 환경을 제공한다.

4-3 시스템 및 사용자 테스트

1) 테스트 목적

본 연구에서는 제안한 뉴스 기반 AI 학습 시스템의 기능적 안정성, 사용성, 그리고 사용자 경험적 효과를 탐색적으로 검토하기 위해 7일간의 사용자 테스트를 수행하였다. 참가자는 일반 뉴스 기사를 이해하는 데 어려움을 느끼는 10명으로 구성되었으며, 시스템의 자동화된 기사 수집·군집화·이슈 추출 기능을 기반으로 생성된 콘텐츠를 활용하여 학습을 진행하였다.

테스트의 주요 목적은 다음과 같다.

^◆ 시스템 기능 안정성 평가: 자동 기사 수집·이슈 추출·군집화 등 전체 파이프라인이 7일간 지속적으로 정상 동작하는지 확인
^◆ 사용자 이해 지원 기능 평가: 맞춤형 기사, 퀴즈, 챗봇 기능이 사용자의 기사 이해 경험에 어떠한 지원을 제공하는지 탐색
^◆ 사용 참여 및 시사 관심도 변화 관찰: 학습 동기 및 시사 이슈 접근성 향상에 대한 잠재적 기여 여부를 행동 기반 데이터로 분석

본 테스트는 학습 능력 향상을 직접적으로 검증하기 위한 것이 아니라, AI 기반 맞춤형 뉴스 학습 시스템이 사용자 경험을 어떻게 지원하는지를 관찰하기 위한 탐색적 평가로 설계되었다.

2) 테스트 방법

사용자 테스트는 참가자가 7일 동안 시스템을 자유롭게 이용하는 방식으로 진행되었다. 최소한의 안내만 제공하였으며, 참가자들은 생성된 맞춤형 뉴스와 퀴즈, 단어 설명, 챗봇 기능을 필요에 따라 활용하였다. 모든 상호작용은 자동으로 로그 데이터로 기록되었으며, 이는 자기 보고식 설문 대신 객관적인 행동 기반 데이터를 수집하기 위한 목적이다.

사용된 지표들은 이러닝이나 원격수업 분야에서 학습자의 참여도, 이해도 및 사용성 패턴을 파악하는데 일반적으로 사용되고 있는 것들로[21],[22], 분석은 다음 세 가지 관점에서 수행되었다.

• 이해도 관련 지표: 퀴즈 정답률(Quiz Accuracy Rate per Day, 그림 7(a))의 변화 추이를 관찰하고, 생성된 글에 대한 이해 수준은 보조적 항목으로 설문 의견을 참고하였다.
• 시스템 사용성: 챗봇 상호작용 빈도(Average Chatbot Interactions per Article, 그림 7(b))와 콘텐츠 접근 빈도(Average Articles Read per Day, 그림 7(c))를 수집하고 챗봇 및 퀴즈 기능의 학습 지원 효과, 시사 이슈에 대한 관심 증대 여부에 대한 설문 결과를 분석하였다.
• 참여 및 관심도: 일일 평균 사용 시간(Average Daily Usage Time, 그림 7(d))과 글 생성 빈도 등의 로그 데이터를 활용하여 분석하였다.

Fig. 7.

User test results

동시에 7일간 서비스를 실제 운영하며 시스템 테스트도 수행되었다. 시스템은 매일 00시부터 05시 사이 자동으로 뉴스를 크롤링하고, 핵심 이슈를 추출하며 DBSCAN 기반 군집화를 통해 동일 주제별로 기사를 분류하도록 했다. 이를 통해 자동 처리 과정의 안정성과 매일의 콘텐츠 갱신 정확성을 검증하였다.

3) 테스트 결과

7일간 10명의 사용자를 대상으로 본 시스템을 이용하게 한 결과, 사용자 참여도와 학습 활동 지표가 전반적으로 향상되는 경향을 보였다. 하루 평균 읽은 기사 수는 초기 1.1개에서 6일차 3개까지 꾸준히 증가하였으며, 마지막 날에는 2.6개로 소폭 감소하였으나 전체적으로 상승 추세를 유지하였다. 평균 서비스 이용 시간 또한 첫날 9.33분에서 7일차 15.2분으로 증가하여, 사용자의 서비스 몰입도 및 지속 이용 의향이 강화되었음을 보여준다.

기능별 분석에서도 긍정적 변화를 확인할 수 있었다. 챗봇 평균 사용 횟수는 3.55회에서 5.04회로 증가하였으며, 퀴즈 정답률은 0.39에서 0.66으로 상승하였다. 6일차에 일시적으로 정답률이 0.42로 하락했으나, 전반적인 학습 성취도는 상승 추세를 유지하였다. 종합적으로, 사용자는 시간이 지날수록 서비스 기능을 적극적으로 활용하였으며, 학습 몰입도와 콘텐츠 이해도가 함께 향상되는 양상을 보였다. 본 결과는 제안된 시스템이 학습자의 지속적 참여를 유도하고, 대화형 학습을 통한 이해도 향상에 효과적으로 기여함을 시사한다.

비록 실험 대상 인원이 적고 기간이 짧아 통계적 유의성을 확보하기에는 제한이 있으나, 본 파일럿 테스트를 통해 사용자의 서비스 활용 패턴과 참여 경향을 확인할 수 있었다. 하루 평균 읽은 글의 수, 챗봇 사용 횟수, 퀴즈 정답률, 서비스 사용 시간을 종합적으로 고려한 분석 결과는 향후 서비스 개선 및 대규모 사용자 기반 연구를 설계하는 데 중요한 기초 자료로 활용될 수 있다.

또한, 정량적 로그 분석과 더불어 사용자 인식 평가를 위해 7일간의 테스트 종료 후 설문조사를 실시하였다. 이 설문은 시스템의 사용성, 학습 지원 효과, 학습 동기 및 재사용 의향 등 정성적 요인을 종합적으로 평가하기 위한 것으로, 사용자들이 실제로 시스템을 어떻게 경험했는지를 보다 구체적으로 파악하고자 하였다.

4-4 사용자 만족도 조사

본 연구에서는 7일간의 사용자 테스트 종료 후, 참가자 10명을 대상으로 7개 항목의 설문조사를 실시하였다. (표 1) 각 항목은 5점 Likert 척도(1=전혀 아니다, 5=매우 그렇다)로 평가되었으며, 설문 문항은 시스템의 학습 지원 효과, 이해 용이성, 흥미 및 관심도, 학습 능력 향상도, 재사용 의향 등을 측정하도록 구성되었다.

Table 1.

Survey results

설문 결과, 대부분의 항목에서 평균 4점 이상을 기록하여 사용자들이 전반적으로 긍정적인 평가를 내렸음을 확인할 수 있었다. 특히 “앞으로 뉴스 학습이나 시사 학습에 이 서비스를 활용하고 싶습니까?” 항목은 평균 4.8점으로 가장 높게 나타나, 사용자의 재사용 의향과 서비스 만족도가 매우 높음을 보여주었다. 또한 “일반 뉴스에서는 이해하기 어려웠던 내용을 쉽게 이해할 수 있었나요?”와 “챗봇 기능이 글을 이해하는 데 도움이 되었나요?” 항목에서도 각각 평균 4.6점과 4.5점을 기록하여, 콘텐츠의 이해도 향상 및 챗봇의 학습 보조 기능이 효과적이었음을 알 수 있다.

반면, “이 서비스를 사용하며 어휘력이 향상된 것 같다” 및 “문해력이 향상된 것 같다” 항목은 각각 평균 3.9점으로 다소 낮게 평가되었으며, 표준편차가 각각 0.88과 1.10으로 나타나 응답자 간 인식 차이가 존재하였다. 이는 단기 사용 기간 내 어휘·문해력 향상을 체감하기 어려운 점과, 학습자의 수준별 개인차가 반영된 결과로 해석할 수 있다.

따라서 향후 개인 맞춤형 피드백 및 난이도 조절 기능을 강화하는 것이 바람직하다. 종합적으로 볼 때, 설문 결과는 본 시스템이 기사 이해도 향상, 학습 몰입 유도, 시사 이슈에 대한 관심 증대 등 학습 측면에서 긍정적 영향을 미쳤음을 보여준다. 특히, AI 기반 맞춤형 뉴스 콘텐츠 제공과 대화형 학습 구조의 결합이 사용자 만족도를 높이고 학습 지속 의지를 강화하는 핵심 요인으로 작용했음을 확인할 수 있었다.

Ⅴ. 결론 및 향후 연구

본 연구에서는 기사 크롤링, 유해 기사 필터링, 이슈 추출, 맞춤형 글·퀴즈 생성으로 이어지는 통합 AI 학습 콘텐츠 생성 파이프라인을 제안하였다. 제안한 시스템은 기존 뉴스 요약이나 단순 정보 제공 서비스와 달리, RAG 기반의 신뢰성 있는 생성 구조를 적용하고, 학습자의 수준별 난이도 조절과 대화형 학습 기능을 결합함으로써 차별성을 확보하였다. 이를 통해 뉴스 기사를 교육 친화적 형태로 재구성하여 학습자가 이해하기 쉽고, 흥미를 유지할 수 있는 AI 기반 시사 학습 환경을 구현하였다.

파일럿 실험 결과, 제안한 시스템은 사용자들의 기사 이해도와 학습 참여도를 향상시키는 경향이 관찰되었다. 특히 자동화된 기사 수집·이슈 추출이 안정적으로 수행되었으며, 사용자는 챗봇과 퀴즈 기능을 통해 학습 몰입도와 피드백 만족도를 높게 평가하였다. 이는 본 시스템이 단순 정보 전달을 넘어 학습자의 자율적 탐구와 지속적 학습 참여를 유도하는 지능형 학습 보조 도구로 활용될 수 있음을 시사한다.

향후 연구에서는 다국어 확장, 멀티모달 콘텐츠(이미지·동영상 포함) 생성, 사용자 수준별 난이도 조정 알고리즘의 고도화를 추진할 예정이다. 또한, 대규모 사용자 기반 실험을 통해 장기적인 학습 효과와 피드백 시스템의 개선 방향을 검증함으로써, 교육 현장에서 활용 가능한 AI 기반 시사 학습 플랫폼의 실용화를 목표로 한다.

References

OECD, PISA 2022 Results (Volume I): The State of Learning and Equity in Education, OECD Publishing, Paris: France, 2023. [https://doi.org/10.1787/53f23881-en]
Y.-K. Park, “A Discourse Study on Literacy Using LDA Topic Modeling: Focusing on News Data,” The Journal of Curriculum and Evaluation, Vol. 28, No. 1, pp. 107-138, 2025. [https://doi.org/10.29221/jce.2025.28.1.107]
D. T. T. Mai, C. V. Da, and N. V. Hanh, “The Use of ChatGPT in Teaching and Learning: A Systematic Review through SWOT Analysis Approach,” Frontiers in Education, Vol. 9, 2024. [https://doi.org/10.3389/feduc.2024.1328769]
E. Kasneci, K. Sessler, S. Küchemann, M. Bannert, D. Dementieva, F. Fischer, ... and G. Kasneci, “ChatGPT for Good? On Opportunities and Challenges of Large Language Models for Education,” Learning and Individual Differences, Vol. 103, 102274, 2023. [https://doi.org/10.1016/j.lindif.2023.102274]
Newsela, “The Research Base for Newsela: Meaningful Classroom Learning: Grounded in the Learning Sciences and the Science of Reading,” Newsela Research Report, 2023. https://go.newsela.com/rs/628-ZPE-510/images/Newsela-Research-Base.pdf
SmartNews. SmartNews Media Research Institute – Media Literacy and Education Initiatives [Internet]. Available: https://about.smartnews.com/en, .
J. Lee, H. Lin, Y. Kim, and Y. Kim, “Impact of the Newspaper in Education Program and Parental Mediation on Adolescents’ Social Participation: A Focus on the Mediated Effects of News Use Behavior and Self-Expression,” Sage Open, Vol. 14, No. 2, 2024. [https://doi.org/10.1177/21582440241257621]
P. Lewis, E. Perez, A. Piktus, F. Petroni, V. Karpukhin, N. Goyal, ... and D. Kiela, “Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks,” in Proceedings of the 34th International Conference on Neural Information Processing Systems (NeurIPS), pp. 9459-9474, 2020.
K. Guu, K. Lee, Z. Tung, P. Pasupat, and M.-W. Chang, “REALM: Retrieval-Augmented Language Model Pre-Training,” in Proceedings of the 37th International Conference on Machine Learning (ICML), 3929-3938, 2020. [https://doi.org/10.48550/arXiv.2002.08909]
V. Karpukhin, B. Oguz, S. Min, P. Lewis, L. Wu, S. Edunov, ... and W. Yih, “Dense Passage Retrieval for Open-Domain Question Answering,” in Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP), pp. 6769-6781, 2020. [https://doi.org/10.18653/v1/2020.emnlp-main.550]
N. Reimers and I. Gurevych, “Sentence-BERT: Sentence Embeddings Using Siamese BERT-Networks,” in Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing (EMNLP), Hong Kong: China, pp. 3982-3992, 2019. [https://doi.org/10.18653/v1/D19-1410]
S. Park, J. Moon, S. Kim, W. I. Cho, J. Han, J. Park, ... and K. Cho, “KLUE: Korean Language Understanding Evaluation,” arXiv:2105.09680, , 2021. [https://doi.org/10.48550/arXiv.2105.09680]
J. Moon, W. I. Cho, and J. Lee, “BEEP! Korean Corpus of Online News Comments for Toxic Speech Detection,” arXiv:2005.12503, , 2020. [https://doi.org/10.18653/v1/2020.socialnlp-1.4]
C. Park, S. Kim, K. Park, and K. Park, “K-HATERS: A Hate Speech Detection Corpus in Korean with Target-Specific Ratings,” Findings of the Association for Computational Linguistics: EMNLP 2023, pp. 14264-14278, Singapore, 2023. [https://doi.org/10.18653/v1/2023.findings-emnlp.952]
Y. Jeong, J. Oh, J. Lee, J. Ahn, J. Moon, S. Park, and A. Oh, “KOLD: Korean Offensive Language Dataset,” in Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing (EMNLP 2022), pp. 10818-10833, Abu Dhabi, UAE, 2022. [https://doi.org/10.18653/v1/2022.emnlp-main.744]
Y. Cho, Y. Ha, and Y. Lim, “KPF-BERT Based Fake News Detection System,” Journal of Broadcast Engineering, Vol. 30, No. 5, pp. 706-714, 2025. [https://doi.org/10.5909/JBE.2025.30.5.706]
S. Choi, J. Jang, and B. An, “Real-time and Post-call Voice Phishing Detection and Classification System Combining the Strengths of KLUE/BERT and LSTM,” in Proceedings of the Korean Institute of Electrical Engineers Conference, pp. 1085-1089, 2024.
D. P. Kingma and J. Ba, “Adam: A Method for Stochastic Optimization,” arXiv:1412.6980, , 2014. [https://doi.org/10.48550/arXiv.1412.6980]
M. Ester, H.-P. Kriegel, J. Sander, and X. Xu, “A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise,” in Proceedings of the 2nd International Conference on Knowledge Discovery and Data Mining (KDD), Portland: Oregon, pp. 226-231, 1996.
L. Hubert and P. Arabie, “Comparing Partitions,” Journal of Classification, Vol. 2, No. 1, pp. 193-218, 1985. [https://doi.org/10.1007/BF01908075]
S. Kim, Development of LMS Log Data Metrics for Blended PBL in Higher Education, Master’s Thesis, Hanyang University Repository, Seoul, 2021.
G. Ahmadi, A. Mohammadi, S. Asadzandi, M. Shah, and R. Mojtahedzadeh, “What Are the Indicators of Student Engagement in Learning Management Systems? A Systematized Review of the Literature,” International Review of Research in Open and Distributed Learning, Vol. 24, No. 1, pp. 117-136, 2023. [https://doi.org/10.19173/irrodl.v24i1.6453]

저자소개

노승아(SeungA Rho)

2021년～현 재: 덕성여자대학교 컴퓨터공학부 학부생

※관심분야：서버 개발, 클라우드, 인공지능, 검색증강생성(RAG)

고예진(Yejin Go)

2021년～현 재: 덕성여자대학교 컴퓨터공학부 학부생

※관심분야：프론트엔드 개발, 웹 인터페이스 설계, 검색증강생성(RAG)

김희윤(Heeyun Kim)

2021년～현 재: 덕성여자대학교 컴퓨터공학부 학부생

※관심분야：서버 개발, 클라우드, 인공지능, 검색증강생성(RAG)

정하은(Haeun Chung)

2023년～현 재: 덕성여자대학교 컴퓨터공학부 학부생

※관심분야：프론트엔드 개발, 웹 인터페이스 설계, 검색증강생성(RAG)

유견아(Kyeonah Yu)

1986년：서울대학교 제어계측공학과 공학사.

1988년：서울대학교 제어계측공학과 공학 석사.

1995년：University of Southern California 컴퓨터학과 공학박사

1996년～현 재: 덕성여자대학교 컴퓨터공학부 교수

※관심분야：인공지능과 LLM을 활용한 개인화된 학습, 멀티모달 정보 정달 시스템

Category	Question	Average	SD
Measurement of Comprehension-related Indicators	Was the content that was difficult to understand in regular news easier to comprehend through this service?	4.6	0.52
	Was the quiz effective in checking your understanding of the article content?	4.1	0.74
	Did the chatbot feature help you better understand the text (e.g., background knowledge, quiz solving, etc.)?	4.5	0.53
Measurement of Change in User-perceived Effects	Do you think your interest in current news or social issues increased after using this system?	4.1	0.74
	Do you think your vocabulary improved while using this service?	3.9	0.88
	Do you think your literacy skills improved while using this service?	3.9	1.10
Measurement of Intention to Use	Would you like to use this service for future news or current-affairs learning?	4.8	0.42