Korea Digital Contents Society

Journal Archive

Journal of Digital Contents Society - Vol. 21 , No. 5

[ Article ]
Journal of Digital Contents Society - Vol. 21, No. 5, pp. 901-910
Abbreviation: J. DCS
ISSN: 1598-2009 (Print) 2287-738X (Online)
Print publication date 31 May 2020
Received 20 Mar 2020 Revised 15 May 2020 Accepted 25 May 2020
DOI: https://doi.org/10.9728/dcs.2020.21.5.901

빅데이터를 이용한 자기효능감과 자기주도학습 간의 텍스트 가치 평가
김선숙1 ; 김희숙2, * ; 김미례3
1호남대학교 상담심리학과 박사과정
2광주과학기술원 대우교수
3호남대학교 상담심리학과 조교수

Text value evaluation between self-efficacy and self-directed learning using big data
Sun-Suk Kim1 ; Hye-Suk Kim2, * ; Mi-Rea Kim3
1Doctor’s Course, Department of Counseling Psychology, Honam University, Gwangju Eodeung-daero 417, Korea
2Lecture Professor, Gwangju Institute of Science and Technology, Gwangju Cheomdangwagi-ro 123, Korea
3Assistant Professor, Department of Counseling Psychology, Honam University, Gwangju Eodeung-daero 417, Korea
Correspondence to : *Hye-suk Kim Tel: +82-62-530-0147 E-mail: iam8036@gmail.com


Copyright ⓒ 2020 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

초록

본 논문에서는 블로그 점유율이 높은 네이버 블로그를 대상으로 자기효능감과 자기주도학습에 관한 텍스트 마이닝을 실행하였다. 빅데이터의 텍스트 마이닝을 통해 수집된 텍스트 데이터를 대상으로 구조화된 텍스트 데이터셋을 구성하고, 자기효능감 기반의 텍스트를 중심으로 인지 조절과 행동 조절로 분류한 후 텍스트 가치 계수를 평가하였다. 평가 결과 교육, 학업, 학업성취도, 성취, 에듀, 조절, 도전, 스스로, 자신 등의 자기효능감 관련 텍스트가 인지 조절 및 행동 조절과 연관성이 높은 것으로 나타났다. 텍스트 가치 계수가 높게 평가된 단어들은 향후 자기주도학습 프로그램 설계에 핵심 단어로 활용될 수 있을 것으로 기대한다.

Abstract

In this paper, we conducted text mining about self-efficacy and self-directed learning on Naver Blogs, which take high ranks on websites. At first, we constructed data-set based on text data collected through text mining of big data. After that, we classified self-efficacy based texts on data-set into cognitive control and behavior control and then, evaluated the text value coefficient. As a result of the evaluation, it was found that texts related to self-efficacy such as education, study, academic achievement, achievement, edu, adjustment, challenge, self, and self were highly related to cognitive control and behavior control. It is expected that words with high text value coefficients can be used as key words in the design of self-directed learning programs in the future.


Keywords: Text Mining, Big Data, Self-efficacy, Self-directed Learning, E-learning, Life-long Learning
키워드: 텍스트 마이닝, 빅데이터, 자기효능감, 자기주도학습, 이러닝, 평생교육

Ⅰ. 서 론

초고령화 사회가 시작되면서 최근 교육 환경에서도 많은 변화가 나타나고 있다. 교육 환경이 전 생애에 걸친 삶의 과정으로 확대됨에 따라 평생교육 학습에 대한 논의가 활발히 진행되고 있으며 이를 위한 이러닝(e-Learning)에 대한 관심 또한 높아지고 있다[1]. 성공적인 이러닝을 달성하기 위해서는 자기주도학습 역량을 갖추고 시간 관리, 학습 과정 검토, 학습 목표 설정 등의 노력을 수반해야 한다. 이처럼 학습 환경이 인터넷 기반의 이러닝으로 확장되면서 학습자의 자기주도학습 태도가 그 무엇보다도 중요시되고 있다. COVID(Coronavirus Disease)-19와 같은 전염성 강한 질병이 유행되고 있는 시점에서는 재택 수업 방식으로 이러닝은 호평을 받고 있으며 이에 따라 온라인 공개수업(MOOC; Massive Open Online Course) 가입자 수는 급증하고 있다.

2019년 평생교육 통계조사에 따르면 우리나라 성인의 평생교육 학습 참여율은 41.7%로 만25세 이상 79세 이하 성인 10명 중 약 4명이 평생교육 학습에 참여하고 있는 것으로 나타났다[2]. 한국교육개발원에서 성인들의 평생교육 학습 수행 후 평생교육 학습에 관한 개인실태를 개인 영역, 직업 영역, 사회 영역의 세 가지 영역으로 구분하여 조사하였다. 조사 결과 개인 영역에서는 심리적 만족 및 행복감 증대 77.7%, 교양함양 및 지식 습득 등의 자기계발 71.6%, 건강 관리 70.4%로 나타났다. 직업 영역에서는 일하는데 필요한 기능 습득 68.2%, 고용안정 63.7%, 취업 · 이직 · 창업에 도움 60.4%, 성과급 · 연봉 등 소득 증대 53.2%로 나타났다. 그리고 사회 영역에서는 친목 도모 증진 67.4%, 자원봉사 및 지역 사회적 활동과 같은 사회참여 59.9%로 나타났다. 이처럼 평생교육 학습은 직업 및 사회 영역의 비중보다 개인 영역의 비중이 좀 더 크게 나타나고 있으며 성인의 평생교육 학습은 직업이나 사회적 관계를 위해서도 필요하지만, 심리적 만족 및 행복감 증대를 위해 더욱 필요한 것이라고 할 수 있다[3]. 하지만 개인의 만족을 위해서 시작한 평생교육 학습에서 목표를 성취하지 못하고 중도에 포기하는 성인학습자가 빈번히 발생하고 있다. 자발적으로 시작한 평생교육 학습에 중도포기자가 나타나는 이유는 목표를 성취하기 위해서 요구되는 조건이 자신의 환경이나 능력에 따른 개인적인 신념이 부족한 결과라고 볼 수 있다. 학자 반두라(Bandura)는 개인이 어떤 결과를 산출하기 위해 요구되는 행동을 성공적으로 수행할 수 있다는 신념에 관한 판단을 자기효능감(Self-efficacy)이라고 정의하였다[4-5]. 이러한 자기효능감은 사람들의 행동 진행 과정에 영향을 미치며 과제 수행 여부, 노력의 정도, 지속성, 개인의 깨닫는 성취 수준에도 영향을 미친다. 자기효능감은 자기통제력과 자기주도학습 능력의 관계에서 매개역할을 하고 있으며 자기통제력과 학업적 자기효능감은 교육적, 상담적 개입을 통해 변화할 수 있다. 이 과정에서 학업적 자기효능감이 자기주도 평생교육 학습능력을 향상하는데 작용하고 있음이 분석되었다[6]. 현시점에서 성인의 자기주도 평생교육 학습능력 향상을 위해서는 자기통제력 및 학업적 자기효능감을 높일 수 있는 활동요소들을 포함한 상담이나 심리교육 프로그램 개발이 병행되어야 할 것이다.

본 논문에서는 평생교육 학습 중도포기자 중에서 자신의 환경이 아닌 행동을 성공적으로 수행할 수 있다는 신념에 관한 판단 즉, 자기효능감을 원인으로 포기하는 경우를 살펴보고 자기주도학습과의 관계를 파악해보고자 한다. 이를 위하여 자기효능감과 자기주도학습과의 관계에 해당하는 키워드를 텍스트 마이닝(Text mining)을 활용하여 수집하고 추출하여 분석한다. 텍스트 마이닝이란 비정형 데이터 마이닝 방법의 하나로 자연어 처리 기술과 문서 처리 기술을 적용하여 유용한 정보를 추출, 가공하는 목적의 기술이다. 인터넷 포털사이트에 존재하는 블로그, 카페, 뉴스와 같은 비구조적 데이터를 대상으로 가치 있는 유용한 정보를 찾아내는 것을 의미한다.

본 논문에서는 향후 자기효능감 향상을 위한 프로그램 개발과 이를 기반으로 평생교육 학습자의 목표 달성에 도움이 될 수 있도록 텍스트 마이닝을 실시하여 자기효능감과 자기주도학습에서 중요한 텍스트를 분석하고 평가하고자 한다.


Ⅱ. 관련 연구
2-1 이러닝과 자기주도학습

인터넷의 발달과 더불어 컴퓨터와 인터넷 기반의 이러닝을 이용한 학습에 대한 수요가 급증하고 있다. 4차 산업혁명 기술인 인공지능과 빅데이터, 로봇, 사물인터넷 등이 발달하면서 ICT(Information & Communication Technology) 기술을 탑재한 이러닝은 본래 가지고 있던 편재성, 휴대성 그리고 접근성을 기반으로 더욱 빠르게 진화하고 있다. 특히 영어 이러닝에 관한 학습은 성인 대상의 평생교육 학습에서 큰 비중을 차지하고 있다. [7]에 의하면 영어 학습의 경우 온라인 인강 듣기 부분이 가장 빈도수 높은 영역으로 나타났고 다음으로 유튜브 및 어플리케이션을 이용하는 방식이 있었다. 유튜브는 시각적인 어학 도구에 익숙한 학습자들의 학업 스타일과 맞물려서 공부 스트레스 없이 재미있고 다양한 내용을 편하게 접근해서 볼 수 있는 강점이 있어서 새로운 학습 도구로 자리매김하기 시작한 것으로 분석되었다. 소셜 빅데이터 분석 결과 우리나라의 대중들은 실제 미국 드라마 시청을 효과적인 영어학습법으로 인식하고 있으며 교육 기관 밖에서도 교수자에 의존하지 않고 자율적이고 적극적으로 활용하고 있음이 드러났다. 이와 같이 미국 드라마 시청도 이미 훌륭한 학습자료로 인정받고 있는 상황이다[8].

진입장벽이 낮아진 이와 같은 이러닝 기반의 학습을 대중들이 쉽게 접할 수 있게 되었지만, 끝까지 완수하지 못하고 중도에 포기하는 학습자들이 발생하고 있다. 유튜브 및 미국 드라마 시청을 이용하여 능동적으로 참여하는 영어 이러닝 평생교육 학습에서 영어 의사소통 의지를 향상하기 위해서 자기주도학습 역량과 학습 동기를 향상할 수 있는 효과적이고 다양한 학습활동 및 지도가 필요한 시점이 되었다. 이제는 이러닝 선택을 학습자에게만 줄 것이 아니라 교육자 및 전문 상담가가 스스로 학습할 수 있는 역량을 가진 자기주도 학습자로 정착할 수 있도록 적극적으로 개입하고 안내해야 할 필요가 있다[7].

[9]에서는 자기주도학습 능력이 낮은 집단의 경우에는 가장 먼저 학습 동기를 유발할 수 있도록 학습을 계획하는 것이 필요함을 발견하고 다음과 같은 내용으로 학습 동기를 향상할 수 있는 활동 예시를 제안하였다.

예시 1 : 교수자는 학생들과 함께 학업계획과 학업일정표를 작성해보는 시간을 마련한다.

예시 2 : 유튜브나 온라인 공개수업(MOOC; Massive Open Online Course) 자료를 포함한 다양한 학습자료 사이트 등을 교수자와 학습자가 함께 탐색해보거나 알고 있는 것들을 공유할 수 있는 활동을 제공한다.

예시 3 : 학습자들이 학습 포트폴리오를 작성하도록 함으로써 자신의 학습 목표와 관련된 사전학습, 수업 활동 및 수업 후 과제나 보충 활동, 학습 과정 성찰일지 작성 등을 포함하는 제반 학습 과정을 정리하도록 요청한다.

위와 같은 활동을 통하여 학습자는 자기주도 학습을 경험하고 스스로에 대한 자기효능감을 고취하며 좀 더 능동적이고 창의적인 학습 마인드를 함양할 수 있을 것으로 기대하였다.

2-2 자기효능감과 자기주도학습

자신이 가진 능력 이상으로 훨씬 뛰어난 결과를 만들어내는 사람이 있고 반대로 자신이 가진 능력에 미치지 못하는 결과를 만들어내는 사람도 있다. 이는 인간의 행동을 예측하는 데 있어 타고난 지능 및 적성 등의 능력을 이용하는 것보다 자신의 능력에 대한 믿음과 자신감을 기준으로 삼는 것이 더 정확할 수 있음을 시사한다[10]. 이처럼 자신의 능력에 대한 신념과 자신감에 해당하는 자기효능감은 인간 행동의 주된 근원이 되고 나아가 개인의 삶을 이끄는 요소로 볼 수 있다[11].

자기효능감이라는 개념을 학문화한 반두라는 자기효능감을 ‘학습자가 과제를 수행하는 데에 필요한 행동을 조직하고 실행하는 자신의 신념에 대한 판단’이라고 정의하였다. 학자 기스트(Gist)와 미첼(Mitchell)은 자기효능감을 과제를 수행하는 데에 필요한 동기 및 행동의 방향성을 설정하는 자신의 능력에 대한 판단이라고 하였으며 이든(Eden)과 아비램(Aviram)은 성공을 위해 필요한 정서적 · 신체적 · 지적 근원을 움직이게 하는 개인의 능력 자체에 대한 신념이라고 정의하였다[12-13].

자기효능감의 하위변인은 학업적 효능감과 자기조절 자기효능감으로 구성되었으며, 학업적 효능감은 학습자가 학업 상황에서 과제 수행을 위해 필요한 행위를 조직하고 실행해 나가는 자신의 능력에 대해 내리는 판단이다. 자기조절 효능감은 개인이 어떤 과제를 달성하기 위해서 자기관찰, 자기판단, 자기반응과 같은 자기조절을 탁월하게 수행할 수 있는지에 대한 효능기대라고 할 수 있다[14].

자기주도학습을 바탕으로 하는 평생교육에 있어서 자기효능감을 높이는 데는 학습 동기가 효과적이다[15]. 여기서 학습 동기란 내적 동기와 외적 동기로 구분할 수 있으며 성인이 가진 자주성, 독립성, 자기 주도성은 내적 강화 때문에 충족되는 내적 동기를 말한다. 즉, 외부의 보상을 추구하기보다는 스스로 만족하는 것에 학습의 의의를 두는 동기이다. 외적 동기는 외적인 목적에 의도가 있는 것을 말하는데 이는 학습에 동기가 없거나 의욕이 없는 사람에게 동기를 유발하는 데에 효과적이다[16]. 이러닝과 같은 시스템을 활용하여 자기주도학습을 기반으로 하는 평생교육을 효과적으로 수행하기 위해서는 내적 및 외적 학습 동기를 바탕으로 자기효능감을 높일 수 있는 대처방식이 필요하다.

2-3 텍스트 마이닝을 활용한 학습시스템 연구

방대한 정보를 효과적으로 다루는 방법에 대한 연구는 이미 활발히 진행되고 있으며, 데이터베이스에 저장된 자료와 같이 정형화된 데이터로부터 정보를 추출, 가공하는 데이터 마이닝은 이미 실용성을 갖추고 많은 분야에서 널리 사용되고 있다. 그러나 인터넷의 방대한 정보는 비정형데이터로 존재하고 있으며 이러한 비정형 데이터에 대해 유용한 정보를 추출하고 가공하는 기술을 텍스트마이닝 기술이라고 한다.

텍스트마이닝 기술을 활용하여 학습자의 관심분야와 인터넷에 존재하는 동영상, 이미지, 문서 등의 다양한 학습 콘텐츠를 연결하여 제공하고, 평가와 리뷰를 작성하여 양질의 콘텐츠를 선별하는 작업을 통해 자기주도적 학습에 필요한 학습 콘텐츠를 제공하는 편의와 새로운 서비스를 제공할 수 있다.

온라인 학습자를 위한 콘텐츠 제공 시스템의 과정은 다음과 같이 요약할 수 있다. 첫째, 학습자의 관심분야 데이터베이스(DB; Data Base)를 통한 적합한 핵심 및 연관 키워드 생성한다. 둘째, 생성된 핵심 및 연관 키워드를 통한 학습 콘텐츠를 크롤링(Crawling)하여 학습자에게 제공한다. 셋째, 학습자는 크롤링된 콘텐츠를 시스템에 등록하고 학습 후 평가와 리뷰를 작성한다. 넷째, 각 분야의 학습 콘텐츠를 평가와 리뷰 순으로 등록하여 양질의 학습 콘텐츠를 제공한다.

학습자의 등록된 관심 분야를 통해 텍스트 마이닝 기법으로 적합하고 범주에 맞는 키워드를 도출하여, 온라인에 존재하는 동영상, 이미지, 문서 등의 학습 콘텐츠를 제목, 리뷰, 댓글을 분석하여 크롤링하고 학습자가 원하는 형태의 콘텐츠를 제공하게 된다. 제공된 콘텐츠는 학습자가 시스템에 등록하고 통합적으로 관리 되며, 평가와 리뷰를 통해 다시 콘텐츠를 검증하여 양질의 콘텐츠를 제공하는 시스템 구현을 목표로 하여 적합한 정보를 획득하고 의미를 정제하여 범주화할 수 있는 텍스트 마이닝 기법을 활용하여 온라인상에서 학습자가 습득하려고 하는 학문 분야의 다양한 콘텐츠를 제공하는 시스템을 구현할 수 있도록 연구할 필요가 있다.

지식전달 위주의 주입식 교육방식에서 학습자들이 능동적으로 지식에 대처할 수 있는 자기주도학습은 사회변화에 따라 요구되는 자아개념, 자신감, 창의성을 발견하고 계발시키는 학습 방법으로 더욱 중요성이 대두되고 있다. 따라서, 학습자의 자기주도적 학습을 위해 관심 분야의 적합한 콘텐츠를 쉽고 간편하게 제공되어야 한다.

그러나 자기주도 학습에 대한 개념 및 전략 등 다양한 이론적 지식이 존재하고 있지만, 실제 자기주도학습 운영계획 또는 학습 분야에 따라 학습자가 원하는 학문 분야의 콘텐츠를 손쉽게 제공할 수 있는 시스템은 부족한 상황이다.

또한, 교수자의 일방적인 콘텐츠, 이러닝, 무크 등 다양한 학습 콘텐츠를 제공하는 방식은 있지만, 교수자의 일방적인 콘텐츠 제공 방식은 자기주도 학습에 맞지 않고 이러닝 및 무크는 학습자가 원하는 콘텐츠를 직접 검색하고 찾아야 하는 불편함이 존재한다. 따라서 현시점에서는 텍스트 마이닝 기술을 이용하여 학습자의 관심 분야에 맞는 키워드를 도출하고 웹 크롤링에 사용하기 위한 처리 방법으로 활용하여 자기 주도 학습에 필요한 학습 콘텐츠를 제공하는 시스템 구축이 필요하게 되었다[17].


Ⅲ. 자기효능감과 자기주도학습 간의 텍스트 가치 평가를 위한 텍스트 마이닝
3-1 자기주도학습 방법과 평생교육 학습 현황

최근 통계청에서는 2012년부터 2년 주기로 한국교육개발원 주관의 자기주도학습 방법별 한국교육종단조사 결과를 게시하였다[18]. 게시된 한국교육종단조사 결과를 연도별로 단위 소계를 통합하여 자기주도학습 방법별 비율을 표시하면 그림 1과 같다. 컴퓨터 및 인터넷을 활용(23%), 주변 인물들의 조언을 활용 (17%), 인쇄 매체를 활용(16%), 도서관 방문(14%), TV · 라디오 · 비디오를 활용(12%), 축제 · 박람회 · 음악회 등 참여(11%), 역사적 ∙ 자연적 ∙ 산업적 장소 방문(7%)의 순서로 나타났다. 그림 1에서 보여준 것과 같이 최근 자기주도 학습시 컴퓨터와 인터넷을 활용하여 도움을 받는 가중사례 수가 가장 높은 비율을 차지하였다. 이러한 컴퓨터와 인터넷을 활용한 자기주도학습을 기반으로 하는 평생교육 학습의 기회 또한 광범위해지고 진입장벽이 낮아져서 성인학습자들의 평생교육 학습에 대한 수요는 더욱 급증하고 있다. 하지만 평생교육 학습을 경험한 학습자들은 처음 의도와 달리 중도에 포기하는 경우가 빈번히 발생하고 있는 문제점이 나타나고 있다.


Fig. 1. 
Percentage of Learning Methods by Self-directed Learning

한국교육개발원에서 2017년부터 2019년까지 평생교육 학습에 참여한 만 25~79세 성인남녀를 대상으로 중도 포기한 학습자를 대상으로 중도 포기 원인을 파악하기 위하여 개인실태 조사를 시행하였다. 시행 결과를 게시한 통계청 자료[19]를 기반으로 평생교육 학습 참여의 중도 포기 요인별 해당 비율을 표시하면 표 1과 같다.

Table 1. 
Exit factors during lifelong learning
Cause type 2017 (%) 2018 (%) 2019 (%)
cause 1 39.8 39.3 32.2
cause 2 3.1 10.1 24.3
cause 3 9.4 14.6 11.8
cause 4 10.6 8.2 9.2
cause 5 12.4 12.3 8.1
cause 6 11.4 2.1 7.6
cause 7 2.4 1.4 3.4
cause 8 6.7 4 0.8
cause 9 2.5 1.4 0.7
cause 10 1.7 6.6 1.9

위의 표 1에서 제시하는 10가지 요인은 다음과 같다.

· 원인 1 : 직장업무로 인한 시간 부족
· 원인 2 : 교육내용이 만족스럽지 못해서
· 원인 3 : 동기, 자신감 부족
· 원인 4 : 학습비가 너무 비싸서
· 원인 5 : 가족 부양에 따른 시간 부족
· 원인 6 : 건강상의 이유로
· 원인 7 : 함께 배울 친구가 없어서
· 원인 8 : 가까운 거리에 교육훈련기관이 없어서
· 원인 9 : 교육시설이 만족스럽지 못해서
· 원인 10 : 기타

원인 8에 해당하는 가까운 거리에 교육훈련기관이 없어서와 원인 9에 해당하는 교육시설이 만족스럽지 못해서는 오프라인 학습에 해당하는 것이다. 평생교육 학습으로 개설되는 과목 중에서 특정 과목의 경우 이러닝으로 대체될 수 없는 실습 또는 현장학습 위주의 과목이 존재하기 때문에 이와 같은 원인이 도출되었으리라 예상한다. 동기, 자신감 부족에 해당하는 원인 3과 함께 배울 친구가 없어서에 해당하는 원인 7은 환경적인 요인이 아니라 자신의 주관적인 성향에 해당하는 부분으로 중도 포기가 결정되었음을 함축하고 있다.

평생교육 학습자의 경우 대부분 성인임에도 불구하고 그림 2에서 제시된 것과 같이 동기, 자신감 부족에 해당하는 원인 3의 경우 2017년도 9.4%, 2018년도 14.6%, 2019년도 11.8%에 해당하는 비율을 차지하고 있다. 평생교육 학습은 의무가 아니라 자신의 필요 때문에 성인이 선택하는 교육이다. 하지만 위와 같이 성인의 경우에도 동기 및 자신감 부족 그리고 같이 학습에 참여할 친구의 부재 등의 이유로 계획했던 평생교육 학습을 중도에 포기하는 경우가 발생하고 있음을 확인할 수 있었다.


Fig. 2. 
Review bounce rate according to subjective disposition

3-2 자기효능감과 자기주도학습에 관한 텍스트 마이닝

이러닝과 같은 편리한 평생교육 학습 환경이 뒷받침되고 있고 수요가 급증하고 있는 현 상황에서 성인학습자들이 자기효능감을 높여서 중도 포기하지 않고 자기주도학습 비중이 높은 평생교육 학습에서 최종 학습 목표를 달성할 수 있는 프로그램 개발이 필요하다. 이에 본 논문에서는 향후 자기주도학습 기반의 평생교육 학습 목표를 달성하기 위한 프로그램 개발 시 활용할 수 있도록 자기효능감과 평생교육 학습에 필요한 자기주도학습과의 관련성을 평가하고자 한다. 이를 위하여 텍스트 마이닝 기법을 이용하여 연관된 텍스트를 수집하고 추출하여 텍스트의 출력 빈도수를 기반으로 자기효능감과 자기주도학습과의 관계를 분석하여 자기주도학습 클리닉을 제공하는 프로그램 개발에 활용되도록 하고자 한다.

최근 상담 심리 분야에서도 python 및 R 언어를 이용하여 웹상의 빅데이터를 활용한 4차 산업시대에 적합한 광범위한 연구가 활발히 진행되고 있다[20]. 본 논문에서는 성인학습자들이 선택한 자기주도학습 방법 중 가장 높은 비율을 차지하고 있는 컴퓨터 및 인터넷을 활용한 자기주도학습에 관한 학습 방법을 대상으로 텍스트 마이닝을 실행하여 텍스트를 수집, 추출, 분석하고자 한다. 최근 블로그 중에서 가장 높은 점유 비율을 차지하고 있는 매체로 네이버 블로그를 집계[21]한 것에 기반을 두어 본 논문에서는 네이버 블로그를 대상으로 자기주도학습에 관련된 데이터를 수집하고 분석한다.

Table 2. 
Blog occupancy rankings in 2017
Ranking Blog name Occupation rate(%)
1 naver 66.2
2 daum 17%
3 tistory 7.5%
4 egloos 2%
5 etc. 7.4%

본 논문에서는 그림 3과 같은 과정으로 python에서 제공하는 bs4의 BeautifulSoup과 selenium webdriver등의 라이브러리를 이용하여 네이버 블로그를 대상으로 텍스트 마이닝을 설계하고 구현하여 데이터 파일을 저장하였다.


Fig. 3. 
Text mining design based on NAVER blog

1단계에서는 텍스트 마이닝에 필요한 라이브러리를 임포트하고, 2단계에서는 네이버 블로그에 진입한다. 3단계에서는 네이버 블로그에서 3가지 검색 요소(검색 키워드, 검색 건수, 검색 기간)를 입력한다. 4단계에서는 크롬(Chrome)을 이용하여 텍스트 데이터를 크롤링한다. 5단계에서는 크롤링된 비구조적 텍스트 데이터를 대상으로 필요한 요소를 추출 및 분리하는 정제 과정을 통하여 구조적 데이터로 재구성한다. 마지막 6단계에서는 구조적 텍스트 데이터를 txt, csv, xls 형식의 데이터 파일로 저장한다. 설계된 텍스트 마이닝 방식 3단계에서 검색을 위해 사용된 키워드는 ‘자기효능감’과 ‘자기주도학습’이다. 검색 기간은 2017년~2019년을 기준으로 매월 100건씩 텍스트 데이터를 수집하여 블로그 제목, 블로그 내용, 블로그 소개, 블로그 주소의 항목으로 구분하여 데이터셋을 만들고 구조적 형식으로 재구성한 후 txt, csv, xls 파일의 형식으로 데이터셋을 저장하였다. 텍스트 마이닝을 실행한 결과 2017년~2019년 월별로 100건씩 총 4800건의 데이터를 수집할 수 있었다. 그림 4는 수집 후 분리된 텍스트 데이터 중에서 2018년 1월 데이터셋의 일부를 보여준다.


Fig. 4. 
Result of crawling based on NAVER blog

저장된 데이터셋을 이용하여 출력된 빈도수(frequency)를 기반으로 그림 5와 같이 워드 클라우드로 시각화하였다.


Fig. 5. 
Visualize in wordcloud based on text frequency

그림 6은 수집된 빅데이터에서 빈도수가 높은 키워드를 중심으로 빈도수를 출력한 그래프이다. 최근 3년간 네이버 블로그에서 ‘자기효능감’과 ‘자기주도학습’이라는 키워드로 검색을 실행한 결과 성취, 목표, 능력, 검사, 과외, 교육, 동기, 역량, 코칭 등의 텍스트가 높은 빈도수로 출력되었다.


Fig. 6. 
Frequency graph corresponding to text

자기효능감은 학습에서 자신감과 비슷한 의미를 포함하며 자기주도학습(SL; Self-directed Learning)검사와도 밀접한 관계가 있다. 자기주도학습 검사란 자기주도학습을 위해 행동원인을 정확히 진단하고, 진단결과에 따른 수준별 맞춤 클리닉 프로그램을 제공하기 위해 개발된 검사 도구를 의미한다[22]. 자기주도학습 검사 도구의 조절 구성 요인을 [22]에서는 동기 조절(motivation control), 인지 조절(recognition control), 행동 조절(behavior control)의 3가지 요소로 구분하였다. 동기 조절영역에 자기효능감, 귀인성향, 학습 목표 성향(숙달 목표, 수행 접근 목표, 수행 회피 목표), 자기 결정성까지 총 4가지 구성 요소 포함하였다. 인지 조절영역은 시연, 정교화, 조직화를 인지 전략으로 그리고 계획, 점검, 조절을 상위 인지 전략으로 하여 총 6가지 구성 요소를 포함하였다. 행동 조절영역에는 행동통제, 시간 및 환경관리, 도움 추구의 총 3가지 구성 요소를 포함하였다.

본 논문에서는 네이버 블로그를 대상으로 텍스트 마이닝을 실행하여 수집된 텍스트 데이터를 대상으로 [22]에서 제시한 자기주도학습 검사 도구의 동기 조절, 인지 조절, 행동 조절의 3가지 구성 요인으로 분류하여 자기효능감과 자기주도학습과의 관계를 표 3과 같이 분류하였다. 표 4에서 제시된 바와 같이 텍스트 마이닝을 통해서 출력된 빈도수 높은 총 40개의 텍스트는 성취, 목표, 능력, 검사, 과외, 교육, 동기, 역량, 코칭, 학업, 시간, 진로, 학업성취도, 수업, 스스로, 인지, 결과, 에듀, 자신, 평가, 방법, 수준, 습관, 자존감, 진단, 행동, 자아, 전략, 조절, 도전, 수행, 영어, 학원, 혜윰, 메타, 요인, 핵심, 플렉스, 향상, 활동 순으로 나타났다.

Table 3. 
Text categorized into three control elements of self-directed learning
text frequency motivation
control
recognition
control
behavior
control
achievement 169,200 O O
goal 131,600   O
ability 126,900   O  
inspection 122,200   O  
tutoring 94,000      
education 94,000 O O O
motivation 89,300 O    
ability 79,900   O O
coaching 75,200   O O
study 70,500 O O O
time 65,800     O
course 65,800 O    
academic achievement 65,800 O O O
class 61,100   O  
myself 61,100 O   O
recognition 61,100   O  
result 56,400      
Edu 56,400 O O O
self 56,400 O   O
evaluation 56,400   O  
way 51,700   O O
level 51,700      
habit 51,700     O
self-esteem 47,000 O    
diagnosis 47,000 O    
behavior 47,000     O
ego 42,300 O    
strategy 42,300   O O
control 42,300 O O O
challenge 37,600 O O O
perform 37,600     O
english 37,600   O O
academy 37,600   O O
haeyum 37,600      
meta 32,900      
factor 32,900      
main point 32,900      
flex 28,200      
improving 28,200      
activity 28,200      

Table 4. 
Evaluation of Text value
text rank TVF control
RCF RCW BCF BCW
education 1 0.20 94,000 0.26 94,000 0.14
study 2 0.15 70,500 0.19 70,500 0.11
academic achievement 3 0.14 65,800 0.18 65,800 0.10
achievement 4 0.13 - - 169,200 0.26
Edu 5 0.12 54,600 0.15 54,600 0.08
control 6 0.09 42,300 0.12 42,300 0.06
challenge 7 0.08 37,600 0.10 37,600 0.06
myself 8 0.05 - - 61,100 0.09
self 9 0.04 - - 56,400 0.09
motivation 10 0.00 - - - -
course 10 0.00 - - - -
self-esteem 10 0.00 - - - -
diagnosis 10 0.00 - - - -
ego 10 0.00 - - - -
total   1.00 364,800 1.00 651,500 1.00

본 논문에서는 [22]에서 정리한 개념을 기준으로 텍스트 마이닝을 통해 구조적 형식으로 재구성된 데이터셋에서 동기 조절에 해당하는 텍스트를 자기효능감과 연관되는 텍스트로 분류하였다. 그 결과 동기 조절에 해당하는 텍스트는 성취, 교육, 동기, 학업, 강좌, 학업성취도, 스스로, 에듀, 자신, 자존감, 진단, 자아, 조절, 도전에 해당하는 14개의 텍스트가 자기효능감과 연관된 텍스트로 선별되었다. 이렇게 선별된 자기효능감과 관련이 높은 텍스트 14개의 빈도수를 기준으로 인지 조절과 행동 조절과의 상관성을 그림 7과 같이 요약한다.


Fig. 7. 
Frequency of texts related to self-efficacy


Fig. 8. 
Graph of frequency of texts related to self-efficacy


Ⅳ. 텍스트 가치 평가

본 논문에서는 텍스트가 가지는 의미를 분석하는 텍스트 마이닝 기법을 사용하였다. 사용된 텍스트 마이닝 분석 기법에서 언어들 사이의 연결 개념들의 연결망을 추출한 후 의미를 찾아내기 위해서 텍스트를 해체한 후 다시 조합하여 텍스트가 전달하고자 하는 행간의 의미를 파악하였고, 주요 개념의 단순 빈도수를 통해 분석하고 그 결과를 워드 클라우드를 활용하여 시각적으로 파악하여 질적 분석과 양적 분석을 동시에 수행하였다. 네이버 블로그를 대상으로 텍스트 마이닝을 실행한 결과 추출된 40개의 텍스트 중에서 14개를 자기효능감 관련 키워드 샘플로 분류한 후 이를 동기 조절 텍스트의 범주로 정의하였다. 그리고 동기 조절 텍스트 14개를 그림 9와 같이 다시 인지 조절, 행동 조절의 범주로 정의하였다.


Fig. 9. 
Classification of Motivation control text into Recognition control and Behavior control

본 논문에서는 이처럼 분류된 14개의 동기 조절 텍스트를 대상으로 인지 조절, 행동 조절 범주 영역과의 상관성에 대한 텍스트 가치를 평가하기 위하여 아래의 식 (1)과 같은 텍스트 가치 계수(TVF; Text Value Factor)를 정의한다.

TVFk=RCWk+BCWk×0.5(1) 

위의 식 (1)에서 인지 조절 가중치(RCW; Recognition Control Weight)는 아래의 식 (2)를 통해 계산하고, 인지 조절 가중치는 인지 조절 빈도수(RCF; Recognition Control Frequency)를 이용하여 처리하였다.

RCWk=RCWki=1nRCF×0.5(2) 

식 (1)에서 사용된 행동 조절 가중치(BCW; Behavior Control Weight)는 아래의 식 (3)을 통해 계산하고, 행동 조절 가중치는 행동 조절 빈도수(BCF; Behavior Control Frequency)를 이용하여 처리하였다.

BCWk=BCFki=1nBCF×0.5(3) 

본 논문에서 텍스트 가치 계수 정의에 사용된 동기 조절 영역은 자기효능감 관련 키워드에 해당하는 샘플 추출을 기반으로 처리되었고 자기효능감 관련 키워드 추출은 본 연구에 참여하는 연구자들의 관점에 의하여 분류되었다. 식 (2)식 (3)을 통해서 인지 조절 가중치와 행동 조절 가중치를 계산한 후 식 (1)을 이용하여 동기 조절에 해당하는 자기효능감 텍스트의 인지 및 행동 조절과의 상관성에 대한 텍스트 가치 계수를 평가하였다. 표 4는 본 논문에서 제안한 텍스트 가치 평가를 위한 식 (1) ~ 식 (3)을 이용하여 자기효능감에 해당하는 14개의 텍스트를 대상으로 인지 및 행동 조절을 기반으로 텍스트 가치 계수를 평가하고 그 결과를 내림차순으로 정렬한 것을 보여준다.

본 논문에서는 네이버 블로그 데이터를 대상으로 [22]에서 제안한 자기주도학습 검사 도구의 조절 요인 3가지 중에서 동기 조절에 해당하는 자기효능감 관련 텍스트의 인지 조절 및 행동 조절과의 상관성에 대한 텍스트 마이닝을 처리하였다. 그 결과 동기 조절에 해당하는 자기효능감 관련 텍스트의 인지 조절 및 행동 조절과의 상관성에 대한 텍스트 가치의 순위는 다음과 같이 요약되었다.

· 1순위 : 교육(0.20)
· 2순위 : 학업(0.15)
· 3순위 : 학업성취도(0.14)
· 4순위 : 성취(0.13)
· 5순위 : 에듀(0.12)
· 6순위 : 조절(0.09)
· 7순위 : 도전(0.08)
· 8순위 : 스스로(0.05)
· 9순위 : 자신(0.04)
· 10순위 : 동기, 강좌, 자존감, 진단, 자아(0.00)


Ⅴ. 결 론

본 논문에서는 네이버 블로그를 대상으로 빅데이터의 텍스트 마이닝을 이용한 자기효능감과 자기주도학습 간의 텍스트가치를 검증하였다. 빅데이터 기반의 텍스트 마이닝을 통해 구조화된 텍스트 데이터셋을 구성하여 자기주도학습능력의 진단 요인 중 자기효능감 기반의 텍스트를 중심으로 인지 조절과 행동 조절로 분류한 후 텍스트 가치 계수를 평가하였다. 평가 결과 교육, 학업, 학업성취도, 성취, 에듀, 조절, 도전, 스스로, 자신 등의 텍스트가 인지 조절 및 행동 조절과 연관성이 높은 텍스트로 출력되었다. 동기, 강좌, 자존감, 진단, 자아 등의 텍스트는 인지 조절 및 행동 조절과 무관한 것으로 나타났다. 본 논문에서는 네이버 블로그를 대상으로 자기주도학습 검사 도구의 조절 구성 요인을 동기 조절, 인지 조절, 행동 조절에 해당하는 3가지 요소로 한계를 두어 분석하였다. 향후 자기주도학습을 위한 행동원인을 정확히 진단하고, 진단결과에 따른 수준별 맞춤 클리닉 프로그램을 개발하기 위하여 본 논문에서 제시한 방법을 기준으로 자기주도학습능력에 영향을 미치는 요인을 학습자 개인의 특성이나 학습자의 진로성숙도 등의 영역으로 다각화할 필요가 있을 것으로 판단된다.

현재 온라인 공개수업, 유튜브, 미국 드라마 시청 등과 같은 이러닝을 평생교육학습 도구로 받아들이고 있는 성인학습자들에게 개인의 자기주도학습 능력을 진단하고 맞춤형 자기주도학습 클리닉을 제공하는 프로그램이 필요한 시점이다. 이에 따라서 본 논문에서 제안한 방식은 자기주도학습 클리닉 프로그램 개발 시 자기효능감을 높일 수 있는 중심 단어 추출의 기준이 될 수 있을 것으로 사료된다. 향후 본 논문에서 제안한 방식을 기준으로 자기효능감과 자기주도학습능력에 영향을 미치는 요인을 확장한 후 온라인 기반의 자기주도학습 클리닉 시스템 구축에 활용하여 자기효능감을 높이고 자기주도학습을 효과적으로 수행할 수 있는 상담 및 심리교육 프로그램으로 활용성을 넓힐 수 있기를 기대한다.


참고문헌
1. H.J. Park, The Effects of Self-direction for Learning, Learning Motivation and Academic Self-Efficacy on Satisfaction of Education Services of Adult Learners in the Lifelong Education Institution, M.A. dissertation, Korea University, Seoul, Korea, 2010.
2. Korean Statistical Information Service(KOSIS). [Internet]. Available: http://kosis.kr/statHtml/statHtml.do?orgId=334&tblId=DT_33409N_001&vw_cd=&list_id=&scrId=&seqNo=&lang_mode=ko&obj_var_id=&itm_id=&conn_path=K1.
3. Korean Statistical Information Service(KOSIS). [Internet]. Available: http://kosis.kr/statHtml/statHtml.do?orgId=334&tblId=DT_33409N_0061&vw_cd=MT_ZTITLE&list_id=334_33409_003&seqNo=&lang_mode=ko&language=kor&obj_var_id=&itm_id=&conn_path=MT_ZTITLE.
4. Bandura. A, Self-efficacy: toward a unifying theory of behavioral change, in Psychol Rev. 191-215, 1977.
5. Bandura. A, Self-referent thought : A development analysis of self-efficacy, in Social Cognitive Development: Frontiers and Possible Futures, 200-239, 1981.
6. H. Y. Kim, The Relationship between Self Control and Self-Directed Learning Ability among College Students: The Mediating Effect of Academic Self-Efficacy, M.A. dissertation, Hanyang University, 2019.
7. S. K. Jung, “A Case Study of College Students Use of Mobile Applications and their Perception of AI-based Apps,” The Journal of Mirae English Language and Literature, Vol. 24, No. 3, pp. 303-330, Aug. 2019.
8. E. Y. Kwon, J. G. Lee and S. W. Park, “Public perception of American TV dramas and self-motivated English learning patterns using them through an analysis of social media big data: Focusing on YouTube and Twitter,” The Journal of Mirae English Language and Literature, Vol. 20, No. 3, pp. 25-48, Mar. 2019.
9. M.. A. Jung, N. H. Kim, “The Relationship between Self-directed Learning Readiness, Learning Motivation and Willingness to Communicate in English,” The Journal of Studies in Language, Vol. 34, No. 1, pp. 63-78, May. 2018.
10. H. I. Park, Review on Relationship Between Perceived Social Support and Self-efficacy, Ph.D. dissertation,
11. K. S. Oh, Influence of Self-efficacy program on the Learned helplessness, M.A. dissertation, Cheju National University, Jeju, Korea, 2001.
12. S. H. Song and Y. S. Ro, “The Effect of Lifelong Education Participative Motivation, Self-Efficacy, and Self-Directed Learning on Educational Satisfaction of Middle Age Adults”, The Journal of Digital Contents Society, Vol. 17, No. 4, pp. 273-278, June 2016.
13. Bandura. A, "On the functional properties of perceived self-efficacy revisited," Journal of Management, Vol 38, pp. 9-44, 2012
14. H. Y. Jang, The Effects of Lifelong Education Participative Motivation, Self-Efficacy, and Self-Directed Learning on Subjective Happiness of Middle and Older Adults, Ph.D. dissertation, Dong-A University, Busan, Korea, 2015.
15. M. H. Park and M. Jeong, “The Study on the Effects of Middle-aged Woman`s Participative Motivation and Lifelong Education Satisfaction on Subjection Well-being: Focused on the Medicated Effect of Self-efficacy,” The Journal of Humanities and Social science, Vol. 8, No. 2, pp. 583-600, 2017
16. Se-jin, A Qualitative Study on Middle-Aged Female Art Learners, Centered on Self-Efficacy, M.A. dissertation, Ewha Womans University, Busan, Korea, 2019.
17. Y. D. Kim and S. J. Yong, “A Study on the Learning System Using Trend Analysis and Text Mining for Online Learning Content,” in Proceeding of the Korea Information and Communication Society Conference, Vol. 23, No. 2, pp. 635-637, 2019
18. Korean Statistical Information Service(KOSIS). [Internet]. http://kosis.kr/statHtml/statHtml.do?orgId=334&tblId=DT_33408N_819&vw_cd=MT_ZTITLE&list_id=334_33408_04_003&seqNo=&lang_mode=ko&language=kor&obj_var_id=&itm_id=&conn_path=MT_ZTITLE
19. Korean Statistical Information Service(KOSIS). [Internet]. http://kosis.kr/statHtml/statHtml.do?orgId=334&tblId=DT_33409N_018&conn_path=I3
20. J. Y. Lee, J. H. Kang, S. U. Jang and S. J. Yoo, “Examining and Analyzing Influential Factors of Ego-resilience: By Applying Data Mining Analysis,” The Journal of Counseling Psychology Education Welfare, Vol. 6, No. 1, pp. 125-136, Mar. 2019
21. K. Timara, A study on Hungary's Image Projected in Korean Travel Blogs, M.A. dissertation, Seoul National University, Seoul, Korea, 2018.
22. D. H. Lee, “Components of Diagnose Tool for K-12 Students Self-Directed Learning Competency,” The Journal of Korea Association of Global Culture, Vol. 8, No.1, pp. 43-65, Jan. 2017.

저자소개

김선숙(Sun-Suk Kim)

2018년 : 동신대학교 사회개발대학원 상담심리학과(상담심리학석사)

2019년~현재 : 호남대학교 대학원 상담심리학과(박사과정)

2018년~현 재: 호남대학교 학생상담센터 객원상담위원

※관심분야 : 교류분석상담, 진로상담, 부모교육, 집단상담, 학습전략 MLST 교육

김희숙(Hye-Suk Kim)

1999년 : 전남대학교 일반대학원 전산통계학과 (이학석사)

2009년 : 전남대학교 일반대학원 전산학과 (이학 박사)

2018년~현 재: GIST(Gwangju Institute of Science and Technology) Lecture Professor

※관심분야 : 빅데이터, 데이터마이닝, 데이터과학, 인공지능, 영상처리, 멀티미디어콘텐츠 등

김미례(Mi-Rye Kim)

2002년 : 전남대학교 일반대학원 교육학과 상담심리전공 (교육학 석사)

2006년 : 전남대학교 일반대학원 교육학과 상담심리전공 (교육학 박사)

2014년~현 재: 호남대학교 상담심리학과 조교수, 학생상담센터장, (사)한국상담학회-한국학교상담학회장

※관심분야 : 상담자교육 및 수퍼비전, 교류분석상담, 부모교육, 가족상담, 집단상담, 진로상담