Korea Digital Contents Society
[ Article ]
Journal of Digital Contents Society - Vol. 24, No. 4, pp.847-860
ISSN: 1598-2009 (Print) 2287-738X (Online)
Print publication date 30 Apr 2023
Received 16 Dec 2022 Revised 25 Jan 2023 Accepted 31 Jan 2023
DOI: https://doi.org/10.9728/dcs.2023.24.4.847

초·중·고 학생의 사교육과 학업성적에 대한 패턴 분석: 의사결정나무 기법을 활용하여

최근호1 ; 바트호약 나랑가라브2 ; 김건우3 ; 이정화4, *
1국립한밭대학교 융합경영학과 부교수
2Digital Concept 대리
3국립한밭대학교 융합경영학과 교수
4근로복지공단 근로복지연구원 책임연구원
Private Tutoring and Academic Performance of Elementary, Middle, and High School Students: A Decision Tree Algorithm
Keunho Choi1 ; Narangarav Batkhuyag2 ; Gunwoo Kim3 ; Jeonghwa Lee4, *
1Associate Professor, Department of Business Administration, Hanbat National University, Daejeon 34158, Korea
2Merchandising Assistant Manager, Digital Concept, Ulaanbaatar 17010, Mongolia
3Professor, Department of Business Administration, Hanbat National University, Daejeon 34158, Korea
4Associate Researcher, Labor Welfare Research Institute, Korea Workers’ Compensation and Welfare Service, Seoul 07254, Korea

Correspondence to: *Jeonghwa Lee Tel: +82-42-821-1468 E-mail: jeong0112@gmail.com

Copyright ⓒ 2023 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

초록

본 연구는 데이터마이닝 기법인 의사결정나무 모형을 적용하여 학업성적과 사교육 간의 관계를 분석하였다. 분석 대상을 초·중·고 학교급별로 구분하고 이를 상·중·하위권의 학업성적 수준별로 재분류한 후 집단별로 연관 패턴을 도출하였다. 분석 결과, 초등학생 집단에서는 다양한 분야에서의 사교육 참여가 주요 요인으로는 식별되었으며 이것은 중등 시기부터 주요 교과목으로 집중하는 패턴을 보였다. 일반고 패턴에서는 사교육 시간, 특성화고에서는 예체능 분야의 사교육비가 주요한 변수였다. 사교육은 공통적으로 초·중학교 학업성취의 주요한 영향 요인이며, 학업성적 수준이 저조할수록 사교육 참여가 적었고 가정 환경에 따라 학업 성과의 격차가 발생하는 공통점이 있었다. 이와 같이 사교육을 비롯하여 학업성적과 연관된 다양한 요건을 폭넓게 비교 분석하고 시사점을 제시하였다.

Abstract

This study analyzed the impact of private education on academic performance using decision tree model by reclassifying student groups based on their school type and academic achievement. Our findings demonstrated that private education participation significantly influenced academic performance across all student groups, and private education participation of lower-level groups were more associated with their performance, with a notable gap depending on the student’s family environment. We also investigated various factors related to the accessibility and impact of private education on academic achievement. Our study contributes insights into the effects of private education on academic achievement and provides theoretical and practical implications.

Keywords:

Private education, Type of school, Academic performance, Decision tree, Pattern analysis

키워드:

사교육, 학교급, 학업성적, 의사결정나무, 패턴 분석

Ⅰ. 서 론

2021년 한국에서는 초·중·고 학생의 75.5%가 사교육을 받는 것으로 조사되었으며, 이는 10년 전보다 약 6%p 증가한 수치이다[1]. 사교육비 규모는 23조 4,158억원 가량인데, 이 중 초등학생의 사교육비 총액이 약 45%를 차지하였다[1]. 사교육은 세계에서 널리 발견되는 현상이지만, 우리나라는 OECD 국가 중에서도 사교육의 비중이 높은 편에 속한다. 사교육에 참여하는 시간은 주당 평균 3.6시간으로 OECD 평균인 0.6시간의 약 6배 가량에 달하였다[2]. 2019년 초·중·고 사교육비 지출액은 1,454달러로 OECD 국가 중 6위를 기록하였는데[3], 2006년에서도 사교육비 규모가 1위(GDP 대비 2.9%)로 조사되어[4] 이러한 추세는 계속 이어진 것으로 보인다. 우리나라 사교육비 흐름을 분석한 연구에 따르면 2010년대 초반에는 초·중·고의 사교육비가 감소하였으나 2016년 이후에 다시 주요 과목을 비롯하여 ‘입시 컨설팅’ 및 예체능 사교육비가 눈에 띄게 증가하였다[5]. 현재 가구의 사회경제적 상황에 따라서 사교육 접근성이 달라지고, 이것이 교육 격차로 이어지는 실정이 사회적 문제로 인식되고 있다. 저소득층에서도 가구경제 상황에 상관없이 사교육을 시작하는 등 양적인 사교육 참여율은 늘어났다[6]-[8]. 하지만 소득 수준을 비롯하여 부모의 학력이나 교육에 대한 가치관, 지역 등 다양한 조건이 사교육 행위에 관련되는 ‘학력과 부의 대물림 현상’[9]은 여전히 발견된다. 코로나19 이후에도 초·중·고 공통적으로 가정배경이 좋을수록 사교육 참여 시간이 늘어났으며, 이러한 경향은 학교급이 높을수록 강한 것으로 분석되었다[10].

한국의 사교육은 ‘경쟁 기제(enrichment)’[9]로서의 성격이 강하다. 사교육 수요의 배경을 학력주의, 학력경쟁을 관리하는 선발 시험, 공교육 체제와 특성, 사교육 수요자 개인의 특성으로 볼 수 있다[11],[12]. 노동시장 성과가 출신 대학과 밀접하게 연결되는 사회구조적 특징도 빼놓기 어렵다[9].

그렇다면 사교육은 학업성적에 긍정적으로 작용하는가? 선행연구는 공통적으로 학생의 연령 내지는 학교급과 학업성적에 따라서 사교육의 효과, 참여 형태와 분야가 상당히 다르다는 점을 강조하였다. 그러므로 학업성과에 대한 사교육의 영향 관계는 초·중·고 학교급과 학업 수준을 고려해서 분석할 필요가 있다. 이에 본 연구는 데이터마이닝 기법 중 하나인 의사결정나무 방법을 활용하여, 사교육 및 학업성적과 관련된 다양한 사회경제적 변인의 조합된 패턴을 도출하였다. 이러한 접근을 통해서 사교육의 역할만이 아니라 각각의 학생 집단별로 사교육을 접하는 방식과 그 배경도 아울러 살펴볼 수 있다.

본 연구는 다음과 같은 특징을 갖는다. 첫째, 초·중·고 학교급 집단을 비교 분석하되 학업성적을 상위권(1~30%), 중위권(31~60%), 하위권(61~100%)으로 재분류하였다. 이에 사교육과 학업성적의 관계를 초·중·고의 학업성적 수준별 집단에 따라 비교 분석하였다. 둘째, 의사결정나무 기법을 활용하여 각 학교급 및 학업성적 집단의 주요 연관 패턴과 각각의 패턴별 확률을 도출하였다. 이 기법은 대상의 특성 및 조건의 조합에 의한 변인의 영향 관계를 체계적으로 실증하는 장점을 갖는다. 즉 요인 간의 관계를 분석하여 패턴을 제시함으로써 학업성과를 유발하는 특정 조건이 체계적으로 결합된 일련의 규칙을 도출한다는 점에서 의미가 있다.


Ⅱ. 본 론

2-1 한국 사교육의 현황 및 특징과 해외 사례

그간 우리나라에서는 입시교육의 대상 연령이 낮아지고 초등학교에서부터 사교육 참여가 늘어나는 추세를 보여왔다[6][13]. 2021년 초등학생의 사교육 참여율은 82.0%로 중학생 및 고등학생의 73.1% 및 64.6%를 앞섰다[1]. 학생 1인당 월 평균 사교육비는 41만 2천원(자녀 1명 가구)이었는데, 이것을 들여다보면 학업성적과 가구소득을 기준으로 현저한 차이가 발생하였다[1]. 초등학교부터 이미 학업성적이 우수한 학생은 사교육에 활발하게 참여하는 반면, 학업성적이 낮거나 대도시에 거주하지 않는 경우에는 사교육 참여가 감소하는 격차를 보여주는 결과이다.

사교육은 넓은 의미에서 ‘좋은 가정 환경’을 반영한다. 선행연구에 따르면 사교육 서비스의 이용 개수나 사교육비 지출은 가구의 소득과 부모의 학력 등의 같은 사회경제적 상황과 밀접한 관련이 있었다[9],[14]. 또한 가구소득이 높을수록 사교육에 참여하는 시기도 빨라지는 것으로 연구되었다[15]. 물론 저소득층의 사교육비 지출액 규모는 적은 편이다. 2007~2016년의 가계소득 수준과 사교육비 지출에 관한 연구에 따르면 가계소득 최고 및 최저집단 간의 사교육비 지출 규모는 약 3~5배의 차이가 났다. 이 같은 격차는 점차 감소하였지만, 중산층 및 저소득층의 사교육비 지출 증가에 기인한 결과로 분석되었다[16]. 구매력 대비 높은 사교육비 지출의 이중 부담을 짊어지는 것이다[17]. 가구소득 수준과 사교육비 간의 통계적 연관이 발견되지 않는 연구 결과도 같은 맥락이다[18].

사교육을 둘러싼 일련의 특징은 비단 한국만의 현상이 아니다. 해외에서도 비슷한 경향을 확인할 수 있다. 과거 서구 국가의 사교육은 성적이 낮은 학생의 보강(remedial)에 중점을 두는 성격이 강하였다[9],[19]. 하지만 점차 EU국가에서 성적이 우수한 학생과 중산층 가구, 도시 거주자를 중심으로 사교육 참여가 크게 증가하였다[20],[21]. 특히 과거 공교육의 틀에서 사교육의 역할을 소화했던 스칸디나비아 국가에서도 과거와 달리 사교육의 비중이 크게 늘어난 것으로 분석된다[21]. 평등주의 국가의 대표적 사례인 스웨덴에서는 최근 가문의 부(富)가 학업성취에 관련을 맺는 것으로 연구되었다[22]. 홍콩 사례에서도 사교육 활용도가 높은 학생일수록 양질의 생활환경을 누리는 것으로 나타났다[23].

2-2 사교육과 학업성적 간 관계에 대한 선행연구

그렇다면 사교육은 학업성적에 도움이 되는가? 사교육의 역할에 대해서는 의견이 분분한 편이다. 사교육의 효과를 제한적으로 보는 연구도 있지만[5],[24], 실제로는 사교육과 교육 격차의 관계가 실증연구의 결과보다 더욱 강할 것이라는 의견도 있다[25]. 학문연구뿐만 아니라 현실적으로도 여전히 사교육은 학업성적을 결정하는 중요한 요소로 인식되는데, 그 역할은 학교급을 비롯한 여러 특징에 따라서 달리 나타난다. 관련한 선행연구를 검토해보겠다.

초등학생에 관한 연구에 따르면, 초등학교 1학년생의 사교육 참여에는 아버지의 학력과 가구소득 및 자녀 수 등의 가정 상황이 유의하게 작용하였다[26]. 또한 초등학교 고학년생의 경우에는 가구상황을 비롯하여 아동의 학업성적 및 주의집중력과 같은 문제가 영향을 미치는 것으로 나타났다[6].

다음으로 중학생에 대한 연구에서는 사교육 참여의 시기가 빠른 집단에서 사교육에 의한 학업성취도가 더욱 높았다[15]. 한편 사교육 참여가 지속적으로 이어진 집단일수록 학업성취도가 가장 높았지만 성취도 향상이라는 측면에서는 사교육 효과가 없는 것으로 보았다[22]. 또는 학업성적 하위권인다는 성적 우수자에 대해서는 사교육 참여의 효과가 강하다는 연구결과도 있다[25]. 중·고생을 함께 분석한 연구에서는 사교육이 학업성취도를 유의하게 향상시켰으나, 학급이 올라갈수록 그 정도가 감소하는 것으로 보았다[27].

고등학생의 경우 사교육 참여가 학업성적에 미치는 영향은 성적 수준에 따라 차이가 있었으며, 부모의 자녀양육 유형별로 학업성취 정도가 다른 것으로 나타났다[28]. 또는 사교육보다 각 고등학교의 질적인 특성으로 인한 학업성취도의 차이가 더 크게 발생한다는 결과도 있다[29].

이처럼 사교육의 효과는 학생의 연령 및 학교급에 따라 달리 나타난다. 다른 한편으로는 가구의 사회경제적 지위를 비롯한 여러 특성도 간과할 수 없는 조건임이 공통적으로 나타난다. 부모의 학력·연령이나 소득수준뿐만 아니라, 경제적 상황에 대한 양육자의 인식과 교육에 대한 태도와 가치관도 사교육 참여 양상에, 그리고 학업성과에 대한 사교육의 효과에 있어서 의미 있는 요인으로 검증되었다[30]-[33].

2-3 의사결정나무 모형

본 연구에서 사용한 분석 방법은 데이터 마이닝(data mining) 분석 방법 중 하나인 의사결정나무(decision tree) 기법이다. 이는 관측치들 간의 관계·패턴·규칙 등을 추정하고, 그것을 바탕으로 대상을 분류(classification)하여 새롭게 탐색된 집단의 특성을 예측한다[35],[36]. 이 기법은 다양한 범주의 요인을 고려하는 사회과학 분야의 연구에서 유용하게 활용되는데, 타깃 변수와 요인들 간에 형성되는 상호작용을 분석하며 그 과정에서 어떤 요인이 우선순위를 갖는지 검증하는 이점을 갖는다[37],[38].


Ⅲ. 연구 방법

3-1 분석 데이터

본 연구는 국가통계포털(KOSIS) 통계청의 마이크로데이터 통합서비스(MDIS: Micro Data Integrated Service) 시스템에서 제공하는 ‘초중고 사교육비 조사’ 데이터를 분석하였다. 이 조사는 2014년부터 전국 초·중·고 학생 및 교사와 학부모를 대상으로 진행하였으며 사교육 관련 사항과 방과 후 학교, 어학연수, 학습시간, 학업성취도 등의 자료를 수집한다. 다만 2018년부터는 학업성적과 관련해서 고등학생만을 대상으로 조사를 실시하였으므로, 본 연구는 초·중·고 학생의 학업성취 관련 데이터의 활용이 가능한 2017년도 조사자료를 이용하여 분석하였다. 특히 최근 1~2년간은 코로나19 상황이라는 큰 변수가 있었으나 점차 종전의 교육환경으로 돌아오는 경향이므로 이러한 환경 변화를 경험하기 이전 시기의 자료를 분석하는 것이 연구의 의미를 더할 것이다.

전체 데이터는 연구목적에 맞게 초등학교, 중학교, 일반고등학교(일반고·과학고·국제고·예술고·외국어고·체육고·자율고), 특성화고등학교(마이스터고·공업고·상업고·농업고·가사고·대안고 등)의 총 4개의 데이터셋으로 분할하였으며 각 학교급 및 종류는 해당 조사의 분류를 따랐다. 모델의 정확도 향상과 간결성을 위해 타깃 변수로 사용될 학업성적을 원 데이터의 5개 클래스에서 상위권(1~30%), 중위권(31~60%), 하위권(61~100%)의 3개 클래스로 재분류하였다. 데이터셋은 총 58개의 변수를 포함하였다(표 2).

3-2 데이터 균형화

분석에 앞서 수집한 데이터를 분석용 데이터셋으로 만드는 전처리 작업 후 균형화 작업을 수행하였다. 타깃 변수의 클래스별 인스턴스의 수가 서로 달라 데이터 불균형이 발생하게 되면, 모델 학습 시 편향된 학습이 이루어져 구축된 모델의 정확성이 감소하는 문제가 발생할 수 있다[34]. 이를 해결하기 위해 타깃 변수의 클래스별 인스턴스의 수를 동일하게 맞추어주는 데이터 균형화 작업을 수행할 필요가 있다.

본 연구에서는 분석에 사용할 데이터셋 별 인스턴스의 수가 충분한 편이며, 클래스별 인스턴스의 수가 큰 차이를 보이지 않는다. 이에 정해진 규칙에 따라 소수 클래스의 인스턴스 수만큼 다수 클래스의 인스턴스를 샘플링하여 클래스별 인스턴스의 수를 동일하게 맞추는 언더샘플링(under-sampling)을 수행하였다(표 1). 이 방법은 학습시간이 단축되고 과잉 적합 문제가 발생할 가능성이 낮은 장점이 있다.

Comparison of instances by class before and after data balancing

3-3 의사결정나무 방법

의사결정나무 기법은 효율적이며 효과적으로 예측 정확도가 높은 모델을 구축하는데, 무엇보다도 분석 결과의 포괄적인 설명력(comprehensibility)이 이 모델의 가장 큰 장점이라 할 수 있다[39],[40]. 모델에서 사용한 데이터의 변수는 다음과 같다.

List of variables


Ⅳ. 의사결정나무 기법을 이용한 패턴 분석 결과

의사결정나무 기법을 도출된 패턴들 중에서 의미 있고 신뢰성 높은 패턴을 추출하기 위해, 인스턴스의 개수가 50개 이상이며 타겟 클래스의 확률이 가장 높은 상위 5개의 패턴을 주요 연관 패턴으로 선정하였다. 분석 결과는 다음과 같다.

4-1 초등학교의 사교육과 학업성적 간 주요 연관 패턴

가장 먼저 초등학생 중 학업성적 상위권(1~30%) 집단의 사교육과 학업성적 간 주요 패턴을 살펴보면 다음과 같다(표 2). 첫째, 어머니의 교육수준이 석사학위이고, 일반교과목 그룹과외비가 연 98.04만원을 초과하는 경우에 확률이 66.67%로 추정되었다. 둘째, 어머니의 교육수준이 대학교 졸업이고, 일반고 진학을 희망하며, 음악 사교육비가 연 29.74만원을 초과하고, 취미·교양에 대한 사교육비가 연 152.94만원 이하, 미술 사교육비가 연 154.66만원 이하, 아버지가 40대이며, 제2외국어·한문·컴퓨터일반·기술가정에 대한 사교육비가 연 23.53만원을 초과하고, 영어 사교육비가 연 77.65만원 이하일 경우에 확률은 54.55%였다. 셋째, 어머니의 교육수준이 대학교 졸업이고 특목고(과학고·외고·국제고) 진학을 희망하며, 가구의 자녀가 3명 이상(2명 초과), 아버지만 경제활동을 하는 경우 확률이 54.55%로 추정되었다.

Patterns for elementary school children: Upper level (1~30%)

다음은 학업성적이 중위권(31~60%)에 속하게 될 확률이 높은 상위 5개의 패턴 결과이다. 첫째, 어머니의 교육수준이 대학교 졸업이고, 일반고 진학 희망, 연 음악 사교육비가 연 29.74만원 이하, 여학생이고 출생순위가 첫째이며, 방과후학교 교과프로그램비가 연 46.58만원을 초과하는 경우 확률이 56.58%로 였다. 둘째, 어머니의 교육수준이 대학교 졸업이고, 특목고(예술고, 체육고) 진학을 희망하며, 여학생이고, 아버지가 40대이며, 음악 사교육비가 연 123.92만원을 초과하는 경우 확률이 56.06%로 추정되었다. 셋째로 어머니의 교육수준이 대학교 졸업이고, 일반고 진학을 희망하며, 음악 사교육비가 연 29.74만원을 초과하고, 취미·교양에 대한 사교육비가 연 152.94만원 이하이며, 미술 사교육비가 연 154.66만원 이하이고, 아버지가 40대이며, 제2외국어·한문·컴퓨터일반·기술가정에 대한 사교육비가 연 23.53만원을 초과하고, 영어 사교육비가 연 77.65만원을 초과하는 경우 확률이 52.87%로 추정되었다.

Patterns for elementary school children: Middle level (31~60%)

학업성적이 하위권(61~100%)에 속하게 될 확률이 높은 상위 패턴 결과로는 첫째, 어머니의 교육수준이 중학교 졸업 미만인 경우로 62.38%의 확률을 추정하였다. 둘째, 어머니가 부재하고 월 평균 가구 소득이 200만원 미만인 여학생의 경우, 학업성적이 하위에 속하게 될 확률이 62.14%였다. 셋째, 어머니의 교육수준이 대학교 졸업이고 특목고(마이스터고) 진학을 희망하며 가구의 자녀 수가 3명 이상인 경우에 확률이 61.43%로 추정되었다.

Patterns for elementary school children: Lower level (61~100%)

4-2 중학교의 사교육과 학업성적 간 주요 연관 패턴

다음으로는 중학생의 사교육과 학업성적 간 주요 연관 패턴을 분석한 결과이다. 먼저 학업성적이 상위권(1~30%)에 속하게 될 확률을 추정하는 주요 패턴은 다음과 같다. 첫째, 일반교과목 사교육비가 연 129.41만원을 초과하고, 일반고 진학을 희망하며, 체육 분야의 사교육비가 연 133.33만원 이하이고, 영어 사교육비가 연 23.53만원 초과, 여학생이고 어머니가 50대이며 일반교과목 사교육 시간이 주 12.33시간을 초과하는 경우에 확률이 67.86%로 추정되었다. 둘째, 일반교과목 사교육비가 연 129.41만원을 초과하고, 특목고(과학고, 외고, 국제고) 진학을 희망히는 경우 확률이 67.84%로 추정되었다. 셋째, 일반교과목 사교육비가 연 129.41만원을 초과하고, 일반고 진학을 희망, 체육 분야의 사교육비가 연 133.33만원 이하이고, 영어 사교육비가 연 23.53만원 초과이며, 남학생이고 읍면지역 소재 학교에 다니며, 어머니의 교육수준이 고등학교 졸업이고, 일반교과 그룹과외비가 연 66.62만원을 초과하는 경우 확률이 64.71%로 추정되었다.

Patterns for middle school student: Upper level (1~30%)

다음으로 학업성적이 중위권(31~60%)인 집단의 결과를 살펴보겠다. 첫째, 일반교과목 사교육비가 연 129.41만원을 초과하고, 일반고 진학을 희망하며, 체육 분야의 사교육비가 연 133.33만원 이하이고 영어 사교육비가 연 23.53만원 초과, 남학생이고 읍면지역 소재 학교에 다니며, 어머니의 교육수준이 고등학교 졸업이고, 일반교과 그룹과외비가 연 66.62만원 이하이며, 사교육 참여시간이 주 6.67시간이고, 사회·과학 사교육비가 연 9.8만원을 초과하는 경우 확률이 55.93%로 추정되었다. 둘째, 일반교과목 사교육비가 연 129.41만원을 초과, 일반고 진학을 희망하고, 체육 분야 사교육비가 연 133.33만원 이하이며 영어 사교육비가 연 23.53만원 이하, 어머니가 40대이고 아버지의 교육수준이 석사학위인 경우에 확률은 52.94%로 추정되었다. 셋째, 일반교과목 사교육비가 연 129.41만원을 초과하고, 일반고 진학을 희망하며, 체육 분야의 사교육비가 연 133.33만원 이하이고, 영어 사교육비가 연 23.53만원 이하이며, 어머니가 40대이고, 아버지의 교육수준이 고등학교 졸업이며, 읍면지역 소재 학교에 다니는 경우 확률이 52.0%로 추정되었다.

Patterns for middle school student: Middle level (31~60%)

학업성적이 하위권(61~100%)에 속하게 될 확률이 높은 주요 패턴 결과는 다음과 같다. 첫째, 일반교과목 사교육비가 연 129.41만원 이하이고 특성화고 진학을 희망하는 경우로 확률이 68.99%로 추정되었다. 둘째, 일반교과목 사교육비가 연 129.41만원 이하, 일반고 진학을 희망하며, 어머니의 교육수준이 중학교 졸업인 경우 66.88%의 확률을 추정하였다. 셋째, 일반교과목 사교육비가 연 129.41만원 이하이며 특목고(예술고, 체육고) 진학을 희망하는 경우 확률이 63.98%였다.

Patterns for middle school student: Lower level (61~100%)

4-3 일반고등학교의 사교육과 학업성적 간 주요 연관 패턴

일반고등학교 학생의 학업성적이 상위권(1~30%)일 확률이 높은 주요 패턴은 다음과 같다. 첫째, 예체능 관련 사교육 시간이 주 1시간 이하이고, 일반교과목 사교육 시간이 주 0.33시간을 초과하며, 의약계열 대학으로의 진학을 희망하고, 어머니의 교육수준이 석사학위인 경우는 확률이 62.34%로 추정되었다. 둘째, 예체능에 대한 사교육 시간이 주 1시간 이하이고 일반교과목 사교육 시간이 주 0.33시간을 초과하며, 인문계열 대학 진학을 희망하고, 취업 관련 사교육 시간이 주 1.33시간 이하, 논술·독서교실·글쓰기·독서토론에 대한 사교육비가 연 297.42만원을 초과하는 경우는 확률이 60.0%였다. 셋째, 예체능에 대한 사교육 시간이 주 1시간 이하, 일반교과목 사교육 시간이 주 0.33시간을 초과하며, 교육계열 인문계열 대학 진학을 희망할 경우 확률이 54.24%였다.

Patterns for high school student: Upper level (1~30%)

고등학생의 학업성적이 중위권(31~60%)에 속하게 될 확률을 추정하는 주요 패턴은 다음과 같다. 첫째, 예체능 관련 사교육 시간이 주 1시간 이하이고, 일반교과목 사교육 시간이 주 0.33시간을 초과하며, 대학 진학 시 공학 계열 전공을 희망하고, 남학생이며 방과 후 학교에 참여하고, 국어 사교육비가 연 188.24만원 이하이며 일반교과목 개인과외비가 연 588.24만원을 초과하는 경우 확률이 58.11%였다. 둘째, 예체능 사교육 시간이 주 1시간 이하이고 일반교과목 사교육 시간이 주 0.33시간을 초과하며, 진학읠 희망하는 대학교 전공이 자연계열이고, 어머니가 50대이며 대학교 졸업자이고, 수학 사교육비가 연 348.97만원 이하인 경우 확률은 55.74%였다. 셋째, 예체능에 대한 사교육 시간이 주 1시간 이하이고, 일반교과목 사교육 시간이 주 0.33시간 이하이며, 방과후학교에 참여하고, 대학 진학 시 인문계열 전공을 희망하며, 충남 거주자인 경우 확률이 53.49%였다.

Patterns for high school student: Middle level (31~60%)

다음으로 일반고등학교 학업성적이 하위권(61~100%)에 속하게 될 확률이 높은 주요 패턴 결과이다. 첫째, 예체능 관련 사교육 시간이 주 1시간 이하이고, 일반교과목 사교육 시간이 주 0.33시간 이하이며, 방과후학교에 참여하지 않고, EBS 교재비가 연 1.18만원 이하인 경우 확률이 58.25%였다. 둘째, 예체능에 대한 사교육 시간이 주 1시간 이하이고, 일반교과목 사교육 시간이 주 0.33시간 이하이며, 방과후학교에 참여하고, 대학교 진학 시 예체능계 전공을 희망하며, 특기적성 프로그램 비용이 연 85.35만원 이하이고, 남학생인 경우 확률이 56.48%였다. 셋째, 예체능에 대한 사교육 시간이 주 1시간을 초과하고, 수학 사교육비가 연 132.05만원 이하인 경우 확률이 56.06%였다.

Patterns for high school student: Lower level (61~100%)

4-4 특성화고등학교의 사교육과 학업성적 간 주요 연관 패턴

특성화고등학교 학생 집단에 대한 주요 연관 패턴 결과이다. 학업성적이 상위권(1~30%)에 속하게 될 확률이 높은 상위 5개의 주요 패턴을 살펴보면 다음과 같다. 첫째, 진로진학학습상담에 참여하지 않고, 수학 사교육비가 연 39.66만원 이하이며, 방과후학교 참여 시간이 주 12시간을 초과하였고, 가구의 자녀가 2명 이상이며 여학생인 경우에 확률이 69.81%로 추정되었다. 둘째, 진로진학학습상담에 참여하지 않고, 수학 사교육비가 연 39.66만원 이하이며, 방과후학교에 주 6시간 초과 12시간 이하로 참여하고, 자녀가 2명 이상인 가구의 자녀가 2명 이상, 출생순위가 2번째인 여학생이며, 어머니의 교육수준이 대학교 졸업인 경우 확률이 55.77%로 추정되었다. 셋째, 진로진학학습상담에 참여하지 않고, 수학 사교육비가 연 39.66만원 이하이며, 방과후학교 참여 시간이 주 12시간 이하, 자녀가 2명 이상인 가구에서 첫째로 태어난 여학생이고, 아버지가 40대이며, 사교육 참여시간이 주 0.33시간을 초과하는 경우에 확률이 55.74%로 추정되었다.

Patterns for specialized high school student: Upper level (1~30%)

학업성적이 중위권(31~60%)에 속하게 될 확률이 높은 패턴 분석 결과는 다음과 같다. 첫째, 진로진학학습상담에 참여하지 않고, 수학 사교육비가 연 39.66만원 이하이며, 방과후학교에 주 12시간 이하로 참여하고, 자녀가 3명 이상인 가구에서 첫째로 태어난 여학생이며, 아버지가 40대이고 주당 사교육 참여시간이 평균 0.33시간 이하인 경우에 확률이 52.7%로 추정되었다. 둘째, 진로진학학습상담에 참여하지 않고, 수학 사교육비가 연 39.66만원 이하이며, 방과후학교에 주 6시간 초과 12시간 이하로 참여하고, 자녀가 2명 이상인 가구에서 둘째로 태어난 여학생이며, 어머니의 교육수준이 고등학교 졸업이고, 진학희망 대학교 유형이 기타(아직 결정 안함, 진학 안함 등)인 경우 확률은 50%로 산출되었다. 셋째, 진로진학학습상담에 참여하지 않고, 수학 사교육비가 연 39.66만원 이하이며, 방과후학교에 참여하지 않고, 가구의 자녀 수가 4명 이하이며, 취업에 관련된 사교육 참여시간이 3시간 이하이고, 어머니가 40대이며, 예체능 학원수강비가 연 11.90만원 이하이고, 어머니의 교육수준이 대학교 졸업이며, 제주 거주자인 경우에 확률은 50%로 추정되었다.

Patterns for specialized high school student: Middle level (31~60%)

학업성적이 하위권(61~100%)에 속하게 될 확률을 추정하는 주요 패턴은 다음과 같다. 첫째, 진로진학학습상담에 참여하는 경우의 확률이 62.3%로 추정되었다. 둘째, 진로진학학습상담에 참여하지 않고, 수학 사교육비가 연 39.66만원 이하이며, 방과후학교에 참여하지 않고, 자녀가 4명 이하인 가구의 첫째이며, 취업 관련 사교육 시간이 주당 3시간 이하이고, 어머니가 40대이며, 예체능 학원수강비가 연 11.90만원을 초과하는 경우에 확률이 55.74%로 추정되었다. 셋째, 진로진학학습상담에 참여하지 않고, 수학 사교육비가 연 39.66만원 이하이며, 방과후학교에 참여하지 않고, 가구의 자녀가 4명 이하이며, 취업 관련 사교육 시간이 주당 3시간 이하이고, 어머니가 50대인 경우 확률이 48.14%로 추정되었다.

Patterns for specialized high school student: Lower level (61~100%)


Ⅴ. 결 론

사교육과 학업성적의 관계에 대해서는 매우 다양한 연구가 이루어져 왔다. 그럼에도 학생의 연령과 학업 성취도, 학업의 방향, 가정 상황, 사회적 환경과 같이 무수한 변화를 고려해서 다각도의 탐색을 지속할 필요가 있는 주제일 것이다.

우리나라 학생의 사교육 참여율은 초등학교 시기부터 매우 높은 수준에 달한다. 대다수의 경우 다양한 경험을 쌓으며 역량을 기르고자 하는 목적에서 시작하여, 점차 학업 성적 향상을 주된 목표로 삼고 대학 입시를 준비하는 방향으로 집중된다고 할 수 있다. 여기서 사교육이 어떤 역할을 하며, 이것이 학교급과 학업성적 수준에 따라서도 차이가 있는지 비교 분석할 필요가 있다. 이에 본 연구에서는 연구 주제 및 대상과 관련한 무수한 변수를 투입하여 분류기법으로 최적의 연관 조합을 탐색하는 의사결정나무 모형을 구축하여 데이터를 분석하였다. 연구결과를 통해서 학급과 학업성적에 따른 사교육의 역할과 기타 주요 요인을 이해하고, 이를 바탕으로 교육현장과 관련 정책에서 활용할 수 있는 실증자료를 제공하고자 하였다. 학교급별 주요 분석 결과를 정리해보자.

초등학생의 학업성적 수준별 주요 연관 패턴들을 종합하면, 일반 교과과목을 비롯해서 예체능 계열과 제2외국어 등의 사교육비도 중요한 변인으로 나타났다. 다양한 방면의 사교육에 참여시키는 것이 학업성과와 관련이 있는 것으로 보인다. 진학을 희망하는 고등학교 유형이 중요한 요인으로 식별된 점도 흥미로운 결과로, 이 시기부터의 사교육과 학업에 대한 장기적인 계획이 학업성적과 관계가 있는 것으로 보인다.

그러나 사교육 참여만큼이나 가정환경과 부모의 돌봄 내지는 교육에 대한 참여가 자녀의 학업성과에 대해서 중요한 역할을 하는 것으로 보인다. 우선 가정의 사회경제적 지위를 설명하는 부모의 ‘교육수준’이 중요한 변수로 식별되었다. 학업성적 상위권 집단에서는 어머니의 교육수준이 대학교 졸업 이상이며, 하위권에서는 부모의 교육수준이 고등학교 졸업이거나 부재한 한부모·조손가정 등의 조건이 검증되었다. 특히 상위권 및 하위권에서는 사회경제적 변수만이 조합된 패턴을 확인할 수 있었는데, 아동 시기의 학업에 대한 가구 특성의 중요성을 잘 설명하는 결과이다.

다음으로 중학생에 대한 패턴 분석에서는 초등학교와 달리 일반교과목에 대한 사교육비와 진학하고자 하는 고등학교 유형 변수가 두드러졌다. 특히 일반교과목 사교육비가 중·상위권과 하위권을 가르는 변수로 식별되어, 사교육 참여와 학업성적 간의 관계가 상당히 밀접해졌음을 설명하였다. 상위권 집단에서는 사교육비가 높으며 과학고 등 진학을 희망하는 패턴이 도출되었다. 또한 지역(중소도시 및 읍면) 변수가 중·상위권에서 다수 식별되었으며, 본 연구에서 다루는 학업성적이 내신 성적임을 고려할 때 이러한 지역에 거주하며 사교육에 대한 지출이 많은 경우의 확률을 보여주는 패턴이었다. 하위권 집단에서는 사교육비가 적고, 특성화고 또는 예체능계 고등학교 진학을 계획하는 경우, 어머니의 교육수준이 낮거나 부재한 경향을 보였다.

일반고등학교 학생의 학업성취에 관한 분석 결과를 살펴보면 사교육 참여 시간 및 비용이 중요한 변수로 식별되었지만, 상위권에서 사교육 시간이나 비용이 상대적으로 높지 않은 등 학업성적과 사교육이 일관된 관계를 형성하지는 않았다. 그보다는 사교육 참여보다는 진학을 희망하는 대학교 유형의 변수가 학업성적 수준별 집단을 더욱 특징적으로 설명하였다. 즉 학업성적이 상위권인 집단에서는 의약계열이나 공학계열, 교육계열이 다수 식별되어, 이미 높은 학업성취도를 갖춘 집단의 패턴을 도출하였다. 그러나 초·중등생과 마찬가지로 학업성적 하위권에서는 사교육 참여가 낮은 공통점을 보였다. 고등학교 시기는 학업성적 수준이 어느 정도 결정된 상태이므로 사교육 참여의 노력을 기울이더라도 학업성적을 현저히 향상시키기 어려운 경향이 있다. 따라서 이미 형성된 학업성적을 유지하는 수준에서 사교육이 보조 역할을 하는 상황을 반영하는 결과로 보인다. 또한 고등학교는 진로를 비교적 명확하게 결정하는 시기인 만큼, 예체능에 투자하는 사교육 수준이 학생의 학업성적 수준을 보조적으로 설명하는 요인으로 식별되었다. 다만 ‘일반고등학교’ 집단의 패턴을 해석할 때는 예술고·체육고·국제고 등 다양한 종류의 고등학교가 혼합되어 있는 데이터상의 한계를 염두에 두어야 할 것으로 판단된다.

특성화고등학교 학생은 일반고등학교 학생 집단과 조금 다른 결과를 보여준다. 학업성적에 관한 주요 연관 패턴들을 종합적으로 살펴보면, ‘진로진학 학습상담의 참여 여부’ 변수의 식별이 두드러진다. 대부분 학업성적이 좋지 않거나 학교생활에 어려움을 겪는 경우에 이 같은 상담 프로그램의 대상이 되기 때문으로 보인다. 중·상위권에서는 방과후학교 참여와 일반교과목에 대한 사교육 이용의 변수가 식별되어 학교 성적에 대한 노력을 기울이는 것으로 유추된다. 하위권 집단은 진로진학 학습상담에 참여하거나 방과후학교에 참여하지 않고 사교육 시간도 적은 편이었는데, 다른 한편으로는 예체능 분야의 높은 수준의 사교육비가 주요 요인인 패턴을 보였다. 그런데 이 집단의 분석에서는 상·중·하위권 모두에서 개인 및 가정환경 특성과 관련된 변수가 다수 식별되었다. 이 같은 패턴의 특징은 초등학교나 중학교의 중·하위권에서, 일반고등학교의 경우 하위권을 중심으로 발견되었다는 점에서 두드러지는 차이점이라 할 수 있다. 사교육을 비롯한 학업성과와 관련된 특성보다는 가정의 특성, 즉 학생이 장기적으로 갖추고 있었을 특성이 중요하게 식별된 결과이다. 특성화고 학생의 학업성적 수준을 결정하는데 성장 과정이나 가정환경이 중요하게 작용하였을 가능성을 유추할 수 있도록 한다.

이상의 분석 결과를 종합하면, 초등학교는 사교육에 참여하는 분야가 넓은 편이다. 이것은 중등 시기로 이행할수록 대학 입시를 위한 주요 교과목이나 전공하고자 하는 분야로 집중하는 경향이 나타났다. 또한 초·중 시기의 패턴은 사교육 비용 측면의 변수와의 조합을 다수 도출하였다. 그와 달리 일반고등학생 패턴에서는 사교육에 투자하는 시간 변수가 식별되었는데 연관 패턴에서 나타나는 사교육 변수의 양적인 수도 상당히 감소하였다. 즉 기존에 갖추어진 학업 성과가 중요하며, 사교육의 양보다는 질적인 측면이 주요하게 작용할 것으로 유추되어 초·중학교와는 차이가 있다. 그와 달리 특성화고에서는 초·중·고(일반고)의 중위권 내지는 하위권에서 확인되는 사회경제적 변수가 비교적 많이 도출되는 패턴의 특징을 보였다. 일반고 및 특성화고 집단의 분석을 통해서, 초창기에 결정된 학업성취 수준이 학업기간 동안 상당 부분 유지되는 선행연구의 공통된 결과를 재확인할 수 있었다. 이처럼 사교육은, 비용 및 시간의 양적인 측면에서 보았을 때 초·중학교 학업성취 수준의 주요한 결정 요인이었다. 그러나 학업성적이 하위권일수록 사교육 참여도 및 비용이 낮은 것은 초·중·고등학교 학생의 공통된 경향이었다. 그 배경으로는 예체능 및 특성화고와 같이 내신성적의 비중이 상대적으로 낮은 진로를 희망하는 경우와, 가정의 학습환경이 취약한 상황을 꼽을 수 있었다.

후자와 관련해서 초·중·고에서 부모의 존재와 교육수준으로 설명되는 교육에 대한 관심과 참여나 가구의 사회경제적 수준이 학업성적별로 중요하게 검증되는 패턴을 보였다. 이것은 초등학교에서 가장 뚜렷하게 식별되었지만, 고등학교 시기까지도 학교의 유형에 관계없이 가정 환경에 따라 학업 성과의 격차가 발생하는 상황을 보여주고 있다.

이상으로 본 연구는 사교육과 학업성적에 대한 패턴 도출을 통해서 사교육의 영향뿐만 아니라 학업과 관련한 다양한 요건을 폭넓게 비교 분석하였다. 데이터 분석을 통해서 학업성적에는 사교육을 비롯하여 여러 차원의 변인이 관련되어 있다는 점을 알 수 있었다. 또한 이 요인들은 긴 시간 동안 축적되거나 오랫동안 개인에게 영향을 미치는 성질을 가졌다고 볼 수 있다. 이 연구가 학업성적만을 다룬 연구임을 유념할 때, 예체능과 같이 교과목 성적의 중요성이 낮은 진로를 계획한 경우가 아닌 부모 내지는 가구의 사회경제적 특성에 의해서 사교육과 학업성적의 격차가 발생하는 패턴은 중요한 사회 문제로 여겨야 할 것이다.

본 연구는 횡단 자료이므로 종단 영향을 분석하기 어려웠고, 데이터상의 정보 제한으로 인해서 다양한 유형의 고등학교를 구분 짓지 못하였으며 분석 자료의 시간차가 발생하는 한계점을 갖는다. 그럼에도 불구하고 여러 측면에서의 시사점을 제공하고 후속연구의 단초를 마련하였다는 점에서 의의가 있다.

References

  • Statistics Korea, Private Education Expenditures Survey 2021, Statistics Korea, 2021.
  • J. S. Yoo, An Analysis of Educational Indicators and the Impact of Private Education in Public Education, KERI Insight 21-1, Korea Economic Research Institute, 2021.
  • OECD, Education at a Glance report 2021, OECD, 2021.
  • OECD, OECD Factbook 2006, OECD, 2006.
  • H. R. Park and H. C. Kim, “The Change of the Private Tutoring Expenditure by School Level and Subject,” The Journal of Learner-Centered Curriculum and Instruction, Vol. 21, No. 10, pp. 907-923, May 2021. [https://doi.org/10.22251/jlcci.2021.21.10.907]
  • S. K. Kim, S. A. Kim and Y. H. Song, “Predictors and Longitudinal Changes in Extra-curricular Education of Korean Students,” Health and Social Welfare Review, Vol. 36, No. 1, pp. 30-60, March 2016. [https://doi.org/10.15709/hswr.2016.36.1.30]
  • J. Y. Lee, Korea Social Trends 2019, Statistics Research Institute, 2019.
  • J. Y. Lee, Korea Social Trends 2021, Statistics Research Institute, 2021.
  • H. J. Song and W. R. Shin, “The Analysis of the Relationship between Childbirth, Private Education Spending and Household Income,” Korean Journal of Labor Economics, Vol. 40, No. 4, pp. 33-59, December 2017.
  • J. Y. Lee, “The Educational Gap with COVID-19 and Challenges,” in Education Policy Forum, pp. 14-20, KEDI Education Policy Network, Feburary 2021.
  • K. O. Song, “Do Policy Strategies for Developing Public Educational System Relate to Demand for Private Tutoring?,” The Journal of Educational Administration, Vol. 26, No. 4, pp. 431-456, December 2008.
  • J. J. Lee and H. S. Lee, “An Analysis on International Tendency of Shadow Education - Focusing on the Demand Mechanism of Shadow Education,” Asian Journal of Education, Vol. 9, No. 2, pp. 203-228, June 2008. [https://doi.org/10.15753/aje.2008.9.2.010]
  • Statistics Korea, Private Education Expenditures Survey 2013, Statistics Korea, 2013.
  • S. J. Ryu, “A Study on Utilization of Private Educational Services in the Elementary School Transition and Lower Grades,” The Journal of Humanities and Social Science 21, Vol. 13, No. 5, pp. 1829-1840, December 2022. [https://doi.org/10.22143/HSS21.13.5.127]
  • J. J. Park, “The Longitudinal Analysis of the Relationship between Private Tutoring and Academic Achievement,” Korean Education Inquiry, Vol. 30, No. 3, pp. 105-124. October 2012.
  • H. C. Kim and E. K. Suh, “Trend in Private Tuition Expenditure Gaps,” Korean Journal of Educational Research, Vol. 56, No. 1, pp. 133-153, March 2018. [https://doi.org/10.30916/KERA.56.1.133]
  • H. Y. Baek and S. Y. Anh, “The Difference of the Effects of Private Tutoring Expenditure on the Change of Consumption Structure of Households Depending on Income Bracket,” Korea Social Policy Review, Vol. 19, No. 3, pp. 9-47, October 2012. [https://doi.org/10.17000/kspr.19.3.201209.9]
  • Y. O. Jang, “Relationship of Income, Education Needs, Private Education Expenses on Preparations for Old Age by Mothers of School-aged Children,” Journal of Family Resource Management and Policy Review, Vol. 18, No. 3, pp. 135-157, October 2014.
  • D. P. Baker, M. Akiba, G. K. LeTendre, and A. W. Wiseman, “Worldwide Shadow Education: Outside-school Learning, Institutional Quality of Schooling, and Cross-national Mathematics Achievement,” Educational Evaluation and Policy Analysis, Vol. 23, No. 1, pp. 1-17. Spring 2001. https://www.jstor.org/stable/3594156
  • M. Bray, The Challenge of Shadow Education: Private Tutoring and Its Implications for Policy Makers in the European Union, European Commission, 2011.
  • M. Bray, “Shadow Education in Europe: Growing Prevalence, Underlying Forces, and Policy Implications,” ECNU Review of Education, Vol. 4, No. 3, pp. 442-475. September 2021. [https://doi.org/10.1177/2096531119890142]
  • M. Hällsten and F. T. Pfeffer, “Grand Advantage: Family Wealth and Grandchildren’s Educational Achievement in Sweden,” American Sociological Review, Vol. 82, No. 2, pp. 328-360. March 2017. [https://doi.org/10.1177/0003122417695791]
  • H. Liang, Z. Wang, and W. Wu, “The Effect of Shadow Education on Hong Kong Student Wellbeing: Evidence From PISA 2018,” Frontiers in Psychology, Vol. 13. pp. 1-8, May 2022. [https://doi.org/10.3389/fpsyg.2022.860179]
  • H. J. Park, K. A. Sang, and J. Y. Kang, “Effect of Private Tutoring on Middle School Students' Achievement,” Journal of Educational Evaluation, Vol. 21, No. 4, pp. 107-127, December 2008.
  • C. H. Kang and Y. S. Park, “Private Tutoring and Distribution of Student Academic Outcomes: An Implication of the Presence of Private Tutoring for Educational Inequality,” The Korean Economic Review, Vol. 37, No. 2, pp. 287-326, June 2021. [https://doi.org/10.22841/kerdoi.2021.37.2.004]
  • H. M. Choi, J. W. Lee, and T. W. Kim, “A Study on the Use of Private Education among Children Transitioning from Age Six to Age Seven,” Korean Journal of Child Care and Education Policy, Vol. 15, No. 1, pp. 3-27, June 2021. [https://doi.org/10.5718/kcep.2021.15.1.3]
  • E. Yoon and H. C. Kim, “Exploring the Effects of Private Tutoring, Afterschool Programs and EBS Participation on Academic Achievement through the Propensity Score Matching,” The Journal of Educational Administration, Vol. 34, No. 1, pp. 385-417, March 2016.
  • S. R. Lee and Y. S. Han, “The Impact of Private Educational Expenditure on Children’s Academic Performance: Focusing on the Moderating Effect of Parenting Style,” Journal of Consumer Studies, Vol. 29, No. 4, pp. 119-138, December 2018. [https://doi.org/10.35736/JCS.29.4.6]
  • D. D. Han, B. C. Sung, and L. J. Gil, “A Study on the Comparison Between the Effects of Private Tutoring versus In-School Education on Academic Achievement of High School Students,” Korean Journal of Sociology of Education, Vol. 11, No. 1, pp. 33-54, January 2001.
  • W. J. Woo and H. J. Kim, “The Effects of Household Income, School Education Satisfaction, and Private Tutoring Expenditure on Two Types of Academic Achievements,” Secondary Education Research, Vol. 65, No.1, pp. 65-89, March 2017. [https://doi.org/10.25152/ser.2017.65.1.65]
  • J. W. Kim and H. J. Bae, “The Effects of Mothers' Psychological Factors on Private Tutoring Expenditure,” Journal of Educational Studies, Vol. 52, No. 2, pp. 1-28, June 2021. [https://doi.org/10.15854/jes.2021.06.52.2.1]
  • J. W. Lee and S. J. Baek, “Parents' Perception Matters: the Effect of Perceived Economic Inequality on Household Expenditure on Private Education,” The Korea Association for Policy Studies, Vol. 30, No. 3, pp. 313-341, October 2021. [https://doi.org/10.33900/KAPS.2021.30.3.10]
  • S. S. Lee, “Private Education Expenditure for Children and Economic Well-being of Household,” Family and Environment Research, Vol. 40, No. 7, pp. 211-227, July 2002.
  • R. Panigrahi, S. Borah, A. K. Bhoi, M. F. Ijaz, M. Pramanik, Y. Kumar, and R. H. Jhaveri, “A Consolidated Decision Tree-based Intrusion Detection System for Binary and Multiclass Imbalanced Datasets,” Mathematics, Vol. 9, No. 7, 751, pp. 1-35, March 2021. [https://doi.org/10.3390/math9070751]
  • S. B. Kotsiantis, “Decision Trees: A Recent Overview,” Artificial Intelligence Review, Vol. 39, No. 4, pp. 261-283, June 2011. [https://doi.org/10.1007/s10462-011-9272-4]
  • E. Massou, G. Prodromitis, and S. Papastamou, “Data Mining in Social Sciences: A Decision Tree Application Using Social and Political Concepts,” Statistics, Politics and Policy, Vol. 13, No. 3, pp. 297-314, November 2022. [https://doi.org/10.1515/spp-2022-0004]
  • F. J. Srour and S. Karkoulian, “Exploring Diversity through Machine Learning: A Case for The Use of Decision Trees in Social Science Research,” International Journal of Social Research Methodology, Vol. 25, No. 6, pp. 725-740, 2022. [https://doi.org/10.1080/13645579.2021.1933064]
  • Y. J. Lee and D. S. Kim, “A Study of the Determinants of General Education at Four-Year Universities,” Korean Journal of General Education, Vol. 16, No. 1, pp. 73-90, February 2022.
  • Z. Mirzamomen and M. R. Kangavari, “A Framework to Induce More Stable Decision Trees for Pattern Classification”. Pattern Analysis and Applications, Vol. 20, No. 4, pp. 991-1004, 2017. [https://doi.org/10.1007/s10044-016-0542-2]
  • J. H. Lee, G. W. Kim and K. H. Choi, “The Relationship between Childbirth, Housing and Socio-Economic Factors: The Pattern Analysis using Decision Tree”, The Journal of Digital Contents Society, Vol. 21, No. 2, pp. 327-336, February 2020. [https://doi.org/10.9728/dcs.2020.21.2.327]

저자소개

최근호(Keunho Choi)

2013년 : 고려대학교 대학원(경영학 박사)

2018년~현 재 : 한밭대학교 융합경영학과 부교수

※관심분야 : 추천시스템, 의료 빅데이터 분석, 딥러닝, 머신러닝, 데이터 마이닝 등

Batkhuyag Narangrav

2021년 : 한밭대학교 대학원(경영학 석사)

2021년~현 재 : Digital Concept 대리

※관심분야 : 빅데이터 분석, 교육정책, 데이터 마이닝 등

김건우(Gunwoo Kim)

2010년 : 고려대학교 대학원(경영학 박사)

2011년~현 재 : 한밭대학교 융합경영학과 교수

※관심분야 : 비즈니스 온톨로지 모델, 빅데이터 분석, 핀테크 기술 및 전략 등

이정화(Jeonghwa Lee)

2015년 : 성균관대학교 대학원(행정학 박사)

2016년~현 재 : 근로복지공단 근로복지연구원 책임연구원

※관심분야 : 복지국가, 사회정책, 사회보험, 노동시장, 여성가족정책 등

Table. 1.

Comparison of instances by class before and after data balancing

Target Class Elementary
School
Middle School High School Specialized
High School
Before Upper 5,984 6,027 9,696 2,067
Middle 5,824 5,966 9,567 2,025
Lower 7,836 7,945 12,599 2,686
Total 19,644 19,938 31,862 6,778
After Upper 5,824 5,966 9,567 2,025
Middle 5,824 5,966 9,567 2,025
Lower 5,824 5,966 9,567 2,025
Total 17,472 17,898 28,701 6,075

Table. 2.

List of variables

Variable Value
a: Elementary School Student
b: Middle School Student
c: General High School Student
d: Specialized High School Student
Group Variable Type of School v0 1=Elementary School
2=Middle School
3=General High School
4=Specialized High School
Class Variable Academic Performance v1 1=Upper Level(1~30%)
2=Middle Level(31~60%)
3=Low Level(61~100%)
Overall Participation in Private Tutoring Total Household Spending v2 KRW (unit: million/year)
Total Hour(s) v3 Hour(s)(week)
Private Tutoring in Core Subjects Purpose v4
/v5
1=Day Care
2=Enhancing Academic Achievement
3=Preparation to Upper Grade Schools
4=Mediating Anxiety
5=Prior Learning
6=Friendship
7=Others
Hour(s) v6 Hour(s)(week)
Total Cost v7 KRW (unit: million/year)
One-on-one Tutoring v8
Group Tutoring v9
Private Tuition Center v10
Home-visiting Tutoring v11
Internet-based Tutoring v12
Private Tutoring in Arts and Physical Education Purpose v13
/v14
(same as v4/v5)
Hour(s) v15 Hour(s)(week)
Total Cost v16 KRW (unit: million/year)
Music v17
Art v18
Physical Education v19
One-on-one Tutoring v20
Small Group Tuition v21
Private Tuition Center v22
Home-visiting Tutoring v23
Household Spending on Private Tutoring in Each Subject Korean Literature v24 KRW (unit: million/year)
English v25
Mathematics v26
Social Science v27
Writing, Reading and Discussion v28
Other Subjects
(Foreign Language, Chinese Character, Computer, and Technology and Home Economics)
v29
Household Spending on Private Tutoring in Others EBS textbook v30 KRW (unit: million/year)
Extracurricular Activities v31
Total Cost of Foreign Language Study v32
Foreign Language Study in Korea v33
Foreign Language Study in abroad v34
Job Trainingc)d) Hour(s) v35 Hour(s)(week)
Household Spending on Job Training v36 KRW (unit: million/year)
After-School Program Participation v37 1=Yes 2=No
Hour(s) v38 Hour(s)(week)
Total Cost in Middle/High School v39 KRW(unit: million/year)
Total Cost in Elementary School v40
Fees for School Subjects v41
Talent-aptitude Education Program Fee v42
Student Counseling Serviced) Participation v43 1=Yes 2=No
Fees v44 KRW (unit: million/year)
Number of Session v45 (number)
High School Choicea)b) v46 1=General High School
2=Autonomous High School
3=Special-purpose High School(Science High School, Foreign Language High School, International High School)
4=Special-purpose High School(Art High School, Physical Education High School)
5=Meister High School
6=Specialized High School
7=Alternative High School
8=Study Abroad
College-major Choicec)d) v47 1=Liberal Arts
2=College of Political Science and Sociology
3=College of Education
4=Engineering
5=College of Science
6=College of Medicine
7=Arts and Physical
8=Others(no plans, etc)
Characteristics of Student Gender v48 1=M(Male)
2=F(Female)
Birth Order v49 (number)
Characteristics of Parents Age of Father/Mother v50
/v51
0=Absence
1=under 20 years
2=30 to 39 years
3=40 to 49 years
4=50 to 59 years
5=60 years and older
Father’s/Mother’s Education Level v52
/v53
0=Absence
1=Elementary School
2=Middle School
3=High School
4=Undergraduate
5=Master’s Degree
6=Doctor’s Degree
7=No Formal Education
Labor Market Participation of Parents v54 0=Absence
1=Father
2=Mother
3=Both Parents Employed
4=Both Parents Unemployed
Household Information Household Income(month) (unit: million, KRW) v55 1=under 200
2=200~299
3=300~399
4=400~499
5=500~599
6=600~699
7=700~799
8=800 and higher
Number of Children v56 (number)
Region v57 1=Seoul
2=Metropolitan City
3=Small and Medium-sized City
4=Twon and Villiage
Administrative Division v58 11=Seoul
21=Busan
22=Daegu
23=Incheon
24=Gwangju
25=Daejeon
26=Ulsan
29=Sejong
31=Gyeonggi-do
32=Gangwon-do
33=Chungcheongbuk-do
34=Chungcheongnam-do
35=Jeollabuk-do
36=Jeollanam-do
37=Gyeongsangbuk-do
38=Gyeongsangnam-do
39=Jeju-do

Table. 3.

Patterns for elementary school children: Upper level (1~30%)

No.(%) Pattern
a: Household Spending on Private Tutoring(year)(unit: KRW, million)
1
(66.67)
Mother's Education Level=5(v53) & Group-Tutoring(Core Subjects)>98.04a)
2
(54.55)
Mother's Education Level=4(v53) & High School Choice=1(v46) & Music>29.74a) & Extra Activitiesa)<=152.94 & Art<=154.66a) & Age of Father=3(v50) & Other Subjects>23.53a) & English<=77.65a)
3
(54.55)
Mother's Education Level=4(v53) & High School Choice=3(v46) & Children>2 & Labor Market Participation=1(v54)
4
(54.46)
Mother's Education Level=5(v53) & Group-Tutoring(Core Subjects)<=98.04a) & High School Choice=1(v46) & Physical Education<=132.85a) & Father's Education Level=5(v52)
5
(54.38)
Mother's Education Level=4(v53) & High School Choice=2(v46) & Age of Father=3(v50) & Birth Order=1 & Father's Education Level=4(v52) & Age of Mother=3(v51)

Table. 4.

Patterns for elementary school children: Middle level (31~60%)

No.(%) Pattern
a: Household Spending on Private Tutoring(year)(unit: KRW, million)
1
(56.58)
Mother's Education Level=4(v53) & High School Choice=1(v46) & Music>29.74a) & Gender=F & Birth Order=1 & After-School Program Fees for School Subjects>46.58a)
2
(56.58)
Mother's Education Level=4(v53) & High School Choice=4(v46) & Gender=F & Age of Father=3(v50) & Music>123.92a)
3
(56.58)
Mother's Education Level=4(v53) & High School Choice=1(v46) & Music>29.74a) & Extra Activities<=152.94a) & Art<=154.66a) & Age of Father=3(v50) & Other Subjects>23.53a) & English>77.65a)
4
(56.58)
Mother's Education Level=4(v53) & High School Choice=1(v46) & Music>29.74a) & Extra Activities<=152.94a) & Art<=154.66a) & Age of Father=3(v50) & Other Subjects<=23.53a) & Birth Order=1 & Labor Market Participation=4(v54) & Children>1 & Physical Education>111.77a)
5
(56.58)
Mother's Education Level=4(v53) & High School Choice=4(v46) & Gender=F

Table. 5.

Patterns for elementary school children: Lower level (61~100%)

No.(%) Pattern
(H): Hours on Private Tutoring(week)
a: Household Spending on Private Tutoring(year)(unit: KRW, million)
1
(62.38)
Mother's Education Level=3(v53)
2
(62.14)
Mother's Education Level=0(v53) & Gender=F & Household Income=1(v55)
3
(61.43)
Mother's Education Level=4(v53) & High School Choice=5(v46) & Children>2
4
(60.00)
Mother's Education Level=4(v53) & High School Choice=1(v46) & Music<=29.74a) & Gender=M & Father's Education Level=4(v52) & Private Tutoring(H)>0 & Korean Literature>47.06a)
5
(59.52)
Mother's Education Level=4(v53) & High School Choice=1(v46) & Music<=29.74a) & Gender=M & Father's Education Level=4(v52) & Private Tutoring(H)=0

Table. 6.

Patterns for middle school student: Upper level (1~30%)

No.(%) Pattern
(H): Hours on Private Tutoring(week)
a: Household Spending on Private Tutoring(year)(unit: KRW, million)
1
(67.86)
Core Subjects>129.41a) & High School Choice=1(v46) & Physical Education<=133.33a) & English>23.53a) & Gender=F & Age of Mother=4(v51) & Core Subjects(H)>12.33
2
(67.84)
Core Subjects>129.41a) & High School Choice=3(v46
3
(64.71)
Core Subjects>129.41a) & High School Choice=1(v46) & Physical Education<=133.33a) & English>23.53a) & Gender=M & Region=4(v57) & Mother's Education Level=3(v53) & Group-Tutoring(Core Subjects)>66.62a)
4
(59.26)
Core Subjects>129.41a) & High School Choice=1(v46) & Physical Education<=133.33a) & English>23.53a) & Gender=F & Age of Mother=2(v51) & After-School Program(H)>2
5
(57.68)
Core Subjects<=129.41a) & High School Choice=3(v46) & Father's Education Level=4(v52)

Table. 7.

Patterns for middle school student: Middle level (31~60%)

No.(%) Pattern
(H): Hours on Private Tutoring(week)
a: Household Spending on Private Tutoring(year)(unit: KRW, million)
1
(55.93)
Core Subjects>129.41a) & High School Choice=1(v46) & Physical Education<=133.33a) & English>23.53a) & Gender=M & Region=4(v57) & Mother's Education Level=3(v53) & Group-Tutoring(Core Subjects)<=66.62a) & Private Tutoring(H)>6.67 & Core Subjects(H)>9.80
2
(52.94)
Core Subjects>129.41a) & High School Choice=1(v46) & Physical Education<=133.33a) & English<=23.53a) & Age of Mother=3(v51)& Father's Education Level=5(v52)
3
(52.00)
Core Subjects>129.41a) & High School Choice=1(v46) & Physical Education<=133.33a) & English<=23.53a) & Age of Mother=3(v51)& Father's Education Level=4(v52) & Region=4(v57)
4
(51.92)
Core Subjects>129.41a) & High School Choice=1(v46) & Physical Education<=133.33a) & English<=23.53a) & Age of Mother=3(v51)& Father's Education Level=4(v52) & Region=3(v57)
5
(50.97)
Core Subjects>129.41a) & High School Choice=1(v46) & Physical Education<=133.33a) & English>23.53a) & Gender=M & Region=3(v57) & Children>2

Table. 8.

Patterns for middle school student: Lower level (61~100%)

No.(%) Pattern
(H): Hours on Private Tutoring(week)
a: Household Spending on Private Tutoring(year)(unit: KRW, million)
1
(68.99)
Core Subjects<=129.41a) & High School Choice=4(v46)
2
(66.88)
Core Subjects<=129.41a) & High School Choice=1(v46) & Mother's Education Level=3(v53)
3
(63.98)
Core Subjects<=129.41a) & High School Choice=4(v46)
4
(61.39)
Core Subjects<=129.41a) & High School Choice=1(v46) & Mother's Education Level=0(v53)
5
(60.00)
Core Subjects>129.41a) & High School Choice=4(v46) & Birth Order=1 & Mother's Education Level=4(v53) & Total Spendinga)<=582.36

Table. 9.

Patterns for high school student: Upper level (1~30%)

No.(%) Pattern
(H): Hours on Private Tutoring(week)
a: Household Spending on Private Tutoring(year)(unit: KRW, million)
1
(62.34)
Arts and Physical Education(H)<=1 & Core Subjects(H)>0.33 & College-major Choice=6(v47) & Mother's Education Level=5(v53)
2
(60.00)
Arts and Physical Education(H)<=1 & Core Subjects(H)>0.33 & College-major Choice=1(v47) & Job Training(H)<=1.33 & Writing, Reading and Discussion>297.42a)
3
(54.24)
Arts and Physical Education(H)<=1 & Core Subjects(H)>0.33 & College-major Choice=3(v47)
4
(53.85)
Arts and Physical Education(H)<=1 & Core Subjects(H)>0.33 & College-major Choice=4(v47) & Gender=M & After-School Program=Yes & Korean Literature<=188.24a) & One-on-one Tutoring(Core Subjects)<=588.24a) & Administrative Division=31(v58)
5
(53.45)
Arts and Physical Education(H)<=1 & Core Subjects(H)>0.33 & College-major Choice=4(v47) & Gender=M & After-School Program=Yes & Korean Literature<=188.24a) & One-on-one Tutoring(Core Subjects)<=588.24a) & Administrative Division=38(v58) & Labor Market Participation=1(v54)

Table. 10.

Patterns for high school student: Middle level (31~60%)

No.(%) Pattern
(H): Hours on Private Tutoring(week)
a: Household Spending on Private Tutoring(year)(unit: KRW, million)
1
(58.11)
Arts and Physical Education(H)<=1 & Core Subjects(H)>0.33 & College-major Choice=4(v47) & Gender=M & After-School Program=Yes & Korean Literature<=188.24a) & One-on-one Tutoring(Core Subjects)>588.24a)
2
(55.74)
Arts and Physical Education(H)<=1 & Core Subjects(H)>0.33 & College-major Choice=5(v47) & Age of Mother=4(v51) & Mother's Education Level=4(v53) & Mathematics<=348.97a)
3
(53.49)
Arts and Physical Education(H)<=1 & Core Subjects(H)<=0.33 & After-School Program=Yes & College-major Choice=Liberal Arts & Administrative Division=34(v58)
4
(52.63)
Arts and Physical Education(H)<=1 & Core Subjects(H)>0.33 & College-major Choice=4(v47) & Gender=M & After-School Program=Yes & Korean Literature<=188.24a) & One-on-one Tutoring(Core Subjects)<=588.24a) & Administrative Division=22(v58) & Age of Father=3(v50) & Labor Market Participation=4(v54)
5
(52.00)
Arts and Physical Education(H)<=1 & Core Subjects(H)<=0.33 & After-School Program=Yes & College-major Choice=1(v47) & Administrative Division=36(v58) & EBS textbook<=9.02a)

Table. 11.

Patterns for high school student: Lower level (61~100%)

No.(%) Pattern
(H): Hours on Private Tutoring(week)
a: Household Spending on Private Tutoring(year)(unit: KRW, million)
1
(58.25)
Arts and Physical Education(H)<=1 & Core Subjects(H)<=0.33 & After-School Program=No & EBS textbook<=1.18a)
2
(56.48)
Arts and Physical Education(H)<=1 & Core Subjects(H)<=0.33 & After-School Program=Yes & College-major Choice=7(v47) & Talent-aptitude Education Program<=85.35a) & Gender=M
3
(56.06)
Arts and Physical Education(H)>1 & Mathematics<=132.05a)
4
(54.10)
Arts and Physical Education(H)<=1 & Core Subjects(H)<=0.33 & After-School Program=Yes & College-major Choice=4(v47) & Father’s Education Level=3(v52) & Mother's Education Level=3(v53) & Age of Father=3(v50) & After-School Program Fees<=39.79 & Region=3(v57)
5
(50.94)
Arts and Physical Education(H)<=1 & Core Subjects(H)<=0.33 & After-School Program=Yes & College-major Choice=1(v47) & Administrative Division=38(v58) & Mother's Education Level=3(v53)

Table. 12.

Patterns for specialized high school student: Upper level (1~30%)

No.(%) Pattern
(H): Hours on Private Tutoring(week)
a: Household Spending on Private Tutoring(year)(unit: KRW, million)
b: Total Hours(week)
1
(69.81)
Student Counseling Service=No &Mathematics<=39.66a) & After-School Program=Yes & Children>1 & Gender=F & After-School Program(H)>12
2
(55.77)
Student Counseling Service=No &Mathematics<=39.66a) & After-School Program=Yes & Children>1 & Gender=F & 4.33<After-School Program(H)<=12 & Birth Order=2 & Mother's Education Level=4(v53)
3
(55.74)
Student Counseling Service=No &Mathematics<=39.66a) & After-School Program=Yes & Children>1 & Gender=F & After-School Program(H)<=12 & Birth Order=1 & Age of Father=3(v50) & Private Tutoring(H)>0.33b)
4
(49.66)
Student Counseling Service=No & Mathematics>39.66a)
5
(48.11)
Student Counseling Service=No &Mathematics<=39.66a) & After-School Program=Yes & Children>1 & Gender=M & Age of Mother=3(v51)& College-major Choice=4(v47) & Labor Market Participation=1(v54)

Table. 13.

Patterns for specialized high school student: Middle level (31~60%)

No.(%) Pattern
(H): Hours on Private Tutoring(week)
a: Household Spending on Private Tutoring(year)(unit: KRW, million)
b: Total Hours(week)
1
(52.70)
Student Counseling Service=No & Mathematics<=39.66a) & After-School Program=Yes & Children>1 & Gender=F & After-School Program(H)<=12 & Birth Order=1 & Age of Father=3(v50) & Private Tutoring(H)<=0.33b) & Children>2
2
(50.00)
Student Counseling Service=No & Mathematics<=39.66a) & After-School Program=Yes & Children>1 & Gender=F & 6<After-School Program(H<=12 & Birth Order=2 & Mother's Education Level=3(v53) & College-major Choice=8(v47)
3
(50.00)
Student Counseling Service=No &Mathematics<=39.66a) & After-School Program=No & Children<=4 & Job Training(H)<=3 & Age of Mother=3(v51)& Private Tuition Center for Art and Physical Education<=11.90a) & Mother's Education Level=4(v53) & Administrative Division=39(v58)
4
(47.78)
Student Counseling Service=No & Mathematics<=39.66a) & After-School Program=Yes & Children>1 & Gender=M & Age of Mother=3(v51)& College-major Choice=4(v47) & Labor Market Participation=4(v54) & Mother's Education Level=3(v53) & Birth Order=2
5
(46.67)
Student Counseling Service=No &Mathematics<=39.66 & After-School Program=Yes & Children>1 & Gender=F & After-School Program(H)<=4.33 & Birth Order=2 & Mother's Education Level=4(v53)

Table. 14.

Patterns for specialized high school student: Lower level (61~100%)

No.(%) Pattern
(H): Hours on Private Tutoring(week)
a: Household Spending on Private Tutoring(year)(unit: KRW, million)
b: Total Hours(week)
1
(62.30)
Student Counseling Service=Yes
2
(55.74)
Student Counseling Service=No &Mathematics<=39.66a) & After-School Program=No & Children<=4 & Job Training(H)<=3 & Age of Mother=3(v51)& Private Tuition Center for Art and Physical Education>11.90a) & Birth Order=1
3
(48.14)
Student Counseling Service=No &Mathematics<=39.66a) & After-School Program=No & Children<=4 & Job Training(H)<=3 & Age of Mother=4(v51)
4
(48.11)
Student Counseling Service=No &Mathematics<=39.66a) & After-School Program=No & Children<=4 & Job Training(H)<=3 & Age of Mother=0(v51)
5
(47.92)
Student Counseling Service=No &Mathematics<=39.66a) & After-School Program=Yes & Children<=1 & Mother's Education Level=3(v53) & After-School Program Fees for School Subjects<=0.71a)