Korea Digital Contents Society
[ Article ]
Journal of Digital Contents Society - Vol. 25, No. 7, pp.1833-1845
ISSN: 1598-2009 (Print) 2287-738X (Online)
Print publication date 31 Jul 2024
Received 26 Apr 2024 Revised 04 Jun 2024 Accepted 19 Jun 2024
DOI: https://doi.org/10.9728/dcs.2024.25.7.1833

한국프로야구 감독역량의 평가 방법에 대한 새로운 시각: 세이버메트릭스 기반 머신러닝 알고리즘의 적용

김필수1 ; 이상현2, * ; 전성삼3
1한국스포츠경영전략연구원 원장
2한국스포츠경영전략연구원 부원장
3한국스포츠경영전략연구원 책임연구원
A New Perspective on Evaluating the Competence of Korean Baseball Managers: Sabermetrics Assessment and Machine Learning Application
Philsoo Kim1 ; Sang Hyun Lee2, * ; Seong-Sam Jeon3
1Director, Korea Sport Management Research Institute, Seoul 02867, Korea
2Deputy Director, Korea Sport Management Research Institute, Seoul 02867, Korea
3Senior Researcher, Korea Sport Management Research Institute, Seoul 02867, Korea

Correspondence to: *Sang Hyun Lee E-mail: shscottlee@naver.com

Copyright ⓒ 2024 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

초록

본 연구는 감독역량을 팀이 내재한 자원을 효율적으로 활용하여 해당 예상 가능한 성적 이상의 성과를 거둘 수 있도록 관리하는 능력이라고 정의하고 한국프로야구 감독의 역량을 분석하기 위해 실시되었다. 이를 위해 스탯티즈와 KBO 공식 홈페이지에서 1982~2023시즌의 모든 프로감독 및 각 팀의 경기데이터를 수집하고 5가지 머신러닝 알고리즘을 적용하여 감독역량을 분석하였다. 분석 결과, 정규시즌을 기준으로 5시즌 이상 활약한 감독 중 팀별 각 시즌 및 경력 전반에 걸쳐 가장 뛰어난 역량을 보인 10명의 감독을 확인할 수 있었다. 본 연구는 머신러닝 알고리즘을 적용하여 한국프로야구 역대 감독역량을 분석하여 실증한 선도적인 연구로 이론·실무적 의의를 지닌다.

Abstract

In this study, managerial capability is defined as the ability to effectively utilize the inherent resources of a team to achieve performance beyond what is expected. This study was conducted to evaluate professional baseball manager capabilities. Data from Statiz and the official Korean Baseball Organization (KBO) website were collected from 1982 to 2023, including information on all KBO managers and game data for each team, for empirical analysis. Five machine learning algorithms were applied to analyze managerial capabilities. As a result, among the 79 managers (n = 343) who led teams from the beginning to the end of a season, managers who had been active for more than 5 seasons were identified. This study is pioneering research that analyzes the managerial capabilities of the KBO.

Keywords:

Managerial Capability, Machine Learning, Sabermetrics, Sports Analytics, Korean Baseball Organization

키워드:

감독역량, 머신러닝, 세이버메트릭스, 스포츠 애널리틱스, 한국프로야구

Ⅰ. 서 론

1-1 연구 목적

프로야구감독은 그 자리의 무게와 희소성으로 모든 야구인과 팬에게 가장 주목받는 자리 중 하나이다[1],[2]. 보통 프로팀의 감독이 되기 위해서는 뛰어난 선수로서의 경력과 더불어, 은퇴 후 코치를 거치며 선수를 육성하고 가르치는 과정을 거쳐 첨예한 구단의 검증 절차를 통과하면 비로소 프로감독이 된다고 볼 수 있다. 다시 말해, 프로야구 경기에서 이기기 위해 통찰할 수 있는 경험과 야구를 보는 눈이 풍부한 극소수의 전문가만이 감독이 될 수 있는 것이다[3]. 하지만, 그렇게 선택받은 프로야구 전문가인 감독 중에서도 극소수의 감독만이 “명장(名將)”이라는 칭호로 역사 속에 새겨지며 시대를 거쳐 인정받는다고 볼 수 있다.

각 프로팀의 구단주와 프런트를 비롯하여 프로야구리그의 지속성을 지탱하는 팬들조차 프로감독의 임기가 끝나갈 무렵이나 시즌 도중 급작스러운 감독교체가 발생하였을 때, 팀을 더 높은 위치에 올려놓아 가을야구를 하고 더 나아가 코리안시리즈에서 우승할 수 있도록 좋은 성과를 거둘 수 있는 프로감독을 영입하기를 희망하며 선임 절차에 착수한다[4]-[6].

프로스포츠에서 감독의 역할이 중요하다는 것은 오랜 경험과 깊이 있는 통찰력이 아니라 하더라도 대부분 인정할 수 있는 명제라 볼 수 있다. 프로농구나 배구 종목과 같이 팀 규모가 작은 종목에서부터, 프로야구나 프로축구와 같이 대규모의 선수단을 보유한 종목에서도 감독은 팀을 구성하고 있는 모든 선수의 기량과 장단점을 파악하여 구축된 조직역량을 극대화하여 적재적소에 활용함으로써 더 높은 수준의 팀 성적을 확보할 수 있다[3],[7],[8].

실례로 LG 트윈스는 1994년도 코리안시리즈 우승 이후 2022년에 이르기까지 정규시즌 1위나 포스트 시즌 우승을 경험하지 못하며 긴 침체기를 겪었다. 2023년도 염경엽 감독이 선임되며 정규시즌 1위와 포스트 시즌 우승을 동시에 달성하여 오랜 우승의 숙원을 해결하였다. 염경엽 감독의 다른 구단에서의 사례로 2013년에는 비교적 짧은 코치 경력에도 넥센 히어로즈의 감독에 선임되어 창단 이후 단 한 번도 가을야구에 진출하지 못했던 팀을 정규리그 3위에 올려놓으며 ‘염갈량’이라는 별명을 얻었다.

아울러, 2019년 삼성 라이온즈 구단에 선임된 허삼영 감독 역시 마찬가지로 감독 경험이 전혀 없었으나 2016년부터 암흑기에 접어든 삼성 라이온즈의 2021년도 성적을 정규리그 2위에 올려놓았다는 점은 감독 중요성에 관해 고찰할 필요성을 잘 보여준다. 더욱 구체적인 수치를 근거로 덧붙이자면, 2021시즌 삼성 라이온즈의 전력은 투수 WAR 19.52(4위), 타자 WAR 21.87(7위)로 정규시즌 6위로 플레이오프에 진출하지 못했던 2018년 기록(투수 WAR 18.08, 4위; 타자 WAR 19.89, 7위)과 큰 차이가 나지 않는다. 이는 유사한 수준의 전력을 가진 팀도 감독의 역량과 운영 능력에 따라 정규시즌 최종 순위에 큰 결과적 차이가 존재할 수 있다는 것을 보여준다.

실제로 한국프로야구의 2002~2012년도 시계열 데이터를 분석한 선행연구 결과 감독 연차가 승률과 역 U자 형태의 관계를 지닌다는 점이 실증되었다[9]. 아울러, 다른 선행연구에서의 회귀분석 결과, 팀 전력을 배제했을 때 감독의 연차는 승률을 낮추는 요인으로 작용하는 한편 경기 지휘 수는 승률을 높이는 것으로 나타났다[10].

한편, 일반적인 프로야구 팬이라면 익숙한 용어인 DTD(Down Team Down: 내려갈 팀은 내려간다)나 UTU(Up Team Up: 올라갈 팀은 올라간다)는 프로야구팀이 144경기의 긴 시즌을 치르는 동안 내재한 전력 자체가 결국 대부분 정규리그의 최종 순위로 수렴된다는 전제를 설명하는 것이 가능하다고 해석할 수 있다.

예를 들어, 프로야구 원년인 1982년부터 2021년까지의 39년간 축적된 프로야구 정규시즌 데이터를 바탕으로 프로야구 승률의 결정요인을 분석한 한 실증연구는 팀의 기본적인 전력이 해당 시즌 승률과 높은 상관관계를 지닌다는 것을 실증함으로 위의 주장을 지지하였다[10]. 한 가지 재미있는 사실은 해당 연구에서 프로야구팀의 전력과 관련된 다양한 변수들과 감독 관련 변수(감독 연차, 지휘 구단 수, 지휘 경기 수)들을 동시에 고려하였을 때, 감독 관련 변수는 프로야구팀 승률에 통계적으로 유의한 영향을 미치지 못하였다는 점이다[7]. 이러한 결과는 프로야구감독의 역할이 팀 성적에 큰 영향을 미치는가에 대해 실증적으로 천착하고 확장하는데 중요한 과제로 작용할 수 있다.

프로야구감독은 팀의 기본적인 전력을 바탕으로 성과를 거두어야 하기에, 감독의 실제적인 성적은 팀이 내재한 자원의 수준에 영향을 받는다고 볼 수 있다. 예를 들어, 프로야구 역사 전체를 통틀어 가장 오랜 기간 감독 생활을 하며 최고의 명장으로 불리던 김응용 감독과 김성근 감독도 각각 2013~2014시즌, 2015~2017시즌 한화 이글스의 감독을 역임하며 한화의 부활에 대한 기대를 받았으나 포스트 시즌 진출에 실패하며 2008~2018년까지 포스트 시즌에 진출하지 못한 한화 이글스의 암흑기를 연장하며 끝내 좋은 성적을 거두지 못하였다. 반면, 일시적이었지만 2018~2019시즌에는 한용덕 감독 체제하에 같은 팀을 최종 순위 3위로 올려놓으며 가을야구에 진출시켰다는 사례는 감독의 효용성과 역할과 중요성에 다시 한번 생각할 기회를 제공한다. 이러한 측면에서 감독역량에 대해 체계적으로 이론화하고 실증하는 것은 대단히 중요하다고 볼 수 있다.

이상의 선행연구와 한국프로야구의 전반적인 역사를 통틀어 돌이켜볼 때, 프로야구팀 감독의 역량과 팀 성적 간에 관련성이 존재한다고 볼 수 있다. 하지만, 구체적으로 어떤 감독이 역량 있는 감독인지 프로야구 감독역량이 생애 주기에서 늘 유사한 수준에서 발현될 수 있는지 등에 대한 의문점이 발생할 수 있다. 하나의 추가적인 예로 선임 당시 초보 감독이던 류중일 감독은 디펜딩 챔피언인 삼성 라이온즈의 감독을 역임한 뒤 2011~2015년의 기간 동안 정규리그 우승을 이끌었다. 이러한 이유로 좋은 성적을 거둔 팀의 감독 중 일부는 ‘선수 빨’로 좋은 성적을 냈다고 평가절하를 당하기도 하고, 반대로 우수한 역량을 갖춘 감독도 능력이 부족한 선수단으로 인해 좋은 성적을 내지 못해 그 역량이 절대적으로 간과되어 좋은 평가를 받지 못한 일도 있다.

따라서, 이러한 질문에 대해 과학적이고 체계적으로 이론화하고 실증적인 근거를 확보하기 위해서는 추가적인 연구가 필요할 것으로 보인다. 무엇보다 프로야구팀 감독의 역량을 어떻게 측정하고, 이를 바탕으로 어떤 감독이 우수한 감독이었는가에 대해 분석할 필요가 있다. 따라서, 본 연구에서는 다음과 같은 연구문제를 현안으로 한국프로야구팀 감독역량의 평가 방법에 대한 새로운 시각을 제시함으로써 실증연구를 진행하고자 한다. 보다 구체적으로 어떤 감독이 좋은 감독인가에 대해 세이버메트릭스 기반 머신러닝 알고리즘을 도입하여 평가할 수 있는 새로운 기준이 필요해 보인다.

  • 연구문제
  • 1) 한국프로야구 감독의 역량을 개념화하고 측정하는 방법은 무엇인가?
  • 2) 세이버메트릭스 기반 머신러닝 알고리즘 분석으로 도출한 한국프로야구 역사상 가장 뛰어난 감독은 누구였는가?
  • 3) 한국프로야구에서 감독의 역량은 팀 성적에 중요한 요인인가?

이상의 연구문제와 관련하여 프로야구팀에서 감독이 팀 성적에 큰 영향을 미칠 것이라는 명제에 대해서 아직 학문적으로 더 큰 연구의 노력이 필요하며 이를 분석하는 것은 시의적절하다고 본다. 이러한 측면에서 프로야구 종목은 모든 플레이와 선수/팀의 경기력이 기록되고 세이버메트릭스로 구축된다는 점에서 경기력에 대한 분석이 다른 프로스포츠 종목과 비교하여 더욱더 객관적이라는 장점으로 이론을 검증하고 실증하기 위해 효과적이다[11]-[13].

더 나아가 4차산업혁명의 개화를 본격적으로 맞이하여 인공지능의 도입과 발전으로 과거에는 시도하지 못했던 프로스포츠팀의 과학적인 전력의 파악이나 성적 예측 등이 정교하게 이루어지기 시작하였다[14]-[16]. 한국프로야구 리그와 같이 세이버메트릭스로 접근할 수 있는 기록이 데이터로 잘 정제되어 있어 이를 인공지능의 연구 분야 중 하나인 머신러닝 알고리즘에 적용한다면 예상 시즌 성적과 실제 시즌 성적의 차이를 통해 각 시즌 감독의 역량을 추정하는 것이 가능하다.

마지막으로, 본 연구는 최근 국내외에 큰 화두가 되는 스포츠 애널리틱스(sports analytics) 관점을 적용함으로써 경기결과 예측 이외에 인공지능 알고리즘이 스포츠 연구에 활용되는 방법을 제시하고자 한다. 한국프로야구 감독의 역량을 분석하면서 프로야구 원년인 1982년부터 2023년까지의 전체 프로감독 관련 정보를 수집함은 물론 각종 세이버메트릭스 기반 경기데이터를 취합하여 감독의 역량을 분석하고자 한다. 이를 위해 먼저 프로야구에서 감독의 역량을 어떻게 정의하고 이를 해석할 수 있을 것인가에 대해 이론화함으로 첫 번째 연구문제에 대해 답하고자 한다. 이후 실증분석 과정과 결과를 바탕으로 나머지 질문에 답하고자 한다.


Ⅱ. 선행연구

프로스포츠 감독이 어떻게 팀의 성적을 높일 수 있는가에 대한 탐구는 이론적인 측면에서 팀을 구성하고 팀의 구성원인 선수들의 특정 행동을 유도함으로써 팀의 성과에 영향을 미칠 수 있다는 리더십 역량(leadership capabilities)의 관점에서 접근할 수 있다[2],[7],[17].

프로스포츠팀의 감독은 일반적인 조직의 리더와 같이 기본적으로 팀의 능력을 개발하고 조직 시스템과 문화를 구축하여 조직의 성과를 달성한다고 볼 수 있다. 또한, 실질적으로 조직 구성원에게 조직의 목표를 설명하고 동기부여 함으로써 조직 성과를 달성하게 된다[18]. 프로감독이 구성된 팀을 구성하고 운영하는 데 필연적으로 리더십 역량이 중요하다는 사실은 일반적으로 널리 받아들여지지만, 과연 이러한 리더십 역량을 정확하게 측정하여 평가할 수 있는가에 관해서는 아직도 명확한 답을 찾기가 힘든 실정이다. 따라서, 리더십에 관한 대다수 연구는 특정 리더십이 어떻게 성과에 영향을 미치는가에 대해 분석하기 위해 설문 방법에 의존하였다[19],[20].

대다수의 리더십 연구는 변혁적(transfromational) 리더십, 거래적(transactional) 리더십, 진성(authentic) 리더십, 서번트(servant) 리더십 등의 다양한 리더의 행동양식이 조직 구성원 혹은 조직 수준의 변수에 어떤 영향을 미치는지에 대해 측정하는 것에 초점을 둔다[19],[21]. 이러한 접근은 리더의 어떤 행동 패턴이 더 유익한지, 혹은 리더의 특성이 어떤 과정을 거쳐 개인이나 조직의 성과에 영향을 미칠 수 있는지에 대해 분석하는 데 효과적일 수 있지만, 특정 리더십 스타일이 리더의 역량 그 자체를 의미하지는 않는다는 한계점을 지닌다[22].

이러한 한계점은 프로스포츠 연구에서도 유사하게 적용되어 나타난다고 볼 수 있다. 프로스포츠팀과 같은 스포츠팀에서의 실질적 리더는 프로감독이라고 볼 수 있지만, 감독의 지휘역량을 직접적으로 실제 측정할 방법이 제한적이라는 점을 부인하기 어려워 보인다. 이러한 측면에서 기존의 선행연구에서는 감독의 경험, 나이, 연차, 우승 횟수, 지휘 팀 수와 같은 인구통계학적 요인이 중심이 되는 변수들을 감독의 특성으로 활용하여 사용하거나[6],[23], 설문을 통해 리더십의 스타일이나 역량을 측정하여 연구 분야를 발전시켜왔다.

감독의 지휘 경력과 같은 인구통계학적인 변수를 감독역량의 대리변수로 활용하는 것은 인구통계학적인 특성이 일정한 방향성을 가지고 있다는 것을 의미한다. 치열한 경쟁이 벌어지는 프로의 세계에서 일정 기간 이상 감독경력을 유지한다는 것은 이 자체로 어느 정도 감독으로서의 능력을 인정받은 것으로도 볼 수도 있으나, 프로야구팀의 성적의 결정요인으로서의 감독의 인구통계학적 변수는 그 역할이 일정하지 않을 수 있다는 점도 간과할 수 없다는 것을 나타낸다[4],[9],[10].

다른 한편, 설문지 방식을 활용할 경우의 문제점은 동일방법편의(common methods bias)를 피해 가기 어렵다는 점에 있다. 기존 설문지 방식을 적용한 리더십 연구의 대부분은 직원들에게 자신의 리더에 대한 인식을 대답한 후 자신의 심리상태 혹은 성과에 대해 응답하는 방식으로 이루어진다. 이는 동일방법분산(common methods variance)을 비롯한 통계적 문제를 일으킬 수 있다. 비록 일부 연구자들이 동일방법분산에 대한 문제를 해결하려고 노력하였지만, 이 자체가 동일방법편향에 대한 근본적인 해결책이 아니라는 문제가 존재한다. 예를 들어, 감독의 역량이 팀 성적에 미치는 영향을 확인하기 위해 설문을 실행할 때, 감독과의 관계나 선수의 현재 기분 등 감정적인 요소가 감독에 대한 평가에 영향을 미칠 소지가 다분하게 존재할 수 있다. 이는 감독의 역량을 통해 선수나 팀의 성적에 영향을 미치는 것이 아니라, 선수나 팀의 상황이 감독의 평가에 영향을 미칠 수 있다는 문제점이 발생할 수 있다[24].

감독의 역량이란 관점에 따라 다양하게 정의될 수 있으나, 본 연구에서는 감독이 자신에게 부여된 리더십을 발휘하는데 주어진 내재적인 팀 자원과 전력을 활용하여 조직의 목표를 달성하는 능력을 의미한다[1],[25],[26].

즉, 팀이 보유한 자원이 같은 수준일 경우 이를 활용하여 더 나은 결과를 보일 수 있는 능력을 갖춘 프로감독을 더 역량이 뛰어난 감독이라고 정의할 수 있는 것이다. 이를 바탕으로 감독의 역량을 분석하고 누가 더 뛰어난 감독인지를 확인하기 위해서는 다음과 같은 세부적인 조건이 필요하다. 첫째, 프로야구팀이 내재한 자원이 무엇인지를 정의할 수 있어야 한다. 둘째, 프로야구팀이 내재한 자원으로 달성할 수 있는 성적을 확인할 수 있어야 한다.

첫 번째 조건인 프로야구팀의 내재적인 자원이 무엇인가에 대해서는 기존의 선행연구에서 이미 체계적으로 정리된 바가 있다[4],[7],[10]. 이를 구체화하면, 프로야구팀이 가치성(valuable)이 있고, 희소성(rare)이 높으며, 모방 불가능하고(inimitable), 대체 불가능한(non-substitutable) 자원의 속성을 성적의 결정요인으로 지니고 있다면, 해당 팀은 다른 팀에 비해 경쟁우위를 확보하게 되어 더 좋은 성적을 낼 수 있다는 것이 실증되었다[7].

두 번째 조건으로 프로야구팀이 보유한 자원을 바탕으로 달성할 수 있는 성적과 관련하여 본 연구에서는 머신러닝 알고리즘을 활용하여 해결할 수 있다. 최근 스포츠과학 연구의 영역에서도 스포츠 애널리틱스 분야가 발전함에 따라 국내에서도 경기결과 예측에 관한 연구가 활발히 이루어지기 시작하였다[27]-[29].

빅데이터와 인공지능 알고리즘을 적용하는 측면에서 구체적으로는 시즌별 각각의 프로팀이 내재한 선수/팀 차원의 자원을 바탕으로 해당 시즌의 경기결과를 예측하고, 이를 각 프로야구팀이 가진 자원을 바탕으로 거둘 수 있는 이론적인 성적으로 가정한다.

아울러, 전제적으로 이를 성적으로 전환할 수 있는 능력을 감독의 역량으로 개념화한다. 이러한 측면에서 역량이 뛰어난 감독은 개별적인 선수들의 능력을 극대화하여 팀 차원의 전력 누수를 줄이고 최적 조합을 찾아 승리 가능성을 높일 수 있다. 이러한 전반적인 감독의 능력은 한 경기에서뿐만 아니라 긴 시즌을 운영하면서 선수의 출전 시간 및 간격, 타순이나 대타, 투수 등판 순서 등을 조절하며, 부상을 예방하고 시즌 마지막까지 운영하는 능력을 포함한다.

따라서, 본 연구에서 정의된 감독의 역량에 따라서 팀이 내재한 자원을 극대화하여 이론적으로 거둘 수 있는 승리 수보다 더 많은 승을 거둘 수도 있다. 반면에, 잘못된 운영으로 선수자원을 충분히 활용하지 못함으로써 이론적으로 해당 팀이 거둘 수 있는 성적보다 더 낮은 성적을 거둘 수도 있게 된다. 이러한 바탕에서 세이버메트릭스 기반 머신러닝 알고리즘을 적용하여 한국프로야구 감독역량을 평가하는 새로운 시각을 이론화하여 제시할 수 있다고 본다.


Ⅲ. 연구 방법

3-1 연구대상

본 연구에서 감독역량을 평가하기 위해 각각의 시즌별 팀이 내재적으로 보유한 전력자원 대비 기대승률과 실제 승률 간이 차이를 활용하였다. 프로야구팀이 보유한 내재적인 전력자원을 파악하기 위해 1982년~2023년까지 42시즌에 걸친 한국프로야구(이하 KBO) 구단들의 시즌별 세이버메트릭스 데이터와 역대 감독의 정보를 체계적으로 수집하였다[7]. 표 1은 본 연구의 실증분석에 적용된 데이터상 모든 구단의 변천과 한국프로야구 리그에서 경쟁한 시즌을 정리하여 나타낸 것이다.

Number of seasons and participation and dissolution of teams in the KBO league

본 연구에 활용한 세이버메트릭스 데이터는 자료의 객관성과 타당성을 정밀하게 확보하는 차원에서 KBO 홈페이지와 STATIZ(https://statiz.sporki.com/stats/)를 기반으로 파이선(Python 3.11.5)의 Selenium, BeautifulSoup, Request 라이브러리를 통해 웹크롤링하였다. STATIZ의 팀기록실 페이지에서 1982시즌부터 2023시즌까지 제공하고 있는 종합ㆍ타격ㆍ투구ㆍ수비 페이지의 모든 항목의 데이터를 수집하였다. 타격 데이터는 “기본”, “심화”, “가치”, “확장”, “클러치”, “파워”, “팀배팅”, “도루”, “주루”, “타구”, “타구방향”, “투구”, “구종”의 14개 항목의 데이터를 수집하였다.

투구 데이터의 경우 “기본”, “심화”, “가치”, “확장”, “WP”, “주자”, “선발”, “구원”, “타구”, “타구 방향”, “투구”, “구종”의 12개 항목으로 분류된 데이터를 수집하였다. 수비 데이터는 “종합”, “타격”, “투구”, “수비” 4가지 항목으로 구성된 데이터 전수를 수집하였다. 추후 실증의 과정에서 감독이 시즌 전체를 운영하지 않은 데이터에 대한 처리를 위해 각 구단의 시즌별 감독 및 시즌 중 감독교체 여부는 구단 홈페이지와 뉴스 기사를 포함한 다양한 매체를 추적하여 직접 수집하였으며 시즌 중 감독교체 여부에 따라 1과 0으로 표기하였다.

3-2 연구 변수

본 연구의 머신러닝 알고리즘 적용 감독역량 평가에 필수적인 KBO 구단의 시즌별 세이버메트릭스 데이터는 STATIZ에서 제공하고 있는 경기데이터를 중심으로 구성하였다. 1982시즌부터 기록이 누적되어 결측치가 없는 140개의 변수를 최종적으로 설정하였으며, 큰 틀에서는 “타격 데이터”, “투구 데이터”, “수비 데이터”로 분류할 수 있다. 세부 변수 항목은 표 2를 통해 나타내었다.

Variables in this study

3-3 자료처리

본 연구에서는 한국프로야구 감독들의 역량을 평가하기 위해 세이버메트릭스 데이터 기반 머신러닝 알고리즘을 적용하여 기대승률을 예측하고, 실제 승률과의 차이를 실증적으로 측정하였다. 기대승률 추산에 가장 적합한 머신러닝 알고리즘을 확인하기 위해 스포츠 경기 결과를 분석하는 데 일반적으로 적용되는 5가지 머신러닝 알고리즘(Light-GBM, 그래디언트 부스팅, 엑스트라 트리, 선형 서포트 벡터 머신, 랜덤 포레스트)을 활용하였으며[27]-[29], 이에 대한 학습과 테스트를 진행하고 성능을 비교하였다.

종속변수를 승률로 설정하였기 때문에 회귀모델을 활용하였으며 파이선 Scikit-Learn과 lightgbm 라이브러리를 사용해 Light-GBM, 그래디언트 부스팅(Gradient Boosting), 엑스트라 트리(Extra Trees), 선형 서포트 벡터 머신(Linear SVM), 랜덤 포레스트(Random Forest) 모형을 생성하여 적용하였다. 5가지 알고리즘의 하이퍼파라미터는 라이브러리에서 제공하는 기본값을 유지하였으며, random_states=0으로 설정하였다.

본 연구에 활용한 데이터 세트는 KBO 각 구단의 시즌 평균 데이터와 해당 시즌의 승률로 구성된 numeric 데이터(n=325,141)로 구성되었다. 학습데이터와 테스트 데이터는 7:3의 비율로 무작위 분할을 시행하였으며, 성능평가를 위해 결정계수(R2_score), 평균 절대 오차(MAE), 평균 제곱 오차(MSE)를 비교하였다.

본 연구에 적용된 5가지 머신러닝 알고리즘 중 가장 높은 성능을 보인 모형을 선택하여 각 구단의 연도별 기대승률을 예측하였다. 한국프로야구 원년인 1982년부터 2023년까지 총 42시즌 중 한 시즌을 테스트 데이터, 나머지 모든 시즌을 학습데이터로 설정하여 기대승률 값을 도출하였다. 이를 바탕으로 감독역량은 도출된 기대승률을 실제 승률에서 뺀 값으로 설정하였다. 예를 들어, 머신러닝 알고리즘이 예측한 A 구단의 기대승률이 0.5이고 실제 승률은 0.6이라면 해당 시즌 A 구단의 프로감독은 구단이 내재적으로 보유한 자원 대비 0.1만큼의 승률을 상승시켜 정(+)의 감독역량이 있다고 볼 수 있다.

위의 세이버메트릭스 기반 머신러닝 알고리즘을 적용하는 과정을 통해 체계적으로 측정되어 도출된 감독역량을 기준으로 2024시즌 한국 프로야구리그 10개 구단의 역대 감독 중 단일시즌 기준 가장 뛰어난 역량을 보인 3명의 감독을 각각 도출하였다. 아울러, 한국 프로야구리그 출범 이후 평균적으로 가장 뛰어난 역량을 보인 감독에 대해 실증적인 분석을 수행하기 위해 5시즌 이상 프로구단을 지휘한 감독 중 평균적인 감독역량이 수치로 0의 값 이상인 감독의 역량을 서열화하여 비교하였다. 시즌 중 감독교체가 발생하였으면 평균 산출에서 제외하였으며, 역대 가장 우수한 감독역량을 나타내는 9명의 감독의 시즌별 승률과 감독역량을 구체적으로 시각화하였다.


Ⅳ. 연구 결과

4-1 머신러닝 모델 간 성능 비교

본 연구에서는 전술한 바와 같이 한국 프로야구감독의 역량을 평가하기 위하여 기대승률과 실제 승률 간의 차를 활용하였다. 팀의 내재적인 전력자원에 기반한 객관적인 기대승률을 구하기 위해 세이버메트릭스 데이터와 실제 승률을 5가지 머신러닝 알고리즘에 적용하였으며, 가장 높은 성능을 보인 모델의 예측 결과를 기대승률로 설정하였다. 5가지 머신러닝 알고리즘 중 가장 뛰어난 성능을 나타낸 모형은 선형 서포트 벡터 머신으로 결정계수 0.989, 평균절대오차 0.0065, 평균제곱오차 0.0001로 높은 설명력을 보였다. 표 3은 5가지 머신러닝 알고리즘의 평가지표를 비교하여 나타낸 것이다.

Comparison of performance metrics among machine learning algorithms

4-2 KBO 구단별 감독역량 상위 Top 3

표 4는 2024시즌 한국 프로야구리그를 구성하는 10개 구단의 역대 감독 중 단일시즌을 기준 가장 높은 감독역량을 발휘한 상위 3개 시즌과 감독, 승률, 기대승률, 감독역량을 나타낸 것이다.

The best head coaches of each team in a single season

LG 트윈스(前 MBC 청룡)의 단일시즌 가장 높은 역량을 보인 감독은 이광은(2000, .111), 류지현(2022, .098), 김동엽(1986, .069)이다. 한국 프로야구리그에 2015년부터 참가하여 10번째 시즌을 보내고 있는 KT 위즈는 이강철이 역임한 2020시즌(.028), 2022(.015), 2019(-.004) 시즌에 가장 높은 역량을 보였다. SSG 랜더스(前 SK와이번스) 구단에서는 김성근(2008, .105), 김원형(2022, .101), 조범현(2005, .583)의 감독역량이 가장 높았으며 NC다이노스에서는 강인권(2023, .092), 이동욱(2020, .089), 김경문(2015, .063)이 가장 높은 수준의 감독역량을 발휘하였다.

두산베어스(前 OB 베어스)에서는 김영덕(1982, .104), 김태형(2019, .070), 김인식(1999, .048)의 감독역량이 가장 뛰어났다고 평가될 수 있으며, KIA 타이거스(前 해태 타이거스)에서는 김응용 감독이 지휘한 1988시즌(.102), 1991시즌(.090), 1986시즌(.079)에 가장 높은 감독역량을 발휘한 것으로 나타났다.

롯데자이언츠 구단에서는 김명성(1999, .070), 김용희(1995, .061), 강병철(1992, .047)의 감독역량이 가장 높았으며, 삼성 라이온즈는 서영무(1982, .111), 김영덕(1985, .101), 김응용(2002, .092)이 가장 높은 수준의 감독역량을 보였다. 한화이글스(前 빙그레 이글스)에서는 김영덕(1992, .078), 카를로스 수베로(2021, .039), 김영덕(1988, .034)의 감독역량이 가장 높았으며, 키움 히어로즈(前 넥센 히어로즈) 구단에서는 손혁(2020, .058), 장정석(2018, .041), 염경엽(2014, .040)이 가장 높은 감독역량을 보였다.

4-3 KBO 역대 최고의 감독

한국프로야구 출범 이후 가장 뛰어난 역량을 지닌 감독을 확인하기 위해 5시즌 이상 역임한 감독들의 평균적인 감독역량의 수준을 비교하였다. 시즌 중도에 사임하거나 임명된 시즌을 제외하였다. 표 5에서는 한국프로야구 리그에서 5시즌 이상 역임한 감독 중 평균 감독역량이 0 이상인 감독 9명을 평균 감독역량의 기준으로 서열화하여 나열한 것이다.

Best head coaches of KBO

감독경력으로 11시즌을 역임한 김영덕이 평균 0.042의 승률을 증가시키며 감독 순위 최상위에 위치하였고, 20시즌을 역임하여 한국프로야구 리그를 대표할 수 있는 김성근 감독이 0.026으로 역대 두 번째로 감독역량이 뛰어난 것으로 평가되었다. 뒤를 이어, 염경엽(0.022), 김태형(0.016), 김재박(0.014), 김응용(0.012), 김기태(0.005), 조범현(0.002), 김시진(0.001)이 평균 감독역량 0의 값 이상을 기록하며 한국프로야구에서 역대 최상위권에 있는 감독역량을 지닌 것으로 나타났다. 그림 1에서부터 그림 9까지는 9명 감독의 시즌별 실제 승률과 감독효과를 각각 막대그래프와 꺾은선그래프로 나타내어 시각화한 것이다.

Fig. 1.

Kim Yeong-Duk managerial capabilities each season

Fig. 2.

Kim Sung-keun managerial capabilities in each season

Fig. 3.

Yeom Kyoung-Youb managerial capabilities each season

Fig. 4.

Kim Tae-Hyeong managerial capabilities each season

Fig. 5.

Kim Jae-Bak managerial capabilities each season

Fig. 6.

Kim Eung-Ryong managerial capabilities each season

Fig. 7.

Kim Ki-Tae managerial capabilities in each season

Fig. 8.

Cho Beom-Hyeon managerial capabilities each season

Fig. 9.

Kim Si-Jin managerial capabilities each season


Ⅴ. 논의

본 연구에서는 최근 스포츠과학 분야에서 눈부시게 발전하고 있는 세이버메트릭스 기반의 머신러닝 알고리즘을 적용하여 프로야구팀 감독의 역량을 측정하는 이론을 제시하고 실증하였다. 이러한 바탕에서 실증분석 결과를 통해 감독의 역량이 감독경력의 시점에 따라 변화하는지, 또 가장 뛰어난 감독은 누구였는지, 감독의 역량이 팀 성적에 유의한 영향력을 행사하는지를 실증하기 위해 실시되었다. 한국프로야구 원년인 1982년도부터 2023년까지 22년간 한 시즌을 처음부터 끝까지 책임진 79명의 감독(n=343)의 감독역량을 선형 서포트 벡터 머신을 활용하여 추정하였다.

단일시즌을 중심으로 가장 뛰어난 활약을 펼친 감독은 1982년 삼성 라이온즈를 지휘한 서영무 감독으로 해당 팀의 전력으로 기대할 수 있는 승률이 .564에 불과하였으나 실제로는 .675의 승률을 거둠으로써 단일시즌 기준으로 팀이 보유한 자원을 가장 효율적으로 활용한 감독(감독역량= .111)으로 볼 수 있다. 10개 구단 체제로 운영되기 시작한 2015년 이후에는 2022년 SSG 랜더스를 지휘한 김원형 감독으로 기대 승률이 .528이던 팀을 승률 .629의 성적을 거둘 수 있도록 운영했다고 볼 수 있다(감독역량= .101). 감독의 평균적인 역량을 확인하기 위해 5년 이상 팀을 지휘한 감독만을 대상으로 감독역량을 추정한 결과, 김영덕(11시즌 평균 감독역량= .042), 김성근(20시즌 평균 감독역량= .026), 염경엽(7시즌 평균 감독역량=. 022), 김태형(8시즌 평균 감독역량= .016), 김재박(14시즌 평균 감독역량= .014), 김응용(24시즌 평균 감독역량= .012), 김기태(6시즌 평균 감독역량= .005), 조범현(10시즌 평균 감독역량= .002) 류중일(8시즌 평균 감독역량= .000), 김시진(6시즌 평균 감독역량= .001) 감독 순으로 팀의 성적에 영향을 미친 것으로 나타났다.

이 중 은퇴한 감독으로 분류할 수 있는 5년 이상 프로야구팀 감독으로 활동하지 않는 김영덕, 김성근, 김재박, 김응용, 박영길, 김시진, 류중일 감독의 감독역량 추세를 보면, 대체로 약한 역 U자 형태의 모습을 보이는 것으로 보인다. 하지만, 샘플이 적고 지휘한 구단의 변동이나 재임 기간에 따라 차이가 존재한다는 점에서 이를 절대적으로 받아들이기에는 무리가 있는 것으로 보이지만 일부 선행연구의 결과와 일치하는 점도 주목할 필요가 있다[4].

본 연구의 마지막 연구주제인 감독역량이 팀 성적에 미치는 효과는 실증적인 근거의 강화로 인해 더욱 분명해 보인다. 본 연구에서 집중적으로 분석한 5시즌 이상 활약한 감독역량 상위 10명은 야구 전문가들과 팬 대다수가 인정할만한 명장의 반열에서 충분히 논의될 수 있는 감독들로 평가될 수 있을 것으로 보인다. 여기에 포함된 10명의 감독은 팀의 최종 순위와는 별개로 전력이 약한 팀을 끌어올리거나 좋은 전력을 갖춘 팀이 최상위권으로 도약하게 만드는 능력을 보여줬다는 점에서 본 연구에서 개념화한 감독역량의 정의에 부합한다. 이러한 측면에서 비추어 볼 때, 감독의 역할이 다른 종목과 비교하면 다소 그 영향력이 적다고 알려진 프로야구에서도 감독의 역할은 팀 운영과 성적을 결정함에 대단히 유의미한 역할을 하는 것으로 판단하는 것이 가능하다.

본 연구는 다음과 같은 이론적 의의를 지닌다. 첫째, 본 연구는 선도적으로 세이버메트릭스 기반의 머신러닝 알고리즘을 적용하여 프로야구감독의 역량을 객관적인 데이터 분석을 통해 제시하였다. 더욱 구체화하면, 리더십 역량에 관해 주어진 자원을 효율적으로 활용하여 조직의 성과를 높이는 것이라는 명확한 개념적 정의[1],[25]를 바탕으로 감독의 역량을 정의하고 이를 측정하였다. 리더십이 궁극적으로 조직의 성과를 높이기 위한 리더의 행동양식[18]이라는 점에서 리더십 역량과 유사한 부분이 존재하지만, 리더십 연구들은 리더의 특정 행동양식이나 패턴이 어떤 과정을 거쳐 조직의 성과 자체에 더 초점을 맞춘다는 점에서 차이가 존재한다.

현재까지 스포츠 분야에서 이루어진 리더에 관한 대부분의 연구는 설문을 바탕으로 한 조직(팀) 구성원의 인식에 초점을 맞추었다는 점에서, 감독 특정 행동양식에 대한 효과성에 대한 실증에 근접할 수 있지만[30], 감독의 우수성을 직접적으로 측정하기에는 한계가 존재하였다.

본 연구에서는 이러한 기존 선행연구의 한계점을 극복하고 어떤 감독이 더 우수한 감독인가를 직접적으로 측정하는 방법을 제시하였다는 점에서 그 연구적 의의를 찾을 수 있다고 본다. 이러한 시도는 프로야구는 물론, 다른 프로스포츠 종목에서도 충분히 이루어질 수 있는 연구임으로 이론적으로 실무적으로 실질적인 통찰을 제공할 것으로 보인다.

둘째, 본 연구는 최근 다양한 분야에서 급격하게 화두가 되는 인공지능 알고리즘을 스포츠 분야에 직접 접목하여 감독의 역량을 측정한 선도적인 연구라는 점에서 연구의 가치를 지닌다. 인공지능 알고리즘은 이론적 가정을 바탕으로 하는 연역적 추론에 기반한 통계적 가정에서 비교적 자유롭고, 미처 고려하지 못한 변수 간 패턴을 인공지능이 파악하여 추론한다는 점에서 종속변수에 대한 설명력이 더 우수한 경우가 많다고 볼 수 있다[28],[31].

본 연구에서 사용한 Linear SVM 알고리즘을 활용하여 시즌 성적을 예측한 결과 설명력(R-square)이 .989에 달할 정도로 높은 수치를 기록하였다. 즉, 기존 야구 전문가나 팬의 가정과 같이 선수단이 내재한 전력이 결국 정규시즌 최종결과의 귀결을 거의 설명할 수 있다는 점을 미루어 짐작할 수 있다. 역설적으로 감독의 영향력과 효과가 발현되는 것은 이러한 전력의 내재성을 얼마나 극대화하였는가는 물론, 섬세한 전술 전략의 수립과 운영의 실행으로 세미한 차이에서 다른 프로감독보다 우위를 점하여 팀의 최종 성적에 중요한 차이를 만들 수 있다는 점이 연구결과 드러났다.

이러한 접근은 인공지능 알고리즘을 활용한 스포츠 경기데이터 분석이 경기결과 예측을 넘어 실제 프로스포츠 현장에서 효과적으로 활용될 수 있는 구체적인 예를 실증적으로 제시했다는 점에서 연구의 확장적 의의를 지닌다고 볼 수 있다. 스포츠 애널리틱스 관점에서 이를 적용하면 인공지능을 활용한 스포츠 빅데이터 분석 연구가 지나치게 경기결과 예측에만 집중되고 있다는 한계점을 넘어, 현장에서 활용 가능한 감독의 구체적인 역량을 측정할 수 있게 되었다는 것이다. 이러한 점에서 해당 연구 분야의 미래 방향성을 어느 정도 제시하였다.

셋째, 다양한 방식으로 한국프로야구 감독의 역량을 분석하여 실제 감독의 역량을 서열화하였다. 기존의 선행연구에서는 선수[32]나 팀[33]의 역량을 서열화하기 위해 자료포락분석(data envelopment analysis: DEA)을 활용하여 효율성을 추산해왔다. 하지만, 자료포락분석의 한계로 언제나 투입 및 종속변수에 대한 객관적인 기준이 없다는 한계점을 지니고 있다.

본 연구는 이를 극복하기 위해 자료포락분석에서 사용한 효율성의 개념을 인공지능 알고리즘을 통해 추정하고 다양한 방법으로 서열화하여 전·현직 한국프로야구 감독의 역량을 평가할 수 있는 체계화된 객관적인 리스트를 제공함으로써 감독역량 논쟁에 뛰어들었다. 실제 본 연구에서 사용한 투입변수가 팀 성적을 종속변수를 99%에 육박하는 수준으로 설명한다는 점에서 그 타당성을 실증적으로 명징하게 확인할 수 있게 되었다.

본 연구는 다음과 같은 실무적 시사점을 지닌다. 첫째, 본 연구는 감독교체가 필요한 프로팀에서 바로 활용할 수 있는 감독평가에 대한 기초자료의 기능을 수행할 수 있다. 지면의 한계로 인해 모든 감독 리스트를 표기할 수는 없지만, 본 연구에서 사용한 방식을 그대로 적용하거나 실무현장의 목적에 따라 적절하게 응용함으로써 감독교체 소요가 발생한 팀의 경우, 이에 적합한 감독을 영입할 때 감독선임 평가 절차에 실용적으로 활용하여 중요한 의사결정에 참고할 수 있을 것으로 보인다.

둘째, 감독별로 적정한 연봉을 추정할 수 있다. 본 연구의 직접적인 결과는 아니지만, 본 연구의 실증적 분석의 결과는 다양한 측면에서 국내 모든 감독의 역량을 객관적으로 서열화할 수 있다는 것을 보여준다. 프로야구팀이 새로운 감독에 대한 계약 혹은 기존 감독과의 계약을 갱신할 경우, 본 연구를 활용하여 적정한 감독의 연봉을 지급할 수 있다면 효율적인 프로스포츠팀의 자본 분배가 이루어질 수 있을 것으로 보인다.


Ⅵ. 결 론

본 연구는 한국프로야구 원년인 1982년부터 2023년까지 한 시즌 이상 프로팀을 지휘한 모든 감독의 역량을 세이버메트릭스 기반의 머신러닝 알고리즘을 통해 실증적으로 분석하였다. 이는 객관적이며 고유의 빅데이터를 활용하여 프로감독의 역량을 최적화하여 평가한 연구라는 점에서 스포츠과학 분야에 이론·실무적인 기여도가 있다고 본다. 앞으로의 연구에서는 본 연구에서 미처 고려하지 못한 다음과 같은 사항을 체계적으로 반영함으로써, 프로스포츠 영역에서 대단히 중요한 감독과 관련된 연구의 수준을 한 단계 높일 수 있을 것으로 기대한다.

첫째, 본 연구에서는 팀의 전력을 바탕으로 예상한 기대승률과 실제 승률의 차이가 감독의 역량에 기인한 것으로 가정하고 이를 설명하였다. 이러한 가정을 바탕으로 추정한 감독역량이 야구 전문가나 팬 사이에서 일반적으로 회자할 수 있는 명장의 리스트와 대체로 일치한다는 점에서 선행연구에 기반한 개념적 정의와 일치하며 그 가정이 타당하다고 볼 수 있다. 하지만, 감독의 영향력을 벗어난 모기업의 경제적 상황이나 지원, 특정 구단의 조직구조나 뿌리 깊은 문화, 연고지와 관련한 이슈 등 외부적인 요인의 영향을 배제할 수 없어, 감독의 팀 전력 활용 효율성만으로는 설명하기 힘든 경우가 존재할 수 있다. 향후 연구에서는 이를 면밀하게 고려하여 더욱 정밀하게 감독의 영향만을 분석하는 것이 중요할 것으로 보인다.

둘째, 본 연구는 프로야구 종목의 특성상 감독의 개입을 통한 선수의 개별적인 역량 변화가 다른 프로스포츠 종목과 비교하면 더 적다는 것을 전제로 분석이 진행되었다. 비시즌 동안의 준비과정을 통한 팀 전력 향상 역시 감독의 중요한 역량 중의 하나이지만, 본 연구에서는 이를 고려하지 않았다. 향후 연구에서는 감독의 개입을 개별 선수 역량 상승, FA나 트레이드, 혹은 팀의 전반적 전력 상승을 위한 훈련 등의 효과 역시 반영하여 감독역량을 측정할 수 있다면, 더욱 유의미한 연구가 될 것으로 판단된다.

셋째, 본 연구는 팀의 전력을 극대화하여 한 시즌을 효율적으로 운용할 수 있는 능력을 감독의 역량으로 정의하고 분석을 진행하였다. 하지만, 감독의 역량은 정규리그만으로 모두 설명하기에는 무리가 있다. 대다수의 야구 감독이나 선수는 최종 목표를 한국시리즈 우승으로 보며, 그에 대한 전제로 가을야구를 이야기한다. 가을야구 경험은 선수뿐만 아니라 팬조차도 중요하게 생각하는 가치이다. 이렇듯 감독역량에 포스트 시즌 성적을 객관적으로 반영할 수 있는 방법론적 세련됨이 앞으로 필요하다고 본다. 이는 정규시즌을 바탕으로 한 감독의 역량뿐만 아니라 진정한 프로야구 명장을 밝히는데 중요한 단서가 될 것으로 보인다.

넷째, 더욱 다양한 유형의 감독역량에 대한 분석이 필요할 것으로 보인다. 본 연구에서는 정규시즌에 팀의 전력을 활용하는 능력을 모두 유사한 수준에서의 잣대로 판단하고 감독의 역량을 제안하였다. 하지만, 프로스포츠팀 감독 중 특정한 전문분야에서 다른 경쟁상대보다 더 우위의 역량을 내재한 감독 역시 존재한다. 감독마다 하위권 팀을 상위권으로 높이는 데 특화된 감독이 있을 수 있고, 상위권 팀을 우승권 팀으로 만드는 감독, 그리고 최상위권 팀을 지속해서 유지하는 측면에서 왕조를 건설하는 데 뛰어난 능력을 발휘하는 희소성이 높은 감독이 있을 수 있다. 이 모든 경우를 하나의 지표로 표현하는 것이 적절치 않을 수도 있으나, 앞으로의 연구에서는 이러한 다양한 경우의 수를 고려하여 감독의 유형을 구분함으로써 감독 연구 발전에 이바지할 수 있을 것으로 보인다.

다섯째, 좋은 감독의 특성을 지표화한다면 기존 감독은 물론 초임감독의 경우에도 이를 평가하는 연구 역시 가능할 것으로 보인다. 본 연구의 목적을 넘어서는 주제이기에 구체적으로 제시하지는 않았지만, 본 연구의 과정에서 모든 연차 감독, 모든 팀 감독의 시즌별 역량을 수치화할 수 있었다. 만약 감독의 선수 시절 기록, 소속 팀, 포지션, 감독 연차나 나이, 지휘 팀 등 다양한 요인의 상호작용을 분석한다면, 조건별로 뛰어난 감독상을 제시하는 것이 가능하다. 이는 기존 감독은 물론, 감독 경험이 없는 신규 감독을 선임할 경우, 해당 감독이 어떤 성과를 낼 수 있을 것인가를 분석하는 것이 가능할 것으로 보인다.

References

  • D. J. Berri, M. A. Leeds, E. M. Leeds, and M. Mondello, “The Role of Managers in Team Performance,” International Journal of Sport Finance, Vol. 4, No. 2, pp. 75-93, May 2009.
  • D. L. Smart and R. A. Wolfe, “The Contribution of Leadership and Human Resources to Organizational Success: An Empirical Assessment of Performance in Major League Baseball,” European Sport Management Quarterly, Vol. 3, No. 3, pp. 165-188, 2003.
  • D. Smart, J. Winfree, and R. Wolfe, “Major League Baseball Managers: Do They Matter?,” Journal of Sport Management, Vol. 22, No. 3, pp. 303-321, 2008. [https://doi.org/10.1123/jsm.22.3.303]
  • P. Kim, “Manager Coaching Tenure, Capabilities, and Turnover Effects on Performance of Korean Professional Baseball Teams,” Korean Journal of Sport Management, Vol. 25, No. 5, pp. 59-78, October 2020. [https://doi.org/10.31308/KSSM.25.5.5]
  • P. Kim and D.-K. Kim, “The Effects of Coach Turnover and Sport Team Performance: Evidence from the Korean Professional Soccer League 1983-2013,” Korean Journal of Sport Studies, Vol. 54, No. 4, pp. 329-345, October 2015.
  • A. A. Cannella Jr. and W. G. Rowe, “Leader Capabilities, Succession, and Competitive Context: A Study of Professional Baseball Teams,” The Leadership Quarterly, Vol. 6, No. 1, pp. 69-88, 1995.
  • P. Kim, The Effects of Organizational Capabilities on the Competitive Performance: Evidence from Korean Baseball Organization (KBO) Professional Teams, Unpublished Ph.D. Dissertation, Hanyang University, Seoul, 2022.
  • H. F. Lewis, K. A. Lock, and T. R. Sexton, “Organizational Capability, Efficiency, and Effectiveness in Major League Baseball: 1901–2002,” European Journal of Operational Research, Vol. 197, No. 2, pp. 731-740, September 2009. [https://doi.org/10.1016/j.ejor.2008.07.002]
  • J.-H. Jang and C.-G. Moon, “Determinants of Team Winning Percentage in the Korean Professional Baseball League,” Korean Journal of Sport Management, Vol. 19, No. 3, pp. 17-31, June 2014.
  • P. Kim and S. H. Lee, “The Effects of Resource-based Determinants on Team Performance of Korean Professional Baseball Teams,” Korean Journal of Sport Management, Vol. 27, No. 5, pp. 16-37, October 2022. [https://doi.org/10.31308/KSSM.27.5.16]
  • J. W. Kim and K. Kim, “Does Pay Dispersion within a Team Enhance Team Performance?: An Analysis of Korean Professional Baseball Data,” Quarterly Journal of Labor Policy, Vol. 11, No. 1, pp. 1-23, March 2011.
  • J.-H. Kim and S.-J. Hwang, “A DEA Analysis of the Effect of High Efficient Pitchers on the Team’s Advance to the Post Season of the Korean Baseball League,” Journal of Society of Korea Industrial and Systems Engineering, Vol. 45, No. 2, pp. 30-36, June 2022. [https://doi.org/10.11627/jksie.2022.45.2.030]
  • D. Yang, E. Ko, and Y. Jang, “Impacts of Wage Difference and Wage Position on Individual Performance: The Case of Korea Baseball League,” Quarterly Journal of Labor Policy, Vol. 19, No. 1, pp. 93-121, November 2019.
  • R. P. Bunker and F. Thabtah, “A Machine Learning Framework for Sport Result Prediction,” Applied Computing and Informatics, Vol. 15, No. 1, pp. 27-33, January 2019.
  • T. Horvat and J. Job, “The Use of Machine Learning in Sport Outcome Prediction: A Review,” Data Mining and Knowledge Discovery, Vol. 10, No. 5, e1380, September/October 2020. [https://doi.org/10.1002/widm.1380]
  • H.-C. Sun, T.-Y. Lin, and Y.-L. Tsai, “Performance Prediction in Major League Baseball by Long Short-Term Memory Networks,” International Journal of Data Science and Analytics, Vol. 15, pp. 93-104, 2023. [https://doi.org/10.1007/s41060-022-00313-4]
  • T. R. Holcomb, R. M. Holmes Jr., and B. L. Connelly, “Making the Most of What You Have: Managerial Ability as a Source of Resource Value Creation,” Strategic Management Journal, Vol. 30, No. 5, pp. 457-485, May 2009. [https://doi.org/10.1002/smj.747]
  • E. H. Schein, Organizational Culture and Leadership, 4th ed. San Francisco, CA: Jossey-Bass, 2010.
  • M. Cao, Y. Zhao, and S. Zhao. “Facilitating the Implementation Process of High-Performance Work Systems: The Role of Authentic Leadership,” Frontiers in Psychology, Vol. 11, 550711, September 2020. [https://doi.org/10.3389/fpsyg.2020.550711]
  • C. Gill, W. Gardner, J. Claeys, and K. Vangronsvelt, “Using Theory on Authentic Leadership to Build a Strong Human Resource Management System,” Human Resource Management Review, Vol. 28, No. 3, pp. 304-318, September 2018. [https://doi.org/10.1016/j.hrmr.2018.02.006]
  • J. J. P. Jansen, G. George, F. A. J. Van den Bosch, and H. W. Volberda, “Senior Team Attributes and Organizational Ambidexterity: The Moderating Role of Transformational Leadership,” Journal of Management Studies, Vol. 45, No. 5, pp. 982-1007, July 2008. [https://doi.org/10.1111/j.1467-6486.2008.00775.x]
  • G. Wang, I.-S. Oh, S. H. Courtright, and A. E. Colbert, “Transformational Leadership and Performance across Criteria and Levels: A Meta-Analytic Review of 25 Years of Research,” Group & Organization Management, Vol. 36, No. 2, pp. 223-270, 2011. [https://doi.org/10.1177/1059601111401017]
  • B. Demiralp, C. Colburn, and J. Koch, “The Effects of Age, Experience and Managers upon Baseball Performance,” Journal of Economics and Finance, Vol. 36, pp. 481-498, April 2012. [https://doi.org/10.1007/s12197-010-9141-z]
  • P. M. Podsakoff, S. B. MacKenzie, J. Y. Lee, and N. P. Podsakoff, “Common Method Biases in Behavioral Research: A Critical Review of the Literature and Recommended Remedies,” Journal of Applied Psychology, Vol. 88, No. 5, pp. 879-903, 2003. [https://doi.org/10.1037/0021-9010.88.5.879]
  • Q. Huang, K. Zhang, Y. Wang, A. A. Bodla, and D. Zhu, “When Is Authoritarian Leadership Less Detrimental? The Role of Leader Capability,” International Journal of Environmental Research and Public Health, Vol. 20, No. 1, 707, 2023. [https://doi.org/10.3390/ijerph20010707]
  • P. M. Wright, B. B. Dunford, and S. A. Snell, “Human Resources and the Resource Based View of the Firm,” Journal of Management, Vol. 27, No. 6, pp. 701-721, December 2001. [https://doi.org/10.1177/014920630102700607]
  • P. Kim and S. H. Lee, “Application of AI Machine Learning Algorithms to Predict Korea Ladies Professional Golf Association (KLPGA) Players Top 10 Ranking: A Sports Analytics Perspective,” Korean Journal of Sport Management, Vol. 28, No. 4, pp. 51-66, August 2023. [https://doi.org/10.31308/KSSM.28.4.51]
  • P. Kim and S. H. Lee, “The Final Ranking Prediction of the Korean Professional Basketball League Using Machine Learning Algorithms: A Sports Analytics Perspective,” The Korean Journal of Measurement and Evaluation in Physical Education and Sports Science, Vol. 25, No. 2, pp. 103-115, 2023. [https://doi.org/10.21797/ksme.2023.25.2.008]
  • P. Kim, S. S. Jeon, and S. H. Lee, “A Study on the Application of Machine Learning to Predict Keirin Competition Ranking and Sports Betting Methods,” Journal of Korea Service Management Society, Vol. 24, No. 2, pp. 157-192, June 2023. [https://doi.org/10.15706/jksms.2023.24.2.007]
  • E. A. Hong and Y. J. Jeong, “A Study on the Differential Effect for Authentic Leadership and Transformational Leadership of Head Coaches to Team Performance within University Football Teams,” Korean Journal of Sports Science, Vol. 27, No. 2, pp. 519-530, April 2018. [https://doi.org/10.35159/kjss.2018.04.27.2.519]
  • P. Kim and S. H. Lee, “Current and Future of Sports Analytics in Korea: A Systematic Literature Review on “On-Field Analysis”,” Korean Journal of Sport Management, Vol. 29, No. 1, pp. 63-81, February 2024. [https://doi.org/10.31308/KSSM.29.1.63]
  • P. Kim, S. H. Lee, and J. S. Kim, “The Effects of the DEA Efficiency of Players on the Results of Keirin Competition,” Journal of Korea Service Management Society, Vol. 24, No. 3, pp. 454-484, September 2023. [https://doi.org/10.15706/jksms.2023.24.3.019]
  • J. S. Kim and S. J. Lee, “An Evaluation of Relative Efficiency on the Korean Professional Baseball Teams Using DEA (Data Envelopment Analysis) Model,” Korean Journal of Sport Management, Vol. 28, No. 2, pp. 51-75, April 2023. [https://doi.org/10.31308/KSSM.28.2.51]

저자소개

김필수(Philsoo Kim)

2013년:연세대학교 대학원(경영학석사)

2022년:한양대학교 대학원(스포츠산업학박사)

2014년~2016년: 한국연구재단 Global PhD Fellow

2015년~2017년: 경기대학교 외래교수

2022년~현 재: 한국스포츠경영전략연구원 원장

※관심분야:스포츠경영, 스포츠 애널리틱스, 인공지능, 프로스포츠 등

이상현(Sang Hyun Lee)

2011년:아주대학교 대학원(경영학석사)

2024년:아주대학교 대학원(경영학박사)

2017년~2018년: 아주경영연구소 연구원

2019년~2022년: G. Lab 연구원

2023년~현 재: 한국스포츠경영전략연구원 부원장

※관심분야:스포츠 애널리틱스, 감독 역량, 리더십, 조직문화

전성삼(Seong-Sam Jeon)

2021년:인하대학교(문화콘텐츠문화경영학과 학사)(스포츠과학과 부전공)

2022년~2023년: 에이치앤컨설팅 연구원

2024년~현 재: 한국스포츠경영전략연구원 데이터 사이언티스트

※관심분야:스포츠 애널리틱스, 프로스포츠, 인공지능 등

Fig. 1.

Fig. 1.
Kim Yeong-Duk managerial capabilities each season

Fig. 2.

Fig. 2.
Kim Sung-keun managerial capabilities in each season

Fig. 3.

Fig. 3.
Yeom Kyoung-Youb managerial capabilities each season

Fig. 4.

Fig. 4.
Kim Tae-Hyeong managerial capabilities each season

Fig. 5.

Fig. 5.
Kim Jae-Bak managerial capabilities each season

Fig. 6.

Fig. 6.
Kim Eung-Ryong managerial capabilities each season

Fig. 7.

Fig. 7.
Kim Ki-Tae managerial capabilities in each season

Fig. 8.

Fig. 8.
Cho Beom-Hyeon managerial capabilities each season

Fig. 9.

Fig. 9.
Kim Si-Jin managerial capabilities each season

Table 1.

Number of seasons and participation and dissolution of teams in the KBO league

Team Participation Dissolution Years
SAMSUNG 1982 - 42
KIA 1982 - 42
LOTTE 1982 - 42
HYUNDAI 1982 2008 42
LG 1982 - 42
DOOSAN 1982 - 42
HANHWA 1986 - 38
SSANGBANGWOOL 1991 2000 9
SSG(SK) 2000 - 24
KIWOOM 2008 - 16
NC 2013 - 11
KT 2015 - 9
Total - - 359

Table 2.

Variables in this study

Variables (Batting)
WAR games
plate apearance at bats
run hits
doubles triples
home run number of bases
runs batted in steal
Caught stealing walks
Hit by pitch Intentional walks
Strike outs Double play
Sacrifice hit Sacrifice fly
betting avarage OBA
SLG OPS
wOBA wRC+
HR% BB%
K% BB/K
IsoP IsoD
BABIP Spd
PSN wRC
wRC/27 wRAA
wOBA_PF wRC_PF
wRC/27_PF wRAA_PF
RAA_Batter RAA_steal
RAA_runner RAA_total
RAA_position RAA_total
RAA_Adj RAA
Alternative Run RAR
RPW WAA
WARBat WAROff
WAR* True runs batted in
InP% Slugging
XH/AB XH/H
XR/XH PA/HR
AB/HR Double play
Satrifice bunt steal %
 
Variables (Pitching)
Starts Complete game
Shoutout Starts
Wins Losses
Saves Holds
Innings Runs allowed
Runs allowed Batters faced
hits allowed home runs allowed
Walks allowed Intentional walks
Hit by pitch Strike outs
Balks Wild Pitches
ERA FIP
WHIP ERA+
FIP+ K/9
BB/9 K/BB
HR/9 K%
BB% K-BB%
PFR BABIP
LOB% Opponent batting average
Opponents on base percentage WHIP+
IP/G CYP
RA FIPRA
F-E R-E
ERA_PF FIP_PF
RA_PF FIPRA_PF
ERA_P_PF FIP_P_PF
kwERA RAA_starter
RAA_reliever RAA_overall
Replacement Run_starter Replacement Run_reliever
Replacement Run_overall RAR_starter
RAR_reliever RAR_overall
WAA_starter WAA_reliever
WAA_overall WAR_starter
WAR_eliever WAR_overall
fWAR RA9-WAR
 
Variables (Fielding)
games POSADJ
RAAw_ADJ WAA_ADJ

Table 3.

Comparison of performance metrics among machine learning algorithms

ML algorithms r2 score MAE RMSE
Linear SVM 0.989 0.0065 0.0001
Light-GBM 0.907 0.0165 0.0006
Random Frest 0.872 0.0148 0.0007
Extra Trees 0.866 0.0167 0.0007
Grandient Boosting 0.785 0.0155 0.0014

Table 4.

The best head coaches of each team in a single season

Team Season Head coach Win % Expected win % Head coach
capabilities
LG 2000 Lee Kwang-Hwan 0.515 0.404 0.111
2022 Ryu Ji-hyun 0.613 0.515 0.098
1986 Kim Dong-yeop 0.590 0.521 0.069
KT 2020 Lee Kang-chul 0.566 0.538 0.028
2022 Lee Kang-chul 0.563 0.548 0.015
2019 Lee Kang-chul 0.500 0.504 -0.004
SSG 2008 Kim Sung-keun 0.659 0.554 0.105
2022 Kim Won-hyung 0.629 0.528 0.101
2005 Cho Beom-hyeon 0.583 0.487 0.096
NC 2023 Kang In-kwon 0.528 0.436 0.092
2020 Lee Dong-wook 0.601 0.512 0.089
2015 Kim Kyungmoon 0.596 0.533 0.063
DOOSAN 1982 Kim Yeong-duk 0.700 0.596 0.104
2019 Kim Tae-hyung 0.615 0.545 0.070
1999 Kim In-sik 0.598 0.550 0.048
KIA 1988 Kim Eung-ryong 0.639 0.537 0.102
1991 Kim Eung-ryong 0.647 0.557 0.090
1986 Kim Eung-ryong 0.644 0.565 0.079
LOTTE 1999 Kim Myungsung 0.591 0.521 0.070
1995 Kim Yong-hee 0.560 0.499 0.061
1992 Kang Byungchul 0.563 0.516 0.047
SAMSUNG 1982 Seo Young-mu 0.675 0.564 0.111
1985 Kim Yeong-duk 0.706 0.605 0.101
2002 Kim Eung-ryong 0.636 0.544 0.092
HANHWA 1992 Kim Yeong-duk 0.651 0.573 0.078
2021 Carlos Sovero 0.371 0.332 0.039
1988 Kim Youngdeok 0.579 0.545 0.034
KIWOOM 2020 Son Hyuk 0.559 0.501 0.058
2018 Jang Jeongseok 0.521 0.480 0.041
2014 Youm Kyoung-youb 0.619 0.579 0.040

Table 5.

Best head coaches of KBO

Head coach Head coach capabilities Season
Kim Yeong-duk 0.042 11 (1982~1993)
Kim Sung-keun 0.026 20 (1984~2017)
Youm Kyoung-youb 0.022 7 (2013~2023)
Kim Tae-hyung 0.016 8 (2015~2022)
Kim Jae-bak 0.014 14 (1996~2009)
Kim Eung-ryong 0.012 24 (1983~2014)
Kim Ki-tae 0.005 6 (2012~2018)
Cho Beom-hyeon 0.002 10 (2003~2016)
Kim Si-jin 0.001 6 (2007~2014)