
Temporal Fusion Transformer를 통한 해석 가능한 농산물 가격 예측
Copyright ⓒ 2025 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

초록
기후 변화와 글로벌 공급망에 대한 불확실성이 커짐에 따라 농산물 장기 가격 예측의 중요성 또한 증가하고 있다. 그러나 기존 통계 및 머신러닝 모델은 변수 간 복잡한 상호작용을 포착하지 못하며, Recurrent 기반 모델은 장기 의존성과 해석 가능성 측면에서 한계를 보인다. 본 연구는 이를 해결하기 위해 Temporal Fusion Transformer(TFT)를 활용하여 농산물 가격을 예측하고, 학습 과정에서 변수의 중요도를 분석하였다. 실험 결과, 96일과 192일 예측 기간에서 평균 MAPE는 각각 7.54%와 11.72%로 나타났다. 이와 더불어 TFT의 Variable Selection Network(VSN)를 활용해 예측 과정의 주요 변수를 정량적으로 평가하여 모델의 해석 가능성을 높였다. 본 연구는 TFT 기반 모델이 농업 분야의 생산 계획 최적화, 원가 관리, 정책 수립 등 다양한 의사결정에 활용될 수 있음을 시사한다.
Abstract
As climate change and global uncertainties continue to grow, long-term agricultural commodity price forecasting is becoming increasingly important. However, traditional statistical and machine learning models struggle to capture the complex inter-variable interactions, while recurrent-based models face limitations in handling long-term dependencies and interpretability. Addressing these challenges, this study employs the temporal fusion transformer (TFT) to predict agricultural prices and analyze the importance of variables during the learning process. Experimental results show that the average mean absolute percentage errors for 96- and 192-day forecasts are 7.54% and 11.72%, respectively. Furthermore, key variables in the prediction process are quantitatively assessed utilizing the variable selection network (VSN) in TFT, thereby improving the model's interpretability. Finally, this study suggests that TFT-based models can be applied to various decision-making processes in agriculture, including production planning optimization, cost management, and policy development.
Keywords:
Agricultural Commodities, Multi-Horizon Forecasting, Explainable AI, VSN, TFT키워드:
농산물 가격, 장기 예측, 설명가능한 AIⅠ. 서 론
기후 변화와 글로벌 식량 공급망의 불확실성이 확대됨에 따라 농산물 가격에 대한 정밀한 예측의 중요성이 더욱 높아지고 있다. 농산물 가격의 변동은 생산량뿐만 아니라 유통망, 수요, 기후 변화, 소비 동향 등 다양한 요인에 의해 결정된다[1]. 그러나 현재까지의 많은 예측 방법론은 단변량 시계열 예측에 집중되어 있다. 이러한 접근은 외부 요인 간의 복잡한 상호작용을 고려하는 것이 어렵기 때문에 신뢰성 있는 예측 결과를 제공하는 데 한계를 보인다[2].
농산물 가격은 농산물 생산, 유통, 금리 등 여러 가지 외부 변수의 영향을 받기 때문에 이를 종합적으로 고려한 모델링이 필요하다. 다변량 분석을 통해 미래 가격 변화를 예측하는 모델은 생산자, 기업, 정부 등 여러 이해관계자에게 새로운 가치를 제공할 수 있다. 정밀한 예측은 생산자에게는 생산 계획의 불확실성을 줄이고 재고 관리 부담을 완화하며, 기업에는 원재료 가격 변동에 대한 선제 대응 기회를 제공해 수익성을 향상시키는데 기여할 수 있다. 따라서 예측 모델은 기상 변수와 경제 변수 등 외부 요인을 정교하게 반영할 수 있는 능력을 갖추어야 한다[3].
특히 작물 생산 주기가 긴 농업 분야에서는 중장기 예측이 매우 중요하다. 농작물은 일반적인 상품과는 달리 재배 기간이 길고, 보관 기간이 짧다는 특성이 있다. 그러므로 긴 미래 시점에 대비한 전략적 의사결정이 필수적이다[4]. 따라서 단기 예측보다는 장기간에 걸친 변동 패턴을 파악하는 것이 중요한 과제이다. 일반적으로 중장기 예측은 30일 이상의 기간을 대상으로 한다. 데이터에 기반한 장기적 전망은 정부의 정책 수립과 의사결정에 중요한 참고 자료로 활용될 수 있다. 뿐만 아니라 농부들의 작물 선택이나 농산물 가격 정보를 활용한 서비스를 제공하는 기업들에게도 장기 예측 정보는 필수적이다[5].
반면, 실제 농산물 가격은 비정상적이고 비선형적인 패턴을 보이기 때문에, 현재 시점에서 알 수 없는 예측 기간이 늘어날수록 정확한 예측이 어려워진다[6]. 전통적인 통계적 모델은 다수의 파라미터를 조정해야 하고, 데이터가 통계적 가정을 충족해야 적합하게 작동하지만, 실제 데이터는 이러한 요건을 충족하지 못하는 경우가 빈번하다[7]. 따라서 전통적인 통계 모델만으로는 농산물 가격의 복잡한 변동성을 효과적으로 예측하기에 한계가 있으며, 대부분 단기 예측에 적합하다[8]. 머신러닝 모델은 복잡한 데이터 간의 비선형적 관계를 학습하는 데 우수한 성능을 보이지만, 특징 추출 과정에서 여전히 인간의 개입이 요구된다는 제한점을 가지고 있다.
최근에는 딥러닝 모델이 이러한 한계를 극복할 수 있는 대안으로 부상하고 있다. 딥러닝 모델은 신경망을 활용하여 데이터의 복잡한 특성과 관계를 자동으로 학습할 수 있으며, 이를 통해 농산물 가격 예측에서도 높은 성능을 달성할 가능성을 제시한다[9]. 현재 농산물 시계열 예측 분야에서는 CNN, MLP, RNN, Transformer와 같은 딥러닝 모델이 시간적 특 성과 장기 의존성을 효과적으로 반영할 수 있는 주요 연구 대상으로 주목받고 있다. 그러나 국내 농산물 가격 예측 연구는 여전히 Recurrent 기반 모델에 국한되어 있으며, 예측 기간이 길어질수록 높은 오차를 보이는 한계를 드러내고 있다. 이러한 한계를 극복하기 위해 보다 향상된 성능을 목표로 하는 새로운 접근법과 모델에 대한 연구가 요구된다[5],[10]-[12].
한편 딥러닝 모델은 높은 예측 성능에도 불구하고 결과 도출 과정이 불투명한 블랙박스 특성으로 인해 결과 해석이 어렵다는 한계를 지닌다[13]. 예측에 영향을 미치는 주요 변수의 기여도를 파악하는 것은 가격 변동의 원인을 분석하고 예측 결과의 신뢰도를 높이는 데 필수적이다. 따라서 농산물 가격 예측에서 딥러닝 모델을 효과적으로 활용하려면 장기간의 예측에 있어 높은 예측 성능뿐만 아니라 해석 가능성도 고려해야 한다.
본 연구는 농산물 가격의 예측 성능과 해석 가능성을 동시에 향상시키기 위해 최신 딥러닝 모델인 Temporal Fusion Transformer(TFT)를 기반으로, Attention Mechanism을 활용한 접근법을 제안한다[14].
본 연구의 차별점은 다음과 같다.
첫째, 본 연구는 한국 작물의 도매가격을 기존의 단기 예측이 아닌 장기 예측으로 수행하여, 이전 연구보다 우수한 성능을 통해 농산물 시장의 중장기적 불확실성을 적절히 반영할 수 있음을 시사한다.
둘째, TFT의 Variable Selection Network(VSN)를 통해 외부 변수의 영향을 효과적으로 반영할 수 있음을 입증하였다. 이 기법은 기존 Recurrent 기반 모델들이 다변량 데이터를 하나의 매트릭스로 단순히 임베딩하여 처리하는 방식과 달리, 외생 변수의 영향을 크게 받는 농산물 도메인에 특화된 최적의 성능을 제공한다.
셋째, 모델 기반의 예측 결과에 대한 해석을 가능하게 한다. 이를 통해 예측값의 도출 근거를 명확히 제시함으로써, 농산물 가격 분야에서 데이터 기반 의사결정을 촉진할 수 있다.
결론적으로, 본 연구에서 제안하는 모델은 단순한 가격 변동 예측을 넘어 다양한 외부 요인을 동적으로 고려함으로써 미래 시장의 불확실성을 효과적으로 관리하고, 신뢰성 있는 예측 정보를 제공하는 데 기여 할 것으로 기대된다.
Ⅱ. 선행 연구
2-1 농산물 가격 예측 모델의 성능 측면에서의 선행 연구
농산물 가격은 계절성 및 트렌드 변화뿐 아니라 예기치 못한 외생 변수의 영향을 받아 비선형적이고 복잡한 데이터 패턴을 형성한다. 예를 들어 강수량과 온도 변화는 특정 작물의 생산성과 직결되며 수출입 규제나 환율 변동은 농산물의 수급 구조에 직접적인 영향을 미친다[15].
외생 변수를 효과적으로 반영한 예측 모델은 단기적 의사결정과 중장기적 안정성을 확보하는 데 핵심적인 역할을 한다. 따라서 한국 농산물 시장의 특수성을 고려하는 외생 변수와 복잡한 데이터 패턴을 반영할 수 있는 고도화된 예측 모델 개발이 필요한 실정이다[1].
통계적 모델(ARIMA, SARIMA 등)은 계절성과 트렌드를 반영하며 적은 데이터로도 예측이 가능하다는 장점을 가진다. 하지만 일반적으로 외생 변수와 비선형적 데이터를 학습하지 못하고 실제 시장의 복잡성을 반영하는 데 한계가 있다[11]. 머신러닝은 데이터 간의 복잡한 상호작용을 학습하여 통계적 모델보다 우수한 성능을 제공한다. Random Forest, XGBoost등의 모델들이 사용되며, 이 역시 주로 단기 예측에만 활용된다[16],[17]. 이는 시계열 데이터의 장기 의존성을 처리하는 데 한계를 보이기 때문이다[18].
딥러닝 모델은 이러한 한계를 극복하며 데이터 패턴과 장기 의존성을 더욱 효과적으로 학습할 수 있다. Shin et al.은 LSTM을 활용하여 기상 관련 외생 변수를 반영하며 단기 예측 성능을 개선하였다[10]. Gu et al.는 STL Decomposition에 Attention Mechanism을 결합한 LSTM 모델로 다중 변수 간 상호작용을 학습하여 월간 예측에서 높은 정확도를 달성하였다[12]. Transformer와 같은 최신 딥러닝 모델은 Attention Mechanism을 통해 데이터의 장기 의존성을 학습하고, 외생 변수와의 복잡한 상호작용을 반영하는 데 탁월한 성능을 보였다[19].
이처럼 딥러닝 모델은 인공 신경망 기반의 유연성을 활용하여 비선형적이고 복잡한 데이터 패턴을 학습하며 기존 통계 및 머신러닝 모델을 뛰어넘는 성능을 보여준다.
본 연구에서는 Park et al.의 기준에 따라 농산물 가격 장기 예측을 T+30 이상의 시점으로 정의한다[5]. 단기 예측(T+30 미만)은 주로 재고 관리와 단기적인 시장 변동 대응에 중점을 둔다. Shin et al.은 LSTM 기반 모델을 활용하여 대파, 양파, 쌀 등 주요 품목의 1~7일 단기 예측에서 자연재해와 같은 외부 요인의 영향을 효과적으로 반영하였다[10]. Park and Lee는 LSTM에 이상치 탐지 기법을 결합하여 배추, 무, 양파의 단기 예측에서 5% 이내의 Mean Absolute Percentage Error(MAPE) 달성하였다[11]. Sun et al.은 VMD-EEMD를 활용하여 1~3 주별 예측에서 기존 LSTM보다 개선된 성능을 보였다[20].
Nayak et al.는 NBEATSX와 TransformerX 모델을 활용하여 precipitation, temperature 외생 변수를 반영한 인도 농산물 가격 단기 예측에서 높은 성능을 입증하며, 기상 변수와 시장 데이터를 통합한 모델의 가능성을 제시하였으나, 장기 예측에 대한 논의는 없었다[19].
장기 예측(T+30 이상)은 월간 또는 연간 데이터를 활용하여 농업 생산 계획과 정책 수립에 필수적인 자료를 제공한다. 하지만 예측 시점이 멀어질수록 정확도가 낮아지는 문제가 존재한다. Park et al.은 LSTM 기반 모델을 활용하여 양파, 오이, 배추의 도매가격을 30일부터 365일까지 예측하였다. Direct, Recursive, Hybrid 등 다양한 예측 방법을 활용하여 비교하였으나 모두, MAPE 20% 이상으로 저조한 성능을 보였고, 전통적인 Recurrent 기반 모델만으로는 변동성이 큰 한국의 농산물 가격의 특성을 적절히 반영하지 못한다는 한계를 보였다[5].
Transformer 기반의 최신 딥러닝 모델은 Attention Mechanism을 활용하여 장기 의존성을 학습하고, 외생 변수와의 복잡한 상호작용을 효과적으로 반영함으로써 Electricity, Weather 등 다른 특성을 가진 다른 도메인의 데이터들의 다변량 장기 예측에서 우수한 성과를 보이고 있다[21],[22]. 따라서 Transformer 기반 모델은 농산물 가격 분야의 장기 예측에 적용했을 때, 외생 변수와 데이터의 복잡한 상호작용을 효과적으로 반영하여 기존 LSTM 기반 모델의 한계를 극복할 수 있을 것으로 판단된다.
2-2 해석 가능성 측면에서의 선행 연구
딥러닝 모델의 예측 결과를 해석하기 위해 다양한 Post-Hoc 해석 방법이 제안되고 있다. Post-Hoc 방법은 모델 학습 이후에 예측 결과에 영향을 미친 요인을 분석하거나 시각적으로 설명하는 접근 방식이며 대표적인 방법으로는 Local Interpretable Model-Agnostic Explanations(LIME), Shapley Additive exPlanations(SHAP), Gradient-Based Methods가 있다[23]-[25].
LIME은 단순한 surrogate 모델을 활용해 모델과 동일한 입출력을 생성함으로써 해석 정보를 제공한다. SHAP은 게임 이론을 기반으로 변수 기여도를 계산해 확장성 있는 해석을 제공하지만, 모든 변수 조합에 대한 계산이 필요해 대규모 데이터에서는 연산 비용이 매우 크다. Gradient-Based Methods는 손실 함수와 경사 하강법을 통해 변수 기여도를 정량적으로 분석한다.
Post-Hoc를 통한 예측 모델 해석은 모델의 종류에 상관없이 적용 가능하다는 장점이 있지만, 시간적 의존성을 반영하지 못하며 예측 기간이 길어질수록 막대한 연산 자원이 요구된다는 한계가 존재한다.
이런 Post-Hoc 방법에 대한 대안으로 모델에서 자체적으로 해석을 제공하는 방법에 대한 논의가 활발하게 이루어지고 있다[14]. TFT는 모델의 구성요소 중 하나인 VSN을 활용한 모델 내 해석을 제공한다. 이는 입력 시퀀스의 각 시점에 대한 기여도를 나타내는 Variable Selection Weight(VSW)을 통해 이루어진다. 이를 활용하면 특정 시점에서의 출력값에 대한 해석이 가능하며, 모델의 예측 과정을 보다 직관적으로 이해할 수 있다. 이와 같은 특징은 모델 기반의 해석 가능성은 예측값을 뒷받침하기 위한 효과적인 방법론이 될 수 있으며, 특히 농산물 가격 예측과 같이 다양한 외생 변수를 반영해야 하는 예측 문제에서 유용함을 시사한다.
2-3 선행 연구를 통한 본 연구의 시사점
기존 연구는 농산물 가격 예측 모델이 통계적 모델에서 딥러닝 모델로 발전하면서 예측 성능이 꾸준히 개선되었음을 보여준다. 그러나 농산물 가격의 단기 예측에 비해 장기 예측에 대한 논의는 상대적으로 부족하며 특히 한국에서는 이러한 차이가 더욱 두드러진다. 본 연구팀은 문헌 조사를 통해 농산물 가격 장기 예측의 어려움이 두 가지 주요 원인에 기인한다고 판단하였다.
첫째, 기존 모델들은 장기 농산물 가격 시계열 데이터의 변동성을 효과적으로 포착하지 못한다. 특히 국내의 연구는 Recurrent 기반 모델에 주로 의존하고 있어, 장기적 의존성을 처리하는 데 한계가 있었다.
둘째, 외부 변수의 영향을 적절히 반영하지 못하는 점이 큰 문제로 지적된다. 농산물 가격은 기후, 공급망, 정책 변화 등 다양한 외부 요인에 큰 영향을 받는다. 따라서 농산물 가격 예측 모델은 시계열 데이터 자체의 특성뿐만 아니라, 외부 요인의 영향까지 정교하게 반영할 수 있어야 한다.
무엇보다 예측의 궁극적인 목적은 사용자의 의사결정을 지원하는 것이다. 예측 모델의 활용이 증가함에 따라 모델에서 제시된 예측값의 근거를 명확히 제공하는 해석 가능성 역시 중요한 요구사항으로 드러나고 있다. 그러나 현재 농산물 가격 예측 분야에서는 이러한 해석 가능성에 대한 논의가 여전히 부족한 상황이다.
이에 따라 본 연구는 농산물 가격의 장기적 의존성과 시간적 특성을 효과적으로 추출하고, 외부 변수의 영향을 세밀히 반영하며 예측값 구성의 투명성을 제공할 수 있는 모델을 제안한다. 특히 TFT 모델을 기반으로 외부 변수를 고려한 농산물 가격 예측을 수행하며 모델 내부의 VSW를 시각화하여 변수의 기여도를 명시적으로 제시함으로써 해석 가능성과 장기 예측 정확도를 동시에 확보하고자 한다.
Ⅲ. 이론적 배경
3-1 Temporal Fusion Transfomer (TFT)
TFT는 시계열 예측을 위한 딥러닝 모델로, 다양한 데이터셋에 대한 일반화 성능을 높이기 위해 여러 가지 핵심 메커니즘을 도입한다. TFT 네트워크 구조는 다음과 같다.
첫 번째로, Gating Mechanism을 활용하여 불필요한 성분을 효과적으로 제거하고, 네트워크의 깊이를 적응적으로 조절함으로써 연산 복잡도를 낮춘다. 이는 모델이 과적합을 방지하면서도 다양한 데이터셋에서 안정적인 성능을 보이도록 한다.
두 번째로, VSN을 통해 입력 변수 중 예측에 유의미한 요소만을 선택하여 학습하며, 불필요한 노이즈를 줄인다. 대부분의 실제 시계열 데이터는 예측과 직접적으로 관련되지 않은 많은 변수들을 포함하고 있으므로, 이러한 변수 선택 과정은 모델의 해석 가능성과 성능을 동시에 향상시키는 중요한 역할을 한다.
세 번째로, Static Covariate Encoder를 활용하여 정적 공변량(static covariate)을 컨텍스트 벡터(context vector)로 변환하고, 이를 전체 네트워크와 결합한다. 이는 개별 인스턴스에 대한 고유한 특성을 모델에 반영하여 보다 정교한 예측이 가능하도록 한다. 단, 해당 논문에서는 정적 공변량을 활용하지 않아 모든 정적 context vector는 0으로 초기화하였다.
마지막으로, Temporal Processing을 통해 시계열 데이터의 단기 및 장기 종속성을 효과적으로 학습한다. 이를 위해 seq2seq 레이어를 활용하여 로컬 시점에서의 패턴을 포착하고, Interpretable Multi-Head Attention을 통해 장기적인 시점 간 의존성을 학습한다. 이러한 구조는 모델이 시계열 데이터의 복잡한 패턴을 보다 효과적으로 이해하도록 도와준다.
3-2 Variable Selection Network (VSN)
TFT는 Instance-wise 변수 선택 기법을 적용하여, static 및 time-dependent 공변량을 포함한 모든 입력 변수 중 예측에 직결되는 요소만을 선택한다. 이는 모델이 불필요한 입력 변수를 무시하고, 보다 의미 있는 특징만을 학습하도록 유도함으로써 성능을 향상시키는데 기여한다.
범주형 변수에 대해서는 Entity Embedding을 적용하고, 연속형 변수에 대해서는 Linear Transformation을 수행한다. 또한, 모든 정적 및 시변 입력 변수에 대해 개별적인 변수 선택 네트워크를 구성하여 처리한다.
수식적으로, 각 시점 t에서 변형된 입력을 ξt라 하고, 모든 이전 시점 t에 대한 입력들의 flatten 벡터를 Ξt라 하면, VSW vχt는 다음과 같이 정의된다.
(1) |
여기서 cs는 Static Covariate Encoder를 통해 얻은 컨텍스트 벡터이며, 이는 정적 변수에서 추출된 정보를 포함한다. 매 시점마다 GRN을 통해 변형된 입력 ξt(j)를 처리하며, 이를 비선형 변환을 통해 정제하는 과정이 추가된다.
(2) |
이때, 최종적으로 모든 변수의 가중합을 통해 최종 입력 벡터 ξt를 구할 수 있으며, 이는 다음과 같이 표현된다.
(3) |
위 식에서 vχt(j)는 변수 선택 가중치 벡터 vχt의 j번째 요소를 의미한다. 이러한 구조를 통해 TFT는 시계열 데이터 내에서 의미 있는 특징을 효과적으로 선택하고, 불필요한 노이즈를 제거할 수 있다.
3-3 Interpretable Multi-Head Attention
Attention Mechanism은 쿼리(Query)와 키(Key) 간의 유사도를 기반으로 가중치를 할당하고, 이를 이용해 값(Value)을 가중합하는 방식으로 동작하며, 시계열 데이터의 중요한 시점을 효과적으로 반영할 수 있도록 한다. Attention Mechanism은 수학적으로 다음과 같이 표현된다.
(4) |
여기서 Q는 Query, K는 Key, V는 Value, dk는 Key의 차원 수이며, softmax 함수는 가중치를 확률 분포 형태로 정규화한다. 본 연구에서 활용된 TFT는 Dot-product Self-Attention을 적용하여 입력 시퀀스 내 요소 간의 상관관계를 학습하며, Multi-Head Attention을 통해 다각적인 관점에서 시간적 의존성과 변수 간의 상호작용을 모델링한다. 특히, TFT는 Interpretable Multi-Head Attention 구조를 도입하여, 모든 헤드에서 동일한 Value 벡터를 공유하고 이를 Additive Aggregation 방식으로 결합함으로써, 각 헤드가 특정 시점 및 변수에 집중하면서도 모델의 해석 가능성을 유지하도록 설계되었다.
이 과정에서 입력 데이터는 학습 가능한 가중치를 갖는 Linear Projection을 거쳐 각각의 Q, K, V 벡터로 변환되며, 이를 통해 서로 다른 패턴을 포착하는 독립적인 헤드가 생성된다. 일부 헤드는 과거의 외생적 변수에 집중하고, 다른 헤드는 미래의 공변량을 반영함으로써, 다변량 시계열 데이터에서 복잡한 의존성을 효과적으로 모델링할 수 있다. 또한, Attention 가중치의 시각화를 통해 모델이 특정 시점과 변수에서 의사결정을 내리는 방식을 분석할 수 있어, 해석 가능성과 투명성이 확보된다.
Ⅳ. 데이터 및 연구 방법
연구는 그림 2와 같은 프레임워크로 진행되었다. 수집된 데이터를 기반으로 피처를 선정한 후 데이터를 전처리한다. 이후, 반복적인 모델 학습 및 평가를 통해 하이퍼파라미터 최적화를 진행하고, 최적의 모델을 선정하여 결과 해석을 진행하였다.
4-1 데이터 수집
본 연구에서는 농산물 가격 예측 모델 훈련을 위해 다양한 데이터 소스를 활용하였다. 농산물 가격 데이터, 기상 데이터, 물가지수 및 수출입 관련 데이터, 유가 데이터를 각각 “Investing.com”, “기상청”, “KOSIS”, “KAMIS”에서 수집하였다.
독립 변수는 과거 공변량과 미래 공변량으로 구분하였으며, 이러한 구분은 시계열 데이터의 특성을 효과적으로 반영하고 예측 모델의 학습 성능을 향상시키기 위함이다.
목적 변수는 전국 평균 일별 도매가격 데이터를 사용하였으며, 분석 대상 품목으로는 국내 가격 예측에 주로 사용되는 품목인 고구마, 양파를 선정하였다.
과거 공변량은 일정 기간 동안의 과거 데이터를 포함하며, 이는 입력되는 목적 변수의 시점 길이와 동일하게 사용한다.
미래 공변량은 확정적인 정보를 바탕으로 생성된 파생 변수들로 주로 날짜 관련 정보(요일, 공휴일, 월 등)를 포함한다.
본 연구에서 활용한 데이터는 2001년 6월 1일부터 2023년 12월 29일까지의 기간을 포함하며, 휴일로 인한 결측치는 사전에 제거하였다.
총 예측 기간은 장기 예측에 주로 사용되는 설정을 참고하였다. 선행 연구에서는 일반적으로 48일, 96일 또는 192일을 예측기간으로 설정하며, 본 연구에서는 이러한 설정을 바탕으로 24의 배수 관계를 고려하여 96일과 192일로 설정하였다. 이를 위한 검증 기간으로는 예측 기간의 두 배인 192일 및 384일로 설정하였으며, 이는 해당 기간 내에서 stride 1로 교차 검증을 수행하기 위함이다.
4-2 피처 선정
딥러닝 모델은 스스로 최적의 변수를 학습할 수 있다는 장점이 있지만, Transformer 기반 모델은 입력 피처의 수가 많을 경우 목적 변수의 중요한 특징을 효과적으로 학습하지 못하는 한계가 있다. 이는 Attention 메커니즘의 특성상 주의가 과도하게 분산되기 때문으로 추정된다. 이러한 문제를 보완하기 위해 본 연구에서는 상대적으로 목적 변수와 상관관계가뚜렷한 변수를 선정하는 절차를 거쳤다. 처음 수집한 다양한 기상, 물가지수, 수출입 관련 변수 중 상관관계 그래프를 통해 최종적으로 14개의 변수만을 선별하여 실험에 활용하였다. 선정된 변수는 앞선 4-1 데이터 수집에서 구체적으로 정의되어 있다.
4-3 데이터 전처리
TFT 모델 학습을 위해, 입력 데이터에 대한 두 가지 전처리 층을 적용하였다.
입력 데이터의 시계열 길이가 배치(batch) 내에서 고정되지 않을 경우 데이터 불균형으로 인해 모델 학습이 불안정해질 수 있다. 이를 해결하기 위해 PyTorch의 ConstantPad1d를 사용하여 배치 내 모든 시계열 데이터의 길이를 동일하게 맞췄다.
패딩을 통해 시계열 데이터의 길이를 정규화한 후, 입력 피처 간 스케일 차이를 조정하기 위해 TemporalNorm1d를 통한 표준화를 진행하였다. 일반적인 표준화는 전체 데이터셋을 기준으로 평균과 분산을 계산하는 반면, TemporalNorm1d는 배치별로 이를 동적 조정하여 시계열 데이터의 본래 특성을 유지하면서도 배치 간 변동성을 반영할 수 있도록 한다.
(5) |
4-4 모델 학습
본 연구는 다양한 모델을 활용하여 예측 성능을 비교하고자 하였다. 이를 위해 Recurrent 기반(RNN, LSTM), MLP 기반(NBEATSx, NHiTS), Transformer 기반(TFT) 모델이 사용되었다. 이러한 모델 선택은 각 모델이 지니는 시계열 데이터를 처리 방식의 차이가 농산물 가격 예측 성능에 어떻게 영향을 미치는지 분석하기 위함이다. 예를 들어, RNN과 LSTM은 순환 구조를 통해 시계열 데이터의 시간적 의존성을 학습하며, NHITS는 복잡한 패턴과 계절성을 효과적으로 처리할 수 있다. 반면, TFT는 Attention Mechanism을 활용하여 장기 의존성과 다양한 공변량 간의 상호작용을 반영할 수 있는 장점을 가진다.
모델의 구조적 특징에 대해 각 50회씩 그리드 서치를 시행하여 학습률(learning rate), 은닉층 크기(hidden layer size) 등은 주요 하이퍼파라미터에 대한 최적값을 도출하였다.
모든 모델의 학습 과정에서는 Optimizer로 Adam을 사용하고, Batch size는 32로 통일하여 설정하였다. 이는 모델 간 비교의 공정성을 확보하고 학습 과정의 안정성을 향상시키기 위함이다.
4-5 모델 평가
본 연구에서는 예측 모델의 성능을 정량적으로 평가하기 위해 Mean Absolute Error(MAE)와 MAPE를 주요 평가 지표로 활용하였다.
MAE는 예측값과 실제값 간의 절대 오차의 평균을 계산하며, 다음과 같이 정의된다.
(6) |
여기서 yt는 실제값, 는 예측값, N은 데이터의 개수를 나타낸다. MAE는 오차의 크기를 절댓값으로 평가하여 양수와 음수 오차의 상쇄를 방지하며 농산물 가격의 절대적 변동성을 평가하는 데 유용하다.
MAPE는 절대 오차를 실제값으로 나눈 백분율의 평균으로 다음과 같이 정의된다.
(7) |
MAPE는 데이터의 스케일에 의존하지 않는다는 장점을 가진다. 이를 통해 가격 차이가 큰 품목들의 예측 성능을 100%라는 동일한 기준으로 비교할 수 있도록 한다.
4-6 결과 해석
본 연구에서는 TFT 모델의 해석 가능성을 확인하기 위해 VSW을 활용하여 데이터를 분석하였다. 이를 통해 모델의 예측 과정에서 특정 시점과 피처가 결과에 미치는 영향을 파악하고, 데이터의 주요 패턴과 변동성을 이해하고자 하였다. 분석은 다음 두 가지 측면에서 진행되었다.
첫째, 전체 예측 과정에서 종합적인 변수들의 중요도를 분석한다. 모든 시점에서 각 변수별 weight 값들의 평균값을 구하면 이를 통해 특정 변수가 모델의 예측 과정에서 얼마나 중요한 역할을 하는지 정량적으로 평가할 수 있으며 이는 모델 내재적으로 해석 가능성을 높이는 데 기여한다.
둘째, 특정 시점에서 중요한 변수를 식별한다. 각 t 시점에서 모든 변수 j ∈ < 1, ⋯ mx >에 에 대해 계산된 VSW을 저장해두고 변수별 시점별 중요도를 시각화하고 분석한다. 이를 통해 Post-HOC 모델에서는 알 수 없는 시점별 변수 중요도를 확인할 수 있다는 큰 장점이 있다.
Ⅴ. 연구 분석
5-1 모델별 성능
표 6은 고구마와 양파 대상으로 다양한 예측 기간(96, 192)과 다양한 딥러닝 모델(RNN, LSTM, NBEATSx, NHITS)의 성능을 비교한 결과를 나타낸다. 분석 결과, 고구마의 경우 Recurrent 기반 모델인 RNN과 LSTM에 비해 MLP 기반 모델인 NBEATSx와 NHITS의 성능이 상대적으로 우수한 것으로 나타났다. 반면 양파의 경우 Recurrent 기반 모델이 MLP 기반 모델에 비해 더 높은 성능을 보였다. 그러나 모든 품목과 예측 기간에서 TFT 모델이 가장 우수한 성능을 기록하였으며 이에 대한 평균 MAPE는 9.63%로 나타났다. 이는 TFT 모델이 농산물 가격 예측에 효과적임을 입증하는 결과이다.
5-2 전체 변수 중요도 분석
그림 3과 그림 4는 각각 고구마와 양파의 96일 예측에서 주요 변수들의 중요도를 시각적으로 나타낸다. 이를 통해 품목별로 예측에 영향을 미치는 변수들의 상대적 중요성과 그 기여도를 도출하였다.
고구마의 경우, 가장 중요한 변수로는 PPI(생산자물가지수)가 선정되었다. 이는 생산자가 느끼는 가격 변화가 고구마의 도매가격에 강력한 영향을 미침을 시사한다. TS_AVG(토양 기온)또한 상위 변수로 나타나, 기온이 농작물의 성장과 공급에 중대한 영향을 미친다는 점을 보여준다. 날짜 관련 변수인 month(연 내 월)와 day_of_month(월 내 일) 역시 예측 과정에서 기여도가 높았으며 이는 월별 계절성과 특정 날짜의 가격 변동성이 고구마 가격 형성에 영향을 미친다는 점을 의미한다.
양파의 경우, month(연 내 월)가 가장 중요한 변수로 나타났다. 이는 양파의 가격 변동이 계절적 특성과 밀접하게 연관되어 있음을 보여준다. 또한, CA_TOT(전운량)은 양파 가격에 영향을 미치는 주요 기상 변수로 분석되었으며 이는 날씨 조건이 농작물의 수확량과 품질에 영향을 미치는 것을 반영한 것으로 해석된다. 이 외에도 week_of_year(연 내 주차)와 PPI(생산자물가지수)가 주요 변수로 도출되었다.
5-3 시점별 변수 중요도 분석
그림 5와 그림 6은 품목별 96일 예측에 사용된 직전 96일의 시점 중요도와 시점별 변수 중요도를 시각적으로 나타낸다. 상단의 검정 선 그래프는 예측 결과에 대한 각 시점의 중요도를 나타내며, 하단의 누적 막대그래프는 각 시점에서 변수들의 기여도를 세부적으로 보여준다.
각 시점은 예측 시작일과 비교하여 구체적인 날짜를 확인할 수 있었다. 이러한 그래프는 모델 기반의 자체적인 해석 가능성을 기반으로 시점 및 변수 수준에서의 정량적 이해를 제공한다.
고구마의 경우, 2022년 8월 말에서 9월 말, 11월 초, 12월 말 시점이 가격 변동에 있어 중요한 시점으로 분석되었다. 2022년 8월 말에서 9월 말 시점에서는 소비자물가지수, 수입물가지수, 신선식품물가지수와 같은 물가지수가 주요 변수로 작용하였다. 2022년 11월 초에는 신선식품물가지수와 수입물가지수의 영향이 더욱 증대되었으며 여기에 기온과 연내 주차와 같은 계절적 요인이 추가적으로 중요한 영향을 미쳤다. 2022년 12월 말에는 생산자물가지수, 소비자물가지수, 그리고 유가의 중요성이 급격히 증가하였다. 이는 연말이라는 특수한 시점이 경제 상황과 사람들의 심리를 넘어 농산물의 가격에도 영향을 미쳤음을 시사한다.
양파의 경우, 2022년 8월 중순, 10월 중순부터 말, 11월 말 시점이 중요한 시점으로 확인되었다. 2022년 8월 중순에는 월과 누적 일이 주요 변수로 작용하였으며 2022년 10월 중순부터 말까지는 월, 연내 주차, 월 내 일 등의 미래 공변량이 중요한 변수로 작용하였다. 이를 통해 양파 가격은 계절적 요인에 크게 의존한다는 것을 반복적으로 확인할 수 있다. 2022년 11월 말에는 이전 가격과 연내 주차가 주요 변수로 부각되었다. 이는 과거 가격 패턴이 이후 가격을 설명하는 데 중요한 역할을 한다는 것을 나타낸다.
Ⅵ. 결론 및 제안
6-1 결론
본 연구는 수집된 데이터를 바탕으로 예측 성능이 우수한 최적의 모델을 제안하고, 품목별 변수가 가격 예측에 미치는 기여도를 분석하였다. 이를 위해 다변량 시계열 데이터의 복잡한 패턴과 장기 의존성을 효과적으로 학습할 수 있는 TFT 모델을 활용하였으며, VSW을 통해 각 품목별 변수의 기여도를 분석하고 이를 시각적으로 표현하였다.
연구 결과, 96일과 192일 두 가지 예측 기간에서의 전체 품목의 평균 MAPE는 각각 6.45%와 12.81%로 나타났으며, 전체 품목의 평균 MAPE는 9.63%로 확인되었다. 해석 가능성 분석에서는 고구마의 경우 생산자물가지수와 토양 기온이, 양파의 경우 월과 전운량이 주요 변수로 도출되었다. 이를 통해 TFT 모델이 농산물 가격 장기 예측에서 높은 예측 정확도와 해석 가능성을 제공하며 주요 변수들의 기여도를 파악할 수 있음을 입증하였다.
6-2 시사점
본 연구는 국내 농산물의 장기 가격 예측을 위해 TFT 모델을 기반으로 접근법을 제안하였으며 본 연구의 시사점은 다음과 같다.
첫째, 본 연구는 장기 예측 관점에서 성능 향상 가능성을 입증하였다. 기존 연구가 주로 단기 예측에 초점을 맞춘 것과 달리, 본 연구는 농산물 도매가격의 장기 예측을 통해 중장기적 시장 불확실성을 효과적으로 관리하는 데 기여한다.
둘째, 본 연구는 TFT 모델의 VSN를 활용하여 외생 변수의 영향을 효과적으로 반영할 수 있음을 검증하였다. 이는 기존 Recurrent 기반 모델들이 다변량 데이터를 단순히 임베딩하여 처리했던 방식과 달리, 외부 요인에 민감한 농산물 도메인에 최적화된 성능을 제공함으로써 Recurrent 기반 다변량 모델 대비 예측의 정확성을 크게 향상시켰다.
셋째, VSW을 활용하여 예측 결과에 대한 모델 자체적인 해석 가능성을 제공하였다. 이는 딥러닝 모델의 블랙박스 한계를 극복하고, 예측 근거를 명확히 제시함으로써 데이터 기반 의사결정을 더욱 신뢰성 있게 지원할 수 있음을 보여준다. 특히, 시점별 변수의 중요도를 파악할 수 있는 모델의 특성은 향후 예측 모델의 최적화와 구조 개선에 있어 중요한 단서를 제공한다.
넷째, 본 연구에서 제안된 접근법은 단순히 예측 정확도를 넘어 농업 도메인에서의 다양한 이해관계자에게 실질적인 가치를 제공한다. 정부는 이를 통해 농업 보조금 정책 조정, 공급망 관리 최적화, 가격 안정화를 위한 전략 수립 등 정책적 의사결정을 강화할 수 있다. 생산자는 장기적 예측값을 활용해 생산 계획을 최적화하고 재고 관리 부담을 줄임으로써 비용 효율성을 극대화할 수 있다. 기업은 원재료 가격 변동에 대한 선제 대응을 통해 수익성을 증대시킬 수 있다.
본 연구는 한국 농산물 시장의 장기적 예측 가능성을 입증하고, 정책적, 산업적, 학문적으로 실질적인 기여에 대한 가능성을 제시하였다는 점에서 중요한 의의를 가진다.
6-3 한계 및 향후 연구
그러나 본 연구는 지역이나 상품군과 같은 계층적 정보를 반영하지 않았고, 각 목표 변수를 개별적으로 모델링(local modeling)함으로써 다양한 품목 간의 상호작용은 고려하지 못했다는 한계가 있다. 이를 극복하기 위해선 계층적 정보를 통합하는 Hierarchical Forecasting을 시도해 볼 수 있다. 이러한 계층적 접근은 농산물의 지역적 차이나 시장 구조를 세밀하게 반영함으로써 예측 결과의 실효성을 높일 수 있을 것이다.
결과 해석 측면에서는 모델에서 학습된 가중치 기반의 Feature Importance는 예측값에 대한 해석의 근거를 제시하지만, 이를 통해 인과관계까지 이끌어내지 못한다는 한계가 있다. 더불어, 정책 변화나 시장 충격과 같은 일시적인 외부 요인을 예측 모델에 직접 반영할 수 있는 체계적인 접근이 부족하다는 점도 본 연구의 한계로 지적된다. 따라서 시계열 데이터에서 발생할 수 있는 교란 변수를 처리하기 위해 인과추론 기법을 활용하는 후속 연구가 요구된다. 특히, 시점별 정책 변화나 외부 충격이 데이터 및 예측값에 미치는 영향을 정량적으로 분석하고, 이를 반영할 수 있는 새로운 시계열 모델링 접근법을 개발해야 한다. 또한 예측 모델의 실시간 대응력을 강화하기 위해 최신 Large Language Model(LLM)을 활용하는 방안도 고려할 수 있다. LLM은 Multi-Modal과 텍스트 기반 데이터를 통합하여 더욱 풍부하고 복합적인 예측 정보를 제공할 가능성을 가지고 있다.
제시된 한계점들이 개선되었을 때, 본 연구에서 제안한 방법론은 농산물 가격 예측을 넘어 생산량, 수입/수출량 예측 등 농업 분야의 다양한 과업에서 활용될 수 있을 것으로 기대된다.
References
-
M. Yun, S. Choi, S.-H. Lee, and H.-W. Kim, “Development of a Deep Learning Model to Predict Agricultural Product Prices: A Focus on Weather and Economic Variables,” Information Systems Review, Vol. 26, No. 3, pp. 221-237, August 2024.
[https://doi.org/10.14329/isr.2024.26.3.223]
-
J. Kim and J.-I. Lee, “A Study on Agricultural Price Prediction System based on Deep Learning,” The Journal of Korean Institute of Information Technology, Vol. 17, No. 6, pp. 27-34, June 2019.
[https://doi.org/10.14801/jkiit.2019.17.6.27]
-
K.-H. Han and W.-S. Na, “Forecasting Prices of Major Agricultural Products by Temperature and Precipitation,” Journal of Advanced Technology Convergence, Vol. 3, No. 2, pp. 17-23, June 2024.
[https://doi.org/10.23152/JATC.2024.03.02.017]
- J. Kim, C. Kim, M. Song, S. Han, and D. Jang, Vision of 2030/2050 Agriculture and Rural Sector in Korea, Korea Rural Economic Institute, Naju, South Korea, Policy Research Report No. P133, pp. 174-176, August 2010, .
-
J. Park, Y.-W. Lim, D. H. Lim, Y. Choi, and H. Ahn, “A Multi-step Time Series Forecasting Model for Mid-to-Long Term Agricultural Price Prediction,” Journal of the Korea Society of Computer and Information, Vol. 28, No. 2, pp. 201-207, February 2023.
[https://doi.org/10.9708/jksci.2023.28.02.201]
-
H. Lee, M. Yeo, and S. Hong, “Comparison of Time Series Forecasting Models in Garlic’s Wholesale Price,” Journal of Rural Development, Vol. 40, No. 2, pp. 55-73, June 2017.
[https://doi.org/10.36464/jrd.2017.40.2.003]
-
A. Grover, A. Kapoor, and E. Horvitz, “A Deep Hybrid Model for Weather Forecasting,” in Proceedings of the 21st ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD ’15), Sydney, Australia, pp. 379-386, August 2015.
[https://doi.org/10.1145/2783258.2783275]
-
J. Gamboa, “Deep Learning for Time-Series Analysis,” arXiv:1701.01887, , January 2017.
[https://doi.org/10.48550/arXiv.1701.01887]
-
M. M. Najafabadi, F. Villanustre, T. M. Khoshgoftaar, N. Seliya, R. Wald, and E. Muharemagic, “Deep Learning Applications and Challenges in Big Data Analytics,” Journal of Big Data, Vol. 2, 1, February 2015.
[https://doi.org/10.1186/s40537-014-0007-7]
-
S. Shin, M. Lee, and S.-K. Song, “A Prediction Model For Agricultural Products Price with LSTM Network,” Journal of the Korea Contents Association, Vol. 18, No. 11, pp. 416-429, November 2018.
[https://doi.org/10.5392/JKCA.2018.18.11.416]
-
C. Park and K.-S. Lee, “Deep-Learning-Based Price Prediction by Outlier Detection and Processing for Agricultural Commodity Prices,” Journal of Digital Contents Society, Vol. 24, No. 8, pp. 1899-1906, August 2023.
[https://doi.org/10.9728/dcs.2023.24.8.1899]
-
H. Yin, D. Jin, Y. H. Gu, C. J. Park, S. K. Han, and S. J. Yoo, “STL-ATTLSTM: Vegetable Price Forecasting Using STL and Attention Mechanism-Based LSTM,” Agriculture, Vol. 10, No. 12, 612, December 2020.
[https://doi.org/10.3390/agriculture10120612]
-
A. Barredo-Arrieta, I. Laña, and J. Del Ser, “What Lies Beneath: A Note on the Explainability of Black-Box Machine Learning Models for Road Traffic Forecasting,” in Proceedings of the 2019 IEEE Intelligent Transportation Systems Conference (ITSC), Auckland, New Zealand, pp. 2232-2237, October 2019.
[https://doi.org/10.1109/ITSC.2019.8916985]
-
B. Lim, S. Ö. Arık, N. Loeff, and T. Pfister, “Temporal Fusion Transformers for Interpretable Multi-Horizon Time Series Forecasting,” International Journal of Forecasting, Vol. 37, No. 4, pp. 1748-1764, October-December 2021.
[https://doi.org/10.1016/j.ijforecast.2021.03.012]
- B. Kim, M. Park, J. Cho, and T. Kim, A Demand and Supply Model of Agricultural and Livestock Products for Midterm Outlook, Korea Rural Economic Institute, Seoul, Technical Report No. M103, pp. 5-6, April 2010.
-
M. H. D. M. Ribeiro and L. dos Santos Coelho, “Ensemble Approach Based on Bagging, Boosting and Stacking for Short-Term Prediction in Agribusiness Time Series,” Applied Soft Computing, Vol. 86, 105837, January 2020.
[https://doi.org/10.1016/j.asoc.2019.105837]
-
J.-J. Im, T.-W. Kim, J.-S. Lim, J.-H. Kim, T.-Y. Yoo, and W. J. Lee, “A Design and Implement of Efficient Agricultural Product Price Prediction Model,” Journal of the Korea Society of Computer and Information, Vol. 27, No. 5, pp. 29-36, May 2022.
[https://doi.org/10.9708/jksci.2022.27.05.029]
-
F. Sun, X. Meng, Y. Zhang, Y. Wang, H. Jiang, and P. Liu, “Agricultural Product Price Forecasting Methods: A Review,” Agriculture, Vol. 13, No. 9, 1671, September 2023.
[https://doi.org/10.3390/agriculture13091671]
-
G. H. H. Nayak, M. W. Alam, K. N. Singh, G. Avinash, R. R. Kumar, M. Ray, and C. K. Deb, “Exogenous Variable Driven Deep Learning Models for Improved Price Forecasting of TOP Crops in India,” Scientific Reports, Vol. 14, No. 1, 17203, July 2024.
[https://doi.org/10.1038/s41598-024-68040-3]
-
C. Sun, M. Pei, B. Cao, S. Chang, and H. Si, “A Study on Agricultural Commodity Price Prediction Model Based on Secondary Decomposition and Long Short-Term Memory Network,” Agriculture, Vol. 14, No. 1, 60, January 2024.
[https://doi.org/10.3390/agriculture14010060]
-
H. Zhou, S. Zhang, J. Peng, S. Zhang, J. Li, H. Xiong, and W. Zhang, “Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting,” in Proceedings of the 35th AAAI Conference on Artificial Intelligence (AAAI-21), Online, pp. 11106-11115, February 2021.
[https://doi.org/10.1609/aaai.v35i12.17325]
-
T. Zhou, Z. Ma, Q. Wen, X. Wang, L. Sun, and R. Jin, “Fedformer: Frequency Enhanced Decomposed Transformer for Long-Term Series Forecasting,” in Proceedings of the 39th International Conference on Machine Learning (ICML 2022), Baltimore: MD, pp. 27268-27286, July 2022.
[https://doi.org/10.48550/arXiv.2201.12740]
-
M. T. Ribeiro, S. Singh, and C. Guestrin, ““Why Should I Trust You?” Explaining the Predictions of Any Classifier,” in Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD ’16), San Francisco: CA, pp. 1135-1144, August 2016.
[https://doi.org/10.1145/2939672.2939778]
-
S. M. Lundberg and S.-I. Lee, “A Unified Approach to Interpreting Model Predictions,” arXiv:1705.07874v2, , November 2017.
[https://doi.org/10.48550/arXiv.1705.07874]
-
K. Simonyan, A. Vedaldi, and A. Zisserman, “Deep Inside Convolutional Networks: Visualising Image Classification Models and Saliency Maps,” arXiv:1312.6034v1, , December 2013.
[https://doi.org/10.48550/arXiv.1312.6034]
저자소개
2020년~현 재: 한동대학교 ICT창업학부 전공 (학사과정)
※관심분야:장기 시계열 예측(Long-Term Time Series Forecasting), 농업 데이터 마이닝(Agricultural Data Mining), 공급망 최적화(Supply Chain Optimization)
2021년~현 재: 한동대학교 ICT창업학부 전공 (학사과정)
※관심분야:데이터 분석(Data Analysis), 시계열 예측(Time Series Forecasting), 인과추론 (Causal Inference)
2010년:한동대학교 (경제학 전공, 경영학 전공, 도시환경공학 부전공)
2012년:서울대학교 일반대학원 (건설환경공학부 석사/ 세부전공: 도시계획)
2015년:도쿄대학 일반대학원 (공학계연구과 박사/ 세부전공: 도시공학)
2016년~2017년: Esri Korea, Government Sector Team, Manager
2017년~2022년: 서울대학교 강사/연구교수
2022년~현 재: 한동대학교 창의융합교육원 조교수
※관심분야:Urban Analytics, Smart Cities, Spatio-temporal Big Data Analysis, Artifical Intelligence in Urban Studies, Geographic Information System and Location Based Services