[ Article ]

Journal of Digital Contents Society - Vol. 26, No. 11, pp.3209-3216

ISSN: 1598-2009 (Print) 2287-738X (Online)

Print publication date 30 Nov 2025

Received 26 Sep 2025 Revised 24 Oct 2025 Accepted 29 Oct 2025

DOI: https://doi.org/10.9728/dcs.2025.26.11.3209

TAR: 스마트팜 센서 시계열 데이터를 위한 적응적 페널티 가우시안 NLL 기반의 실시간 이상 탐지 모델

박태원¹ ; 강창원² ; 김효석³ ; 이도훈⁴^{, *}

1부산대학교 정보융합공학과 박사과정
2농심 스마트팜사업팀 팀장
3농심 스마트팜사업팀 선임
4부산대학교 정보컴퓨터공학부 교수

TAR: A Real-Time Anomaly Detection Model Using Adaptive Penalty Gaussian NLL for Smart Farm Sensor Time Series Data

TaeWon Park¹ ; Chang-Won Kang² ; Hyo-Seok Kim³ ; DoHoon Lee⁴^{, *}

1Ph.D Student, Department of Information Convergence Engineering, Pusan National University, Busan 46241, Korea
2Team leader, Smart Farm Business Team, Nongshim, Seoul 07057, Korea
3Manager, Smart Farm Business Team, Nongshim, Seoul 07057, Korea
4Professor, School of Computer Science and Engineering, Pusan National University, Busan 46241, Korea

Correspondence to: ^*DoHoon Lee Tel: +82-51-510-2491 E-mail: dohoon@pusan.ac.kr

Copyright ⓒ 2025 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

초록

스마트팜의 안정적인 운영을 위해 센서 데이터의 실시간 이상 탐지가 필수적이지만, 가우시안 NLL(negative log likelihood)로 학습한 모델은 예측 불확실성을 과소평가는 문제로 인해 잦은 오탐이 발생해서 실제 현장에 적용이 어렵다. 본 논문은 이런 과소평가 문제를 완화하기 위해 예측된 표준편차를 손실 계산의 적응형 가중치항에 적용한 새로운 손실함수인 APG-NLL(adaptive penalty Gaussian NLL)을 제안한다. 제안된 APG-NLL로 학습된 TAR(Transformer-based DeepAR) 모델을 스마트팜 센서 데이터에 적용한 결과, 가우시안 NLL로 학습한 모델 대비 오탐을 유의미하게 감소시켰다. 이 모델을 활용하면 스마트팜 실시간 이상 탐지 시스템의 신뢰성을 높일 수 있을 것으로 기대된다.

Abstract

Real-time anomaly detection for smart farm sensor data is crucial for stable operation. However, models trained with Gaussian negative log likelihood (NLL) may underestimate prediction uncertainty, which leads to frequent false positives and complicates applications in real-world settings. To mitigate this problem, the present paper proposes a new loss function, namely adaptive penalty Gaussian NLL (APG-NLL), which applies the predicted standard deviation as an adaptive weighting term in the loss calculation. When APG-NLL was applied to a Transformer-based DeepAR (TAR) model trained on smart farm sensor data, the proposed method significantly reduced false positives, outperforming models trained with Gaussian NLL. Utilizing the TAR model could enhance the reliability of real-time anomaly detection systems for smart farms.

Keywords:

Smart Farm, Time Series, Anomaly Detection, Deep Learning, Loss Function

키워드:

스마트팜, 시계열, 이상 탐지, 딥러닝, 손실 함수

Ⅰ. 서 론

스마트팜 기술은 센서를 통해 수집되는 환경 시계열 데이터(CO₂ 농도, 온도, 습도 등)를 기반으로 작물 생육 환경을 정밀하게 제어하며 농업 생산성과 효율성을 혁신하고 있다. 그러나 센서 오류, 통신 이상, 또는 예측하지 못한 환경 변화로 인해 발생하는 데이터 이상(anomaly)은 스마트팜 시스템의 안정적인 운영을 저해하는 주요 원인이다. 이러한 이상 징후를 실시간으로 탐지하고 신속하게 대응하는 것은 스마트팜의 생산성과 자원 효율성을 극대화하기 위해 필수적이다.

최근 딥러닝 기술의 발전과 함께 시계열 예측에 특화된 인공지능 모델들이 등장하며 이상 탐지 분야에서 뛰어난 성능을 보이고 있다. 특히, 언어나 소리 등의 서열 데이터를 잘 학습하는 트랜스포머(Transformer)와 예측 분포를 통해 불확실성을 정량화하는 DeepAR(auto regressive recurrent network) 같은 모델은 시계열 예측 및 이상 탐지 분야의 유망한 접근법이 될 수 있다[1],[2]. 하지만 딥러닝 모델은 예측 분포의 불확실성을 정확하게 학습하는 과정에서 어려움을 겪는 경우가 있다. 특히, 예측 표준편차를 과도하게 줄이려는 경향은 모델이 정상 데이터를 이상으로 잘못 탐지할 수 있으며, 이는 이상 탐지 시스템의 신뢰도를 떨어뜨린다. 이러한 문제를 완화하기 위해서 예측 불확실성 모델링을 개선하는 새로운 접근법이 필요하다.

본 논문은 스마트팜 센서 시계열 데이터의 실시간 이상 탐지를 위한 TAR(Transformer-based DeepAR)를 제안하며, 다음과 같은 주요 기여를 포함한다.

• TAR 모델: 서열 데이터에 뛰어난 성능을 보이는 트랜스포머와 확률론적 예측에 강점을 가진 DeepAR 모델을 결합하여, 불확실성을 효과적으로 예측하고 이상치를 강건하게 탐지하는 모델을 개발하였다.
• APG-NLL(adaptive penalty Gaussian negative log likelihood) 손실함수: 예측 분포의 표준편차를 과도하게 축소하려는 경향을 완화하기 위해, 표준편차 자체에 따라 페널티의 크기가 조절되는 새로운 손실함수를 제안한다. 이는 모델이 예측 불확실성을 더 안정적으로 모델링하도록 유도한다.

본 논문의 연구는 스마트팜 시스템의 안정성을 높이고, 예측 기반의 이상 탐지 시스템의 신뢰도를 향상시킬 수 있을 것으로 기대된다.

Ⅱ. 관련 연구

2-1 스마트팜 관련 모델

스마트팜 분야의 인공지능 연구는 주로 농업 생산성을 향상시키고 자원 효율성을 최적화하는 데 초점을 맞추고 있다. 초기에는 작물의 수확량을 예측하거나, 특정 환경 변수와 생육 상태 간의 상관관계를 분석하는 연구가 주를 이루었다. 최근에는 딥러닝 기술인 합성곱 신경망(CNN, convolutional neural network) 모델을 이용해 작물의 질병을 조기 진단하거나 해충을 탐지하는 연구나 순환 신경망(RNN, recurrent neural network) 모델을 이용해 센서 시계열 데이터를 분석하여 생육 환경을 예측하는 연구 등이 있다[3],[4].

2-2 시계열 이상 탐지 모델

시계열 데이터에서 이상치를 탐지하는 주요 딥러닝 기법은 작동 원리에 따라 크게 재구성 기반, 생성 기반, 예측 기반의 세 가지 범주로 분류할 수 있으며, 각 방법론은 고유한 특성과 한계를 지닌다[5]. 재구성 기반 기법은 정상 시계열을 잠재 공간으로 인코딩 후 재구성하는 과정에서 재구성 오차가 큰 경우를 이상치로 판단하며, 모델이 정상 패턴의 핵심 특징만을 학습하여 비정상적인 입력의 재구성을 어렵게 만든다. 그러나 압축 과정에서 세밀한 시간적 특징이 손실될 가능성이 존재한다[6]. GAN(generative adversarial network) 구조를 활용하는 생성 기반 기법은 정상 데이터의 분포를 정교하게 학습하고, 주로 판별자 점수와 재구성 손실을 조합하여 이상치 점수를 계산한다[7]. 이런 기법은 정상 패턴에 대한 정교한 모델링이 가능하지만, GAN 모델 특유의 학습 불안정성 문제가 수반된다. 마지막으로 예측 기반 기법은 과거 서열을 기반으로 미래의 정상 상태를 예측하고 예측 오차를 이상 점수로 사용하여, 스트리밍 환경의 실시간 탐지에 유리하다[8]. 다만, 예측해야 할 미래 윈도의 길이를 최적으로 설정하는 것이 성능에 중대한 영향을 미친다는 한계가 있다. 국내 스마트팜과 축산 분야에서는 예측 기반 기법이 주로 사용되고 있으며, 시계열 예측의 오차율을 이상 탐지 허용 범위로 사용한 연구나 예측 시계열 윈도의 평균과 표준편차를 사용해 동적인 허용 범위를 계산하는 연구가 있다[9],[10]. 본 논문에서 제안하는 모델은 실시간 이상 탐지에 유리한 예측 기반 기법을 사용하며, 예측의 불확실성을 모델링하기 위해 정규분포를 예측하도록 모델을 설계하였다.

Ⅲ. 본 론

3-1 실험 대상 스마트팜

본 논문의 실험 대상 수직농장형 스마트팜은 그림 1과 같이 재배실이 약 90평 규모이며, 두 대의 메인 공조기(덕트형)와 8대의 천장형 에어컨으로 온도 및 습도를 제어하고 있다. 내부는 8개의 재배대로 구성되어 있으며 2개의 구역(A, B)으로 나누어 온도, 습도, 이산화탄소 정보를 수집하고 있다.

Fig. 1.

Diagram of the target smart farm

생육 환경 모니터링용 센서는 A구역 2번, 3번 재배대 사이와 B 구역 6번, 7번 재배대 사이에 2개가 설치되어 있다. 또한 재배대마다 양액 탱크를 설치하여 양액량을 조절하여 공급하고 있으며, 양액 탱크 안에는 전력량, 산성도, 수온 정보 수집이 가능한 센서를 설치하여 양액 정보를 확인하고 있다.

그림 2와 같이 재배대별로 설치된 제어장치를 통해 LED의 광량을 제어하여 주요 생산품인 엽채류(프릴아이스 크리스피아노) 생육에 적합한 환경을 조성하고 있으며, 해당 엽채류를 하루에 약 90kg 정도 생산하고 있다.

Fig. 2.

Vertical grow stand

3-2 TAR 모델

실시간 이상 탐지를 위한 TAR 모델은 그림 3과 같이 길이가 n인 시계열을 입력하면 각 입력 시간 단계의 다음 단계에서의 예측 시계열을 출력한다. 길이가 n+1인 출력 시계열의 각 예측은 DeepAR과 같이 정규분포의 매개변수 형태인 평균 μ과 표준편차 σ로 예측값과 예측의 불확실성을 함께 표현할 수 있다[2].

Fig. 3.

TAR model architecture

입력 시계열의 각 원소는 먼저 선형변환을 통해 d차원의 토큰 벡터 공간으로 투영(projection)된다. 입력 x에 대한 선형변환의 정의는 식 (1)과 같다.

Linear x = W x + b

(1)

이때 선형변환을 위한 행렬 W와 편향 벡터 b를 포함하고 있어 실질적으로는 아핀(affine) 변환이다. 변환된 토큰 서열 가장 앞에 서열의 시작(beginning of sequence)을 표현하는 <BOS> 토큰을 결합하며, 해당 토큰은 임의로 초기화된 다음에 학습 과정에서 최적화된다. 그리고 절대 위치 인코딩(absolute positional encoding) 정보를 토큰에 더해주는데 이는 트랜스포머가 서열을 이루는 각 토큰의 위치와 순서를 구별할 수 있도록 하기 위함이다[1].

TAR 모델의 트랜스포머 블록은 두 개의 내부 블록을 통해 식 (2)의 과정으로 실행된다.

x ← x + CausalAttention RMSNorm 1 x x ← x + MLP RMSNorm 2 x

(2)

트랜스포머 블록의 첫 번째 내부 블록은 제곱평균제곱근 정규화(RMSNorm, root mean square normalization)가 적용된 서열에 인과적 주의(causal attention)을 적용한 후 원래 서열과 더해주는 잔차 연결(residual connection)로 구성된다[11]. 두 번째 내부 블록은 첫 번째 내부 블록의 인과적 주의 부분이 다층퍼셉트론(MLP, multi layer perceptron)으로 교체된 것을 제외하면 같은 구조를 가진다.

제곱평균제곱근 정규화는 식 (3)과 같이 정의되며, 입력 서열 $X ∈ R n + 1 × d$ 의 각 토큰 벡터를 해당 벡터의 제곱평균제곱근으로 나누는 방식으로 정규화를 수행하여 학습 중에 기울기가 과도하게 커지는 것을 방지한다[12].

RMSNorm X = X i j 1 d ∑ j = 1 d X i j 2 + ϵ γ j, where ϵ > 0

(3)

이때 γ_j는 벡터의 각 원소의 크기를 조절하는 매개변수, ϵ은 0으로 나누는 것을 방지하기 위한 상수를 의미한다. 제곱평균제곱근 정규화는 기존 트랜스포머에 주로 사용하던 층 정규화(LayerNorm)와 비교해 성능은 비슷하게 유지하면서 연산량이 상대적으로 작은 장점이 있어 최근 거대언어모델 등에서 많이 사용하고 있다[13],[14].

인과적 주의는 서열에서 토큰 간의 정보교환이 발생하기 때문에 트랜스포머 블록에서 가장 핵심적인 부분이며 식 (4)와 같은 과정으로 실행된다.

Q, K, V ← Linear QKV X M ← CausalMask Q K T d X ′ ← Linear out RowSoftmax M V

(4)

먼저 입력 서열 X를 선형변환하여 X와 동일한 모양의 질의 Q, 키 K, 값 V 서열을 만들고, Q와 K 서열 간의 모든 토큰 벡터 쌍의 내적으로 이루어진 행렬 QK^T를 $d$ 로 나누어 유사도 행렬을 구한다. 여기서 k번째 예측은 과거(첫 번째 토큰에서 k-1번째 토큰까지)의 서열만 고려하도록 인과적 마스크(causal mask)를 적용하는데, 식 (5)와 같이 유사도 행렬의 하삼각 행렬 부분을 제외한 부분을 음의 무한대 값으로 변경시켜 행렬 $M ∈ R n + 1 × n + 1$ 을 만든다.

CausalMask M = - ∞, if i < j M i j, otherwise

(5)

그리고 마스크가 적용된 유사도 행렬 M에 식 (6)의 각 행에 대한 소프트맥스를 적용하면 각 행의 합이 1인 주의 가중치 행렬이 계산된다.

RowSoftmax M = exp ⁡ M i j ∑ j = 1 n + 1 exp M i j

(6)

이렇게 계산된 주의 가중치 행렬과 V를 행렬곱하고, 마지막으로 선형변환을 거치면 인과적 주의가 적용된 토큰 서열 X′이 구해진다[1].

다층퍼셉트론은 식 (7)과 같이 두 개의 선형변환 층과 하나의 비선형 활성화 층으로 구성되어 있으며, 토큰 간의 정보를 종합하는 주의 연산과 달리 각 토큰별로 복잡한 비선형적 특징을 추출한다.

MLP x = Linear 2 SiLU Linear 1 x

(7)

SiLU(sigmoid linear unit)의 정의는 식 (8)과 같으며, 입력에 시그모이드를 적용한 결과를 게이트로 사용하는 방식의 비선형 활성화 함수다[15].

SiLU x = Sigmoid x x = x 1 + exp - x

(8)

최종 예측을 위한 헤드 블록은 식 (9)와 같은 과정으로 실행된다. 트랜스포머 블록에서 출력된 토큰에 먼저 정규화를 적용한 다음에 선형변환을 통해 정규분포의 매개변수인 μ와 σ를 구한다.

x ← RMSNorm x μ ← Linear μ x σ ← Softplus Linear σ x

(9)

이때 DeepAR과 같은 방식으로 예측하는 표준편차 σ를 0보다 큰 양수로 만들기 위해서 식 (10)의 소프트플러스 함수를 추가로 적용한다[2].

Softplus x = log ⁡ 1 + exp ⁡ x

(10)

3-3 이상 탐지를 위한 손실함수

이상 탐지를 위해서 정규분포의 매개변수인 평균과 표준편차를 예측하도록 TAR 모델을 최적화해야 한다. 식 (11)은 단변량 정규분포의 확률밀도함수(PDF, probability density function)를 나타내며, 이를 통해 목표값 x가 주어지면 예측된 정규분포에서 우도를 계산할 수 있다.

GaussianPDF x μ, σ = 1 2 π σ 2 exp - x - μ 2 2 σ 2

(11)

식 (12)는 정규분포에서 음의 로그 우도 함수를 나타내며 TAR 모델 학습 시에 손실함수로 사용할 수 있다.

GaussianNLL μ, σ x = log ⁡ 2 π σ 2 2 + x - μ 2 2 σ 2

(12)

GaussianNLL의 첫 번째 항은 σ를 작게 만드는 항이며, 두 번째 항은 x와 μ간의 거리를 줄이고 σ를 크게 만드는 항이다. 하지만 그림 5에서 확인할 수 있듯이 GaussianNLL을 손실함수로 사용한 모델은 정상 데이터를 이상으로 잘못 탐지하는 FP(false positive)가 많이 발생하는 문제가 있다. 이는 학습 과정에서 모델이 우도를 최대화하기 위해 σ를 과도하게 작게 만들어 예측의 불확실성을 과소평가하는 문제로 보인다.

위에서 언급한 문제를 완화하기 위해 식 (13)과 같이 GaussianNLL의 첫 번째 항에 0보다 크고 1보다 작은 가중치 상수 λ와 예측 표준편차인 σ를 적응적 페널티로 곱한 손실함수인 APG-NLL을 제안한다.

APG - NLL μ, σ x = λ σ log ⁡ 2 π σ 2 2 + x - μ 2 2 σ 2

(13)

Ⅳ. 실험 및 결과

4-1 실험 데이터

실험을 위한 대상 스마트팜의 A 구역 센서(CO₂, 온도, 습도) 시계열 데이터는 2025년 8월 1일 자정부터 8월 29일 자정까지 총 4주간 1분 단위로 수집되었다. 시계열 데이터 수집 과정 중에 다양한 문제로 발생한 결측치는 결측 전, 후 데이터의 선형 내삽(linear interpolation)을 사용해 대체하였다.

그림 4는 전체 데이터집합과 딥러닝을 위한 데이터 분할을 보여준다. 시계열 데이터 수집 기간 중 공급용 이산화탄소가 소진되어 실제로 이상이 발생한 첫 번째 주를 테스트용, 두세 번째 주를 학습용, 네 번째 주를 검증용으로 설정하였다. 따라서 학습용과 검증용 데이터는 모두 이상이 없는 데이터다.

Fig. 4.

Visualization of dataset and split

표 1은 학습용 데이터의 3가지 센서 시계열에 대한 통계인 최소, 최대, 평균, 표준편차를 보여준다.

Table 1.

Statistics of training data

4-2 모델 학습 및 추론 방식

모델에 입력되는 시계열은 식 (14)와 같이 학습용 데이터의 평균 μ_data와 표준편차 σ_data로 표준화(standardization)하도록 전처리하였다.

Standardization x = x - μ d a t a σ d a t a

(14)

이는 입력 데이터의 평균이 0, 표준편차가 1이 되도록 만들어 딥러닝이 원활하게 수행되도록 만들어 준다. 그리고 이상 상황이 발생한 센서의 값이 다른 센서의 예측에도 영향을 주기 때문에, 3가지 센서 시계열을 하나의 다변량 모델로 학습하지 않고 같은 구조를 가지는 3개의 단변량 모델로 학습하였다.

표 2는 딥러닝을 위한 초매개변수를 보여준다. TAR 모델은 최대 60분 길이의 시계열 데이터를 입력으로 다음 1분을 포함한 최대 61분 길이의 시계열 정규분포를 출력하도록 구성하였으며, 언어 모델과 같은 자기 회귀(auto regressive) 학습 방식을 따른다. 그리고 학습 과정 중에 과적합을 방지하기 위하여 검증용 데이터에 대한 손실이 가장 낮을 때의 모델을 최종 추론용 모델로 선택하였다.

Table 2.

Hyperparameters for deep learning

TAR 모델은 다양한 길이의 시계열을 입력받거나 자기 회귀 방식으로 2분 이상의 길이의 미래 시계열도 예측할 수 있지만, 성능 측정을 위한 추론 시에는 60분 길이의 슬라이딩 윈도를 입력하는 방식으로 다음 1분의 결과를 예측하였다. 이는 TAR 모델의 목적이 장기간의 미래 시계열을 예측하는 것이 아니라 실시간으로 센서 시계열의 이상을 탐지하는 것이기 때문이다.

4-3 이상 탐지 기준과 예측 결과

평균과 분산을 알고 있는 정규분포 N(μ,σ²)에서 2시그마 규칙을 사용해 관측값이 95.45%로 떨어지는 예측 구간 [μ-2σ, μ+2σ]을 계산할 수 있다. 따라서 관측값이 예측 구간을 벗어나면 해당 데이터를 이상으로 탐지하도록 구현하였다.

그림 5의 (a)는 GaussianNLL을 손실함수로 학습한 모델 의 예측 결과이며, (b)는 APG-NLL에서 페널티 상수 λ를 0.1로 설정하고 학습한 모델의 예측 결과를 보여주는데 최초 60분의 데이터는 입력으로만 사용하므로 예측치가 없다.

Fig. 5.

Prediction result for test data

GaussianNLL을 사용한 모델은 예측 구간이 상대적으로 좁아서 짧은 시간에 급격하게 값이 변하는 구간에서 FP가 많이 발생하는 결과를 보여주었다. 반면에 APG-NLL을 사용한 모델은 상대적으로 예측 구간이 넓어서 해당 구간에서 FP를 줄인 결과를 보여주었다. 하지만 예측 구간이 너무 넓을 경우, 반대로 이상 데이터를 정상으로 잘못 탐지하는 FN(false negative)이 발생할 수 있으므로 데이터집합에 적합한 초매개변수 λ를 찾아야만 한다.

표 3은 GaussianNLL과 여러 가지 λ를 적용한 APG-NLL로 학습한 모델을 사용해 이상이 없는 검증용 데이터에 대해 1단계 예측 성능을 MAPE와 FP로 보여준다. 식 (15)는 평균절대백분율오차(MAPE, mean absolute percentage error)의 정의이며, L은 예측에 사용된 시계열의 길이를 의미한다.

MAPE x i, μ i = 1 L ∑ i L x i - μ i x i

(15)

Table 3.

1-step prediction performances for validation data

GaussianNLL을 사용한 모델과 비교해서 APG-NLL을 사용한 모델은 예측 능력이 조금 감소하지만, 정상 데이터에 대한 FP가 확실히 줄어든 것을 확인할 수 있다.

표 4는 실제로 이상 상황이 발생했던 테스트용 CO₂ 데이터에 대한 이상 탐지 성능을 식 (16), 식 (17), 식 (18)의 정밀도(precision)와 재현율(recall), F₁ 점수로 나타낸 것이며, TP(true positive)는 이상으로 탐지한 데이터가 실제로 이상인 경우를 의미한다.

Precision = TP TP + FP

(16)

Recall = TP TP + FN

(17)

F 1 = 2 Precision - 1 + Recall - 1 = 2TP 2 TP + FP + FN

(18)

Table 4.

Anomaly detection performances for test CO2 data

GaussianNLL을 사용한 모델은 정밀도가 0.912로 해당 데이터에서 탐지한 이상 중에 약 8.8%가 FP인 결과를 보여주었다. 반면에 APG-NLL을 사용한 모델은 전체적으로 재현율이 약간 낮아졌지만 높은 정밀도로 FP를 제거하는 결과를 보여주었다. 또한 정밀도와 재현율을 모두 고려한 F₁ 점수에서 APG-NLL의 초매개변수 λ를 0.1로 설정한 모델이 가장 좋은 이상 탐지 성능을 보여주었다.

본 연구에서 TAR 모델의 추론 시간 측정은 Intel Core i7-13700 CPU, 16GB RAM 및 Windows 11 운영체제로 구성된 환경에서 수행되었다. GPU를 사용하지 않은 환경에서, TAR 모델은 60분 길이의 입력 데이터를 처리하는 데 약 58 마이크로초가 소요되는 것으로 확인되었다. 이러한 추론 성능은 스마트팜 센서의 이상을 실시간(1분 단위)으로 탐지하는 본 연구의 목표를 달성하기에 충분한 것으로 판단된다.

Ⅴ. 결 론

본 연구에서는 실시간 이상 탐지를 위해 시계열 값을 입력하면 다음 단계를 불확실성을 고려한 정규분포 형태로 예측할 수 있는 TAR 모델을 설계하였다. TAR는 2시그마 규칙을 사용해서 예측 구간을 구하고 관측값이 예측 구간을 벗어나면 이상으로 탐지하는 방식을 사용한다. GaussianNLL을 손실함수로 사용해 학습한 모델은 실험에서 정밀도가 낮아 정상적인 상황에서 잘못된 이상 탐지가 많이 발생하는 결과를 보였으며, 실세계의 스마트팜 관리에서 이런 모델은 사용하기 힘들다. 반면에 제안하는 APG-NLL로 학습한 TAR 모델은 정밀도가 높아서 잘못된 이상 탐지를 줄이면서도 재현율을 많이 낮추지 않는 장점이 있다.

APG-NLL은 표준편차 자체를 적응적 가중치로 적용하였지만, 여전히 적절한 페널티 상수를 설정할 필요가 있다. 또한 APG-NLL은 TAR 모델의 정밀도를 높이면서 재현율을 낮추기 때문에 약한 수준의 이상 상황을 놓치는 단점을 가지고 있다. 향후 이런 문제들을 개선하기 위한 추가적인 실험이나 연구가 필요하다고 생각된다.

References

A. Vaswani, N. Shazeer, N. Parmar, J. Uszkoreit, L. Jones, A. N. Gomez, ... and I. Polosukhin, “Attention is All You Need,” in Proceedings of the 31st International Conference on Neural Information Processing Systems, Long Beach: CA, pp. 6000-6010, 2017. [https://doi.org/10.5555/3295222.3295349]
D. Salinas, V. Flunkert, and J. Gasthaus, “DeepAR: Probabilistic Forecasting with Autoregressive Recurrent Networks,” arXiv:1704.04110, , 2019. [https://doi.org/10.48550/arXiv.1704.04110]
Y. Ko, H. Lee, H. Jeong, L. Yu, and N. Kim, “Deep Learning-Based System for Plant Disease Detection and Classification,” Smart Media Journal, Vol. 12, No. 7, pp. 9-17, August 2023. [https://doi.org/10.30693/SMJ.2023.12.7.9]
C.-H. Park, S.-H. Lee, M.-J. Lee, J.-Y. Kim and G.-H. Yu. “Smart Farm Sensor Data and Deep Learning Prediction Models for Strawberry Growth in All Seasons,” Journal of Digital Contents Society, Vol. 25, No. 2, pp. 557-565, 2024. [https://doi.org/10.9728/dcs.2024.25.2.557]
P. Boniol, Q. Liu, M. Huang, T. Palpanas, and J. Paparrizos, “Dive into Time-Series Anomaly Detection: A Decade Review,” arXiv:2412.20512, , 2024. [https://doi.org/10.48550/arXiv.2412.20512]
C. Lee, S. An, J. Kim, and H. Ahn, “Sensor Anomaly Detection System in Greenhouse-Type Smart Farm Using Environmental Data,” Journal of the Korean Data and Information Science Society, Vol. 32, No. 6, pp. 1237-1248, 2021. [https://doi.org/10.7465/jkdi.2021.32.6.1237]
S. Y. Chung and S. C. Kim, “Anomaly Detection in Livestock Environmental Time Series Data Using LSTM Autoencoders: A Comparison of Performance Based on Threshold Settings,” Smart Media Journal, Vol. 13, No. 4, pp. 48-56, 2024. [https://doi.org/10.30693/SMJ.2024.13.4.48]
C. Zhang, D. Song, Y. Chen, X. Feng, C. Lumezanu, W. Cheng, ... and N. V. Chawla, “A Deep Neural Network for Unsupervised Anomaly Detection and Diagnosis in Multivariate Time Series Data,” in Proceedings of the AAAI Conference on Artificial Intelligence, Vol. 33, No. 1, pp. 1409-1416, 2019. [https://doi.org/10.1609/aaai.v33i01.33011409]
J. Audibert, P. Michiardi, F. Guyard, S. Marti, and M. Zuluaga, “USAD: UnSupervised Anomaly Detection on Multivariate Time Series,” in Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, pp. 3395-3404, 2020. [https://doi.org/10.1145/3394486.3403392]
K. Banerjee, B. Gupta, M. Maheshwari, L. Parsai, G. Vudata, S. Dasgupta, and A. Chatterjee, “Real-time Anomaly Prediction at Scale Using Anomaly Detection Augmented with Regression,” in Proceedings of the 8th International Conference on Data Science and Management of Data, Jodhpur: India, pp. 183-191, 2025. [https://doi.org/10.1145/3703323.3703716]
K. He, X. Zhang, S. Ren and J. Sun, “Deep Residual Learning for Image Recognition,” in Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition, Las Vegas: NV, pp. 770-778, 2016. [https://doi.org/10.1109/CVPR.2016.90]
B. Zhang and R. Sennrich, “Root Mean Square Layer Normalization,” in Proceedings of the 33rd International Conference on Neural Information Processing Systems, Vancouver: Canada, pp. 12381-12392, 2019. [https://doi.org/10.5555/3454287.3455397]
J. L. Ba, J. R. Kiros, and G. E. Hinton, “Layer Normalization,” arXiv:1607.06450, , 2016. [https://doi.org/10.48550/arXiv.1607.06450]
Z. Jiang, J. Gu, H. Zhu, D. and Z. Pan, “Pre-RMSNorm and Pre-CRMSNorm Transformers: Equivalent and Efficient Pre-LN Transformers,” in Proceedings of the 37th International Conference on Neural Information Processing Systems, New Orleans: LA, pp. 45777-45793, 2023. [https://doi.org/10.5555/3666122.3668105]
D. Hendrycks and K. Gimpel, “Gaussian Error Linear Units (GELUs),” arXiv:1606.08415, , 2016. [https://doi.org/10.48550/arXiv.1606.08415]

저자소개

박태원(TaeWon Park)

2013년：부산대학교 대학원(컴퓨터공학 석사)

2015년～2021년: 부산대학교 강사

2022년～2024년: 동명대학교 조선해양시뮬레이션센터 책임원구원

2025년～현 재: 부산대학교 정보융합공학과 대학원 박사과정

※관심분야：컴퓨터 과학 및 공학, 인공지능 등

강창원(Chang-Won Kang)

2007년：강원대학교 대학원(농학석사)

2007년～현 재: ㈜농심

※관심분야：스마트팜(Smartfarm), 그린바이오(Green-Bio), 자동화 & AI(Automation & AI) 등

김효석(Hyo-Seok Kim)

2011년：수원대학교(전기공학 학사)

2022년～현 재: 농심 스마트팜사업팀

※관심분야：전기도면 설계, 제어프로그램 설계(PLC, HMI) 등

이도훈(DoHoon Lee)

1992년：부산대학교 대학원(전산학 석사)

1998년：부산대학교 대학원(컴퓨터공학 박사)

2017년～2023년: IEEE Region10 Busan section Chair

2019년～2021년: 부산대학교 컴퓨터 및 정보통신연구소장

2006년～현 재: 부산대학교 정보컴퓨터공학부 교수

2023년～현 재: 양산부산대학교병원 의료빅데이터센터장

※관심분야：컴퓨터 비전, 데이터 분석, 장면이해(Scene understanding), 비디오 예측 등

Sensor	Min	Max	Mean	SD
CO₂ (ppm)	493	662	554	32.9
Temperature (℃)	17.6	23.3	20.4	1.56
Humidity (%)	59.2	88.3	74.4	6.36

Optimizer	Adam
Learning rate	0.001
Number of iterations	1,000
Batch size	4,096
Max length of input sequence	60
Length of token vector	16
Number of transformer blocks	1
Length of hidden vector	64

Sensor	Gaussian NLL		APG-NLL
	Gaussian NLL		λ=1.0		λ=0.1		λ=0.01
	MAPE	FP	MAPE	FP	MAPE	FP	MAPE	FP
CO₂	0.71	666	0.73	1	0.79	0	0.83	0
Temperature	0.32	585	0.36	0	0.40	0	0.37	0
Humidity	0.72	995	0.81	62	0.71	1	0.80	0

Metric	Gaussian NLL	APG-NLL
Metric	Gaussian NLL	λ=1.0	λ=0.1	λ=0.01
Precision	0.912	1.000	1.000	1.000
Recall	0.909	0.842	0.856	0.839
F₁ score	0.911	0.914	0.923	0.913