Korea Digital Contents Society
[ Article ]
Journal of Digital Contents Society - Vol. 25, No. 7, pp.1883-1890
ISSN: 1598-2009 (Print) 2287-738X (Online)
Print publication date 31 Jul 2024
Received 02 Jun 2024 Revised 09 Jul 2024 Accepted 19 Jul 2024
DOI: https://doi.org/10.9728/dcs.2024.25.7.1883

인공지능 냉장고 내 보관된 음식재료 폐기처분 여부를 결정하는 QSLT 학습 알고리즘에 관한 연구

서성현*
단국대학교 SW융합대학 소프트웨어학과 겸임교수
A Study on QSLT Learning Algorithm That Determines Whether to Dispose of Food Materials Stored in an Artificial Intelligence Refrigerator
Sung-Hyun Seo*
Adjunct Professor, College of SW Convergence, Dankook University, Gyeonggi-do 16890, Korea

Correspondence to: *Sung-Hyun Seo E-mail: sshyun1472@nate.com

Copyright ⓒ 2024 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

초록

본 논문은 인공지능 냉장고 내 보관된 음식재료 폐기처분 여부를 결정하는 QSLT 학습 알고리즘에 관한 것으로, 음식재료의 유통기한을 대상으로 현재 상태에서의 최적 가치 함수를 계속적으로 학습해 감으로써 주어진 현재 상태에 관한 최적의 행동을 선택할 수 있도록 반복적 학습을 통해 최적 가치 함수 QSLT(s, a)를 찾는다. 최적 가치 함수를 찾게 되면, 이를 사용해 최적 정책을 추론해 낼 수 있다. 즉, 본 논문은 미리 정해진 유통기한 중 구매한 음식재료가 인공지능 냉장고 내 보관되어 아직 사용 전 상태에 있다 하더라도 음식재료의 생물학적 부패현상의 급변화로 인해 어쩔 수 없이 폐기처분해야 하는 경우에 인지된 폐기처분 시점 즉, 현재시점(tP)을 정확히 파악해 낸 다음, FPt(식품유효 기한), Tslt*(식품유용 가치율)을 파라미터로 삼아 생물학적 부패가 시작된 음식재료를 대상으로 폐기처분 여부를 명확히 결정할 수 있도록 하는 QSLT 학습 알고리즘을 제안한다.

Abstract

In this study, we discuss a QSLT learning algorithm that determines whether to dispose of food materials stored in an artificial intelligence refrigerator. It continuously learns the optimal value function in the current state based on the expiry date of the food materials to determine the given current state. The optimal value function QSLT(s, a) is determined through iterative learning so that the optimal action can be selected. Once the optimal value function is determined, it can be used to infer the optimal policy. In other words, we highlight that even if food ingredients purchased within a predetermined expiry date are stored in an artificial intelligence refrigerator and are still in a state before use, they must inevitably be disposed of due to rapid changes in the biological decay of food ingredients. The point of disposal, that is, the current point in time (tP), is accurately identified. Then, we propose a QSLT learning algorithm that uses FPt (food expiration date) and Tslt*(food useful value ratio) as parameters to determine whether to dispose of food materials that have started undergoing biological decay.

Keywords:

Optimal Value Function, Food Expiration Date, A.I. Refrigerator, Food Ingredients, Food Utility Value Rate

키워드:

최적 가치 함수, 식품유효 기한, 인공지능 냉장고, 음식재료, 식품유용 가치율

Ⅰ. 서 론

본 논문은 미리 정해진 유통기한 중 구매된 음식재료가 인공지능 냉장고 내 보관되어 아직 사용 전 상태에 있다 하더라도 하고 어쩔 수 없이 폐기처분해야 하는 입장을 고려할 때 폐기처분 시점을 정확히 파악해 인공지능 냉장고 내 보관된 음식재료들 중 유통기한이 얼마남지 않아 폐기처분해야 할지 여부를 명확히 결정해 주는 QSLT 학습 알고리즘을 제안하고자 한다.

냉장고는 음식재료를 저장하는 저장공간인 것으로, 냉매를 순환시켜 열교환을 하는 냉장 싸이클에 의해 음식재료를 저온으로 냉장 혹은 냉동시켜 장기 보관할 수 있도록 하는 저장창고이다.

최근의 냉장고에 관한 연구논문은 음식재료를 저장하고 보관하는 한정된 기능에서 벗어나 사물인터넷(Internet of Things, IoT) 기술을 기반으로 한 정보입력 기능이나 디스플레이 기능을 접목시켜 음식재료 관리의 어려움을 해결하기 방안들을 꾸준히 연구 중에 있다 할 것이다[1].

관련 연구로는 냉장고 전면에 스크린을 달아 냉장고 안의 냉장 및 냉동 보관 환경 및 음식재료의 보관 상태를 모니터링하는 것에 관한 연구[2], 단순 인터넷 접속 기능과 가정 내 비치된 가전들 간의 연동 기능만을 제공했던 것은 물론 냉장고 내 설치된 스캐너를 활용해 RFID(Radio Frequency Identification, 전파주파수 인식기)태그가 부착된 공산품과 (재)포장된 음식물에 관한 유통이력 정보를 빠르게 알려주고, 냉장고 내 보관된 위치까지도 쉽게 제공해 주는 RFID 기반의 물품 정보 관리 시스템에 관한 연구 등이 있겠다[3].

또한, 4차 산업 관련 분야 중 하나인 IoT 기술을 접목시킨 냉장고는 스마트 홈 분야를 더욱 발전시키는데 충분히 기여하였다 할 것이다[4].

사물인터넷을 접목시킨 여럿 관련 제품들은 WiFi (Wireless Fidelity, 무선 데이터 전송) 통신 환경하에서 단순히 리모컨 역할만 수행한 것에 그친 것이 아니라, 인공지능의 머신러닝 기술을 결합시킨 융합 기술을 계속 선보면서 최신 가전제품 산업의 고도화를 이루는데 충분히 뒷받침해 주는 동력원으로 급부상했음을 알 수 있겠다[5].

스마트 홈 환경에 적용된 인공지능은 사용자의 효율적인 제품 조작을 지원한다[6]. 더불어, 사물인터넷, 인공지능, 빅데이터 등은 센서 기술을 통한 데이터와의 관련성이 매우 높기 때문에 서로 유기적인 연관성이 깊다고 하겠다[7].

데이터가 축적하기 위한 인터넷 사용 과정에서도 사물인터넷, 인공지능, 빅데이터를 화두로 한 다양한 알고리즘들이 WiFi 뿐만 아니라 클라우드 통신망 환경에서도 크게 활용되었다 말할 수 있을 것이다[5].

그에 따라, 인공지능 냉장고는 로봇팔 구동부를 이용해 폐기처분 대상 음식재료만을 대상으로 인공지능 냉장고 내 선반 전면부 쪽으로 위치 이동시켜 사용자의 빠른 소진을 유도케 하거나, 폐기처분 경고 메시지를 생성시켜 인공지능 냉장고의 도어 전면에 설치된 디스플레이부에 표출 또는 사용자 통신 단말기에 전달해 폐기처분 대상 음식재료에 대한 알림 기능을 수행하게 되기도 할 것이다.


Ⅱ. 클라우드 운영관리 시스템 상의 인공지능 냉장고

2-1 시스템 구성

본 논문의 QSLT 학습 알고리즘이 적용되는 인공지능 냉장고는 다음과 같은 시스템 구성으로 이루어진다. 그림 1은 폐기처분 대상 음식재료 검출용 인공지능 냉장고를 지원하는 클라우드 운영관리 시스템을 설명하기 위한 예시도이다.

Fig. 1.

System diagram

즉, QSLT 학습 알고리즘으로 활용해 폐기처분 대상 음식재료를 검출해 내는 인공지능 냉장고를 지원하는 클라우드 운영관리 시스템은 인공지능 냉장고, 크라우딩 운영관리 서버, 사용자 통신 단말기 및 적어도 하나의 이웃 통신 단말기로 이루어지며, 이 중 인공지능 냉장고는 식재료 촬영부, 디스플레이부 및 로봇팔 구동부로 구성된다.

인공지능 냉장고는 음식재료마다 각기 다른 자기만의 고유한 생물학적 특성을 내포하고 있어 이를 고려해 냉장 칸에 보관할 것인지 아니면 냉동 칸에 보관할 것인지 구분해야 할 것이다.

음식재료가 냉장 칸 혹은 냉동 칸에 들어가 보관됨에 따라, 식재료 촬영부는 냉장 칸 또는 냉동 칸에 보관된 음식재료를 디텍팅 및 Zoom-in, Zoom-out과 같은 포커싱 동작을 하면서 밀착 촬영을 반복 실행하여 음식재료 영상정보를 생성시킨다.

이때, 크라우드 운영관리 서버는 식재료 촬영부와 기연결된 클라우드 통신망으로부터 음식재료 영상정보를 전달받은 후, 음식재료 영상정보를 토대로 딥러닝을 활용해 음식재료의 품목명과 유통기한을 데이터베이스로부터 찾아내어 이를 인공지능 냉장고에 정보 제공해 준다.

디스플레이부는 음식재료의 품목명과 유통기한을 화면 디스플레이한다.

크라우드 운영관리 서버는 VLDB(Very Large Database)내 저장된 다양한 음식재료에 관한 빅데이터 정보를 참조하며, 클라우드 통신망을 거쳐 전달된 음식재료 영상정보를 기초로 텐서플로우 기법으로 강화 학습시켜 음식재료에 관한 품목명을 정확히 판별한다.

인공지능 냉장고는 품목명이 확정된 음식재료를 대상으로 유통기한을 지속적으로 모니터링함으로써, 음식재료가 소진되었는지를 파악하거나 아니면 아직 보관 중 상태인지를 파악한다.

또한, 인공지능 냉장고가 유통기한이 얼마남지 않은 음식재료에 한해 음식재료의 영상 이미지를 디스플레이부에크게 표시케 해 사용자로 하여금 디스플레이부 상에 나타난 로봇팔 호출 아이콘이 터치되도록 할 시, 냉장-냉동 칸 영역 상단의 슬라이드 도어가 오픈되면서 냉장 칸 혹은 냉동 칸 영역 상단에 은폐·엄폐 형태로 감춰진 로봇팔 구동부는 냉장 칸 또는 냉동 칸으로 내려오면서 자동 노출 및 구동을 시작한다.

즉, 로봇팔 구동부의 구동에 따라 상하좌우로 움직이는 양팔 머신은 음식재료를 들어올려 인공지능 냉장고 내 선반 전면부까지 이동해 안착할 수 있도록 수평을 유지하면서 동작한다.

다만, 음식재료가 선반 전면부로 옮겨지기 전에 인공지능 냉장고는 음식재료 크기와 대비해 제 1 물리적 위치(기존 위치)에서 제 2 물리적 위치(선반 전면부)로 위치 변경해도 될 만한 공간 넓이를 갖고 인지를 비교 판단해야 할 것이다. 다시말해, 제 2 물리적 위치의 공간 넓이가 이 음식재료의 사이즈보다 커야 할 것임을 전제로 한다.

로봇팔 구동부의 양팔 머신은 냉장(동)온도에 상관없이XYZ축 기준 360도 회전, 상하좌우 움직임이 가능해야 할 것임을 전제로 한다.

사용자 통신 단말기와 적어도 하나의 이웃 통신 단말기는 PDA, 스마트폰, 스마트 패드, 태블릿 PC 중 하나인 것으로, 인공지능 냉장고를 원격 제어하기 위한 용도로 크라우드 운영관리 서버로부터 다운로드받은 “나의 냉장고 관리전용 앱 컨텐츠”를 소장한다.

특히, 사용자 통신 단말기는 나의 냉장고 관리전용 앱 컨텐츠로 로봇팔 구동부를 원격 제어해 음식재료를 제 1 물리적 위치에서 제 2 물리적 위치로 이동시킬 수 있으며, 식재료 촬영부로부터 제공되는 냉장 칸-냉동 칸의 현재 상태를 상시 모니터링한다.

이웃 단말기는 인공지능 냉장고 내 보관된 음식재료를 제 3 자 관찰자 시점에서 인지할 수 있어, 사용자의 식습관, 레시피, 음식 섭취 패턴 및 편식정도를 미리 유추해 볼 수 있고 사용자의 현 건강상태를 언제든 조언해 줄 수 있는 조력자 역할도 가능한 IoT 시스템 환경을 지원받는다.

2-2 나의 냉장고 관리 전용 앱 컨텐츠

인공지능 냉장고는 식재료 본연의 맛을 유지토록 하기 위해 온오프 마켓을 통해 구매한 음식재료를 냉장 칸(B, C) 또는 냉동 칸(A, D)으로 정해놓은 A, B, C, D 공간 영역 중 하나, 그 이하에 속한 세부 공간 중 하나에 냉장 혹은 냉동 보관한다.

나의 냉장고 관리 전용 앱 컨텐츠는 크라우드 운영관리 서버에서 요청한 회원인증 절차를 거쳐 실제 소유권자가 사용자임을 검증받아 사물인터넷(IoT)을 위한 고유 IP정보를 부여받는다.

나의 냉장고 관리 전용 앱 콘텐츠는 사물인터넷(IoT) 접속을 통해 인공지능 냉장고 상의 음식재료 보관 전(前)부터 음식재료를 보관하고 있는 현재까지의 음식재료 파악 영상정보를 언제든 볼 수 있다.

나의 냉장고 관리 전용 앱 콘텐츠는 인공지능 냉장고 구조를 그래픽으로 모델링한 후 화면 제공하며(그림 2), 냉장 칸(B, C) 및 냉동 칸(A, D) 즉, A, B, C, D 공간 중 A 공간 영역을 화면 터치할 시, A 공간 영역 이하의 A 세부 공간 영역(AC-1, AC-2, AC-3, AD-1, AD-2, AD-3)을 화면 디스플레이한다.

Fig. 2.

Refrigerator internal monitoring screen using contents of an app dedicated to my refrigerator management


Ⅲ. 인공지능 냉장고 내 보관된 음식재료 폐기처분 여부를 결정하는 QSLT 학습 알고리즘

3-1 QSLT 학습 알고리즘

본 논문은 인공지능 냉장고 내 보관된 음식재료의 유통기한을 탐지한 후 이를 바탕으로 유통기한 만료일이 도래될만한 음식재료를 대상으로 한 구매한 날로부터 인공지능 냉장고에 보관 중에 있는 음식재료가 생물학적으로 부패하기 시작한 현재시점(tp)을 알아내고, 그로부터 파악된 FPt(식품유효 기한) 및 유통기한(Tslt)를 중요 파라미터를 근거로 삼아 음식재료에 대한 폐기처분 여부를 명확히 결정하는 QSLT 학습 알고리즘(Q-Leaning Algorithm reflected SLT)을 제안하고자 한다.

기존의 Q-러닝(Leaning) 알고리즘[8],[9]은 에이전트가 특정 상태에서 특정 행동을 선택할 때, 그 행동의 가치를 나타내는 Q 값을 추정하는 것이다. 이 추정된 Q 값은 다음과 같은 벨만 최적 방정식(Bellman Optimality Equation)에 기반한 것으로 수식 (1)과 같이 정의할 수 있다.

Qs,a1-LQs,a+Lr+γmaxa'Qs',a'(1) 

Q(s,a)는 상태 s에서 행동 a를 선택할 때의 예상가치를 나타내는 함수이다.

여기서, L : 새로운 정보를 얼마나 빨리 받아들일지를 확률로써 결정하는 학습률(learning rate)

r : 상태 s에서 행동 a를 취했을 때 받는 현재 보상(present reward)

γ는 미래 보상에 대한 가중치를 나타내는 할인 인자(discount factor)로, 0≤γ≤1

s′는 행동 a를 취한 후에 도달한 다음 상태

a′는 다음 상태에서 선택된 행동

maxa′′​Q(s′, a′)는 다음 상태에서 가능한 모든 행동에 대한 가치의 최댓값

벨만 최적 방정식은 강화 학습의 주요 알고리즘 중 하나로, 강화 학습에서 사용되는 Q-러닝(Q-learning) 알고리즘의 업데이트 규칙을 나타내며, 표 1에서 같이 Q 함수의 값을 업데이트하는 규칙을 보여준다.

Initial parameters for the QSLT learning algorithm

이것은 이전의 추정치를 새로운 정보로 조금씩 조정함으로써 점진적으로 학습하는 것을 나타냄을 의미하며, 이전 값에 현재 보상과 다음 상태에서의 최대 Q 값의 가중 평균을 취한다.

이러한 업데이트는 새로운 경험을 토대로 Q 함수를 조정하여 점진적으로 더 나은 정책을 학습하는데 사용된다.

Q-러닝 알고리즘은 특히 환경 모델이 주어지지 않은 경우에도 사용할 수 있는 모델-프리(model-free) 방법으로, 재귀적으로 최적 가치 함수를 정의한다.

본 논문은 음식재료의 유통기한을 대상으로 현재 상태에서의 최적 가치 함수를 계속적으로 학습해 감으로써, 주어진 현재 상태에 대한 최적의 행동을 선택할 수 있도록 하는 것이다. 즉, 학습을 통해 이를 반복하여 최적 가치 함수를 찾는다. 최적 가치 함수를 찾으면, 이를 사용하여 최적 정책을 추론해 낼 수 있음을 제안한다.

유통기한이란 “제품의 제조일로부터 소비자에게 판매가 허용되는 기한”이라고 나타내고 있다. 즉 유통기한은 개념상 판매기한을 의미하는 “Sell by date”를 나타내는 것으로 이는 “소비기한”과 구별되는 개념이다[11].

본 논문에서 제안하는 QSLT 학습 알고리즘은 부패의 우려가 다분히 있을 음식재료의 유통기한 정보 혹은 생물학적 폐기 처분기한 정보로부터 인지된 유통기한(SLT, Shelf Life Time : Tslt)에 의해 γ 값을 저해시키는 요소로 작용한다고 하겠다. 즉, γ 는 미래의 보상을 현재 가치로 환산하는 매개변수로써, 음식재료를 대상으로 한 보관 기한 만료일이 도래할수록 반비례적인 추세를 나타내며 미래의 보상을 감소시킨다고 할 것이다.

유통기한과 할인 인자 간의 관련성은 다음과 같다.

유통기한이 짧게 남은 음식재료 : 유통기한이 짧은 남은 음식재료는 빠르게 할인 인자를 감소시킴.

유통기한이 길게 남은 음식재료 : 유통기한이 길게 남은 음식재료는 할인 인자를 큰 변동없이 그대로 유지시킴.

γ는 미래 보상에 대한 가중치를 조절하는 중요 파라미터로, 0≤γ≤1로 추산할 수 있다. 즉, γ는 음식재료를 구매한 날을 최대값 1로 본다면 그날로부터 음식재료에 대한 가용성이 시간에 따라 점점 줄어들 것이고 유통기한이 만료되는 날을 최소값 0으로 설정할 수 있다 하겠다.

FPt=Tslt-tptpTstt (2) 

FPt(식품유효 기한)은 수식 (2)와 같이 음식재료의 구매일부터 유통기한 만료일까지의 기간인 유통기한(Tslt)에서 음식재료의 구매일부터 인공지능 냉장고에 보관 중 상태에 있는 현재시점(tP)을 뺀 잔여 일자가 식품처분 가능기간이다[9],[10].

Tslt*식품유용 가치율=FPt/Tslt *100(3) 

따라서, Tslt*(식품유용 가치율)는 음식재료를 대상으로 미래 보상에 대한 가중치를 나타내는 할인 인자 γ 을 대체하는 중요 파라미터라 할 것이고, 수식 (3)처럼 FPt(식품유효 기한)을 Tslt(유통기한)으로 나누게 되면 식품유용 가치가 생성되고 이를 확률적 개념을 갖도록 %율로 적용하면 비로소, 음식재료가 유통기한 동안에 자신이 가지고 있는 수율(다시말해, 자기만의 고유 생존 수명율)을 얼마나 유지한 채로 보관할 수 있는가를 알려주는 척도인 Tslt*을 구할 수 있다.

이는 SLT가 반영된 Q-학습 알고리즘이 수식 (4)와 같이 성립됨을 의미한다고 할 것이다.

QSLTs,a1-LQs,a+Lr+Tslt*maxa'Qs',a'(4) 

Tslt*이 1에 가까울수록 식재료를 사용할만한 미래의 보상가치율은 최대가 되고, 0에 가까울수록 미래에 보상받을 수 있는 확률은 매우 낮아 음식재료를 더 이상 보관해 두어서는 안된다고 할 것이다. 다시말해, 유통기한 만료일이 도래되는 음식재료는 소비자의 건강을 위해 폐기 처분해야 함을 의미한다고 하겠다.

본 논문은 γ(할인인자) 대신 Tslt*(식품유용 가치율)를 반영함으로써 유통기한 만료일이 도래되는 시점까지 시간에 따라 최적 가치 함수 QSLT(s, a)를 찾을 수 있다. 최적 가치 함수를 찾으면, 이를 사용하여 음식재료에 대한 최적 정책을 추론해 낼 수 있다고 하겠다. 즉, 최적 가치 함수 Q(s, a)가 점진적으로 하락 추세를 띈다는 점을 예상해 볼 수 있음을 파악해 수율(收率)면에서 음식재료가 감가 상각되더라도 상대적인 측면에서 접근시 최적 가치 함수 Q(s, a)가 (-)지수 함수적으로 기울기가 급변하기 前 상대 최적값을 가리키는 골든 타임을 찾아낼 수 있다.

3-2 QSLT 학습 알고리즘에 관한 모의실험

본 논문의 인공지능 냉장고 내 보관된 음식재료에 관한 폐기처분 여부를 결정하는 QSLT 학습 알고리즘은 특정 음식재료, 그 예로써 ‘삼각김밥’의 유통기한 48시간일 경우에 FPt(식품유효 기한)와 Tslt*(식품유용 가치율)을 각각 구한다[12].

그림 3, 4에서 보듯이, 삼각김밥의 FPt(식품유효 기한)은 유통기한(Tslt) 48시간 중 현재시점((tP) 즉, 약 29.04시간 정도에서 기울기의 변화가 급격히 일어나 아래로 내려오는 지수적인 추세를 갖음을 파악할 수 있다.

Fig. 3.

FPt(food expiration date) of triangle gimbap

Fig. 4.

Tslt*(food utility value ratio) of triangle gimbap

Tslt*(식품유용 가치율)은 유통기한(Tslt) 48시간 중 약 29.04시간이 가리키는 현재시점(tP)에서 약 83.94%일 때 급격히 하락추세로 바뀐다는 사실을 알 수 있다.

이외로, 임계점(삼각김밥만의 수율 하락으로 폐기처분을 강제적으로 결정해야만 하는 시점)은 약 41.68시간대이다.

또한, 현재시점(tP) 약 29.04시간 대비 삼각김밥의 FPt(식품유효 기한)는 약 40.26의 값을 나타냄을 고려해 본 결과, 삼각김밥의 FPt 지수곡선과 순간 지나가며 해당 포인트(40.26, 29.04) 상의 가로 평행선과 이루는 제 1 위상각은 수식 (5)에 대입해 보더라도 약 58°의 각도를 유지함을 알 수 있다. 따라서, 이는 삼각김밥의 Tslt*(식품유용 가치율)을 찾아내는데 현재시점(tP)과 함께 매우 중요한 파리미터라 할 것이다.

ϕ1=TSLT-tPTSLT×360(5) 

또한, 삼각김밥의 Tslt*(식품유용 가치율)은 현재시점(tP) 약 29.07시간일 때, 약 83.94% 정도를 나타냄을 알 수 있겠다.

삼각김밥의 Tslt* 지수곡선이 순간적으로 지나가며 해당 포인트(83.94, 29.07)을 통과해 해당 포인트 상의 가로 평행선과 이루는 제 2 위상각 역시 수식 (6)에 대입해 보듯이 약 58°의 각도를 형성한다는 것도 알아냈다.

ϕ2=100-TSLT*100×360(6) 

본 논문에서 SLT가 반영된 Q-학습 알고리즘은 삼각김밥의 FPt(식품유효 기한)와 삼각김밥의 Tslt*(식품유용 가치율)을 알아내는 것이 핵심사항이다.

그에 따라, Tslt*이 반영된 최적 가치 함수인 QSLT(s, a)을 각각 구하고 기존 Q(s, a)과 QSLT(s, a)와의 대비를 통해 음식재료를 대상으로 한 폐기처분 여부를 결정함에 있어 QSLT(s, a)의 예상가치를 반드시 고려해야 함을 알려 음식재료마다 미리 정해놓은 유통기한(Tslt) 중에 QSLT(s, a)의 예상가치가 생물학적 부패현상으로 급변해져 인공지능 냉장고가 음식재료를 실질적으로 폐기처분해야 하는 실제폐기 처분일 즉, 현재시점(tP)을 정확히 파악해 냄으로써, 폐기처분 결정에 대한 명확성을 확고히 할 수 있음을 의미한다.

그림 5에 도시된 파란색 선은 삼각김밥이 변질될 가능성이 높아보여 부패 염려되는 특정 상태에 대한 가치분을 기존의 Q-학습 알고리즘을 적용해 Q값을 산출한 결과이다. 48시간의 삼각김밥의 유통기한에서 기준 약 10.58시간 지난 후엔 Q값이 더 이상 변동되지 않고 그대로 유지되거나 하락을 시작하는 추세 꺾임 현상이 일어난다. 다시말해, 부패가 일어나는 시점이 약 10.58시간 이후일 것이라 추정해 본 것이라 하겠다[10].

Fig. 5.

Q-learning algorithm reflected the SLT of triangle Gimbap

Tslt*(식품유용 가치율)은 음식재료를 구매한 날로부터 인공지능 냉장고에 보관 중에 있는 현재시점(tp), FPt(식품유효 기한) 및 유통기한(Tslt)를 중요 파라미터로 삼는다. 이를 바탕으로 SLT가 반영된 Q-학습 알고리즘<일명 : QSLT 학습 알고리즘> 일예로, 음식재료로 선정한 ‘삼각김밥’이 언제부터 부패되는지 가늠해 본 후 이때의 특정상태 학습값인 QSLT을 본 모의실험을 통해 구한다. QSLT그림 5에 도시된 녹색선이라 하겠다.

SLT가 반영된 Q-학습 알고리즘로부터 구한 Q값의 변동분이 그대로 유지되거나 하락하는 추세로 바뀌는 시점은 앞서 FPt(식품유효 기한), Tslt*(식품유용 가치율)의 추세 변경을 일으킨 현재시점(tP) 즉, 48시간의 삼각김밥의 유통기한(Tslt) 기준 약 29.03시간 이후라 보는 것이 타당하다 할 것이다.

따라서, 본 논문의 모의시험을 통해 음식재료(예 : 삼각김밥)의 부패가 시작되는 현재시점(tP)을 알아내는 것은 SLT가 반영된 Q-학습 알고리즘을 성립시키기 위한 핵심사항이라 하겠다.

다른 예로써, 음식재료로 선정한 ‘샌드위치’의 부패가 언제부터 일어날지 알아보기 위한 모의실험으로, 우선 샌드위치의 FPt(식품유효 기한)은 그림 6에서 보듯이 42시간으로 알려진 유통기한(Tslt) 중 현재시점(tP) 약 24.8시간 정도에서 확률적으로기울기의 변화가 급격히 일어나 약 35.22 지점에서부터 지수 하락하는 추세를 갖는다 할 것이다.

Fig. 6.

FPt(food expiration date) of triangle gimbap

즉, 샌드위치의 생물학적 부패로 인해 지수 하락이 급격히 일어나려고 하는 순간, 기울기의 변화는 해당 포인트(35.22, 24.8)인 현재시점(tP)을 기준으로 180° 가로로 그은 평행선과 FPt(식품유효 기한)의 지수곡선이 만나 생기게 된다. 이때 자동 생성된 제 1 위상각은 약 58°의 각을 이룸을 알 수 있다.

Tslt*(식품유용 가치율) 역시도 유통기한(Tslt) 42시간 중 현재시점(tP) 약 24.76시간에서 확인되는 약 83.86%의 가치율을 나타내는 해당 포인트를 지나가는 순간 이후, 급격하게 하락하는 추세로 바뀐다는 사실도 알 수 있다(그림 7 참조).

Fig. 7.

Tslt*(food utility value ratio) of triangle gimbap

또한, 삼각김밥의 Tslt*(식품유용 가치율)은 현재시점(tP) 약 24.76시간일 때, 약 83.86% 정도를 나타냄을 알 수 있겠다.

삼각김밥의 Tslt* 지수곡선이 순간적으로 지나가며 해당 포인트(83.86, 24.76)을 통과해 해당 포인트 상의 가로 평행선과 이루는 제 2 위상각 역시 수식 (6)에 대입해 보듯이 약 58°의 각도를 형성한다는 것도 알아냈다.

Tslt*(식품유용 가치율)은 음식재료를 구매한 날로부터 인공지능 냉장고에 보관 중에 있는 현재시점(tp), FPt(식품유효 기한) 및 유통기한(Tslt)를 중요 파라미터로 삼는다.

이를 바탕으로 SLT가 반영된 Q-학습 알고리즘을 이용해 일예로, 음식재료로 선정한 ‘샌드위치’가 언제부터 부패되는지 가늠해 본 후 이때의 특정상태 학습값인 QSLT을 본 모의실험을 통해 구한다. QSLT그림 8에 도시된 녹색선이라 하겠다.

Fig. 8.

Q-learning algorithm reflected the SLT of triangle Gimbap

SLT가 반영된 Q-학습 알고리즘로부터 구한 Q값의 변동분이 그대로 유지되거나 하락하는 추세로 바뀌는 시점은 앞서 FPt(식품유효 기한), Tslt*(식품유용 가치율)의 추세 변경을 일으킨 현재시점(tP) 즉, 42시간의 삼각김밥의 유통기한(Tslt) 기준 약 24.8시간 이후라 보는 것이 타당하다 할 것이다.

이는 Tslt*(식품유용 가치율)이 Q 값의 변동분을 실제 컨트롤하는 요인으로 작용하였음을 잘 나타내고 있다고 할 것이며, 음식재료가 특정 상태에 놓여있을 때에 대한 가치분을 변동시킬 수 있을 만한 중요 파라미터로 현재시점(tp), FPt(식품유효 기한) 및 유통기한(Tslt)이 이 내부에 작용하고 있다 하겠다.

본 논문의 주목할 점으로, 음식재료가 삼각김밥이든, 샌드위치든 어떤 음식재료가 인용되어 음식재료마다 유통기한(Tslt)이 각기 달리 설정되어있다 하더라도 각각의 FPt(식품유효 기한)의 지수곡선과 Tslt*(식품유용 가치율)의 지수곡선과 현재시점(tP)의 가로 평행선이 순간 만나 기울기 변화로 일어나 형성되어진 제 1, 2 위상각은 약 58° 의 일정 패턴을 상시 유지함을 본 모의실험을 통해 알아냈다.

즉, 본 논문의 SLT가 반영된 Q-학습 알고리즘은 음식재료마다 유통기한이 다르더라도 실제 음식재료가 부패되는 현재시점(tP)을 찾아내야 함을 강조하며, 이를 토대로 FPt(식품유효 기한)과 Tslt*(식품유용 가치율)을 구해 최적 가치 함수인 QSLT(s, a)로부터 파악된 인공지능 냉장고 내 보관된 음식재료 폐기처분 여부에 대한 결정을 명확히 할 수 있다는 것을 의미한다.


Ⅳ. 결 론

본 논문은 Tslt*(식품유용 가치율)이 반영된 최적 가치 함수인 QSLT(s, a)을 통해 인공지능 냉장고 내 보관된 음식재료 폐기처분 결정에 대한 명확성을 강조함을 의미하는 것으로, 미리 정해진 유통기한 중 구매된 음식재료가 인공지능 냉장고 내 보관되어 아직 사용 전 상태에 있다 하더라도 하고 어쩔 수 없이 폐기처분해야 하는 입장을 고려할 때, 음식재료를 대상으로 구매한 날로부터 인공지능 냉장고에 보관 중에 있는 음식재료가 생물학적으로 부패하기 시작한 폐기처분 시점 즉, 현재시점(tp)을 정확히 알아낸 다음 그로부터 파악된 FPt(식품유효 기한) 및 유통기한(Tslt)를 중요 파라미터를 근거로 삼아 음식재료가 비록 유통기한 내 속해 있다 하더라도 폐기처분 해야함을 좀 더 명확히 결정할 수 있도록 하는 QSLT 학습 알고리즘을 제안한다.

그에 따라, 본 논문은 건강한 인간의 삶의 영위를 돕고, 유통기한만을 믿고 인공지능 냉장고 내 무분별하게 방치된 상태 이후 음식재료의 생물학적 부패현상의 도래로 음식재료로 사용되지 못하고 반드시 폐기처분해야 하는 사태가 일어나지 않도록 미리 예방하며, 반대급부로 음식재료의 사용율을 증대시켜 환경오염의 주범 중 하나인 음식재료의 폐기 처분율이 오히려 감소되도록 유도해 지구환경 파괴로 갈수록 고갈되어가고 있는 식량자원의 효율성 향상 및 이를 통한 건강한 음식문화를 새로이 정립해 가는데 이바지하고자 한다.

References

  • H. Kim, S. Lee, and W.-T. Kim, “A Smart Refrigerator System Based on Internet of Things,” Journal of Institute of Korean Electrical and Electronics Engineers, Vol. 22, No. 1, pp. 156-161, March 2018. [https://doi.org/10.7471/ikeee.2018.22.1.156]
  • H. Doh and S. Jo, “A Study on The RFID Refrigerator Design Focusing on the Structure of System,” Journal of Digital Design, Vol. 10, No. 2, pp. 189-198, April 2010. [https://doi.org/10.17280/jdd.2010.10.2.019]
  • J. Lee, H. Kim, T. Kim, and H.-J. Suh, “RFID-Based Automatic Entity Information Management System for Smart Refrigerator,” Journal of Korean Society for Internet Information, Vol. 9, No. 1, pp. 43-54, February 2008.
  • M.-S. Sul, “AI(Artificial Intelligence) & IoT(Internet of Things) through Smart Health Care Service Industrial Development,” The Korea Journal of Sports Science, Vol. 25, No. 4, pp. 599-612, August 2016.
  • D.-G. Jeong and D. Song, “Characteristics of IoT-Artificial Intelligence Technologies and Their Related Industry Trend,” Korean Institute of Information Technology Magazine, Vol. 15, No. 2, pp. 29-39, December 2017.
  • J. Park and M. Yeoun, “A Proposal of the Smart Hubs Scenarios of Smart Home Users in the Near Future Based on the Use Patterns,” Journal of Integrated Design Research, Vol. 18, No. 3, pp. 25-42, September 2019. [https://doi.org/10.21195/jidr.2019.18.3.002]
  • Y. Ji, J. Yoo, and S. Lee, “Internet of Things, Big-Data and Artificial Intelligence,” Communications of the Korean Institute of Information Scientists and Engineers, Vol. 35, No. 7, pp. 43-50, July 2017.
  • S.-W. Seo, H.-C. Yang, and K.-B. Sim, “Object Tracking Algorithm of Swarm Robot System for Using SVM and Polygon Based Q-Learning,” in Proceedings of KIIS Spring Conference, Chungju, pp. 143-146, April 2008.
  • H.-U. Yoon, I.-H. Jang, and K.-B. Sim, “Area-Based Q-Learning for Multiple Robots Control,” in Proceedings of KFIS Spring Conference 2005, Seoul, pp. 198-201, April 2005.
  • S.-B. Yang and S.-R. Yang, “Economic Value of Food Shelf Life,” Journal of Channel and Retailing, Vol. 18, No. 4, pp. 31-50, October 2013. [https://doi.org/10.17657/jcr.2013.10.31.2]
  • H. Yoon, A CFD Study on the Quality Effected by Temperature and Microbial Distribution in Milk in Market Environment, Master’s Thesis, Kyung Hee University, Yongin, February 2013.
  • M. Koo, Y. Kim, D.-B. Shin, S.-W. Oh, and H. S. Chun, “Shelf-Life of Prepacked Kimbab and Sandwiches Marketed in Convenience Stores at Refrigerated Conditions,” Journal of Food Hygiene and Safety, Vol. 22, No. 4, pp. 323-331, January 2007.

저자소개

서성현(Sung-Hyun Seo)

2020년:한성대학교(공학박사-스마트융합학부)

2014년~2023년: 특허법인 대한, 휴피아 특허사무소, 이사

2013년~현 재: ㈜비즈팟, 대표

2024년~현 재: ㈜제세 IP&G, 책임연구원

2023년~현 재: 단국대학교, SW융합대학, 소프트웨어학과, 겸임교수

2021년~현 재: 한국외국어대학교, 인재융합대학, 겸임교수

2022년~현 재: 동국대학교, 미래융합대학, 융합보안학과, 외래교수

2023년~현 재: 건국대학교, 공과대학, 초빙교수

※관심분야:창의공학설계, SW컴퓨팅, 인공지능, 빅데이터, ICT융합, 정보처리및보안, 지식재산권 등

Fig. 1.

Fig. 1.
System diagram

Fig. 2.

Fig. 2.
Refrigerator internal monitoring screen using contents of an app dedicated to my refrigerator management

Fig. 3.

Fig. 3.
FPt(food expiration date) of triangle gimbap

Fig. 4.

Fig. 4.
Tslt*(food utility value ratio) of triangle gimbap

Fig. 5.

Fig. 5.
Q-learning algorithm reflected the SLT of triangle Gimbap

Fig. 6.

Fig. 6.
FPt(food expiration date) of triangle gimbap

Fig. 7.

Fig. 7.
Tslt*(food utility value ratio) of triangle gimbap

Fig. 8.

Fig. 8.
Q-learning algorithm reflected the SLT of triangle Gimbap

Table 1.

Initial parameters for the QSLT learning algorithm

Q(s,a) state s, initialize action a to 0
<Repeat the following process>
1. After recognizing the current state s, select action A and perform action A
2. Currently receive an immediate reward r for a
3. Enter Tslt* instead of γ (alternate value)
4. Recognizing the new state s'
5. Select action A' for the new state s' and perform action A'
6. Continuously update the values in the Q(s, a) table to s←s', a←a'
7. Check FPt in real time and apply it to TSLT*