복합재난 데이터 처리를 위한 데이터 통합 연구 : 센스데이터 중심
Copyright ⓒ 2019 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
초록
전 세계적으로 많은 재난들이 발생하고 있다. 그 재해들은 점점 대형화 되고 복잡한 형태의 복합재난이 연이어 발생하고 있다. 이런 다양한 복합재난 데이터를 통합분석하기 위해서는 우선 각 시스템간의 데이터의 중복, 단위, 스키마 등의 문제를 우선적으로 해결해야 하다. 그렇지 않을 경우에 복합재난 시스템은 시스템간의 호환성 및 오작동 등의 많은 문제가 발생한다. 특히 복합재난에 사용되는 시스템은 반드시 시스템간의 표준화 및 데이터 통합이 중요하다. 본 논문에서는 초고층 건물에서 발생할 수 있는 다양한 복합재난 데이터 처리를 위한 센스 데이터 중심으로 데이터 통합을 하기 위해서 조사 및 연구하였다. 이를 바탕으로 다양한 센스데이터로부터 표준화 및 통합된 스키마를 제시함으로 시스템간의 불일치를 최소화하였다.
Abstract
Many disasters are currently occurring throughout the world. These disasters are gradually becoming larger in scale, and various forms of complex disasters are continuously happening. In order to integrate and analyze complex disaster data, it is necessary to solve the problems such as duplication, unit, and schema of data between each system. Otherwise, a complex system has many problems such as incompatibility and malfunction between systems. In particular, a complex system for disaster is sure to standardization and data integration between systems, it is very important. This study has examined data standardization which focuses on sense data in order to process data related to the various complex disasters which can occur in high-rise buildings. Based on this, discrepancies are resolved by presenting standardization metadata from various sense data.
Keywords:
Complex Disaster Integration, Data Standard, Sense Data Integration, Term Standard키워드:
복합재난 데이터 통합, 데이터 표준화, 센스데이터 통합, 용어 표준화Ⅰ. 서 론
과거 재난 관리 시스템의 경우에는 하나의 시스템에 하나의 데이터베이스로도 필요한 업무를 처리 할 수 있었다. 그러나 오늘날 데이터 개방으로 기업이나 기관에서는 하나의 시스템에서 처리하던 업무를 여러 시스템으로 분산 및 협업하여 업무를 처리하게 되었다. 특히 복합재난에서는 다양한 IOT 센스데이터로부터 발생하는 데이터들을 통합하고 표준화하여 데이터의 정확성 및 품질 보증 확보가 더욱 더 중요해지고 있다. 이 사실은 어떠한 형태로든 데이터의 통합이 이루어져 있어야만 시스템의 목적에 맞는 기능을 원활히 수행 할 수 있다는 것을 의미하고, 데이터 통합은 기업이나 기관에서 반드시 필요한 필수적인 요소가 되었다.
데이터 통합은 기업의 각 조직과 주요 업무, 핵심 어플리케이션에서 발생하는 물리적인 데이터 소스들을 표준 규칙과 메타데이터에 여과시켜 중복성을 제거하고, 오직 단일의 데이터 및 단일 뷰(view)를 정확하게 제공하는 것에서 출발한 다[1].
정보공유를 위해서는 데이터의 표준화가 필연적이다. 정보공유를 위한 데이터 표준화를 지원하기 위한 작업의 일환으로 ISO/IEC JTC1 WG2- 데이터 관리 및 교환(Data Management and Interchange)에서는 데이터 공유 및 교환을 위한 근본적인 해결 방안으로 메타데이터 레지스트리(Metadata Registry : MDR)에 대한 표준화를 진행하고 있다. 국내의 경우 산업자원부 기술표준원에서 만든 KMR(Korea Metadata Registry)의 IMR사업이 있다[2]. 메타데이터 레지스트리는 다양한 종류의 메 타데이터 표준을 메타데이터 요소의 설명을 통 하여 메타데이터의 공유를 가능하게 한다[3].
우리나라의 국가재난관리 업무는 1948년부터 시작되었으며, 자연재해를 중심으로 수행되어 왔다. 이는 과거 사회구조가 단순하여 사회재난의 피해가 자연재난의 피해보다 현저히 적었기 때문이지만, 점차 사회가 복잡해지고 재난의 양상이 복합적으로 변화함에 따라 효율적인 재난관리를 위한 정보시스템의 필요성이 증가했다. 이에 따라 국가적 차원의 재난관리정보시스템 구축 계획을 수립하게 되었으며, 2015년 현재 통합 재난안전정보체계 구축사업을 수행하였다[4]. 국내외에서 연속적으로 발생하는 화재, 지진, 침수 등의 다양한 재난으로 인하여, 기존의 법제도 하에 최소한으로 도입되었던 단순 재난 대비 설비에서 벗어나 주기적이고 체계적인 시설물의 재난 관리의 중요성이 높아지고 있다[5].
본 논문에서 초고층 건물에서 발생한 복합재난 데이터 처리를 위해 지진, 화재, 침수에 사용한 센스 데이터들을 중심으로 각 데이터별 통합 스키마를 제공하고자 한다. 이를 위해서 2장의 2.1절에서는 표준화 개요와 목적을 설명하고 2.2 절에서는 표준화 명명 규칙을 설명한다. 이를 바탕으로 2.3 절에서는 실제 표준화 목록 및 사용 범례에 대해서 지진, 화재, 침수별 표준 센스 통합 스키마에 대해 기술한다. 그리고 마지막에는 장치 간의 연동을 지원을 위한 인터페이스에 대해서 기술한다. 이를 바탕으로 다양한 센스 데이터로부터 표준화 및 통합된 스키마를 제시함으로 시스템 간의 상호운용성을 높이고 시스템 간의 불일치를 최소화하였다.
Ⅱ. 표 준 화
본 연구에서는 복합 재난 데이터 표준화를 위한 데이터 항목들의 명세하고 해당 시스템을 이용한 시스템 구현에 있어 상호 연계 인터페이스에서 전송되는 데이터 집합의 규격을 기준하여 각 부분별 분산 과제 수행 있어 요구되는 규격화된 일관성을 제시한다. 또한 본 문서의 구성 및 내용은 아래와 같이 실용성에 주목하여 데이터 관리 절차의 일반론 사항을 최대한 배치하고 실질 표준화 사항을 중점 기술하였다.
2-1 표준화 개요 및 목적
표준화의 정의, 목적, 조직 관리 등은 [6-7]의 표준화 가이드 및 지침 등에 정의가 되어 있다. 즉 표준화란 체계 별로 산재해 있는 데이터 정보 요소에 대한 명칭, 정의, 형식 및 규칙 에 대한 원칙을 수립하고 이를 전체 연구에 적용하여 데이터의 품질을 향상시키려는 지속적인 활동이다.
본 연구에서는 데이터 표준화, 정의, 목적 및 조직관리 등에 대해서 표준 지침서를 따르고 복합재난에서 사용되는 다양한 센스 데이터들에 대해서 통합 시스템 구축을 위한 데이터 통합을 중심으로 연구하였다.
2-2. 표준화 명명 규칙
본 연구에서는 다양한 센스 데이터들로부터 입수되는 데이터들에 대해서 통합 스키마 설계를 위해서 가장 우선적으로 처리해야 할 것은 데이터 명명 규칙을 설계하는 것이다. 따라서 본 논문에서는 개별 연구에 있어서 산출된 데이터 및 공유 자료에 기반 하여 단어 목록, 도메인 목록 들을 도출하였으며 이들을 조합하여 개별 구성 요소의 명칭을 확정하기 위한 일반 규칙을 정의하였다.
본 연구에서는 지진, 화재, 침수 등에서 사용되는 다양한 입수 데이터들에 사용하기 위해서 표준 용어를 우선적으로 구성할 필요가 있었다. 즉 시스템 설계를 위해서 시스템 테이블이나 필드명에 대한 물리적 표준화된 용어를 사용해야 개발자 및 관리자가 해당 테이블이나 필드명에 대한 상호운용성을 높일 수가 있다. 따라서 본 연구에서는 물리적 명칭을 영어 원문이 4자 이하일 경우는 그대로 사용하고 이상일 경우 3자 이내의 축약어를 사용하기로 했다. 물리적 명칭이 너무 길거나 짧지 않게 설정하여 개발자나 시스템 관리자가 사용하기 용이하게 처리하게 설정하였다.
본 연구에서는 지진, 화재, 침수 등의 다양한 센스 데이터로부터 입수한 정보를 조사 분석한 결과 <표1>과 같이 표준 용어 사전을 구성하였다.
본 연구에서는 단어들을 조합하여 칼럼 이름을 구성할 때의 규칙은 아래와 같다. 본 연구에서는 복합재난에서 발생하는 다양한 데이터 수집을 위해서 유연한 구조로 테이블이나 필드 이름을 결합할 수 있도록 구성하였다.
2-3 표준화 목록 및 사용 범례
각 계측 데이터는 계측 장치(센서)와 위치 정보를 아래와 같은 항목들로 구성하여 본 계측 데이터와 통합 저장 또는 별도의 Table로 구성하여 저장하고 시스템 간 연계 시에도 본 데이터 전송 전 선언적으로 1회 또는 매 데이터 전송 시 반복 제공하여 계측 데이터의 산출 근거와 구분을 제시하였다.
제조사 코드, 분류 코드, 감독기관 코드, 건물코드 등은 과업 주체들 간 협의하여 지정한다. 위치코드 및 3차원 좌표계는 생략될 수 있다.
(1) 장치
형식코드(DEV_PN)는 각 계측기의 제조사가 확정한 완전한 모델번호를 기입해야 하며 이는 통상의 제품을 지칭하는 제품명이 아닌 제조사가 제시하는 주문양식 등에서 기입하는 Part Number(P/N)를 의미한다.
분류 코드(DEV_TYPE)는 계측기의 유형을 분류하는 통합데이터관리 및 협의체에서 정의한 체계로 센서의 목적, 형태, 설치 기준 및 방안 등을 고려하여 계측기들 간의 통합 관리, 데이터 마이닝(Data Mining) 및 종합 분석, 통합 관리를 위한 기준 분류 코드로 사용된다.
계측 주기(DEV_PER)는 각 단위 거점(Node)에서의 데이터 저장을 기준으로 계측기가 데이터를 산출하는 기간 단위를 의미하며 실시간으로 데이터를 산출하거나 상황 발생시(이벤트 발생시) 데이터를 산출하는 경우 계측 주기는 0으로 설정한다.
계측 단위(DEV_UNIT)는 동일 분류 계측기라 하더라도 측정 단위 및 정확도의 상이점이 발생하는데 주목하여 명확한 측정 단위를 기입하여야 하며 이를 기준으로 통합 데이터 산출 시의 변환을 수행한다.
DBMS 저장 예시는 아래 <표 4>와 같다. 즉 논리적 데이터 조건 형태로 제조사 코드 000으로 분류된 Intel Co. Ltd. 사의 CM8068403358220 기기는 01로 내부 분류되어 있으며 60분 단위로 계측하며 mV를 측정 단위로 한다.
Binary Stream은 아래 <표 5>와 같이 Payload의 크기를 최소화하기 위하여 아스키(ASCII) 코드를 사용하며 개별 데이터 Entity의 구분을 위하여 CR(0xOD) 코드를 구획자로 사용하며 1행의 종료는 CR코드와 LF코드를(OxOD OxOA) 기입하여 구분한다.
JSON 및 SOAP XML 전송 시에 있어서 Entity 명칭의 대소문자는 구분하지 않으며 본 문건에서는 예시로 JSON 구성을 예시한다. 각각의 데이터 형은 문자형을 기준으로 사용하되 길이가 가변적이지 않은 경우는 숫자 형으로 구성한다.
(2) 위치
감독기관(지역) 코드 (CD_LOC_AGN)는 행정 지역 또는 감독기관의 코드로 정부 표준화된 행정코드를 기준하며 세부 단위 연구 기관별 사용 코드의 상이할 때는 협의체에 의하여 지정된 내부 표준안을 준수 한다. 건물(장소) 코드 (CD_LOC_BD)는 건물, 교량, 특정 지정 위치에 대한 코드로 정부 표준화된 행정코드를 기준하며 세부 단위 연구 기관별 사용 코드의 상이할 때는 협의체에 의하여 지정된 내부 표준안을 준수 한다. 위치 코드 (CD_LOC_PT)는 건물(장소)에 계측기가 설치된 장소에 대한 매핑 코드를 지정한다. 매핑 코드에 대한 테이블은 각 단위 연구 기관(자)에 따라 상이할 수 있으나 CHAR(4)의 데이터 포맷 및 길이를 준수하여 지정하고 건물(장소)내 단일 계측기만을 사용할 경우 0000을 지정한다. 통합관리주체에 대하여 데이터 매핑 테이블을 각 연구 기관(자)은 제공하여야 한다. 위치 코드 3차원 X (CD_LOC_PT_X)값은 계측기가 설치된 장소를 3차원 좌표 형식으로 지정할 때의 X 값으로 건물(장소)내 단일 계측기만을 사용할 때는 0을 지정한다. 위치 코드 3차원 Y (CD_LOC_PT_Y) 값은 계측기가 설치된 장소를 3차원 좌표 형식으로 지정할 때의 Y 값으로 건물(장소)내 단일 계측기만을 사용할 때는 0을 지정한다. 위치 코드 3차원 Z (CD_LOC_PT_Z) 값은 계측기가 설치된 장소를 3차원 좌표 형식으로 지정할 때의 Z 값으로 건물(장소)내 단일 계측기만을 사용할 때는 0을 지정한다. DBMS 저장 예시는 아래 <표 8 >와 같다. 즉 논리적 데이터 조건 형태인 형정 코드 KY로 지정되는 경기도에 건물코드 00으로 지정된 임의 건물에 3층 1번 센서로 매핑 테이블상 0301로 정의된 위치 정보로 3차원 좌표 지정은 되어 있지 않다.
Binary Stream은 Payload의 크기를 최소화하기 위하여 아스키(ASCII) 코드를 사용하며 개별 데이터 Entity의 구분을 위하여 CR(0xOD) 코드를 구획자로 사용하며 1행의 종료는 CR코드와 LF코드를(OxOD OxOA) 기입하여 구분한다.
JSON 및 SOAP XML 전송 시에 있어서 Entity 명칭의 대소문자는 구분하지 않으며 본 문건에서는 예시로 JSON 구성을 예시한다. 각각의 데이터 형은 문자형을 기준으로 사용하되 길이가 가변적이지 않은 경우는 숫자 형으로 구성한다.
지진에서 사용하는 센스는 경사계, 변형률계, 풍향계, 풍속계, 가속도계 등이 있지만 본 논문에서는 경사계 센스만 예시를 들어서 표준화 지침에 대해 설명한다.
측정일자는 다양한 센스 값들에 대한 문자 8자리로 측정 연월일을 YYYYMMDD 형식으로 표준화하였고 측정시간은 밀리 세컨드 단위까지 표현, 밀리 세컨드를 생략할 때는 000으로 기입하다.
측정 센서 ID값은 센서 ID가 지정되는 경우, 풍산 지진기록계의 채널 코드 부여 시 등 사용된다. 그리고 측정 X와 Y값의 최대, 최소 및 평균값으로 계측 주기 당 값을 저장한다.
DBMS 저장 예시는 아래 <표 12>와 같다. 논리적 데이터 조건 형태 : 2018년 5월 20일 12:00 정각에 생성된 데이터로 측정 채널 01번에서 측정된 값을 저장한다.
Binary Stream은 Payload의 크기를 최소화하기 위하여 아스키(ASCII) 코드를 사용하며 개별 데이터 Entity의 구분을 위하여 CR(0xOD) 코드를 구획자로 사용하며 1행의 종료는 CR코드와 LF코드를(OxOD OxOA) 기입하여 구분한다.
본 논문에서는 침수계 센스만 예시를 들어서 표준화 지침에 대해 설명한다.
측정일자는 측정 연월일을 YYYYMMDD 형식으로 표준화하며 측정 시간을 밀리 세컨드 단위까지 표현, 밀리 세컨드를 생략할 때는 000으로 기입한다. 도한 측정값은 Number형태인 Integer, Float, Double 숫자를 지원한다.
BMS 저장 예시는 아래 <표 15>와 같다. 즉 논리적 데이터 조건 형태인 2018년 5월 20일 12:00 정각에 생성된 데이터를 저장한다.
Binary Stream은 Payload의 크기를 최소화하기 위하여 아스키(ASCII) 코드를 사용하며 개별 데이터 Entity의 구분을 위하여 CR(0xOD) 코드를 구획자로 사용하며 1행의 종료는 CR코드와 LF코드를(OxOD OxOA) 기입하여 구분한다.
JSON 및 SOAP XML 전송 시에 있어서 Entity 명칭의 대소문자는 구분하지 않으며 본 문건에서는 예시로 JSON 구성을 예시한다. 각각의 데이터 형은 문자형을 기준으로 사용하되 길이가 가변적이지 않은 경우는 숫자 형으로 구성한다.
화재에서 사용하는 센스는 화재수신기, 음향센서(이상시), 음향센서평상시) 등이 있지만 본 논문에서는 화재수신기에 대한 예시를 들어서 표준화 지침에 대해 설명한다. 정확하게 말을 하면 화재센스 데이터가 아닌 화재수신기간의 데이터 전송 표준화이다.
측정타임스탬프는 측정 일시 타임스탬프로 long타입으로 정의하며 측정 센서의 ID는 측정 센서의 ID 또는 채널 코드 값이다. 이상여부-전원은 char(1) 타입으로 0이면 정상 1이면 오류로 한 개의 문자로 표현하였다.
Ⅳ. 결론 및 향후 연구
오늘날 전 세계적으로 많은 재해들이 발생하고 있다. 그리고 그 재해들은 지진을 포함하는 침수, 화재 등 피해 규모가 보다 대형화 되고, 점차 다양한 형태의 대규모 복합 재난·재해가 연이어 발생하고 있다.
이와 같이 다양한 복합재난 데이터들을 처리하기 위해서는 데이터 표준화가 중요하다. 이를 위해서 본 논문에서는 표준화 개요와 목적을 제시하고 표준화 관리 및 조직, 표준화 명명 규칙을 정의하였다. 이를 바탕으로 실제 표준화 목록 및 사용 범례에 대해서 지진, 화재, 침수별 통합 스키마를 제시하였다.
따라서 본 논문에서는 지진, 화재, 침수 등의 다양한 센스 데이터로부터 표준화 및 통합된 스키마를 제시함으로 시스템 간의 상호운용성을 높이고 시스템 간의 불일치를 최소화하였다. 또한 외부 시스템의 연동을 위한 다양한 인터페이스도 함께 제공한다.
향후에는 복합재난 데이터별 센스데이터를 포함한 플랫폼 각 기능별, 운영 절차 및 다양한 인터페이스간의 프로토콜 정의 등에 대한 추가 표준화 연구가 필요하다.
Acknowledgments
본 논문은 2019년 정부(미래창조과학부)의 재원으로 국가과학기술연구회 융합연구단 사업의 지원을 받아 수행된 연구임.
References
- C. C. Shilakes, and J. Tylman, "Enterprise Information Portals", Meril Lynch, New York, NY, November, 16), (1998.
- D. G. Baek, “Standardization trend of metadata registry”, Journal of Scientific & Technological Knowledge Infrastructure, 9, p20-25, (2002).
- T. W. Lee, J. H. Kweon, and D. K. Baik, “XML schema generating technique based on metadata registry”, Proceedings of the Korea Information Science Society Fall Conference, 29(2), p181-183, (2002).
- I. K Jeong, and C. W. Choi, “Data Current Analysis of National Disaster Management Information System”, Proceedings of the Korea Society of Disaster Information, 27, p230-231, (2015).
- J. E. LKim, and C. H. Hong, “A Study on the Application Service of 3D BIM-based Disaster Integrated Information System Management for Effective Disaster Response”, Journal of the Korea Academia-Industrial cooperation Society, 19(10), p143-150, (2018).
- M. S. Park, and S. Y. Kim, The guideline for data quality management ver 2.10, Korea Dabase Promotion Center, (2006).
- Data Professional Knowledge Port, [Internet] Available: http://www.dbguide.net/.
저자소개
2001년 : 부산대학교 대학원 (공학석사-한글어형태소분석기)
2011년 : 충남대학교 대학원 (문헌정보학박사-개인화검색시스템)
2001년~현 재: 한국과학기술정보연구원
※관심분야: 지진피해분석, 정보검색(IR), 딥러닝기반 개체명인식기, 개인화 검색시스템, PLOT기반 식별기술