Korea Digital Contents Society

Journal Archive

Journal of Digital Contents Society - Vol. 25 , No. 5

[ Article ]
Journal of Digital Contents Society - Vol. 25, No. 5, pp. 1225-1232
Abbreviation: J. DCS
ISSN: 1598-2009 (Print) 2287-738X (Online)
Print publication date 31 May 2024
Received 10 Mar 2024 Revised 12 Apr 2024 Accepted 16 Apr 2024
DOI: https://doi.org/10.9728/dcs.2024.25.5.1225

인공지능 활용과 디지털 헬스케어 활성화의 구조적 관계에서 보건의료 데이터 공유 활용의 매개 효과
한대현*
독립연구자

Mediating Effect of Healthcare Data Sharing on Structural Relationship Between Artificial Intelligence Utilization and Digital Healthcare Activation
Daehyun Han*
Independent Researcher, Seoul, Korea
Correspondence to : *Daehyun Han E-mail: dh78_han@naver.com


Copyright ⓒ 2024 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

초록

현재, 디지털 헬스케어 관련 정책에 있어 보건의료 데이터의 공유 활용은 매우 중요한 이슈이다. 본 연구에서는 인공지능 활용과 디지털 헬스케어 활성화 간의 인과 관계에서 보건의료 데이터 공유 활용이 갖는 매개 효과를 실증하였다. 선행 연구에서 수립된 인공지능 활용과 디지털 헬스케어 활성화 간의 구조 모형을 확장시켜 보건의료 데이터 공유 활용이라는 매개 변수를 투입하고 모형을 검증하였다. 한국개발연구원(KDI)의 ‘2021년 디지털 헬스케어 인식 조사’ 데이터가 연구에 사용되었다. 연구 결과는 다음과 같다. 첫째, 보건의료 데이터 공유 활용이 매개하는 인공지능 활용과 디지털 헬스케어 활성화 간의 구조 모형 적합성이 유지되고 있었다. 둘째, 보건의료 데이터 공유 활용은 디지털 헬스케어의 활성화에 유의미한 정(+)적 매개 효과를 보였다. 보건의료 데이터 공유 활용이 디지털 헬스케어 발전에 영향 미치는 변수임이 확인되었으며 새로운 매개 모형이 구축되었다. 본 연구는 보건의료 데이터 활용이 가로 막혀 있는 현재의 법과 제도 개선에 근거 자료가 될 것이다.

Abstract

The sharing and use of healthcare data in digital healthcare policies are currently a crucial issue. This study demonstrated the mediating effect of healthcare data sharing (HDS) on the causal relationship between artificial intelligence utilization (AIU) and digital healthcare activation (DHA). By expanding upon the structural model established in the previous study on the relationship between AIU and DHA, HDS was introduced as a mediating variable, and subsequently, the model was verified. Data from the 2021 digital healthcare awareness survey conducted by the Korea Development Institute were used. The findings of the study are as follows: First, the structural model linking AIU and DHA with HDS as a mediator was validated. Second, HDS exhibited a substantial positive mediating effect on DHA. The study confirmed that HDS as a variable influences the development of digital healthcare. Therefore, a new mediation model was constructed. This study provides supporting data for improving the present laws and systems that restrict the use of healthcare data


Keywords: Artificial Intelligence, Digital Healthcare, Healthcare Data, Structural Equation Modeling, Mediating Effect
키워드: 인공지능, 디지털 헬스케어, 보건의료 데이터, 구조방정식, 매개 효과

Ⅰ. 서 론

과학기술의 발전은 학문, 산업, 경제의 사회 전반에 걸쳐 디지털화(Digitalization)를 촉진하고 있다. 대량의 데이터와 이를 가공하고 체계적으로 분석할 인공지능은 디지털화의 구성 요소라 할 수 있다. 데이터 형성과 인공지능 처리 기술의 적용은 의료와 이를 확장된 헬스케어 영역도 예외가 아니다[1]. 디지털이 결합된 디지털 헬스케어라는 산업을 태동시켰으며, 지금 이 순간에도 다양한 유형의 측정 지표와 단위를 갖는 보건의료 데이터가 대량으로 생성, 저장, 축적되고 있다[2]. 개인과 사회 집단 그리고 국가 차원의 보건의료 데이터 풀(Pool)이 형성되고 있는 것이다.

보건의료 데이터의 활용은 의생명과학과 산업의 고도화를 위해 매우 절실하다. 빅 데이터로서 신약, 의료기기 개발, 질병 양상의 새로운 발견과 산업적 응용 등에 활용성은 매우 높다 하겠다[2]-[4]. 정책적 지원을 위해 정부에서는 ‘의료데이터 중심병원’을 추진하고 있으며, 국회에서는 '디지털 헬스케어 진흥 및 보건의료 데이터 활용 촉진에 관한 법률안'을 발의한 상태이다.

그러나 보건의료 데이터는 개인(환자, 질병) 정보 등 민감한 정보를 포함하고 있어 활용에 제한이 있는 현 상황으로 디지털 헬스케어 발전의 저해 요인으로 제기되고 있다[2]. 즉, 데이터의 신뢰성, 보안성 유지, 소유권, 공공적 활용과 관련한 사회적 신뢰 확보 등이 해결되어야 할 사항으로 선행 연구에서는 지적하고 있다[5]-[15].

본 연구에서는 인식 분석에 관한 연구로서 선행 연구에서 지적한 보건의료 데이터를 둘러싼 이슈들을 확인하고 해결된다는 가정 하에서 보건의료 데이터의 활용이 디지털 헬스케어 발전에 어느 정도 긍정적 기여를 할 수 있을지 분석하였다. 본 연구의 직접적인 선행 연구[16]에서 실증하고 수립한 구조방정식 모형에 보건의료 데이터 활용을 변수로 추가하여 모형을 확장하였고 실증하였다. 그 결과, 보건의료 데이터 활용이 디지털 헬스케어의 활성화에 유의미한 정(+)적 영향력을 갖는 매개 효과가 확인되었다.

선행 연구들이 대체로 질적 연구에 의존하여 데이터를 둘러싼 문제 해결(신뢰성, 거버넌스, 활용성 등)의 필요를 펼쳐왔다면[5]-[8],[10]-[14], 본 연구는 분석 모형을 제안하고 디지털 헬스케어에 영향을 미치는 요인을 통계적으로 실증하였다는 점에서 차별성이 있다. 본 연구에서 얻은 결과는 보건의료 데이터 활용이 막혀 있는 법 제도적 현 상황에서 활용 필요성을 지지하는 근거 자료로 가치가 있다.

본 연구의 논점은 보건의료 데이터 공유 활용이 헬스케어 경쟁력 제고에 도움이 될 것으로 사회적, 의료적 이용이 중요함을 인식하며 두 가지로 정리된다. 첫째, 보건의료 데이터 공유 활용을 선행 연구[16]에서 수립한 모형 내 변수 투입 시 모형 적합도의 성립 여부이다. 이는 학술적인 연구 모형의 확장에 관한 것이다.

둘째, 인공지능 활용에 의한 디지털 헬스케어 간의 인과 관계에서 보건의료 데이터 공유 활용이 매개 효과를 발생시키는지 여부이다. 이는 디지털 헬스케어 활성화에 영향 미치는 추가적인 변수를 확증하며 디지털 헬스케어 정책 추진의 근거 제공과 관련되어 있다. 본 연구에서는 보건의료 데이터 활용이 구조 모형 내에서 디지털 헬스케어 활성화에 매개 효과를 보이고 있음을 살펴보고자 한다.


Ⅱ. 선행 연구 검토
2-1 인공지능과 보건의료 데이터 취급

헬스케어에 디지털 기술이 접목된 디지털 헬스케어가 발전함에 따라 새로운 종류의 데이터가 새로운 방식과 주체에 의해 측정, 저장, 통합되며 분석을 요구받고 있다[2]. 데이터의 측정, 통합 및 해석의 3단계는 디지털 헬스케어에 의한 미래 의료 즉, 4P 의료(Preventive, Personalized, Participatory, Predictive Medicine) 구현의 프레임워크라 할 수 있는데 이 프레임워크가 데이터의 복잡성을 취급하고 맞춤형 헬스케어 서비스의 제공을 위해서는 인공지능을 필요로 하고 있다[2],[17].

인공지능은 고도의 문제 해결 능력을 갖는 인공적 지능으로 정의된다[18]. 인공지능은 헬스케어에서 크게 병원 솔루션, 개인 건강관리, 보험회사, 신약개발의 4가지 분야에서 활용되고 있다[16],[19]. 복잡한 생명 현상 데이터의 처리와 이를 기반으로 한 신약 연구와 개발에 있어 인공지능의 필요를 높이고 있다[20]. 특히, 병원에서 인공지능의 활용은 사회적 파급력이 클 것으로 예상되는데 검사에서 진단까지의 소요 시간 단축, 비용 감소와 의료적 처치 중, 후에 있어 환자의 돌발 상태 예측, 진료프로세스 개선에 의한 전반적 생산성 향상과 효율성 제고를 기대할 수 있게 한다[4].

인공지능은 데이터를 취급하는데 그 대상은 유전체, 전사체, 대사체, 단백체, 마이크로바이옴, 의료 영상(MRI; Magnetic Resonance Imaging, CT; Computerized Tomography, PET/CT; Positron Emission Tomography/Computerized Tomography, Ultrasound, X-ray), 개인 일상생활 정보, 개인이 처한 주변 환경 정보 등이 될 수 있다. 데이터를 입체적으로 판단하기 위해서는 데이터 통합이 요구되며 가치 제고를 위한 플랫폼의 필요가 강조되는 상황이다[2],[5].

데이터를 표현하는 형식은 다양하다. 숫자, 그래프, 이미지, 음성, 영상, 텍스트, 영상, 위치 등이 있는데 수치 표현의 정량적 변환 여부, 데이터 발생의 연속성 여부가 구분 기준이 된다. 측정 수단도 다양한데 의료기기, 휴대폰, 웨어러블 디바이스, 사물인터넷 센서 등이 있다. 데이터의 다양한 형식, 유형에 있어 이질적 데이터의 통합과 분석 시도가 요구되는 가운데, 한 사람의 건강 상태를 이해하려면 다양한 수준의 의료 데이터가 통합되어야 그 사람에 대한 총체적인 상태를 정의할 수 있을 것으로 보고 있다[2],[21].

그러나 데이터의 수집, 가공에서의 편향(Bias) 및 구동 알고리즘, 진단 치료에서 편향이 발생할 수 있으므로 편향에 대한 최소화가 필요할 것이다[22]. 병원 현장에서의 의료 데이터는 정보 민감성, 데이터 수집과 생산이 이루어지는 영역, 데이터의 정형화 정도 등으로 분절되어 수집⋅관리되고 있으므로 분석과 활용이 쉽지가 않다[6].

데이터 통합의 저해 요인으로 의무 기록의 디지털화 여부와 구축 수준, 기록 표준화의 미비가 걸림돌로 지적되고 있다[2]. 이를 극복하기 위해서는 표준을 만들어 활용함이 필요하다. 미국의 기업 ‘애플’은 헬스케어 데이터 통합을 위한 플랫폼을 제작, 사용하고 있는데 헬스케어 플랫폼으로 환자 유래 의료데이터를 통합한 ‘헬스키트’, 진료 기록을 통합한 ‘헬스레코드’는 그 사례가 될 것이다[2]. 이 플랫폼은 의료기관, IT(Information Technology) 업체 및 환자 간의 데이터 이동의 수단이자 소통 체계로 기능하고 있는 것으로 평가되고 있다.

데이터의 통합적인 취급을 위해서는 데이터의 측정 기술, 통합할 플랫폼, 통신 기술, 클라우딩 환경의 구축을 요구받는다. 이는 데이터 측정, 수집, 통합, 저장, 분석, 공유 및 활용의 구성 요소이다. 수집된 데이터를 통해 인공지능 분석으로 데이터 간 규칙성, 상관성, 상호 작용을 찾을 수 있을 것으로 기대되는데 이는 데이터 기반의 질병 예측 예방, 맞춤 정밀 의료 등 미래 4P 의료 구현에 기여할 것으로 예상된다[2]. 축적된 대량의 데이터를 연속적이고, 실시간으로 분석하기 위해서는 인공지능 활용은 불가피하다. 측정 대상과 대상자 수가 증가하며 후향적 데이터로부터 미래 데이터 변화를 예측하기 위해서는 인공지능의 도움을 더욱 요구 받을 것이다. 데이터 복잡성의 증가, 다양한 유형의 데이터에 대한 실시간 모니터링, 종합적 분석을 위해서 인공지능은 필수이며 불가피한 선택이라 하겠다[2].

향후, 건강관리와 의료에서 인공지능의 역할은 증대될 것이며 데이터의 측정, 통합, 분석을 통해 완성되는 디지털 헬스케어에서 인공지능은 핵심적인 역할을 할 것으로 기대된다[2]. 보건의료 데이터를 취급하는 인공지능 적용의 확대를 위해서는 보다 정교한 알고리즘 개발 및 최적화가 요구되며 데이터의 충분한 확보와 품질 검증은 매우 중요해 질 것이다[16]. 데이터 활용에 따른 디지털 헬스케어 수혜 대상은 개인들이며 일상의 라이프로그(Life Log) 데이터(활동량, 체중, 체질량, 근육량, 수면 등)의 수집, 검증을 통한 질병 원인과 연관성 판단 및 치료에 활용 가능할 것으로 예상된다[16],[23].

이상의 선행 문헌을 검토할 때 인공지능 기술이 고도화 될수록 개인의 보건의료 데이터 수집, 저장, 분류, 가공, 분석과 활용 시스템 구축에 대한 압력과 의료적, 사회적 필요성, 의약 R&D 등 연구 목적상의 필요성은 증대될 것으로 사료된다. 인공지능이라는 환경이 조성되면 인공지능을 구동시킬 재료 즉, 개인의 보건의료 데이터에 대한 공유와 활용 요구는 커질 것이다. 결국, 헬스케어 영역 내에 인공지능 기술의 도입과 기술 고도화는 방대한 데이터의 수집, 가공, 분석 수행의 효율성을 제고시킬 것으로 예상할 수 있다.

2-2 디지털 헬스케어 발전의 촉진 요소: 보건의료 데이터

현대의 지식기반 사회에서 데이터의 중요성은 강조해도 지나침이 없다. 데이터는 학문과 산업 발전의 재료로서 디지털 기술이 도입된 헬스케어 영역도 예외일 수 없다. 디지털 헬스케어는 다양한 유형, 빈도, 측정 단위를 갖는 보건의료 데이터를 실시간으로 생성하고 있다.

선행 문헌에서는 디지털 헬스케어의 발전과 경쟁력 제고를 위해 보건의료 데이터 전반에 걸쳐 해결이 요구되는 이슈를 제기하고 있다. 즉, 측정된 보건의료 데이터는 빅 데이터(Big Data)화 되어야 할 것이며 빅 데이터화를 위한 기술적, 법률적 해결[7], 수집된 개인 정보의 비식별화[8],[9], 비식별화에 의한 가명 정보 활용, 정보 주체에 대한 권리 보호[10], 공공데이터로서 보건의료 데이터의 안전성 확보[11], 사이버 공격으로부터 데이터의 보호[12], 데이터 소유권이 누구한테 있는지에 관한 정립[13], 데이터의 공공적 활용 가치 증진을 위한 거버넌스 구현[5], 현행 데이터 3법에 기초한 데이터 수집, 폐기까지의 보안책과 국가 거버넌스 구축[14], 보건의료 학술 연구를 위한 데이터 이차 활용 법제 개선[15], 데이터 활용 활성화를 위한 수집, 유통, 관리 등 전체 가치 사슬에 관한 정책 지원[6]의 필요를 지적하고 있었다.

선행 문헌을 종합할 때, 보건의료 데이터 체계 전반에 걸쳐 해결이 요구되는 상황으로 해결 또는 개선이 이루어진다면 보건의료 데이터는 디지털 헬스케어의 활성화에 기여할 것으로 사료된다. 데이터 활용에 관한 기술적, 윤리적, 법제도적 지원과 해결은 당면한 과제라 하겠다.


Ⅲ. 연구 설계 및 분석
3-1 연구 질문, 모형 및 가설

디지털 헬스케어는 인공지능 기반으로 대량의 데이터를 취급하며 해석하고 결과 활용을 통해 의료, R&D와 산업에 혁신을 발생시킬 것이다. 본 연구는 디지털 헬스케어 활성화에 관한 선행 연구[16]의 후속 연구라 할 수 있다. 한대현[16]은 구조방정식 모형(SEM; Structural Equation Modeling) 도입을 통해 인공지능 활용과 디지털 헬스케어의 활성화에 관한 인과 관계를 실증하였고 구조적 관계를 제안하였다(그림 1).


Fig. 1. 
Structural model between AIU and DHA proven in previous research[16]

그러나 기존 모형에서는 기본적인 인과 관계를 반영한 구조 모형으로 타 변수의 개입과 영향 관계에 관한 연구를 추가하지는 않았다. 선행 문헌 검토에 기초하여 디지털 헬스케어에 영향을 미칠 수 있는 중요한 타 변수로, 본 연구에서는 개인의 보건의료 데이터 공유 활용을 제시하였다. 선행 연구들에서는 데이터가 적절하게 활용되기 위해서는 데이터 체계 전반에 걸쳐 기술적, 윤리적, 법제도적 해결을 과제로 제기하고 있었다. 이에 대한 문제의식을 바탕으로 기존의 구조 모형에서 새로운 변수 ‘보건의료 데이터 활용’을 추가하여 구조적 관계를 조사하기 위해 다음의 연구 질문을 제기하였다.

한대현[16]에서 수립한 구조 모형에 보건의료 데이터 공유 활용 변수를 추가하여 모형을 확장 시에도 모형의 타당성은 유지되는가? 종속변수 디지털 헬스케어 활성화에 대한 인과성이 새롭게 형성된다면 어떠한 의미 부여가 가능한가?

그림 1의 기존 모형에 비해 ‘보건의료 데이터 공유 활용(HDS; Healthcare Data Sharing)’ 변수를 추가한 새로운 연구 모형(그림 2)에서 매개 변수로 기능할 것이라는 가정이 가능하다. 연구 질문 검증을 위해 다음과 같이 연구 가설을 수립하였다.

  • H1. 인공지능 활용은 보건의료 데이터 공유 활용에 정(+)적 영향을 나타낼 것이다.
  • H2. 보건의료 데이터 공유 활용은 디지털 헬스케어 활성화에 정(+)적 영향을 나타낼 것이다.
  • H3. 보건의료 데이터 공유 활용은 인공지능 활용에 따른 디지털 헬스케어 활성화 간의 관계에서 매개 효과(Mediation Effect)를 나타낼 것이다.

Fig. 2. 
Establishment of a mediation model as a research model

그림 12에서 AIU(Artificial Intelligence Utilization)는 ‘인공지능 활용’이며 3개의 변수로 구성된다. DDT(Disease Diagnosis and Treatment)는 ‘질병 진단 치료’, DPP(Disease Prediction and Prevention)는 ‘질병 진단 예방’, ETP(Efficiency of Treatment Procedures)는 ‘진료(치료) 절차 효율’을 의미한다. 여기서 AIU는 독립 변수로 잠재 변수(Latent Variable)에 해당되며 DDT, DPP, ETP는 측정 변수(Measurement Variable)가 된다[16].

DHA(Digital Healthcare Activation)는 ‘디지털 헬스케어 활성화’로 2개의 변수로 구성된다. PHI(Personal Health Improvement)는 ‘개인 건강 향상’, FD(Future Demand)는 ‘미래 수요’를 의미한다. 여기서 DHA는 종속 변수로 잠재 변수에 해당되며 PHI, FD는 측정 변수가 된다[16].

HDS(Healthcare Data Sharing)는 ‘보건의료 데이터 공유 활용’으로 매개 변수로 기능하며 2개의 변수로 구성된다. 즉, IPH(Intent to Provide Healthcare Data)는 ‘보건의료 데이터 제공 의도’, CHS(Consent to Use Healthcare Data Sharing)는 ‘보건의료 데이터 공유 활용 동의’이다. IPH와 CHS는 HDS에 대한 측정 변수가 된다. 그림 2의 연구 모형은 변수 간 영향성이 단일 방향인 재귀모델(Recursive Model)로 구성된다.

3-2 분석 자료 및 방법

분석에는 한국개발연구원(KDI)에서 2021년 6월 웹(Web) 설문한 국내 일반인 1,000명의 원 자료(Raw Data)가 사용되었다. 표본은 지역, 성별 및 연령에 대한 층화 표집으로 수집되었고 표본오차 95%, ±3.1%p의 신뢰 수준을 갖는다. 표 1에 인구통계학적 특성을 제시하였다. 표본은 일반인 코호트(Cohort)로 특정 시점에 수집된 설문이다.

Table 1. 
Demographic sample characteristics[16]
Demographics Frequency Ratio
Total frequency
(16 Cities and provinces nationwide)
1,000 100.0%
Gender Men 509 50.9%
Women 491 49.1%
Age 20~29 181 18.1%
30~39 182 18.2%
40~49 220 22.0%
50~59 231 23.1%
60~69 186 18.6%
Job Agriculture/forestry/fishery, etc. workers 9 0.9%
Self-employed 77 7.7%
Sales/Service 49 4.9%
Production/Technical Jobs/Labor Jobs 75 7.5%
general office work 395 39.5%
Managerial/professional 114 11.4%
Housewife 132 13.2%
Student 45 4.5%
Unemployed 88 8.8%
etc 16 1.6%
Education High school graduate or below 193 19.3%
University/college attendance or higher 807 80.7%

분석 방법은 우선, 변수를 설정하며 변수에 대한 모형 적합도 향상을 위해 항목 묶기(Item Parceling)를 하였고 신뢰도 분석(Reliability Analysis)을 진행하였다. 이어서 상관 분석 및 정규성 판단을 진행하였고, 매개 모형에 대한 적합도(Model Fit) 판단을 위해 확인적 요인 분석(CFA; Confirmatory Factor Analysis) 후 경로 분석(Path Analysis)을 실시하였다. 마지막으로 연구 모형으로서 매개 모형에 대한 유의성 검정(Bootstrapping)을 하였다. 분석에는 SPSS 26과 AMOS 25 버전이 사용되었다. 구조방정식 모형 분석은 표본 개수가 200개 이상이면 가능한데[24], 본 연구는 조건을 만족하고 있었다.

본 연구에서 매개 변수(HDS)를 설명하는 측정 변수 IPH, CHS 중에서 IPH는 ‘보건의료 데이터 제공 의도’를 말하는 것으로 4개의 세부 변수로 구성되어 있다. 즉, 개인의 보건의료 데이터를 1) 타 병원 진료기록 공유 등을 통한 정밀한 진단 및 진료 2) 맞춤형 운동, 식이 처방 등 개인별 맞춤 서비스 이용 3) 치료법 개발 등 학술⋅연구 목적 4) 민간 헬스케어 기업의 의료 상품·서비스 개발 목적으로의 제공 의사를 말하는 것으로, ‘예(0점)’, ‘아니오(1점)’로 측정되었다.

상기 4개 문항에 대해서는 분석을 위해 항목 묶기 기법이 적용되었다. 항목 묶기는 각 항목을 하나 이상의 묶음으로 만들어 잠재 변수를 구성하는 관측 변수를 활용하는 것을 말한다[25]. 이 방법은 문항의 공통성 수치를 강화하고 오차를 감소시키는 특징이 있다[26]. 그러나 설문에 있어 개별 문항의 정보가 상실된다는 약점도 있다. 그럼에도 구조방정식 분석 모형에 있어 모형 적합도 향상에 장점이 있는 것으로 제시되어 있다[27].

3-3 변수 및 내적 일관성

표본은 5점 리커트(Likert) 척도로 측정되었다. 다만, 측정 변수 IPH는 항목 묶기에 의해 4점 척도로 측정되었다. 표 2에 변수에 대한 빈도 분석 결과를 정리하였다. 구조 모형 내에서 측정 변수들은 내적 일관성(Internal Consistency Reliability)을 갖추어야 한다. 연구 모형에 사용된 변수 즉, DDT, DPP, ETP, PHI, FD, IPH, CHS에 관한 신뢰도 분석 결과는 표 3과 같다. 표에서 크론바흐 알파(Cronbach's alpha) 값은 각각 .856, .717, .640으로 나타났으며 기준 수치 .6 이상을 보이며 내적 일관성[28]이 만족되고 있었다.

Table 2. 
Frequency analysis for variables
Latent
Variable
Measure
ment Variable
Score Frequency N
0 1 2 3 4 5
AIU DDT1) - 6 67 302 512 113 1,000
DPP2) - 5 52 247 555 141 1,000
ETP3) - 4 37 201 560 198 1,000
DHA PHI4) - 1 15 165 638 181 1,000
FD5) - 2 9 121 570 298 1,000
HDS IPH6) 47 80 181 299 393 - 1,000
CHS7) - 7 41 237 565 150 1,000
The meaning of measurement variables is as follows: DDT1)(Disease Diagnosis and Treatment), DPP2)(Disease Prediction and Prevention), ETP3)(Efficiency of Treatment Procedures), PHI4)(Personal Health Improvement), FD5)(Future Demand), IPH6)(Intent to Provide Healthcare Data), CHS7)(Consent to Use Healthcare Data Sharing)

Table 3. 
Reliability analysis for variables
Latent Variable Measurement Variable Cronbach's alpha
AIU DDT, DPP, ETP .856
DHA PHI, FD .717
HDS IPH, CHS .640


Ⅳ. 분석 결과
4-1 상관 분석

측정 변수 간의 상관 분석 결과를 표 4에 정리하였다. 표에서 변수에 대한 정규성 지표인 왜도(Skewness), 첨도(Kurtosis)를 확인한 결과, 모든 변수에서 만족되고 있었다. 즉, 절대값 2를 초과하는 왜도와 절대값 7을 초과하는 첨도는 없었다[29]. 다중공선성(Multicollinearity)과 관련하여서도 상관계수 .8을 초과하는 변수는 발견되지 않았다.

Table 4. 
Correlation, descriptive statistics and normality of measured variables
AIU DHA HDS
DDT DPP ETP PHI FD IPH CHS
DDT 1 - - - - - -
DPP .688** 1 - - - - -
ETP .630** .678** 1 - - - -
PHI .448** .491** .484** 1 - - -
FD .358** .393** .434** .560** 1 - -
IPH .178** .184** .151** .227** .190** 1 -
CHS .246** .305** .290** .471** .389** .401** 1
Mean 3.66 3.78 3.91 3.98 4.15 2.91 3.81
S.D .788 .769 .759 .644 .671 1.145 .761
Max 5 5 5 5 5 4 5
Min 1 1 1 1 1 0 1
Skewness -.435 -.546 -.580 -.412 -.528 -.901 -.601
Kurtosis .217 .511 .630 .841 .763 -.007 .843
*p<.05, **p<.01, ***p<.001

변수 간 상관성은 p<.01 수준에서 낮거나(.151~.393) 또는 보통에서 비교적 높은(.401~.688) 범위를 나타내었다. 이는 측정 변수 간의 상관 계수 정보이며 인과성을 대변하는 것이 아니므로 잠재 변수에 대한 구조모형 분석을 후속 진행하였다.

4-2 모형 적합도 및 경로 분석

연구 모형 분석을 위해서는 모형 적합도(Fitness) 평가가 요구된다. 구조 모형 적합도 평가 지표로는 TLI(Tucker-Lewis Index; 터커 루이스 지수), CFI(Comparative Fit Index; 비교 적합 지수) 및 RMSEA(Root Mean Square Error of Approximation; 근접 평균 제곱 오차)를 사용하였다[16]. 그리고 모형 타당성(Validity) 평가 지표로는 AVE(Average Variance Extracted; 평균 분산 추출), Construct Reliability(개념 신뢰도)를 사용하였다[16]. 분석 결과를 표 5에 정리하였다.

Table 5. 
Confirmatory factor analysis results for mediation model
Latent Variable Mesurement
Variable
Estimate S.E. Critical Ratio AVE Construct
Reliability
B β
AIU ETP 1 .801 - - .770535 .909609
DPP 1.080*** .854*** .039 27.407
DDT 1.029*** .794*** .040 25.859
DHA PHI 1 .822 - - .751665 .857143
FD .861*** .680*** .046 18.730
HDS IPH 1 .446 - - .627884 .751803
CHS 1.343*** .901*** .159 8.444
*p<.05, **p<.01, ***p<.001

표에서 보건의료 데이터 공유 활용(HDS; Healthcare Data Sharing)을 매개로 하는 인공지능 활용(AIU; Artificial Intelligence Utilization)과 디지털 헬스케어 활성화(DHA; Digital Healthcare Activation)의 측정 모형 적합도는 χ2=22.091(p<.05), TLI=.992, CFI=.996, RMSEA=.032로 나타나 만족되는 것으로 확인되었다. 모형의 집중타당성 지표인 AVE는 .5 이상 및 Construct Reliability는 .7 이상으로 나타나며 타당성이 확인되었다.

모형 적합도 판단을 위한 확인적 요인분석 결과(CFA), 표 5에서 확인할 수 있는 것과 같이 잠재 변수인 보건의료 데이터 공유 활용, 인공지능 활용, 디지털 헬스케어 활성화는 각 측정 변수에 이르는 모든 경로계수 값이 통계적으로 유의함을 보였다(p<.001). 후속된 경로 분석의 수행 조건이 만족되고 있었다.

따라서 경로 분석을 실시하였고 결과를 표 6에 정리하였다. 표에서 인공지능 활용(AIU)은 보건의료 데이터 공유 활용(HDS)에 유의한 정(+)적 영향을 나타내었다(β=.388, p<.001). 보건의료 데이터 공유 활용(HDS)은 디지털 헬스케어 활성화(DHA)에 유의한 정(+)적 영향을 나타내었다(β=.424, p<.001). 그리고 인공지능 활용(AIU)은 디지털 헬스케어 활성화(DHA)에 유의한 정(+)적 영향을 나타내었다(β=.542, p<.001).

Table 6. 
Path analysis results for mediation model
Path Estimate S.E. Critical Ratio
B β
AIU → HDS .326*** .388*** .048 6.814
HDS → DHA .441*** .424*** .048 9.170
AIU → DHA .472*** .542*** .036 13.212
*p<.05, **p<.01, ***p<.001

모든 경로에서 유의한 정(+)적 효과를 나타내었는데 이는 보건의료데이터 공유 활용이 매개 변수로 작용하여 부분 매개 효과를 발생시키고 있으며 디지털 헬스케어 활성화가 촉진된다는 것으로 해석할 수 있다. 이에 관한 매개 효과 검증이 요구되며 검증 도구로 부트스트래핑(Bootstrapping)을 후속 진행하였다.

4-3 매개 효과 검증

인공지능 활용과 디지털 헬스케어 활성화 간의 관계에서 보건의료 데이터 공유 활용의 매개 효과를 검증하였다. 표본에 결측 값은 없었으며 매개 효과 유의성 검증(부트스트래핑)이 가능하였다. 부트스트래핑 조건으로 Estimate(β) 추정을 위한 반복수는 500회로 설정하였고 Bias-corrected confidence intervals가 95% 신뢰구간 내에서 유의한지를 확인하였다. 매개 효과의 Estimate, 표준오차 및 95% 신뢰 구간 값을 표 7에 정리하였다.

Table 7. 
Mediating effect validation of healthcare data sharing utilization(Bootstrapping)
Path Estimate S.E. 95% Confidence Interval
B β
AIU → HDS → DHA .144*** .165*** .028 .096~.204
*p<.05, **p<.01, ***p<.001

표에서 보건의료 데이터 공유 활용에 대한 매개 효과는 95% 신뢰 구간에서 .096~.204 범위의 하한 값과 상한 값을 나타내고 있어 0을 포함하지 않은 것으로 나타났다. 만약 신뢰 구간 내에 0이 포함되어 있을 경우, 추정 계수 Estimate는 음(-)의 영향력 또는 양(+)의 영향력이 될 수가 있기에 유의하지 않은 것으로 해석한다[30]. 즉, 보건의료 데이터 공유 활용의 매개 효과는 유의한 것으로 검증되었고(p<.001), 매개 효과의 종류는 부분 매개(Partial Mediation)임이 확인되었다.


Ⅴ. 결 론

본 연구에서는 인공지능과 보건의료 데이터 취급에 관한 선행 연구를 검토하며 디지털 헬스케어 발전의 촉진 요소로서 보건의료 데이터 공유 활용이 핵심적 대상임을 확인하였다. 선행 연구에 기초하여 보건의료 데이터 공유 활용이라는 변수를 도입하고 디지털 헬스케어 활성화에 영향 미치는 매개 모형 설정과 분석을 진행하였다.

분석 및 부트스트래핑 검증 결과, 연구 가설로 진술한 보건의료데이터 공유 활용의 매개 효과가 통계적으로 유의하게 성립되었다(p<.001). 따라서 종속변수 디지털 헬스케어 활성화에 대한 새로운 구조 모형 즉, 매개 모형이 수립되었음을 연구의 결과물로 제시할 수 있겠다.

본 연구에서 보건의료 데이터가 인공지능과 디지털 헬스케어 사이에서 양자를 매개하는 요인으로 설정되어 검증한 것은 선행 연구들과의 차별성이라 하겠다. 또한, 본 연구에 대한 직접적인 선행 연구[16]의 확장 연구라는 측면에서도 차별성이 있다.

연구 모형의 확장은 디지털 헬스케어 활성화와 상관성, 인과성을 갖을 수 있는 타 요인에 관한 추가적 연구 기회를 부여할 수 있다는 점에서 학술적 의미가 있다. 나아가 디지털 헬스케어를 중심으로 요인 간의 상호 작용 연구 결과가 축적된다면 신기술(Emerging Technology)인 디지털 헬스케어에 관한 이론 정립에 기여할 수 있을 것이다. 방법론에 있어 구조방정식 모형 분석을 도입함으로 선형적인 회귀 모형의 한계를 극복하며 여러 변수가 작용하는 복합적 상황에서 인과성 판단이 가능하다는 연구의 특징이 있다. 다만, 보건의료데이터 변수 이외의 추가 변수를 설정하지 못하여 다중 매개 모형 등 분석을 진행하지 못한 것은 연구의 한계라 하겠다.

본 연구를 기반으로 디지털 헬스케어를 둘러싼 새롭고 발전된 모형 제안이 가능하였고 향후, 모형 수정을 거쳐 분석이 가능할 것이다. 본 연구는 디지털 헬스케어 관련 정책과 법제도 개선을 뒷받침하는 근거 자료로 활용될 수 있을 것이다. 디지털 헬스케어 관련 정책과 법제도 개선에 근거가 되고 나아가 데이터의 사회적 활용 관련 논의에 기초가 되길 바란다.

아울러 선행 연구[4],[16]에서도 지적하였듯이 사회 이슈가 되어 가는 인공지능은 의료와 관련 산업에 깊숙이 개입할 것으로 예상되는바 국가의 헬스케어 정책 추진, 보완과 관련하여 헬스케어에 관한 인식 조사와 연구가 지속적으로 요구되며 마땅히 강조되어야 할 것이다.


References
1. Y. S. Choi, Medical Artificial Intelligence, Seoul, Cloudninebooks, 2018.
2. Y. S. Choi, Digital Healthcare: The Future of Healthcare, Seoul, Cloudninebooks, 2020.
3. G. Hessler and K.-H. Baringhaus, “Artificial Intelligence in Drug Design,” Molecules, Vol. 23, No. 10, pp. 1-13, October 2018.
4. D. Han, “Causal Relationship Between Use of Artificial Intelligence and Vitalization of Digital Healthcare,” Journal of Digital Contents Society, Vol. 24, No. 11, pp. 2777-2786, October 2023.
5. H. C. Kim and S.-J. Kim, “Healthcare Data in the Intelligent Information Age How to Activate Use,” Journal of Korean Association for Regional Information Society, Vol. 25, No. 3, pp. 1-21, September 2022.
6. E. H. Choi, “Use of Medical Data and Policy Implications,” KIET Monthly Industrial Economics, Vol. 296, pp. 23-33, May 2023.
7. Y. Kim, “Legal Issues on the Use of Personal Medical Information and Big Data,” Legislation, Vol. 691, pp. 61-115, December 2020.
8. J. H. Kim, “Utilizing Big Data and Protection of Personal Information in Healthcare : Non-identification,” Law & Technology, Vol. 15, No. 2, pp. 49-67, March 2019.
9. S.-M. Choi and K.-J. Kim, “A Study on the Safe Use of Data in the Digital Healthcare Industry Based on the Data 3 Act,” Journal of the Korea Convergence Society, Vol. 13, No. 4, pp. 25-37, April 2022.
10. S. Y. Kim. “Pseudonymized Medical Information for Drug Development: Issues and Suggestions,” Law & Technology, Vol.16, No. 6, pp. 80-89, November 2020.
11. K. Y. Choi, “Challenges for Safe Utilization of Public Open Data and Protection of Data Subject in Healthcare,” Health Insurance Review & Assessment Service Policy Brief, Vol. 14, No. 3, pp. 21-28, May 2020. https://repository.hira.or.kr/handle/2019.oak/2321
12. K.-H. Kim, S.-S. Choi, I.-H. Kim, and Y. Shin, “A Study on the Establishment of a Digital Healthcare Next-Generation Information Protection System,” Journal of the Korea Society of Computer and Information, Vol. 27, No. 7, pp. 57-64, July 2022.
13. H. Cha and J. Kim, “Ethical Issues Concerning Health Data Ownership,” Korean Journal of Medical Ethics, Vol. 24, No. 4, pp. 423-459, December 2021.
14. H. Kim, “The Effect of Data 3 on the Utilization of Medical Big Data for Early Detection of Dementia,” Journal of Digital Convergence, Vol. 18, No. 5, pp. 305-315, May 2020.
15. M.-J. Park, “A Study on Legal Framework for Secondary Use of Public Data in Scientific Research on Health : Focusing on Secondary Use of Bio·Medical Information and Genomics Data,” Korean Journal of Medicine and Law, Vol. 24, No. 2, pp. 69-85, December 2016.
16. D. Han, “Structural Relationship Between Artificial Intelligence Utilization and Digital Healthcare Activation: Application of Structural Equation Modeling,” Journal of Digital Contents Society, Vol. 25, No. 1, pp. 257-265, January 2024.
17. M. S. Park, “Application and Expansion of Artificial Intelligence Technology to Healthcare,” Journal of Business Convergence, Vol. 6, No. 4, pp. 101-109, November 2021.
18. Dictionary of Current Economic Terms. AI: Artificial Intelligence [Internet]. Available: www.moef.go.kr/sisa/dictionary/detail?idx=2046
19. S. B. Lee, J. Song, and A. Park, “A Trend of Artificial Intelligence in the Healthcare,” The Journal of the Korea Contents Association, Vol. 20, No. 5, pp. 448-456, May 2020.
20. M. Jung and W. Kwon, “Present Status and Future of AI-based Drug Discovery,” Journal of the Korea Institute of Information and Communication Engineering, Vol. 25, No. 12, pp. 1797-1808, December 2021.
21. A. Arora, “Conceptualising Artificial Intelligence as a Digital Healthcare Innovation: An Introductory Review,” Medical Devices: Evidence and Research, Vol. 13, pp. 223-230, August 2020.
22. Y. Chang and W. Jung, “Ethical Issues on Healthcare Artificial Intelligence and Bias: Based on Phase of Design and Use,” Human Beings, Environment and Their Future, No. 31, pp. 197-214, October 2023.
23. M. Park, “Lifelog Analysis and Future using Artificial Intelligence in Healthcare,” The Journal of the Convergence on Culture Technology, Vol. 8, No. 2, pp. 1-6, March 2022.
24. A. Boomsma, “The Robustness of LISREL Against Small Sample Sizes in Factor Analysis Models,” Systems Under Indirect Observation: Causality, Structure, Prediction, pp. 149-173, 1982.
25. R. B. Cattell and C. A. Burdsal Jr., “The Radial Parcel Double Factoring Design: A solution to the Item-Vs-Parcel Controversy,” Multivariate Behavioral Research, Vol. 10, No. 2, pp. 165-179, June 1975.
26. T. D. Little, W. A. Cunningham, G. Shahar, and K. F. Widaman, “To Parcel or Not to Parcel: Exploring the Question, Weighing the Merits,” Structural Equation Modeling: A Multidisciplinary Journal, Vol. 9, No. 2, pp. 151-173, November 2002.
27. D. L. Bandalos, “The Effects of Item Parceling on Goodness-of-Fit and Parameter Estimate Bias in Structural Equation Modeling,” Structural Equation Modeling: A Multidisciplinary Journal, Vol. 9, No. 1, pp. 78-102, November 2002.
28. H. Y. Lee, Marketing Research, 4th ed. Seoul, Chung Ram Publishing, 2013.
29. K. V. Mardia, “Applications of Some Measures of Multivariate Skewness and Kurtosis in Testing Normality and Robustness Studies,” Sankhya: The Indian Journal of Statistics, Vol. 36, No. 2, pp. 115-128, May 1974.
30. Hiddengrace Papers Statistics Team, A Paper Passing at a Time: Using AMOS Structural Equations and Advanced Analysis of SPSS, Seoul, Hanbit Academy, 2018.

저자소개

한대현(Daehyun Han)

2023년:고려대 박사(과학기술학) Policy and Management of Science and Technology

2006년~2009년: 경기도경제과학진흥원

2010년~2016년: 삼성전자

2017년~현 재: 삼성서울병원

※관심분야:과학기술정책, 기술위험, 디지털 바이오헬스