텍스트 마이닝 기법을 활용한 국내 스마트워치 인식 및 반응 분석: 트위터(Twitter)를 중심으로
Copyright ⓒ 2023 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
초록
본 연구는 스마트워치 개발시 주목해야 할 항목과 방향성을 제시하고자 이용자의 관심도가 직접적으로 표출되는 소셜 미디어인 트위터(Twitter)의 2018년부터 2021년까지의 스마트워치 관련 게시물 91,028건을 수집한 후 텍스트 마이닝 기법인 LDA기반 토픽 모델링 및 TF-IDF 통해 국내의 잠재적 이용자와 실질적 이용자를 포함한 대중들의 스마트워치 인식에 대한 주요 쟁점을 도출하고, 시계열 이상치 탐지 및 감정 분석 기법을 활용하여 스마트워치의 정서적 반응을 파악하였다. 분석 결과 국내 스마트워치에 대한 주제는 스마트워치의 ‘재질’, ‘시리즈’, ‘건강정보측정기능’, ‘기타기능’, ‘운동항목’, ‘훈용기기’, ‘구매처/사유’로 나뉘었으며, 2020년과 2021년 코로나19 전염병의 영향으로 스마트워치의 ‘혈중산소농도’ 측정 기능이 상대적으로 주목받았음이 확인되었다. 또한 감성 분석을 실시한 결과 긍정적인 평가가 부정적인 평가보다 꾸준히 높으며 디자인의 심미성과 사용시 편리함을 긍정적으로, 높은 가격과 기능 활용의 어려움 및 착용시 불편함을 부정적으로 평가함이 확인되었다.
Abstract
This study presented the factors and directions that should be noted in smart watch development by analyzing the perception and emotional response of domestic smart watches using text mining techniques. Accordingly, 91,028 posts related to smart watches from 2018 to 2021 were collected through Twitter text data, a representative service of SNS(Social Network Service), and LDA(Latent Dirichlet Allocation)-based topic modeling, TF-IDF(Term Frequency-Inverse Document Frequency), Anomaly Detection, and Sentiment-Analysis techniques were performed after preprocessing the collected posts by R and Python Program. Through LDA-based topic modeling and TF-IDF, it aims to derive major issues on the perception of smart watches by the public, including potential and actual users in Korea, and to grasp the emotional response of smart watches using emotional analysis techniques based on Anomaly Detetion.
Keywords:
Wearable Device, Topic Modeling, Term Frequency-Inverse Document Frequency, Sentiment Analysis키워드:
웨어러블 디바이스, 토픽 모델링, 빈도 가중치 모델, 감정 분석Ⅰ. 서 론
사물인터넷(IoT; Internet of Things)은 스마트홈, 스마트시티, 스마트카, 헬스케어 등 다양한 분야에서 활용되고 있으며 특히 헬스케어 기반의 웨어러블 디바이스에 적용되어 이에 대한 관심도가 증가하고 있다[1]. 디지털 기술의 혁신적 발전으로 정보통신기술을 개인의 건강관리 서비스에 접목해 활용하는 디지털 헬스(Digital Health) 개인 건강 정보관리 능력도 크게 향상되었다[2]. 이러한 기술발전은 개인이 스스로 건강정보 및 건강상태를 모니터링하고 관리하는 방향으로 개인 건강 정보관리 능력을 전환시켰으며 건강한 삶에 대한 욕구를 증가시켰다[3]. 웨어러블 디바이스는 의료기관 외에서 생성되는 건강생체정보를 개인 스스로 관리할 수 있게끔 지원하는 역할을 하고 있다. 이에 웨어러블 디바이스 사용이 증가하고 있으며 특히 코로나바이러스 감염증이 장기화되고 있는 상황에서 건강에 대한 대중들의 관심이 높아지며 스마트워치 시장이 더욱 급성장하고 있다. 실제로 2021년 SA(Strategy Analytics) 조사에 따르면 웨어러블 디바이스의 대표격인 스마트 워치의 전세계 출하량은 전년대비 47% 급증하였다[4]. 스마트워치란 웨어러블 디바이스 중 하나로 손목형 밴드 모양의 개인 생체데이터를 실시간 분석할 수 있는 트래킹 단말기이다[5].
또한 국내에서도 스마트워치 이용자 수가 증가하고 있으며, 한국갤럽의 ‘2012-2021 스마트폰 사용률 & 브랜드’ 조사 결과에 의하면 국내 스마트워치 이용자 비율은 2015-2016년 기준 1, 2%에서 2019년에는 11%, 2020년에는 12%를 기록하였다[4]. 이처럼 현재 스마트워치는 기술, 의료, 보건 등 다양한 분야에서 주목하고 있으며, 샤오미, 애플, 삼성과 같은 기업에서 2016년부터 2021년까지 다양한 버전의 웨어러블 디바이스를 출시하고 있다. 따라서, 본 연구는 스마트워치 시장이 본격적으로 활성화된 2018년부터 2021년까지 국내 잠재적 이용자와 실질적 이용자를 포함한 대중들의 스마트워치 인식을 살피는데 목적이 있다.
Ⅱ. 선행연구
2-1 스마트워치 연구
기술개발에 따라 웨어러블 디바이스에 대한 관심이 집중됨에 따라 웨어러블 디바이스의 기능 뿐 아니라 디바이스에 대한 사용자의 경험과 반응을 분석한 연구도 다수 실시되었다[6], [7]. 손목형 웨어러블 디바이스에 대한 사용자 반응분석은 샤오미 미밴드2 사용자의 반응을 분석하여 제품에 대한 만족도를 기반으로 유용성, 경제성, 심미성, 사용성, 가치성, 기타로 웨어러블 디바이스의 사용자 반응을 분석하는 연구가 진행되었다[1]. 유사하게 스마트워치에 대한 사용자 경험과 관심요소를 평가하기 위해 남녀 10명에게 스마트워치를 24시간 배부하고 17문항의 설문조사를 진행한 이후에 70명의 대학생을 대상으로 스마트워치의 기능 및 외관에 대한 7문항의 설문조사를 실시하였다[8]. 뿐만 아니라 스마트워치 사용자들이 스마트워치를 통해 건강을 관리하는 방법을 통해 스마트워치와 관련한 비판적인 관점을 확인하고자 8명의 남성 사용자를 대상으로 심층면담을 실시하였다[5]. 또한 스마트워치의 기능 만족도를 측정하기 위해 스마트워치 사용경험이 있는 소비자를 대상으로 인터뷰를 진행하여 소비자들이 스마트워치를 사용할 때 고려하는 핵심 요인을 도출하였다[9]. 다만 이러한 연구는 특정 회사의 웨어러블 디바이스 제품을 활용한 이용자를 대상으로 연구를 진행하였기 때문에 일반화에 한계가 있다. 이러한 한계점을 보완하기 위해 스마트워치 및 웨어러블 디바이스의 트렌드를 분석하기 위한 연구로 텍스트 마이닝 기법을 적용한 연구가 등장하였다[10], [11]. 또한 텍스트 마이닝 방법론을 활용한 웨어러블 관련 키워드의 트렌드 분석 연구는 기존 연구와 달리 웨어러블 디바이스 관련 신문기사 11,952건을 수집하여 빈도분석과 바이그램 분석을 실시하였고 이를 통해 웨어러블 관련 키워드의 트렌드 추이파악과 동시에 웨어러블 기기의 동향성과 향후 방향성을 제시하였다[12]. 이는 대량의 텍스트 데이터를 기반으로 트렌드를 분석했으나 웨어러블 디바이스의 이용자 및 비용자의 의견이 아닌 신문기사를 분석했다는 점에서 잠재적 이용자를 위한 웨어러블 디바이스 발전 방향을 제시하는 데에 한계가 있다. 따라서 본 연구에서는 이용자 및 비이용자의 스마트워치에 대한 의견을 자유롭게 주고받는 SNS를 활용하여 스마트워치에 대한 이용자의 의견과 담론을 확인하고자 한다.
2-2 텍스트 마이닝 연구
토픽모델링은 텍스트 마이닝 연구에서 많이 사용되는 연구기법 중 하나로, 다량의 텍스트 집합에서 핵심 주제를 추출하고 각 주제에 대응되는 텍스트를 찾아 분류하는 분석방법이다[13]. LDA(Latent Dirichlet Allocation) 토픽 모델링은 문서 내부에 여러 토픽의 단어가 혼재되어 있음을 가정하며, 확률에 근거하여 이러한 단어들을 토픽에 맞게끔 분류할 수 있다고 본다[14]. 토픽모델링을 실제로 연구에 활용할 시, 토픽 네트워크를 통해 도출된 주제를 기반으로 하여 연구자가 토픽을 분류한다[14]. 해당 연구와 유사한 웨어러블 디바이스 사용자 연구 분야에서도 LDA 토픽 모델링을 활용한 연구가 진행되고 있다. 사용자 리뷰 텍스트 마이닝을 이용한 모바일 헬스 애플리케이션 사용자 니즈 도출 연구는 피트니스 앱 리뷰 119,804건을 대상으로 LDA 토픽 모델링을 실시하였다[3]. 또한 텍스트 마이닝 기법을 이용한 모바일 피트니스 애플리케이션 주요 요인 분석 연구는 6개의 앱 리뷰 13,119건을 LDA 토픽 모델링으로 분석하였다[15]. 본 연구에서는 다량의 트윗 텍스트 집합에서 핵심 주제를 추출하기 위해 토픽모델링 기법을 적용하여 웨어러블 디바이스에 대한 전체적인 담론을 토픽으로 나누어 살펴보고자 한다.
TF-IDF는 빈도 가중치 모델로 문서들 간 단어의 중요도를 비교하고 평가하는 방식으로 가중치 값이 클수록 각 문서의 주제를 식별하는데 사용될 수 있다[16]. TF-IDF를 활용한 연구로는 올림픽과 관련된 SNS 게시글을 TF-IDF 기법으로 분석하여 연도별 키워드 차이를 확인하여 스포츠 트렌드를 분석한 연구[17]와, 소설의 구조인 머리말, 대화문, 비대화문, 맺음말 별 TF-IDF 가중치를 분석하여 도서별 주제어를 추출하고 이를 통해 고객에게 적합한 도서 정보를 제공하는 연구[18]가 있다. 특히, 두 개 이상의 텍스트 문서를 비교할 때 TF-IDF를 활용할 수 있으며, 텍스트의 개성 및 특징을 드러내는 주요 단어를 찾는데 활용된다[17]. TF-IDF 값이 큰 단어를 확인해보면 다른 텍스트 그룹과는 구별되는 특징을 알 수 있다.
본 연구에서는 TF-IDF 기법을 활용하여 스마트워치 관련한 트위터 게시물을 연도별로 분석하여, 해당 연도에서는 다른 연도와 달리 무엇에 관심이 있는지 파악하고자 한다.
감정 분석은 텍스트 마이닝 기술을 사용하여 문장 또는 문서에서의 표현이 긍정, 부정 혹은 중립 인지를 판별하는 기술로서 텍스트내 어떤 감정이 담겨있는지를 분석하기 위해 사용하는 분석 기법이며 이를 통해 텍스트 생성자가 어떤 감정을 담아 생성하였는지, 혹은 사람들이 어떤 주제를 긍정적 또는 부정적으로 받아들이는지를 수치화 하여 확인할 수 있다[19]. 감정 분석을 활용한 연구분야로는 관련 뉴스, SNS를 분석하거나 서비스, 제품에 대한 데이터를 분석하는 경우가 있으며 실제 감정 분석을 활용한 연구로는 트위터 게시글에 드러난 감성을 분석하고 이를 기반으로 패션 트렌드 마케팅을 예측한 연구가 있다[20]. 또한 감성사전을 구축하고 이를 검증하고자 트위터 SNS 플랫폼에서 고속도로 관련 키워드를 활용한 게시글을 대상으로 감성분석을 실시한 연구는 SNS 중 하나인 트위터 감성분석을 통해 교통분야에 적합한 의미 있는 정보추출이 가능함을 확인하였다[21]. 본 연구에서는 감정 분석 기법을 활용하여 국내 스마트워치에 대한 감정적 반응을 살피고 구체적으로 어떠한 긍정어, 부정어로 반응이 형성되고 있는지를 파악하고자 한다.
시계열 이상치 탐지는 과거 시간순으로 배열된 시계열 데이터를 바탕으로 생성된 모델이 제시한 신뢰수준에서 벗어나는 데이터를 이상치로 탐지하여 다량의 데이터를 빠르게 살펴볼 수 있는 방법이다[22]. 시계열 이상치 탐지를 활용한 연구로는 시계열 모델 기반 트래픽 이상 징후 탐지 연구[23]나 특정 애플리케이션의 리뷰 수 탐지 연구[22] 등이 있다. 본 연구에서는 2018년부터 2021년까지 작성된 트위터의 게시글 수 91,208개를 대상으로 시계열 이상치를 탐지하였으며, 탐지된 원본 데이터를 직접 살펴 토픽모델링과 TF-IDF 결과를 구체적으로 확인하고자 하였다.
Ⅲ. 연구방법
3-1 데이터 수집
손목형 웨어러블 디바이스인 스마트워치가 국내에서도 널리 보급된 것을 바탕으로 이와 관련된 활발한 국내 담론을 확인하려는 목적으로 데이터를 수집하였다.
데이터 수집은 잠재적 사용자를 포함한 이용자들의 인식 파악을 위해 이용자의 관심도가 직접적으로 표출되는 소셜 미디어인 트위터(Twitter) 게시물을 분석하였다. SNS는 대중들이 다양한 관심사에 관해 자유롭게 의견을 피력하는 공간으로 관련된 데이터가 풍부하여, 특정 주제나 기관에 대한 인식 조사를 위해 SNS의 게시글을 텍스트 마이닝 기법으로 분석하는 연구도 다수 진행되고 있다[24], [25]. 본 연구는 최대규모의 SNS 플랫폼 중 하나인 트위터를 활용하였으며, 트위터 플랫폼의 경우 일상에서 대중들이 다른 SNS 플랫폼에 비해 스스로의 생각이나 의견을 보다 실시간으로 편리하게 업로드 할 수 있다는 특징이 있다. 140자라는 글자수 제한이 있는 상황에서 떠오르는 생각과 느낌을 가감없이 업로드한 데이터를 수집할 수 있다는 장점이 있기에, ‘스마트워치에 관한 국내 담론 수집 및 인식 파악’ 이라는 본 연구의 취지에 적합한 데이터를 수집할 수 있다.
트위터 데이터 수집에 사용된 스마트워치 대표 브랜드는 애플사(Apple, Inc.)의 애플워치이다. 2021년 분석에 따르면 스마트워치 시장의 52%를 애플사가 점유하고 있다[4]. 본 연구를 위해 국내 시장 점유율을 반영하고 게시물이 스마트워치에 관한 내용임을 보증하며 동시에 다양한 데이터를 수집하고자 애플워치의 다양한 버전에 해당하는 단어가 사용되었다.
데이터 수집을 위해 파이썬(Python) 텍스트 마이닝 프로그래밍 언어를 활용하였고, 트위터에서 개발한 Tweepy 패키지를 통해 트위터 API를 구동하여 키워드 검색을 실시하였다. 수집된 정보는 1) 트윗(Tweet)한 내용 2) 게시한 일시 3) 작성자 정보이다. 데이터 수집 기한은 애플워치의 시장점유율을 반영하여 2018년 1월 1일부터 2021년 12월 31일까지 최근 4년으로 설정하였다. 수집 결과 광고성 게시물과 중복 게시물을 제거하고 2018년부터 2021년까지 총 91,208개의 스마트워치와 관련한 데이터를 수집하였다([표 1] 참조).
3-2 데이터 분석
본 연구는 다음 <그림 1>과 같은 프로세스로 분석을 진행하였고, RStudio 프로그램을 사용하여 데이터 분석 및 시각화 하였다. 데이터 전처리 과정은 적용되는 텍스트 마이닝 기법에 따라 달라진다(이정우, 2022). 따라서 본 연구는 LDA 토픽모델링과 TF-IDF 및 감성분석기법에 따라 전처리 방식에 차이를 두었다. 우선 텍스트 마이닝 기법과 관계없이 인터넷 커뮤니티에서 주로 사용하는 특수문자, 자음, 모음 위주의 표현과 게시글 검색에 활용되어 모든 리뷰에 포함된 키워드를 불용어로 간주하여 제거하였다. 이후 NLP4kec 라이브러리의 형태소 분석기를 활용하여 단어의 품사를 복원하여, 원래의 형태가 드러나게끔 추출하였다. 이후 텍스트마이닝 분석 기법에 따라 LDA 토픽모델링은 연구자가 키워드를 보다 명확히 확인하고, 토픽의 내용을 해석하기 용이하게 하기 위하여 명사만을, TF-IDF 분석은 연구자가 연도별 텍스트에서 드러나는 차이를 확실히 파악할 수 있도록 명사와 동사, 숫자를 포함하였으며, 감성분석에는 다양한 감정을 나타내는 텍스트가 포함될 수 있도록 명사와 동사를 포함하는 품사를 필터링하였다. 이후 데이터 분석을 위해 첫째, 연도별 스마트워치의 담론을 파악하기 위한 토픽 모델링(Topic Modeling) 기법을 사용하였다. 이는 잠재 디리클레 할당 기법(LDA; Latent Dirichlet Allocation)을 활용하였으며, 토픽을 도출하고 토픽 설명을 위한 핵심 키워드를 선정, 이를 기준으로 토픽명을 설정하였다. 둘째, 연도별 스마트워치의 담론간 차이점 및 특수성을 파악하고자 TF-IDF(Term Frequency-Inverse Document Frequency)기법을 사용하였다. 상위 10개의 TF-IDF 값을 분석하여 연도별 고유한 담론을 확인하였다. 마지막으로 연도별 스마트워치와 관련한 긍정적, 부정적 정서를 확인하고자 감정 분석(Sentiment Analysis)을 실시하였다. 긍정적, 부정적 정서 별 상위 20개의 단어를 분석하였으며 이를 그래프로 시각화 하였다. 추가적으로 스마트워치와 관련된 담론의 구체적인 내용을 원본 데이터에서 직접 확인하고자 트윗 수의 시계열 이상치 분석을 실시, 이상치를 추출하여 원본 데이터를 확인하고 토픽모델링 결과 및 감성분석 결과와 연결지어 해석하였다.
Ⅳ. 연구결과
애플워치와 갤럭시워치 관련 트위터 게시물을 분석한 결과, 스마트워치에 관한 게시물의 추이는 <표 1>과 같이 지속적으로 증가하고 있다. 애플워치와 관련된 게시물 수는 애플워치 기기 출시일 후로 증가하였다. 2018년 11월 852건, 2019년 10월 1,294, 11월 1,429건, 2020년 9월 3,795건, 10월 4,385, 2021년 9월 4,320건, 10월 4,460건으로 언급량이 증가하였는데 ([표 1] 참조), 이는 2018년 11월 2일 애플워치 시리즈 4가 국내에 정식으로 출시되었으며, 2019년 10월 15일 애플워치 시리즈 5의 국내 정식 출시일이 확정, 10월 25일에 정식 출시된 것이 반영된 언급량으로 볼 수 있다. 또한 2020년에는 9월 18일에 애플워치 SE와 애플워치 시리즈 6이 출시되었다. 2021년 9월 15일에는 애플워치 시리즈 7이 출시되었다. 이는 대중들의 관심이 스마트워치의 신제품 출시일 직후에 증가함을 의미한다.
4-1 토픽 모델링(Topic Modeling) 분석
2018년 1월 1일부터 2021년 12월 31일까지 수집한 총 91,208개의 트위터 게시물을 대상으로 LDA 토픽 모델링을 실시하여 주제와 키워드의 분포를 확인하였다([표 2] 참조). 국내 스마트워치 이용자가 증가함[4]에 따라 연도별로 스마트워치 언급 게시물도 증가하였다. 토픽 수를 객관적으로 결정하기 위해 특정 확률이 해당 모델의 결과를 얼마나 잘 예측하고 있는지를 나타내는 값인 혼잡도(perplexity)와 주제 내 단어의 유사도를 계산하여 의미론적 일관성을 측정하는 응집성 지수(coherence score)를[26] 활용하였다. 혼잡도 값이 클수록 의미론적 일관성이 높으며, 응집성 지수가 높을수록 결과를 잘 예측한다는 의미이다. 본 연구 모델의 혼잡도는 토픽 수가 3개일 때 가장 높았으며, 이후 점진적으로 감소, 토픽 수가 10개일 때 급격히 감소하였다. 반면 응집성 지수는 토픽 수가 3개일 때 가장 높았으며, 이후 9개일 때 높았다. 따라서 본 연구는 토픽 수를 9개로 설정하였다([그림 2,3] 참조).
LDA 토픽 모델링 분석결과 및 토픽 내 핵심 키워드 가중치 분포도 ([표 2] 참조)를 도출하였고, 토픽을 대표할 수 있는 키워드를 중심으로 토픽명을 설정하였다. 토픽은 ‘건강정보측정기능’, ‘기타측정기능’, ‘기타기능’, ‘시리즈 디자인’, ‘재질 및 색상 디자인’, ‘구매방법’, ’구매사유’, ‘혼용기기’, ‘업데이트 및 기타’로 명명하였다. LDA 토픽모델링 분석결과, ‘건강정보측정기능’ 에는 ‘심박수’, ‘측정’, ‘기능’, ‘혈당’, ‘심전도’와 같은 키워드가 추출되었으며 이는 스마트워치의 심박수, 심전도, 혈중산소농와 같은 건강정보를 측정하는 기능에 관한 내용임을 알 수 있다. ‘기타측정기능’에는 ‘심호흡’, ‘소리’, ‘수면’과 같은 키워드가 추출되었으며 이는 심호흡, 주변 소음, 수면상태 등을 측정하는 기능에 대한 내용임을 추정할 수 있다. ‘기타 기능’은 ‘시계’, ‘사진’, ‘전화’, ‘알람’ 등의 키워드가 추출되었으며 이는 스마트워치가 제공하는 시계, 앨범, 전화, 알람등의 기능에 대한 내용임을 파악할 수 있다. ‘시리즈 디자인’은 ‘에르메스’, ‘나이키’, ‘에디션’ 등 스마트워치가 특정 브랜드와 협업한 제품에 관해 언급하고 있음을 알 수 있다. ‘재질 및 색상 디자인’의 경우 ‘실버’, ‘블랙’, ‘알루미늄’ 과 같은 키워드가 추출되었으며 이는 스마트워치의 색상이나 재질을 의미하는 내용임을 확인할 수 있다. ‘구매사유’ 에는 ‘생일’, ‘선물’, ‘자랑’ 등의 키워드가 추출되었으며 이는 생일이나 선물과 스마트워치가 함께 언급되는 경우가 많음을 시사한다. ‘구매방법’ 에는 ‘이벤트’, ‘구입’, ‘공식’, ‘네이버’ 와 같은 키워드가 추출되었으며 이는 스마트워치 구입 시, 특정 포털사이트나 공식 판매점에서 구매하는 내용임을 알 수 있다. ‘혼용기기’ 의 경우 ‘아이폰’, ‘아이패드’, ‘에어팟’ 등의 키워드가 추출되었으며 이는 스마트워치와 같은 회사의 제품으로, 스마트워치와 함께 자주 언급됨을 확인할 수 있다. ‘업데이트 및 기타’ 는 ‘업데이트’, ‘설정’, ‘셀룰러’, ‘공유’ 와 같은 키워드가 추출되었으며, 스마트워치 구매 이후에도 다양한 기능적 업데이트에 대한 언급이 있음을 확인할 수 있다.
4-2 TF-IDF 분석
텍스트의 개성 및 특징을 드러내는 주요 단어를 찾는데 유용한 TF-IDF 분석을 연도별로 실시하여, 스마트워치 게시물 간의 연도별 차이점 및 특수성을 도출하였다. TF-IDF 수치 기준 스마트워치와 관련된 주요 키워드 상위 10개를 연도별로 <표 3>과 같이 도출하였다. TF-IDF 값이 큰 단어를 확인해보면, 해당 연도에서는 다른 년도와 달리 무엇에 관심이 있는지, 다른 연도와 구별되는 대중의 인식의 차이점 및 특징을 분석할 수 있다.
다른 연도와 달리 2018년에 두드러지는 상위 TF-IDF 키워드로는 ‘500대’, ‘출고’가 있으며, 이는 스마트워치가 다량 출고되었다는 것으로 알 수 있다[27]. ‘당뇨병’은 스마트워치의 심박센서 데이터를 활용하여 사용자가 당뇨를 추적할 수 있다는 것[1], ‘걸음걸이’는 2018년부터 스마트워치로 건강 데이터를 측정하고 이를 의료 서비스와 연계해 더 다양한 건강정보 서비스를 제공할 수 있음을 의미한다[1]. 2019년에 두드러지는 상위 TF-IDF 키워드로는 ‘티타늄’은 스마트워치 재질을 의미하며 ‘넘어짐’은 스마트워치로 신체의 기울기를 측정하여 넘어짐을 확인하고 응급상황에 대처할 수 있음[28]을 뜻한다. 2020년과 2021년에 등장한 ‘혈중’ 키워드는 2020년부터 출시된 스마트워치의 혈중산소농도 측정 기능을 의미한다[29]. 2021년은 유명 연예인들이 스마트워치를 착용한 것과 관련하여 연예인 성명이 등장하였다.
분석결과 2018년, 2019년은 비교적 다양한 생체데이터가 등장한 반면 2020년과 2021년은 코로나와 관련된 단어의 등장과 함께 코로나와 관련하여 스마트워치의 심전도, 심박수 뿐 아니라 혈중산소농도 측정기능과 같은 생체데이터에 대한 대중들의 관심이 높아졌음이 확인되었다.
4-3 시계열 이상치 탐지 및 감정 분석
2018년부터 2021년까지 스마트워치를 둘러싼 대중들의 정서를 분석하고자, 91,265개의 트위터 게시물을 대상으로 감정 분석을 실시하였으며, 스마트워치와 관련하여 어떠한 부분에서 긍정적이거나 부정적인 정서가 도출되었는지를 구체적으로 확인하고자 원본 데이터를 살펴보았다. 이 때 원본데이터를 보다 효율적으로 확인하기 위해 원본데이터를 대상으로 시계열 이상치 탐지를 실시하였으며 게시물의 수가 급증한 이상치 위주로 원본데이터를 확인하였다.
우선 감정분석 결과 2018년에서 2021년까지 긍정적인 정서와 부정적인 정서를 포함한 언어들이 모두 꾸준히 증가하였음이 확인되었다. 연도별 긍정어와 부정어의 빈도분석 결과는 <그림 4>와 같다. <그림 4>를 통해 2018년부터 2021년까지 스마트워치를 둘러싼 대중들의 감정은 긍정이 부정보다 꾸준히 우세함을 알 수 있다. 시간의 흐름에 따라 긍정어와 부정어의 수는 각각 2018년 긍정어 981개, 부정어 601개, 2019년 긍정어 2037개, 부정어 1260개, 2020년 긍정어 4886개, 부정어 3216개, 2021년 긍정어 10,342개, 부정어 5,996개로 긍정과 부정의 격차는 점차 커지는 것으로 관찰되었다 ([표 4] 참조). 스마트워치의 긍정적, 부정적 인식을 구체적으로 확인하고자 연도별 전체 긍정, 부정어 중 상위 20개를 추출하여 <그림 5>와 같이 시각화 하고 상위10개의 유사한 긍정/부정어의 등장 추이를 살피고자 <표 5>와 같이 확인하였다.
<그림 5>에 따르면 2018년 긍정어는 ‘좋다’가 가장 많았으며, 이후 스마트워치를 사용하는 사람이 ‘많다’와 같이 이용자의 수가 많다는 점을 지적하는 부분이 뒤를 이었다. 이외에도 디자인이 ‘예쁘다’, ‘귀엽다’, ‘어울리다’ 와 같이 디자인을 칭찬하는 부분이 관찰되었으며, ‘멋지다’, ‘깔끔하다’ ‘고급’과 같은 단어도 등장하였다. 반면 부정어의 경우 ‘버리다’ 가 가장 많았고, 스마트워치의 가격이 ‘비싸다’가 뒤를 이었다. ‘어렵다’, ‘힘들다’, ‘부담’과 같이 기능을 활용하는데 어려움을 겪는 단어가 다음으로 많이 관찰되었다. 구매를 ‘후회’하는 단어도 관찰되었다. 2019년 긍정어는 마찬가지로 ‘좋다’가 가장 많았으며, 디자인을 칭찬하는 ‘예쁘다’가 이용자 수가 많음을 뜻하는 ‘많다’보다 더 많이 관찰되었다. 이외에 기능이 ‘편리하다’는 긍정어가 새롭게 등장하였으며, 스마트워치를 활용하니 ‘뿌듯하다’와 같은 단어도 새롭게 관찰되었다. 부정어의 경우 2018년과 마찬가지로 ‘버리다’가 가장 많았으며 가격이 ‘비싸다’는 부분이 다음으로 많이 관찰되었다. 이외에도 디자인이 ‘못생기다’ 는 부정어도 새롭게 관찰되었다. 2020년 긍정어의 경우 ‘좋다’를 제외하고 디자인을 칭찬하는 ‘예쁘다’, ‘이쁘다’는 단어가 ‘많다’를 제치고 더 많이 관찰되어 이용자가 많은 장점보다 디자인이 예쁘다는 장점이 더 긍정적으로 평가되는 모습이 확인되었다. 이외에도 ‘성공’, ‘즐기다’, ‘멋있다’는 단어가 새로 등장하였다. 반면 부정어의 경우 지난 2년과 유사하게 가격이 ‘비싸다’, 기능이 ‘어렵다’, ‘불편하다’, ‘쓸데없다’는 부분이 함꼐 등장하였고, 새롭게 ‘부작용’, ‘오류’라는 단어가 등장하여 기능에 대해 부정적인 정서가 형성되는 모습이 보였다. 마지막으로 2021년의 경우 디자인을 긍정적으로 보는 ‘예쁘다’, ‘귀엽다’ 다음으로 사용하니 ‘편리하다’는 단어가 등장하였다. 이용자가 많음을 긍정적으로 보는 모습은 사라졌으며 대신 ‘이득’, ‘똑똑하다’는 단어가 새롭게 등장하였다. 부정어의 경우 ‘비싸다’가 가장 많이 등장하였으며 ‘불편하다’, ‘힘들다’, ‘싫다’, ‘후회’, ‘어렵다’가 뒤를 이어 관찰되었다. 이외에도 ‘불량’, ‘실망’ 등이 등장하였다.
2018년 1월 1일부터 2021년 12월 31일까지의 트위터 게시글 수를 대상으로 시계열 이상치 탐지 분석 결과 <그림 6>과 같이 총 6건의 이상치가 발생하였다. 이상치로 판단된 일자는 2020년 9월, 2020년 10월, 2020년 11월, 2020년 12월, 2021년 3월, 2021년 4월로 확인되었다. 이는 해당 기간에 게시글의 수가 특별히 증가하였음을 의미한다. 따라서 해당 기간의 원본데이터를 살펴보고 감성분석 결과와 연결하여 해석하였다. 해당 일자의 원본 데이터를 확인하여 분석한 결과 대중들이 스마트워치를 긍정적으로 평가하는 요인은 디자인의 심미성, 사용시의 편리함, 다수의 이용자로 확인되었다. 반면 부정적으로 평가하는 요인은 높은 가격, 기능 활용의 어려움, 착용시의 불편함, 기록의 부정확함 등으로 확인되었다(<표 5> 참조). 또한 긍정적으로 평가하는 요인 중 디자인의 심미성이 4년 동안 큰 폭으로 1위를 차지하였으며, 부정적으로 평가하는 요인 중 높은 가격이 4년동안 지속적으로 가장 많이 지적된 것이 확인되었다.
Ⅴ. 결 론
본 연구는 IT기술의 발전으로 개인건강정보관리의 형태가 치료에서 예방으로 바뀌어감에 따라 개인이 건강정보를 얻기 위해 활용하는 주요 기기 중 스마트워치에 관해 국내 잠재적 이용자 및 실질적 이용자를 포함한 대중들이 가진 인식을 파악하였다. 이를 위해 이용자의 의견이 직접적으로 표출되는 소셜 미디어인 트위터라는 SNS 플랫폼을 활용하여 국내 이용자들의 스마트워치 관련 게시물을 수집하였다. 전체적인 담론을 파악하기 위해 연도별로 LDA 토픽모델링 분석 기법을 사용하였고, 이를 기반으로 연도별 인식의 차이를 파악하고자 연도별 TF-IDF 분석기법을 사용하였으며, 대중들의 스마트워치에 관한 정서를 확인하고자 연도별 감정 분석을 실시하였다.
그 결과 스마트워치에 대한 주제는 스마트워치의 ‘재질’, ‘시리즈’, ‘건강정보측정기능’, ‘기타기능’, ‘운동항목’, ‘훈용기기’, ‘구매처/사유’로 나뉘었으며 2018년, 2019년 2년간 ‘디자인’의 ‘기타디자인’항목이 2020년, 2021년에는 ‘색상’으로 구체화되는 변화가 관찰되었다. 이는 연구기간동안 대중들이 스마트워치에 대해 가지고 있는 인식이 일관적이며 주목하는 부분도 명확함을 시사한다. TF-IDF를 실시한 결과 2020년과 2021년 전세계를 강타한 코로나19 전염병의 영향으로 특히나 스마트워치의 ‘혈중산소농도’ 측정 기능이 2018, 2019년도 연구결과에 비해 상대적으로 주목받았음이 확인되었다. 또한 스마트워치를 둘러싼 대중들의 정서변화를 파악하고자 감정 분석을 실시한 결과 긍정적인 평가가 부정적인 평가보다 꾸준히 높으며 그 폭도 지속적으로 증가함을 확인하였다. 시계열 이상치 탐지 기법을 통해 원본데이터와 대조한 결과 연구기간동안 대중들이 스마트워치에 대해 긍정적으로 높은 평가를 준 부분은 디자인의 심미성이었으며 사용시의 편리함이 그 뒤를 이었다. 반면 부정적으로 평가한 항목은 높은 가격과 기능활용의 어려움, 착용시의 불편함임이 관찰되었다.
본 연구는 국내의 잠재적 이용자와 실질적 이용자를 모두 포함한 대중을 대상으로 하였다는 점에서 소수의 특정 계층을 대상으로 한 선행 연구와 차이가 있다. 또한 비교적 짧은 기일이 아닌 2018년부터 2021년까지 4년간의 데이터를 수집하였고, 2020년, 2021년의 스마트워치 시장점유율을 반영하여 데이터를 수집하였다는 점에서 연구결과를 일반화할 수 있으며 신뢰성이 높다. 또한 대중들이 스마트워치에 대해 가지고 있는 인식과 정서적 반응을 알아보기 위하여 텍스트 마이닝 기법은 토픽 모델링, TF-IDF, 감정 분석 기법을 도입하였다는 측면에서 기존의 연구방법과 차이가 크다. 그러나 향후 연구에서는 텍스트 마이닝 분석 기법을 활용함에 있어서 텐서플로우를 홀용한 양방향 LSTM 혹은 자연어 처리 업무에서 사용가능한 트랜스포머 인코더를 활용하여 멀티 헤드 셀프 어텐션(Multi-head Self Attention)을 활용한 텍스트 분류기법을 도입한다면 보다 정밀한 결과를 분석할 수 있다. 결과적으로 본 연구는 대중들이 스마트워치에 대해 가지고 있는 인식을 2018년부터 2021년까지 시간의 흐름에 따라 구체적으로 제시하였으며, 스마트워치에 대해 긍정적, 부정적으로 평가하고 있는 항목을 명확히 제시함으로써 앞으로 스마트워치가 주목해야할 항목과 방향성을 제시하였다.
Acknowledgments
본 연구는 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임 (No. NRF-2020R1G1A1101029).
References
- Gun A Kim, “User Responses Analysis of Wrist Wearable Devices”, Korea Science & Art Forum, Vol. 29, pp. 13-22, June, 2017. [https://doi.org/10.17548/ksaf.2017.06.29.13]
- M. L. A. Lustria, S. A. Smith and C. C. Hinnant, “Exploring digital divides: an examination of eHealth technology use in health information seeking communication and personal health information management in the USA”, Health informatics journal, Vol. 17, No. 3, pp. 224-243, September, 2011. [https://doi.org/10.1177/1460458211414843]
- Gyeong Bin Park and Sang Won Lee, "Examining user needs for mHealth apps based on text mining of user", Proceedings of 2020 Spring Conference of ESK, pp. 85-89, June, 2020.
- Seol Min Park, “Who will be the winner of the smartwatch market in the era of COVID-19“, SisaWeek, Sep. 2021. [Internet],Availabe: http://www.sisaweek.com/news/articleView.html?idxno=147181
- Jung Lae Lee and Ki Nam Kwon, “The Critical Research of Healthcare Focused on Smartwatch Users“, Korean Society for the Sociology of Sport, Vol. 32, No. 2, pp. 92-109, June, 2019. [https://doi.org/10.22173/ksss.2019.32.2.6]
- Ga Yeon Kim, Su Min Kim and Eun Ryoung Hyun, “A Study on User Experience and Usability of Apple-Watch as Wearable Devices“, The Korean Society of Science & Art, Vol. 21, pp. 19-29, September, 2015. [https://doi.org/10.17548/ksaf.2015.09.21.19]
- Hyun Jung Son, Sang Won Lee and Mun Hee Cho, “Influential Factors of College Students’ Intention to Use Wearable Device An Application of the UTAUT2 Model“, Korean Journal of Communication & Information, Vol. 68, No. 4, pp. 7-33, December, 2014.
- Li Ke Cui and Won Kyoung Kim, “For wearable device user experience and user concerns of the elements of the evaluation - Focused on the Wearable Device and Fitbit Flex -“, Journal of Digital Design, Vol. 15, No. 1, pp. 255-264, December, 2015. [https://doi.org/10.17280/jdd.2015.15.1.025]
- Jaehoon Choi and Pansoo Kim, "A Study on the impact of Service Improvement on the Satisfaction Level of Smart Watch Functions", Korean Journal of Business Administration, Vol. 34, No. 5, pp. 807-825, May, 2021. [https://doi.org/10.18032/kaaba.2021.34.5.807]
- Na Kyeong Kim, Won Woo Yang and Jae Boong Choi, “Application of Keyword Analysis Method in Designing Wearable Devices“, The Korea Society of Management information Systems, pp. 470-477, June, 2016.
- Jong Ho Lee and Hee Jun Park, “Comparing Customer Reactions Before and After of a Smart Watch Release through Opinion Mining”, Journal of the Korea Bigdata Society, Vol. 1, No. 1, pp. 1-7, January, 2016.
- Min Jeong Kim, “Analyzing the Trend of Wearable Keywords using Text-mining Methodology“. Journal of Digital Convergence, Vol. 18, No.9, pp. 181-190, September, 2020. [https://doi.org/10.14400/JDC.2020.18.9.181]
- Jun Hyeong Park and Jung Oh Hyo, “Comparison of Topic Modeling Methods for Analyzing Research Trends of Archives Management in Korea: focused on LDA and HDP”. Journal of Korean Library and Information Science Society, Vol. 48, No. 4, pp. 235-258, December, 2017. [https://doi.org/10.16981/kliss.48.4.201712.235]
- Ja Hyun Park and Min Song, “A Study on the Research Trends in Library & Information Science in Korea using Topic Modeling”, Journal of the Korean Society for Information Management, Vol. 30, No. 1, pp. 7-32, March, 2013. [https://doi.org/10.3743/KOSIM.2013.30.1.007]
- S. H. Lee, J. Kim, S. H. Yoon, & H. W. Kim, “An Analysis on Key Factors of Mobile Fitness Application by Using Text Mining Techniques: User Experience Perspective“, Journal of Information Technology Services, Vol.19, No.3, pp.117-137, April, 2020. [https://doi.org/10.9716/KITS.2020.19.3.117]
- Sung Jick Lee and Han Joon Kim, “Keyword Extraction from News Corpus using Modified TF-IDF”, The Journal of Society for e-Business Studies, Vol. 14, No. 4, pp. 59-73, November, 2009. https://uci.org/G704-000612.2009.14.4.010
- Kyu-Won Lee and Hyongjun Choi, "Analysis of Keyword Trends for the Summer Olympics Based on Social Network(SNS) Data", The Korean Society of Sports Science, Vol, 29, N0. 5, pp. 1251-1260, October, 2020. [https://doi.org/10.35159/kjss.2020.10.29.5.1251]
- Eun Soon You, Gun Hee Choi and Seung Hoon Kim, “Study on Extraction of Keywords Using TF-IDF and Text Structure of Novels”, Journal of The Korea Society of Computer and Information, Vol. 20, No. 2, pp. 121-129, February, 2015. [https://doi.org/10.9708/jksci.2015.20.2.121]
- Kang Bok Lee, Jong Bum Baik & Soo Won Lee, “Estimating a Pleasure-Displeasure Index of Word based on Word Similarity in SNS”, KIISE Transactions on Computing Practices, Vol. 20, No. 3, pp. 159-164, December, 2014. G704-A00398.2014.20.3.007
- Yoon-Ju Lee, Ji-Hoon Seo and Jin-Tak Choi, “Fashion Trend Marketing Prediction Analysis Based on Opinion Mining Applying SNS Text Contents”, The Journal of Korean Institute of Information Technology, Vol. 12, No. 12, pp.163-170, December, 2014. [https://doi.org/10.14801/jkiit.2014.12.12.163]
- Doopyo Hong, Harime Jeong, Sangmin Park, Eum Han, Honghoi Kim and Ilsoo Yun, "Study on the Methodology for Extracting Information from SNS Using a Sentiment Analysis", The Journal of The Korea Institute of Intelligent Transportation Systems, Vol. 16, No. 6, pp.141-155, November, 2017. [https://doi.org/10.12815/kits.2017.16.6.141]
- Ji-Hoon Jung, Hye-In Chung and Zoon Ky Lee, “An Analysis of Mobile Food Delivery App 'Baemin' by Using Text Mining and ARIMA Model”, Journal of Digital Contents Society, Vol. 22, No. 2, pp. 291-299, February, 2021. [https://doi.org/10.9728/dcs.2021.22.2.291]
- Gang Hong Cho and Do Hoon Lee, “A Study on Traffic Anomaly Detection Schene Based Time Series Model”, The Journal of Korean Institute of Communications and Information Sciences B, Vol.33, No. 5, pp. 304-309, Feb, 2008. G704-B00600.2008.33.5.004
- Seong Yeon Shin, “Image Analysis and Management Strategy for The National Science Museum Utilizing SNS Big Data Analysis”, Journal of the Korea Academia-Industrial cooperation Society, Vol. 51, No. 3, pp. 251-279, January, 2020. [https://doi.org/10.5762/KAIS.2020.21.1.81]
- Tae Yeon Park and Hyo Jung Oh, “A Study on Library Service in the Post-COVID Era through Issues on Media”, Journal of Korean Library and Information Science Society, Vol. 51, No. 3, pp. 251-279, September, 2020. [https://doi.org/10.16981/kliss.51.3.202009.251]
- Lee Sae-Mi and Hong Soon-Goo, “Analysis of Blockchain Trends Using Topic Modelling Technique”, Journal of information and communication convergence engineering, pp. 44-47, October, 2019.
- Eun Jung Lee, “Smart watch Sales 37% high … No.1 for Apple, ZDnet Korea“, Sep. 2018. [Internet], Available: https://zdnet.co.kr/view/?no=20180905080751
- Ho Seop Choi, “Apple Watch's 'Fall Detection' Story”, Bloter, Feb, 2019. [Internet], Available: https://www.bloter.net/newsView/blt201902060001
- Min Gyu Hwang, “Apple Watch measures 'blood oxygen saturation'… "Early detection of respiratory diseases"“, Chosun Biz, Sep, 2020. [Internet], Available: https://biz.chosun.com/site/data/html_dir/2020/09/16/2020091600162.html
저자소개
2020년 : 숙명여자대학교 학사 (문헌정보학 전공)
2021년 : 숙명여자대학교 일반대학원 석사과정 (문헌정보학 정보학 전공)
2021년~현 재: 숙명여자대학교 일반대학원 문헌정보학과 정보학 석사과정
※관심분야 : Health Informatics, Data Mining, User Experince
2009년 : 숙명여자대학교 학사 (컴퓨터과학 전공)
2011년 : 미국 조지아공과대학교 석사 (컴퓨터과학 전공)
2018년 : 미국 노스캐롤라이나대학교 채플힐 캠퍼스 박사 (문헌정보학 전공)
2020년~현 재: 숙명여자대학교 문헌정보학과 교수
※관심분야 : Consumer Health Informatics, Medical Informatics, Information Retrieval