Korea Digital Contents Society
[ Article ]
Journal of Digital Contents Society - Vol. 26, No. 7, pp.1943-1955
ISSN: 1598-2009 (Print) 2287-738X (Online)
Print publication date 31 Jul 2025
Received 23 Jun 2025 Revised 22 Jul 2025 Accepted 25 Jul 2025
DOI: https://doi.org/10.9728/dcs.2025.26.7.1943

자동차 산업 내 차량 AI 기술 동향 분석: 텍스트 마이닝을 활용하여

신한솔1 ; 이찬희2 ; 서상원1 ; 전대일3, *
1동아대학교 기계공학과 학사과정
2동아대학교 전기공학과 학사과정
3동아대학교 창업교육센터 조교수
Text Mining-Based Analysis of Automotive AI Research Trends
Han-Sol Shin1 ; Chan-Hee Yi2 ; Sang-Won Seo1 ; Dae-Il Jeon3, *
1Bachelor’s Degree, Department of Mechanical Engineering, Donga University, Busan 49315, Korea
2Bachelor’s Degree, Department of Electrical Engineering, Donga University, Busan 49315, Korea
3Assistant professor, Center for Entrepreneurship Education, Donga University, Busan 49315, Korea

Correspondence to: *Dae-Il Jeon Tel: +82-51-200-1045 E-mail: jdipd8219@dau.ac.kr

Copyright ⓒ 2025 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

초록

AI 기술은 자동차 산업에서 주요한 기술이지만 관련 학술 연구는 2022년 이후 감소하는 경향을 보여 이에 대한 학술적ㆍ산업적 관점에서 연구 동향의 정량적 분석이 필요하다. 본 연구는 최근 8년 동안 발표된 국내외 논문을 수집하여 텍스트 마이닝 기법으로 키워드 빈도, TF-IDF, 키워드 네트워크 분석, LDA 기반 토픽 모델링을 수행하였다. 분석 결과 ‘자동차’, ‘자율주행’, ‘음성인식’, ‘빅데이터’ 등이 주요 키워드로 도출되었고, 연구 주제는 차량 내 AI와 사용자 인터페이스, 음성인식 시스템 개발, 자율주행차와 환경 데이터 활용, 운전자 안전 및 위험 관리, 전기차 기술 활용으로 나타났다. 특히 특정 시점 이후 연구 감소는 법 및 윤리적 이슈에 관한 관심 증가와 연관 있으며, 이를 통해 연구는 향후 기술 상용화 및 정책 수립을 기대한다.

Abstract

AI (Artificial intelligence) has become a core technology in the automotive industry. However, recent years have shown a noticeable decline in related research activity, highlighting the need for a systematic, quantitative analysis of emerging trends from both academic and industrial perspectives. This study examines domestic and international publications from the past eight years using Python-based text mining techniques, including keyword frequency analysis, TF-IDF, keyword network analysis, and topic modeling using Latent Dirichlet Allocation. Frequently occurring terms include ‘vehicle,’ ‘autonomous driving,’ ‘voice recognition,’ and ‘big data’. The analysis identified five main research areas: in-vehicle AI and user interfaces, voice recognition systems, autonomous driving using environmental data, driver safety and risk management, and technologies related to electric vehicles. The downward trend in publications may reflect growing concerns about legal and ethical challenges. This study provides valuable insights into the evolution of AI applications in the automotive sector and offers guidance for future research, commercialization strategies, and policy development.

Keywords:

Artificial Intelligence, Speech Recognition, In-Vehicle Infotainment, Autonomous Driving, User Experience

키워드:

인공지능, 음성인식, 차량용 인포테인먼트, 자율주행, 사용자 경험

Ⅰ. 서 론

1-1 연구의 필요성 및 목적

AI(Artificial Intelligence)는 70여 년간 여러 알고리즘의 등장으로 지속적으로 성장하였고, 특히 2010년대에 딥러닝과 관련된 Software(SW), Hardware(HW) 기술의 발전으로 인해 급진적으로 발전하였다[1]. AI 기술이 발전함에 따라 AI는 현대 사회와 개인의 생활 전반에 깊이 통합되어 다양한 분야에서 중요한 역할로 자리 잡았다[2]. 또한 여러 산업 분야에서 적용도 확대되고 있는데[3], 특히 AI 기술을 활용하여 차량 내 인포테인먼트 시스템과 함께 운전자의 운전 경험을 향상하기 위한 다양한 기술들이 적극적으로 개발 및 연구되고 있다[4]. AI 기술은 2010년 중반부터 자동차 산업에 본격적으로 적용되기 시작했다. 초기 AI 기술은 음성인식 기능을 중심으로 발전했고 2015년 이후 자동차 산업에서 적극적으로 활용하기 위해 노력했다.

테슬라(Tesla)와 같은 글로벌 기업뿐만 아니라 국내 완성차 브랜드인 현대자동차(Hyundai Motors)와 르노코리아(Renault Korea) 또한 인포테인먼트 콘텐츠를 다양화하고 있다[5]. 예로, 현대기아의 차량인 EV3에 생성형 AI 기반의 음성 어시스턴트가 적용되는 등 차량 내 AI 어시스턴트의 기술이 고도화되며 대화 형태의 자유로운 탐색과 검색이 시도되고 있다[5]. 생성형 AI의 가장 중요한 특징이 차량과 탑승자의 데이터를 지속적으로 학습하여 맞춤화 또는 업그레이드를 통한 새롭고 다양한 경험을 개발할 수 있다는 것이며 고객 경험에 대한 이해가 높아지면, 편의 기능 제공을 넘어 맞춤형 서비스까지 제안하는 개인 비서, 즉 자동차 기반의 AI Agent의 등장도 충분히 예상할 수 있다[6]. 최근 국내외 완성차 브랜드들의 차량 내 AI 기술 발전 흐름을 살펴보면, 2018년을 기점으로 음성인식 시스템의 상용화가 본격화했고, 이후 해당 기술은 지속적으로 고도화됐다. 그러나 2022년을 기준으로 관련 연구가 눈에 띄게 감소하는 경향을 보이며, 이는 연구 분야의 방향 전환과 연관된 것으로 해석된다. 예로 우리나라는 2023년 2월 인공지능 책임법을 발의하여 AI를 통한 국가 전반의 성공적 수행을 위해 AI 기술의 윤리적 기준 정립 및 AI에 대한 국가와 사업자의 책무 등을 규정하였다[7]. 실제로 최근 연구들은 기존의 단순 음성 인식 기술을 넘어 보다 정교한 대화형 AI로 초점을 옮겨가는 추세이다. 국제적으로 유럽연합은 2020년 인공지능 윤리 평가 목록을 공개하여 인공지능 윤리의 기본 원칙을 선언하였다[7]. 이에 따라, 세계 선진국은 AI 상용화를 대비하여 법적 제도화 및 윤리적 문제 대처에 집중하고 있다[7]. 현재 차량 내 AI 기술은 음성인식, 운전자 지원 시스템(ADAS), 인포테인먼트, 차량 유지보수 및 원격 관리 등의 분야에서 활용되고 있다[8]. 이러한 기술은 사용자 경험을 바탕으로 운전자 맞춤 대화형 AI 기술로 활용될 수 있다. 과거 인포테인먼트의 기능은 자동차 오디오 시스템, 내비게이션, 실내 온도 조절뿐이었으나, 최근 인포테인먼트는 인간과 자동차를 연결하고 정보를 교환하는 데까지 발전했다[8]. 현대자동차그룹의 인포테인먼트 시스템은 음성인식, 증강현실 기술을 통한 길 안내 서비스, 사용자 맞춤형 음악 선곡, 운전자의 생체 정보를 분석하여 쾌적한 운전 환경 조성 등 다양한 기능을 제공하는 등 사용자 친화적인 시스템으로 발전하고 있다[8].

그러나 현재까지 진행되었던 연구들 대부분은 차량과의 연결 기술, 즉 통신 및 데이터 프로토콜 구성에 초점이 맞춰져 있으며 실제 서비스와 플랫폼 간의 연동 시에 발생할 수 있는 통합적인 기술 문제점, 고려 사항 및 관련 사례 분석이 필요한 상황이다[9]. 또한 생활 가전에서 쓰이는 서비스, 인터랙션, 인터페이스가 자동차에 직접적으로 적용되어 운전자가 가진 상황을 고려하지 못하고 사고로 이어지는 다양한 사례가 발생하고 있는 등 아직 해결해야 할 문제 사항들이 남아있다[10]. 현재 스마트 시스템은 단순 운전 자동화에 초점이 맞춰져 있으며, 운전자의 생리적ㆍ감정적 상태를 실시간으로 반영하지 못하고 있다.

본 연구에서는 차량 내 AI 기술의 연구 동향을 분석하여 해당 기술의 현재 수준을 파악하고자 한다. 이를 위해 본 연구는 다음과 같은 세 가지 연구 질문에 답하고자 한다. 첫째, 2018년-2025년 사이 차량 내 AI 기술 연구의 주요 흐름과 변화는 무엇인가. 둘째, 텍스트 마이닝을 통한 핵심 키워드와 현재 연구 동향의 관계 및 토픽 모델링을 통해 알 수 있는 차량 내 AI 기술의 핵심 주제는 무엇인가. 셋째, 완성차 브랜드의 차량 내 AI의 현시점 한계 요소는 무엇이며 향후 기술 연구 및 개발을 위한 시사점은 무엇인가. 연구자들은 위와 같은 물음에 답하고 선행된 연구를 종합적으로 검토하여 주요한 기술의 발전, 적용 사례, 현재 기술이 가진 한계점을 분석할 것이다. 아울러 이와 관련된 시사점을 도출하고 향후 사용자 맞춤 대화형 AI 및 자동차 브랜드 AI 기술의 차별화 전력을 제안하며 실무적으로 적용될 수 있도록 개선점을 제안하는 것을 목표로 한다.

1-2 선행 연구

텍스트 마이닝은 자연어의 형태로 이루어진 데이터에서 사용자가 필요한 정보를 찾아내는 과정이다[11]. 정보기술의 발전으로 텍스트 빅데이터의 수집과 분석이 수월해지면서 텍스트 마이닝 기법을 활용한 분석 연구가 다양한 분야에서 이루어지고 있다[12]. 이지은, 배기수는 텍스트 마이닝 기법을 통해 바이오 분야의 기술 사업화 동향을 파악하여 바이오 기술 산업화 활성화 방안을 제시해 정부의 정책 지원 방안 마련 등을 강조했다[13]. George O.While, Orhun Guldiken, Mehdi Sharifi Khoobdeh는 텍스트 마이닝 기법을 활용하여 국제 전략 경영 트렌드를 분석하였다[14]. 조혜인, 김진우, 이봉규는 Web of Science에 등재된 논문 중 국내 125건, 국외 754건을 수집하여 토픽 모델링을 실시하여 국내외 블록체인 분야의 연구 동향을 파악하였다[15]. 이원상, 소손영은 ScopusDB에서 1971년부터 2014년까지 “Spatial Big Data” 키워드 논문 1,621건을 수집하여 LDA (Latent Dirichlet Allocation) 분석을 실시하여 국내외 공간 빅데이터 연구 동향을 분석하였다[16]. 박건철, 이치형은 Scopus DB와 Springer DB에서 2008년부터 2019년까지 “Smart City(ies)” 키워드 학술논문 11,527건을 수집하여 토픽 모델링 기법을 활용함으로써 스마트시티의 국내외 연구 동향을 파악하였으며, 예를 들어, 시민 참여 플랫폼, 시민 역량 강화 등 스마트시티 관련 활성화 전략이 필요하다는 것을 제시하였다[17]. 이와 같이 연도별 연구 동향을 분석하기 위해 텍스트 마이닝은 적절한 데이터 분석 기법일 뿐만 아니라 바이오 분야부터 스마트시티 분야까지 다양한 산업 군에서 사용됨을 알 수 있었다.

자동차 산업에서도 텍스트 마이닝 활용한 여러 논문이 존재한다. 한은주, 천세희는 현대차를 대상으로 텍스트 마이닝을 이용한 전기차와 내연기관차의 소비자 후기 비교 분석하여 전기차와 내연기관차 간의 소비자 요구사항의 상의함을 파악하고 전기차의 경우 AS문제가 시급히 개선되어야 할 사항으로 파악하였다[18]. CUI RAN 외는 텍스트 마이닝을 이용하여 다른 브랜드와 비교하여 현대 자동차 중국 시장 소비자 만족도를 분석 연구하여 현대자동차의 경쟁력 강화 방안을 제시하였다[19]. 최염, 남인용은 텍스트 마이닝을 이용하여 다른 브랜드와 비교하여 현대 자동차 중국 시장 소비자의 만족 및 불만족 요인 분석 연구를 통하여 소비자 만족ㆍ불만족 후기를 수집 후 분석하여 현대자동차의 중국 시장에서의 경쟁력이 크게 향상될 것을 시사하였다[20].

AI는 복잡한 데이터를 수집하여 복잡한 기능을 수행할 수 있으며, 워크플로와 프로세스를 오류 없이 실행할 수 있는 기술임으로 자동차 산업에 적용하여 차량 및 환경 안전, 운전 및 성능 등을 개선할 수 있다[21]. LG전자는 5GAA 제34차 총회에서 운전자 안전을 획기적으로 혁신할 인공위성 기반의 차세대 AI 음성통신 솔루션을 최초 시연에 성공하였다[22]. 구글은 AI 모델 제미나이(Gemini)는 차량에 탑재되어 AI 음성 비서 기능과 라이브 서비스를 제공할 계획을 발표하였다[23]. 허화형, 한정엽은 AI는 모빌리티 분야에 큰 영향을 주고 있어서 자율주행, 음성인식, 맞춤형 서비스 등 자동차 내 다양한 곳에 적용되어 있을 뿐만 아니라 단순한 이동 수단을 넘어 다양한 콘텐츠와 서비스 기반 공간으로 변모되고 있다 밝혔다[24]. 유보라는 자동차 시장 내 AI 기술은 음성을 중심으로 개발되고 있으며 2020년 기점으로 AI 기반 자율주행차량의 상용화가 시작되면, 운전자의 편의성을 극대화할 AI 기술로 확장될 것으로 주장하였다[25]. Shizen bai는 친환경 차량에 AI 어시스턴트의 적용 및 확산이 빠르게 확산되고 있으며 친환경 차량 운전자에게 자율주행, 운전자 보조 기능 등 다양한 응용 시나리오에서 추후 대체 불가능한 역할을 수행할 것이라 주장하였다[26]. Lukas Stappen은 현재 차량 내 AI는 인포테인먼트 시스템의 제어를 중심으로 연구가 진행되고 있으며 전방위적인 개인 비서 구현이라는 비전을 실현하는 데 중점을 두고 있다[27]. 대표적으로 BMW는 사용자와 감성적으로 교류하며 자연스러운 관계를 형성하는 동반자를 구상하고 있다[26].

위의 선행 연구에서 제시된 듯이 음성인식, AI 비서, ADAS의 흐름으로 발전해 온 차량 내 AI 기술과 연관된 각각의 연구 논문은 꾸준히 발행되었다. 또한, 소비자 분석 및 시장성을 분석하는 사례에 텍스트 마이닝을 자주 활용하였음을 알 수 있으나 차량의 기술 분석에 대한 텍스트 마이닝 활용 연구 사례는 부진하다는 것을 파악하였다. 본 연구는 이러한 선행 연구에 기초하여 차량 내 AI 기술에 관한 연구 동향을 분석하고 이에 부딪히는 한계점을 텍스트 마이닝을 통해 분석함과 동시에 향후 연구 방향을 제시하는 바이다.


Ⅱ. 주요 개념

2-1 Text Mining

방대한 텍스트 데이터가 개인의 일상뿐 아니라 유통, 제조, 서비스, IT 영역 등 다양한 영역에서 축적되면서 텍스트 데이터에 대한 분석이 점점 더 중요해지고 있다[28]. 이러한 시대적 변화에 따라 텍스트 데이터를 분석하는 연구 기법과 방법론들이 등장하기 시작했다. 텍스트 마이닝이란 알려지지 않은 유용한 패턴과 지식, 새로운 정보를 추출하기 위해 사용되는 텍스트 기반 데이터베이스에서 자연어 처리 기술과 문서 처리 기술이다[29]. 텍스트 마이닝은 연구자 중심 내용분석의 한계점을 극복하여 텍스트 데이터를 과학적인 방법으로 분석하며 연구의 주제와 동향을 다각도로 조명할 수 있다는 장점이 있다[30]. 텍스트 마이닝 기법에는 텍스트 데이터의 구조를 파악하고 주요 주제와 관련된 키워드 간의 상호 관계를 추출하고 시각화하는 키워드 네트워크 분석 등이 가능하다[30]. 텍스트 마이닝의 과정은 다음과 같다. 논문 수집, 데이터 정제, 키워드 분석, 키워드 네트워크 분석, 토픽 모델링 수행의 절차로 진행된다.

Fig. 1.

Text mining process diagram

2-2 Artificial Intelligence

AI는 ‘모든 것이 연결되고 보다 지능적인 사회로의 진화’로 전망되는 제4차 산업혁명의 주역으로, 인간의 지적 능력(지능)의 일부 또는 전체를 ‘컴퓨터’를 이용해 구현하는 지능을 의미하며 데이터와 지식 처리가 핵심 경쟁 원천기술이라 할 수 있다[31]. AI는 1980년대까지의 1세대를 시작으로 현재 4세대까지 발전해 나가고 있으며 초기 단순 제어 프로그램에서 딥러닝으로 이어지고 있다[31]. 정보통신의 급속한 발전은 사회의 각 부문을 자동화 단계를 넘어서 지능화 단계로 빠르게 변화시키고 있고. 근래에 시장에 소개되고 있는 많은 제품이나 서비스는 새로운 정보통신 기술을 이용하여 과거의 제품이나 서비스로부터 경험하지 못했던 새로운 가치를 소비자들이 경험하도록 하고 있다[32]. 지능형 자동차, 지능형 책, 지능형 건물, 지능형 전화 등 우리가 일상생활에서 사용하고 있는 거의 모든 물리적인 제품이 지능화되고 있으므로. 제품뿐만 아니라 서비스에서도 소비자의 만족과 생산성을 높이기 위하여 AI 기반의 지능형 기술로 개발되고 있다[32]. 이에 따라 AI 딥러닝 기술은 점차 중요해지고 있다.

2-3 Deep Learning

딥러닝은 패턴 인식 문제 또는 특징점 학습을 위해 많은 수의 신경층을 가지도록 모델을 구성하는 기계학습 기술들을 의미한다[33]. 딥러닝 학습의 결과로 얻어진 모델을 분석하면 층이 높아질수록 점진적으로 복잡한 특징을 구성함을 확인할 수 있고, 딥러닝 데이터양에 비례하여 성능이 향상되는 경향성을 보인다[34]. 딥러닝 기반의 접근법은 데이터가 공급됨에 따라 성능이 꾸준히 향상되는 특성을 보여, 데이터가 풍부한 현시점에 기존 방법과 비교하여 매우 중요하고 현실적인 장점이 있다[34].

2-4 Infotainment

인포테인먼트(Infotainment)란 정보(Information)와 오락(Entertainment)의 합성어로 차량용 인포테인먼트 시스템(In-Vehicle Infotainment)은 차량 내의 운전자나 동승자에게 여러 가지 정보나 엔터테인먼트 요소적인 기능을 모두 제공해 줄 수 있는 시스템을 의미한다[35]. 이는 국내외 기업의 발전에 영향을 미쳤다. Apple과 Google은 스마트폰 시장의 포화에 따라 커넥티드 카 시장을 미래 성장 동력으로 인식[36], 각각 자신들의 스마트폰 운영체제를 기반의 인포테인먼트 플랫폼 ‘카플레이(CarPlay)’와 ‘안드로이드 오토(Android Auto)’를 운용하여 스마트폰을 차량 디스플레이에 연결해 미러링(mirroring)하는 방식으로, 실시간 교통상황을 반영한 내비게이션, 문자메시지, 음악 감상, 검색 등을 제공한다[36]. 현재 자동차 기업은 물론 IT 기업들이 인포테인먼트 개발을 위해 치열하게 경쟁하고 있다[37]. 차량용 인포테인먼트 시스템은 2022년까지 6,819만 대 규모로 성장할 전망이다[38]. 연평균 11%의 높은 성장세를 기록하고 있으며 2020년이 되면 매출액이 350억 달러로 늘어날 것으로 예상한다[38].

2-5 User Experience(UX)

UX는 어떤 제품이나 서비스의 사용 전과 후 그리고 사용하는 순간까지 포함해 사용자가 지각, 생각, 반응, 행동하는 모든 것을 합쳐놓은 개념이다[39]. 과거 운전자의 행위에 주목하여 운송 수단에 불과했던 자동차에 사용자 경험이 적용되며 문화, 생활공간으로 진화를 거듭하고 있다[40]. 예를 들어, 5G, 사물인터넷 등 4차 산업 혁명 기술과 결합하여 자동차에서 인간과 가장 가깝게 맞닿는 부분인 인테리어에 반영되었고 자동차를 이동뿐만 아니라 휴식, 상호작용, 엔터테인먼트의 기능까지 수행하는 복합적 공간으로 만들었다[41].


Ⅲ. 연구 방법

3-1 자료 분석 절차

본 연구에서는 완성차 브랜드에서 차량용 AI 기술이 활용되는 연구의 동향을 분석하기 위해, 연구 대상 문헌을 선정하고 텍스트 마이닝 기법을 적용하여 연구 흐름을 도출하였다. 본 연구를 위해 텍스트 마이닝 기법을 이용한 이유는 다음과 같다. 첫째, AI 관련 논문은 그 양이 방대하여 모든 내용을 분석하는 것은 비효율적이라고 판단하여, 연구의 흐름과 주요 키워드의 체계적인 도출을 위해 이용하였다. 둘째, 토픽모델링 및 키워드 네트워크 분석 등을 활용하여 시간 흐름에 따른 연구 주제의 변화 및 트렌드 분석이 용이하기 때문이다. 셋째, 정량적 데이터 기반 분석으로 연구자의 주관이 개입되는 해석의 한계를 줄이고, 객관성 있는 결과를 제시하는 데 유리하기 때문이다. 연구는 논문 수집, 데이터 정제, 키워드 분석, 키워드 네트워크 분석, 토픽 모델링 수행의 절차로 진행되었으며, 각 단계의 세부 절차는 다음과 같다.

첫째, 연구 대상 논문을 선정하는 과정에서 학술 연구 정보 서비스(RISS)와 구글 스칼라에서 ‘자동차 AND 인공지능’, ‘자동차 AND 음성’, ‘자동차 AND 인식’, ‘자동차 AND 자연어’, ‘Vehicle AND Infotainment’, ‘Vehicle AND AI’ 등 총 7개의 검색 키워드를 활용하여 국내외 논문을 검색하였다. 논문 선정 과정에서는 본 연구의 핵심 키워드 검색 결과 중 초록과 제목을 기반으로 연구 주제와의 관련성을 1차로 판단한 뒤, 연구자들이 각 논문의 영향력 있는 학술지 게재 논문을 중심으로 선별하였다. 총 7개의 검색 키워드를 활용한 논문들의 특성은 아래 표 1과 같다. 아래의 논문 특성 표는 연구자가 조사한 100편의 논문이 본 연구의 데이터와 어떠한 연관성을 가지는지를 보여주며, 각 주제별 특성 분석을 통해 본 논문의 연구 방향성을 제시한다.

Summary of paper characteristic

둘째, 데이터 정제 과정을 수행하여 분석의 정확도를 높였다. 본 연구는 차량 내 AI 기술의 상용화가 본격적으로 이루어진 2018년을 기준으로 2025년까지의 연구 동향을 분석 대상으로 설정하였다. 일차적으로 학술 데이터베이스에 검색된 1,276편의 논문을 대상으로 진행되었다. 이후 연구팀의 주제인 기술 연구 동향 분석의 정확도를 향상하기 위해 본 연구의 분석 범위를 벗어나는 법적, 윤리적 문제에 관한 논문자료를 제거하였다. 특히, 키워드 조합을 통해 수집된 논문 중 다수가 법 및 제도 관련 연구였기 때문에, 상세 검색을 추가로 수행하여 해당 분야의 논문을 선별적으로 제외하였다. 그다음, 위에서 설정한 분석 기간을 바탕으로 연구자가 개별적으로 논문을 검토하여 연구 주제와 관련성이 낮은 논문을 제거하는 과정을 거쳐 최종 분석 대상 논문 총 100편을 선정하였다. 이와 같은 과정을 아래 그림 2에 PRISMA 흐름도로 나타내었다. 또한, 영문 초록이 포함된 논문은 한국어로 번역한 후 활용하였으며, 텍스트 마이닝의 분석 정확도를 높이기 위해 주요 용어를 일관되게 정리하는 전처리 과정을 거쳤다. 예를 들어, ‘차량’ → ‘자동차’, ‘이용자’, ‘사용자’ → ‘운전자’와 같이 용어를 일관되게 정리하였으며, ‘있다’, ‘하다’, ‘그리고’, ‘하지만’, ‘이는’, ‘등’, ‘위한’, ‘ 및’과 같은 기본 불용어(Stopwords)와 ‘연구’, ‘성공’, ‘실시’, ‘문제’, ‘구조’, ‘분야’, ‘가능성’, ‘실시간’ 등 맞춤형 불용어를 제거함으로써 정확도를 높였다.

Fig. 2.

PRISMA flow diagram

셋째, 텍스트 마이닝 기법을 적용하여 주요 키워드를 도출하고 분석하였다. 먼저, Term Frequency(TF) 분석을 수행하여 초록에서 가장 많이 등장하는 주요 30개 단어를 추출하고, Term Frequency-Inverse Document Frequency(TF-IDF) 분석을 통해 각 단어의 상대적 중요도를 측정하였다. 이 과정에서는 TF, TF-IDF, DF(문서 빈도), IDF(역문서 빈도) 값을 산출하여 각 논문에서 중요하게 다뤄지는 개념들을 도출하고자 하였다.

넷째, 키워드 네트워크 분석을 통해 연구 키워드 간의 연관성을 파악하였다. 이를 위해 전처리된 텍스트 데이터를 기반으로 논문 내에서 공동으로 등장하는 키워드 쌍을 추출하고, 이를 시각화한 네트워크 그래프를 구성하였다. 또한, 연구의 흐름을 더욱 정밀하게 파악하기 위해 네트워크 중심성 지표를 분석하고, 이를 바탕으로 핵심 키워드들이 형성하는 주요 클러스터를 도출하였다.

다섯째, 토픽 모델링을 수행하여 연구 주제의 주요 흐름을 분석하였다. 이를 위해 LDA (Latent Dirichlet Allocation) 모델을 적용하여 토픽별로 가장 중요한 키워드 5개를 도출하였다. 본 연구에서는 토픽 모델링 기법으로 LDA (Latent Dirichlet Allocation)를 사용한 이유는 텍스트 내 잠재 주제를 효과적으로 도출하는 데 널리 활용되는 확률 기반 모델로, 최근 유사 주제 분야의 선행 연구들에서도 빈번히 사용되고 있어 본 연구에 적합하다고 판단하였다. 또한, 각 논문이 어떤 연구 주제에 해당하는지를 파악하기 위해 문서별 토픽 분포를 분석하였다.

3-2 자료 분석 방법

1) 데이터 전처리(Preprocessing)

텍스트 마이닝을 진행하기 이전, 논문 초록의 데이터를 다듬는 과정은 필수적이다. 데이터 전처리 과정을 거침으로써 연구의 객관성과 분석의 정확성을 높였으며, 주요 과정은 다음과 같다. 텍스트 정제 작업을 통해 초록 내 불필요한 특수문자와 숫자를 제거하고 특정 용어를 통합함으로써 분석의 일관성을 유지하였다. 예를 들어, ‘차량’을 ‘자동차’로, ‘이용자’, ‘사용자’를 ‘운전자’로 변환하여 분석의 정확도를 높였다. 또한, 의미가 중복되거나 분석에 불필요한 단어를 제거하기 위해 불용어 처리 과정을 진행하였다. stopwords=[]”를 코드로 이용하여 연구자가 직접 선정한 불용어 리스트를 바탕으로 ‘있다’, ‘하다’, ‘그리고’, ‘하지만’, ‘이는’, ‘등’, ‘위한’, ‘및’ 등의 단어를 필터링하여 핵심적인 단어만 남길 수 있도록 하였다. 기본 불용어만으로 데이터 전처리에 어려움을 겪어 논문에 맞는 맞춤형 불용어 리스트를 추가하여 핵심적인 단어만을 선정하기 위한 작업을 진행하였다. 이후 전체 불용어 리스트를 합치는 작업을 연구자가 명명한 코드를 사용하여 진행하였다. 텍스트 정제 후, 형태소 분석을 적용하여 초록에서 명사만 추출하였다. 한국어 텍스트의 특성을 고려해 형태소 분석기를 사용하였으며, 분석의 일관성을 유지하기 위해 의미 전달이 어려운 단어를 제외하여 정제된 데이터를 확보하였다.

2) 키워드 빈도 분석(TF & TF-IDF)

연구의 핵심 키워드를 도출하기 위해 TF 분석과 TF-IDF 분석을 수행하였다. TF 분석을 활용하여 각 단어가 연구 초록 내에서 얼마나 빈번하게 등장하는지를 확인하고, 이를 바탕으로 연구에서 중심이 되는 핵심 키워드를 도출하였다. 앞서 정리한 데이터 전처리 엑셀 파일을 이용하여 TF 분석을 위해 CountVectorizer를 활용하였다. 또한, 상위 200개 키워드를 선택하여 빈도순으로 정리하였다. 분석 결과를 지속적으로 파악하며 논문과 관계없는 단어의 출현 시 데이터 전처리 과정을 반복 진행하며 TF 분석의 정확도를 높였다. 이후, TF-IDF 분석을 활용하여 특정 키워드가 전체 문서에서 얼마나 중요한지를 측정하였다. 이를 위해 TF(단어 빈도), IDF(역문서 빈도), DF(문서빈도) 값을 동시에 계산하여 연구에서 핵심적으로 다뤄지는 주요 개념들을 분석하였다. 우선, 전처리 데이터 파일을 업로드한 후 TF-IDF 과정에서 텍스트 전처리를 다시 진행함으로써 정확도를 높이고자 하였다. 이후 TF-IDF 결과를 계산하기 위해 행렬을 이용하였고 DF 및 IDF 계산을 위해 각각 array 함수와 log 함수를 사용하여 정리하였다. TF-IDF 값으로 상위 30개 키워드를 추출하였다. TF 분석을 통해 연구 주제 내 반복 핵심 키워드를 도출할 수 있었고, TF-IDF 분석으로 연구에서 상대적 주요 개념을 식별할 수 있었다. 해당 분석을 통해 추출된 주요 키워드를 기반으로 연구자 간의 개념적 연관성을 분석하기 위해 키워드 네트워크 분석을 진행하였다.

3) 키워드 네트워크 분석(Keyword Network Analysis)

연구에서 동시에 나타나는 키워드 간의 관계를 분석하기 위해 키워드 네트워크 분석을 실행하였다. 논문 초록에서 동시에 나타나는 키워드 쌍을 추출하기 위해 상위 키워드의 개수를 조정하여 결과값을 확인하며 이 과정을 반복했다. 이 과정에서 상위 80개의 키워드만 선택하도록 for문을 구성하여 80개의 키워드 쌍을 바탕으로 네트워크 그래프를 작성하였다. 상위 80개의 키워드를 선정한 이유는 본 연구자들은 키워드 네트워크 분석에서 노드의 개수를 최소 20개 이상으로 선정하였는데 상위 키워드 20개만을 선정하여 결과를 분석했을 때 노드의 개수가 중복 값에 따라 10개 미만으로 나옴을 확인하였다. 따라서, 여러 번의 시행착오 후 상위 키워드를 최소 80개로 선정하였을 때 노드의 개수가 20개 이상으로 나오는 것을 확인하였기에 80개로 선정하였다. 이후 특정 키워드가 다른 키워드와 함께 등장하는 빈도를 측정하여 키워드 간의 관계를 정량적으로 분석하였고, 이를 바탕으로 키워드 네트워크 구조를 시각화하였다. 네트워크 분석에서는 노드(Node)크기와 엣지(Edge)를 활용하여 키워드 간의 상호 연결 관계를 시각적으로 표현하였다.

4) 토픽 모델링(Topic Modeling)

연구의 주요 주제를 분류하기 위해 LDA (Latent Dirichlet Allocation) 기반 토픽 모델링을 수행하였다. 연구 초록 데이터와 키워드 전처리 데이터를 기반으로 LDA (Latent Dirichlet Allocation) 모델을 학습시켜, 논문에서 다루어지는 주요 연구 주제를 도출하였다. LDA (Latent Dirichlet Allocation) 모델 학습 과정에서 연구자는 토픽 수를 사전 실험을 통해 5~20 범위 내에서 비교하여 결정하였으며, 최종적으로 해석 가능성과 통계적 적합성이 모두 확보된 K=10으로 설정하였다. 이후 각 토픽의 문서 수와 비율을 고려하여 10% 미만의 키워드 관련도가 낮은 토픽 5개를 제외하고 나머지 5개의 토픽 5개를 최종적으로 선정하였다. 이 과정에서 연구자는 gensim 코드를 사용함으로써 각 토픽에 대한 키워드를 파악하였다. 또한, 데이터 분석 결과의 시각화를 위해 각 토픽의 문서 수와 비율을 계산하였다. 이후, 각 연구 주제에 대해 가장 중요한 키워드 5개를 선정하여 연구 흐름을 분석하였고, 연구 초록별 토픽 분포를 분석하여 각 논문이 속한 연구 주제를 분류하였다. LDA (Latent Dirichlet Allocation) 분석을 통해 자동차 산업에서의 차량 내 AI 기술에 대한 연구의 흐름을 보다 체계적으로, 분류된 주제로 도출하였다.

Main code


Ⅳ. 연구 결과

4-1 키워드 텍스트 마이닝

1) 연도별 연구 동향 분석(Analysis of Research)

연도별 연구 논문 개수를 분석한 결과, 자동차 산업에서의 AI 기술 연구가 2022년을 기점으로 줄어들고 있음을 확인할 수 있었다. 2018년에 13편의 연구 논문에서 2019년에 17편, 2020년에 18편으로 증가하였으며, 2021년에는 연구 논문 개수가 11편으로 줄었다가 2022년에 21편으로 급증하였음을 확인하였다. 하지만 이를 기점으로 2025년까지 꾸준히 하락세를 보이며 이후에는 연구가 활발히 진행되고 있지 않음을 연구 동향 분석을 통해 확인하였다. 연도별 연구 논문의 특징은 다음과 같다. 2018년에 발표된 대부분의 논문은 차량 내 음성인식 기술 활용을 중심으로 하고 있었으며, 2020년까지 유사한 연구 경향이 지속되었다. 2020년 이후에는 전기차 관련 연구가 다수를 차지하였고, 본 연구의 기술 중심 문헌 분석 결과, 2022년을 기점으로 관련 연구의 양적 감소가 확인되었다. 이는 기술 혁신의 정체를 의미하기보다, 학계의 관심이 본 연구의 분석 범위를 벗어나는 법적‧윤리적 문제로 이동하고 있음을 시사한다. 그러나 같은 시기부터 자율주행차 및 인포테인먼트 등 운전자 중심의 차량 내 AI 기술에 관한 연구가 새롭게 주목되는 특징이 나타났다. 하지만, 데이터 수집 시점이 2025년 초이기 때문에 연구 논문 수는 충분히 반영되지 않았을 가능성이 있다. 이러한 연도별 연구 추이에서 2022년에 급격히 연구 논문이 감소한 이유를 AI 챗봇의 도입과 자동차 산업에서 AI의 법 제도가 주요 이슈로 주목받으면서, 많은 연구자가 법과 규제에 관련된 논문을 작성한 것으로 해석할 수 있다. 그림 4를 통해 이를 확인할 수 있다. 이는 최근 자동차 산업에서의 AI 기술의 정체기를 보여주며 연구가 활발히 진행되고 있지 못함을 반영하는 결과로 해석할 수 있다.

Fig. 3.

Research trends by year

Fig. 4.

Research trends on AI and law

4-2 키워드 빈도분석(TF) 결과

1) 주요 키워드 분석(Main Keyword Analysis)

TF 분석을 통해 연구 논문 초록에서 가장 빈번하게 등장하는 주요 키워드를 도출하였다. 키워드 빈도 분석 결과, 표 3과 같이 ‘자동차(367회)’, ‘주행(160회)’, ‘지능(136회)’ 등의 키워드가 높은 빈도를 보였다. 이는 최근 연구가 자동차 주행 중 AI 기술에 초점을 맞추고 있음을 반영한다. 또한, ‘운전자(127회)’, ‘자율(121회)’, ‘데이터(118회)’ 등의 키워드가 주요하게 등장하며, 자율주행과 데이터 분석을 기반으로 하는 AI 기술에 초점을 두고 있음을 알 수 있다. 특히, ‘주행’, ‘지능’, ‘운전자’와 같은 키워드를 통해 연구의 주된 관심사가 주행 중 운전자 맞춤형 AI 기술 개발에 집중되고 있음을 반영한다. 또한 ‘자율’, ‘데이터’, ‘기술’ 등의 단어가 높은 빈도를 보인 것은 자율주행차량의 연구와 운전자 데이터 기반 서비스 및 AI 기술 연구가 활발히 이루어지고 있음을 의미한다. 이 외에도 ‘음성’, ‘정보’, ‘환경’ 등의 키워드가 주요하게 등장하였으며, 이는 연구에서 자동차 내 음성 인식 시스템, 주변 환경 및 운전자 정보를 바탕으로 한 AI 기술 개발이 자동차 산업에서 주요 연구 주제로 다뤄지고 있음을 보여준다.

Fig. 5.

TF analysis results visualized as a word cloud*Displayed in Korean for readability

TF analysis results

4-3 TF-IDF 분석 결과

TF-IDF 분석을 통해 연구에서 상대적으로 중요한 키워드를 도출하였다. 이를 통해 각 단어의 상대적 중요도를 고려해 연구의 핵심 개념을 파악할 수 있다. 분석 결과 표 4와 같이 TF-IDF 값이 큰 주요 키워드는 ‘인식(7.79)’, ‘제어(7.63)’, ‘자율(7.24)’, ‘음성(7.24)’, ‘전기차(7.06)’ 등으로 나타났다. 이는 연구 논문들에서 자율주행차량과 전기차에서의 음성 인식 시스템, AI 시스템의 제어 및 인식 등이 핵심 연구 주제로 다뤄지고 있음을 시사한다. 특히, ‘자율’과 ‘인식’은 TF 값(출현 빈도)뿐만 아니라 IDF 값(문서 내 상대적 중요도)도 큰 편으로 나타나, 연구에서 반복적으로 등장하면서도 중요한 개념으로 사용되고 있음을 알 수 있다. ‘환경’, ‘주행’, ‘센서’ 등의 키워드 역시 TF와 IDF 값이 상대적으로 높음을 알 수 있고 이를 통해 자동차 산업에서 센서를 통한 주행 중 주변 환경 인식은 AI 기술에서 점점 더 중요한 역할을 하고 있음을 반영한다. 이 외에도 ‘운전자’, ‘경험’, ‘정보’ 등의 키워드가 높은 TF-IDF 값을 기록하였으며, 이는 연구가 운전자의 경험과 정보를 바탕으로 하는 운전자 맞춤형 AI 기술 개발 단계로 나아가고 있음을 의미한다. TF-IDF 분석 결과를 통해 도출된 키워드들은 이후 키워드 네트워크 분석과 토픽 모델링을 통해 연구 주제 간 연관성과 주요 연구 클러스터를 도출하는 과정으로 확정되었다.

Table 4. TF-IDF analysis results

4-4 키워드 네트워크 분석

키워드 네트워크 분석을 통해 연구에서 중요한 개념 간의 관계를 시각적으로 도출하고, 연구 주제 간 연관성을 분석하였다. 분석 결과 노드의 크기를 중심성 값에 비례하도록 조절하였고 키워드 출현 빈도에 따라 노드의 크기를 다르게 하였다. 또한, 연결선의 굵기를 키워드 간 관계도에 따라 조절하였다. 중심 부분의 대부분 키워드가 서로 간의 깊은 관계성을 띠고 있어 그림 6에서처럼 중심 부분의 해석에 어려움이 있다. 그림 6에서 ‘자동차’, ‘주행’, ‘자율’ 등의 키워드가 중심에 위치하며, ‘인식’, ‘정보’, ‘센서’ 등의 키워드와 긴밀한 관계를 형성하고 있음을 확인할 수 있다. 이는 연구가 자율주행차량에 초점을 두고 있으며 AI 기술 중에서도 데이터나 정보의 인식 및 센서에 중점을 두고 있음을 시사한다. 특히, 이러한 키워드들은 중앙에 위치하며 주변 인접 키워드들과 높은 관계성을 띠는 것으로 보아 대부분의 연구가 비슷한 관점에서 진행되고 있으며 이는 자율주행차량과 주변 환경 인식, 데이터 기반 서비스의 AI 기술 개발이 활발히 진행됨을 알 수 있다. 네트워크 분석을 통해 주요 연구 주제별 클러스터를 도출할 수 있었고, 연구의 핵심 클러스터는 표 5와 같다. 이와 같은 분석 결과를 통해 연구에서 자율주행차량에서 AI 기술이 운전자와 밀접하게 연결되어 있으며, 운전 환경 인식, 제어 기술뿐만 아니라 사회적 영향 및 위험성 관리 정책에 대한 논의가 이루어지고 있음을 확인할 수 있다.

Fig. 6.

Keyword network analysis result output

Key Research topic clusters through network analysis

4-5 토픽 모델링

토픽 모델링 기법을 활용하여 연구 논문에서 각 토픽의 핵심 키워드를 도출하였다. 이 과정에서 멀티디멘셔널 스케일링 결과를 활용하여 토픽 간의 유사성이나 차이를 쉽게 파악할 수 있었다. 분석 결과 연구 논문들은 다섯 개의 주요 연구 주제로 분류되었으며, 각 토픽은 연구의 핵심 흐름을 반영하는 주제들로 구성되었다. 또한, 각 토픽 별 키워드의 문서 내 비율을 반영하였다.

첫 번째 토픽은 차량 내 AI 및 사용자 인터페이스(AI in Vehicles and User Interface)이다. 본 연구에서도 가장 중요하게 다루고 있는 부분인 차량 내 AI 기술 및 사용자 경험을 바탕으로 하는 인터페이스 기반이 중요한 연구 주제로 다루어졌다.

두 번째 토픽은 자동차 내 음성인식 시스템의 발전(Development of In-Vehicle Speech Recognition Systems)이다. 이 토픽에서는 음성인식 시스템의 발전과 이를 위한 최신 AI 기술, 음성 제어 시스템의 발전 동향을 포함한 연구들이 다루어졌다. 또한, 키워드 중에서 인식, 에러, 변수, 신뢰와 같은 키워드를 통해 자동차 내 AI 시스템의 한계점을 포함한 연구도 주요 흐름을 형성하고 있었다.

세 번째 토픽은 자율주행차량과 환경 데이터 활용(Autonomous Vehicles and Environmental Data Utilization)이다. 자율주행차량이 도로 및 주변 환경 데이터를 활용하는 방식, 센서 및 네트워크 기반 데이터 처리 연구가 포함되었으며, 자동차 산업에서 운전자의 편의성을 위한 자율주행차량 내 AI 기술이 어떻게 적용되는지에 대한 연구가 활발히 이루어지고 있었다.

네 번째 토픽은 운전자 안전 및 위험 관리(Driver Safety and Risk Management)이다. 사용자의 경험 및 정보를 기반으로 하는 인터페이스 기술 개발이 진행되면서 운전자의 상태를 실시간으로 모니터링하는 기술, 운전자의 사고 예방과 안전을 위한 시스템 개발 등 관련된 연구가 증가하고 있었다.

다섯 번째 토픽은 전기자동차와 빅데이터의 활용(Utilization of Electric Vehicles and Big Data)이다. 전기차의 성능 분석과 관리에 빅데이터를 활용하는 방법, 주행 효율성 향상 등과 관련된 연구가 활발히 진행되고 있었다. 이와 같은 토픽 모델링 분석을 통해 차량 내 AI 기술이 크게 다섯 개의 연구 방향으로 진행됨을 확인하였다. 연구의 주요 흐름은 자동차 내 음성인식 시스템, 사용자 인터페이스, 운전자 안전 및 위험 관리, 자율주행차량과 환경 데이터 활용, 전기자동차와 빅데이터의 활용 연구로 구분될 수 있었다.

본 연구의 분석 결과들은 연관된 방향을 가리킨다. TF 분석 결과에서 ‘자동차’, ‘주행’과 같은 키워드들뿐만 아니라 ‘자율’, ‘인식’은 TF 값(출현 빈도)뿐만 아니라 IDF 값(문서 내 상대적 중요도)도 큰 편으로 나타나, 연구에서 반복적으로 등장하면서도 중요한 개념으로 사용되고 있음을 알 수 있다. 위에 나타난 키워드들은 키워드 네트워크 분석에서도 가장 중심에 위치하며 허브 역할을 수행했다. 이러한 핵심 개념들은 다시 5개의 LDA (Latent Dirichlet Allocation) 토픽에 걸쳐 구체화 되었는데, 이는 해당 개념들이 차량 내 AI와 사용자 인터페이스에 관한 연구 주제부터 운전자의 안전 및 위험 관리나 자율주행차량 및 전기차의 기술 활용으로 구체화 되었으며 다양한 세부 연구 주제의 근간을 형성하고 있음을 보여준다.

Results of topic modeling


Ⅴ. 결 론

본 연구에서는 완성차 브랜드의 차량 내 AI 기술의 발전 수준과 방향을 분석하고, 현시점에서의 한계를 파악하기 위해 텍스트 마이닝 기법을 활용하여 체계적인 연구 동향 분석을 수행하였다.

연구 결과, 연구자들은 서론에서 제기한 세 가지 질문에 대해 다음과 같은 답을 도출하였다. 첫째, 2018년부터 자동차 산업에 음성인식 기반 AI 시스템이 도입되면서 관련 기술은 지속적으로 발전해 왔으나, 2022년 이후부터는 논문 수가 점차 감소하는 경향을 보였다. 특히 2022년 이후 ChatGPT 및 다양한 생성형 AI의 등장으로 인해 기존의 법이나 제도 등 사회규범과의 충돌을 해결해야 하는 난제에 맞닥뜨렸다[42]. 당초 AI 기술의 급격한 발전 속도에 비례하여 관련 기술 연구 역시 지속적으로 증가할 것으로 예측했으나 실제 분석 결과는 기술 개발 자체에 대한 연구 증가세는 둔화된 반면, 법‧제도 관련 연구가 증가하는 추세를 보였다. 둘째, 텍스트 마이닝 분석 결과, 자율주행 중심의 AI 기술이 자동차 산업 내 주요 연구 주제임을 확인할 수 있었다. 또한 키워드 네트워크 분석 및 토픽 모델링 결과, 연구는 차량 내 음성인식 시스템, 사용자 인터페이스, 운전자 안전 및 위험 관리, 자율주행차와 환경 데이터 활용, 전기자동차와 빅데이터 활용의 다섯 가지 주요 주제로 구성되어 있음을 확인하였다. 분석 이전에는 운전자 중심의 AI 기술 개발이 주를 이룰 것으로 예측하였으나, 실제로는 자율주행과 데이터 기반 시스템 등에 연구 초점을 두고 있었다. 셋째, 완성차 브랜드의 차량 내 AI 기술은 지속적인 기술 발전에도 불구하고 상용화와 실질적인 운전자 경험 향상 측면에서 여러 한계를 지니고 있다. 특히 법적, 윤리적 기준 마련의 지연, 기술 신뢰성 검증 부족, 브랜드 간 표준화 부재 등이 현시점의 주요 제약 요인으로 분석된다. 향후 연구는 기술 개발과 더불어 윤리적 기준과 제도적 기반 마련에 초점을 맞춰야 하며, 실제 운전자 경험을 중심으로 한 사용자 인터페이스 및 AI 적용 사례 분석이 병행되어야 할 것이다. 이러한 방향은 AI 기술의 상용화와 정책 연계성 강화에도 이바지할 수 있을 것이다.

본 연구의 시사점은 다음과 같다. 첫째, 본 연구에서 가장 주목할 만한 발견 중 하나는 ‘인포테인먼트’나 ‘운전자 지원 시스템(ADAS)’ 와 같은 상업적으로 널리 통용되는 용어들이 학술 연구의 핵심 어휘에서는 상대적으로 낮은 중요도를 보였다는 점이다. 이는 실제 상용 제품과 달리, 학계의 연구는 ‘자율주행’, ‘센서’, ‘데이터’와 같은 더 근원적인 기술에 집중되어 있음을 시사한다. 따라서 AI 기술들의 활용이 운전자의 주행 환경의 개선을 위하여 개발되어야 하며 운전자 맞춤 대화형 AI 기술에 관한 연구가 진행되어야 한다. 둘째, 본 연구 결과 차량 주행 성능 외에 차량 내 AI 기술에 관한 키워드는 음성인식뿐임을 알 수 있었다. 현재의 기술은 음성인식 시스템을 넘어 대화형 AI 기술로 사용자에게 서비스를 제공할 수 있는 수준으로 발전했다. 하지만, 이를 넘어 운전자에게 차량의 상태 및 솔루션을 제공해 주는 등 운전자 맞춤형 서비스를 더욱 고도화할 필요가 있다. 셋째, 전기자동차나 자율주행차량에 빅데이터를 활용하는 연구가 활발히 진행되고 있다는 점을 활용해서 향후 EV 기술 개발에 따른 체계적인 데이터 관리 시스템의 필요성이 보인다. 이에 따라 국내외 완성차 브랜드는 차량 운행 데이터 수집 및 분석 역량을 강화하고, 사용자 맞춤형 운행 최적화 솔루션을 제공하는 방향으로 경쟁력을 확보해야 할 것이다.

향후 연구에서는 다음과 같은 방향으로 확장될 필요가 있다. 첫째, 현재 자동차 산업에서는 자율주행차량의 개발에 대부분의 연구가 진행되고 있다. 따라서, 사용자 경험(UX)과 정보를 활용한 대화형 AI 기술의 개발에 관한 연구가 필요하며, 이를 통해 운전자에게 편의성과 안전성을 제공할 수 있도록 해야 한다. 둘째, 자동차뿐만 아니라 다른 제조업의 현재 수준을 파악하고 자동차만의 차별화된 AI 기술을 개발한다면, 보다 경쟁력 있는 산업 군으로 소비자에게 서비스를 제공할 수 있을 것이며, 자동차 산업에서 AI 기술이 효과적으로 활용될 수 있기를 기대한다. 셋째, 현재 자동차 산업 내 텍스트 마이닝을 활용한 학술 자료는 소비자 분석, 인식 조사 등이 대부분인 상황에서 자동차 산업 내 큰 영향을 미치고 있는 차량 내 AI 기술을 주제로 연도별 동향을 분석하고 향후 연구 방향을 제시했다는 점에서 학술적 기여도가 크다. 현재는 차량 내 AI 기술 전반에 관한 연구 동향을 분석했지만, 향후 AI 기술이 자동차 내 필수 요소로 자리 잡고 연구의 증가로 인한 학술 자료가 방대해진다면, AI 기술 중 하나인 자율주행차량 또는 UX와 같은 보다 세분된 주제를 중심으로 텍스트 마이닝 기법을 활용한 연구 동향 분석이 가능해질 것이다.

본 연구는 완성차 브랜드의 AI 기술 관련 연구 동향을 분석하여 의미 있는 결과와 시사점을 도출하였으나, 다음과 같은 한계점이 존재한다. 첫째, 본 연구의 자료 수집 과정에서 정한 키워드 7가지를 통해 국내외 학술 자료를 수집하였으나 키워드에 따라 .연도별 연구 동향의 추이에 영향을 미칠 수 있다는 점이다. 이에 따라, 연구자가 선정한 100편의 논문 안에 유의미한 연구들이 배제되었을 가능성이 있다. 이 과정에서 연구팀의 주제인 기술 연구 동향 분석에 초점을 두었기에 법과 관련된 논문은 제거하여 2022년 이후의 논문들이 급격하게 줄어드는 결과를 초래하였다. 둘째, 본 연구는 완성차 브랜드를 대상으로 연구 동향 분석을 진행하려 했으나, 텍스트 마이닝 기법을 활용하기 위한 논문의 수가 충분하지 않아, 텍스트 마이닝 기법을 적용하기에 한계가 있었다. 그리고, 전처리 과정에서 불용어 및 키워드 선정 과정에서 연구자의 주관이 개입될 수 있다. 향후 연구에서는 완성차 브랜드의 연구가 진행됨에 따라 기업별로 연구 결과를 제시할 필요가 있으며 실제 운전자 경험을 중심으로 한 사용자 인터페이스 및 AI 적용 사례 분석이 병행되어야 한다. 이러한 한계점에도 불구하고, 본 연구는 완성차 브랜드의 차량 내 AI 기술의 연구 동향과 향후 발전 방향을 제시했다는 점에서 학술적, 산업적 의미가 있다. 향후 위와 같이 제시된 한계를 극복하는 연구가 진행되어 더욱 정교하고 실용적인 시사점을 도출할 수 있기를 기대한다.

Acknowledgments

본 연구는 2025년도 동아대학교 교내 연구비 지원에 의하여 이루어진 연구입니다.

References

  • J. S. Park, “Introducing Artificial Intelligence Technology for Autonomous Driving and Commercial-Level Automation,” The Journal of Communications of the Korean Institute of Information Scientists and Engineer, Vol. 40, No. 6, pp. 41-45, June 2022.
  • T. H. Min, Y. J. Moon, and H. J. Maeng, “Comparison of Domestic and International AI Literacy Research Topics Using Text Mining Techniques,” The Journal of Korea Society of Computer and Information, Vol. 30, N0. 2, pp. 213-226, February 2025. [https://doi.org/10.9708/jksci.2025.30.02.213]
  • S. H. Hong, J. H. Kim, H. S. Lee, G. H. Lee, K. H. Lee and K. K. Ryu, “Design and Development of an Autonomous Cart Based on Object Color Recognition Using AI Camera,” in Proceeding of the Autumn Conference of the Institute of Electronics and Information Engineers, Gangwon, pp. 670-673, November 2024.
  • D. Y. Kim, B. K. Son, and J. H. Lee, “AI Infotainment for Custom Music Generation Based on Drivers Emotional Recognition,” in Proceedings of the KICS Summer Conference, Jeju, pp. 1406-1408, June 2024.
  • E. H. Kim and N. C. Park, “Complementary Multimodal Interface in Level 3 Autonomous Vehicles - Focusing on Information Contents,” The Journal of HCI Society of Korea, Vol. 20, No. 1, pp. 15-28, March 2025. [https://doi.org/10.17210/jhsk.2025.03.20.1.15]
  • LG Business Research, Generative AI in the Driver’s Seat [Internet]. Available: https://www.lgbr.co.kr/report/view.do?idx=19702
  • W. Jeong, “A Study on the Legal Issues of Chat GPT,” The Journal of InHa Law Review, Vol. 26, No. 4, pp. 329-355, December 2023. [https://doi.org/10.22789/IHLR.2023.12.26.4.10]
  • I. Kim and Y. W. Jeong, “A Study on Personalization of Automotive Infotainment Design for Car Sharing Service,” in Proceedings of the Spring International Conference of the Korean Society of Design Science (KSDS), Seoul, pp. 268-269, May 2021.
  • J. Kim, “A Study of Artificial Intelligence Platform for Vehicle Remote Control: AI Speaker-Based Service Case,” The Journal of Korean Institute of Communications and Information Sciences, Vol. 44, No. 12, pp. 2362-2373, December 2019. [https://doi.org/10.7840/kics.2019.44.12.2362]
  • B. Yu, “A Study on Emotional Content Direction of Automobile A.I Service Based on Driver's Situation,” Journal of Basic Design & Art, Vol. 20, No. 3, June 2019. [https://doi.org/10.47294/ksbda.20.3.16]
  • J. Wu, S.-R. Jeong, and S.-H. Lee, “Analysis of Green Washing Research Trends Using Text Mining Techniques,” The Journal of Advanced Technology Convergence, Vol. 4, No. 2, pp. 93-102, 2025. [https://doi.org/10.23152/JATC.2025.04.02.093]
  • S. H. Han and H. W. Lee, “An Analysis of News Articles Related to Public Records Using Text Mining,” The Journal of Korean Society of Archives and Records Management, Vol. 25, No. 1, pp. 103-127, 2025. [https://doi.org/10.14404/JKSARM.2025.25.1.103]
  • J. E. Lee and K. S. Bae, “Analyzing Trends in Biotech Commercialization Using Text Mining Techniques,” The Journal of Korean Entrepreneurship Society, Vol 19, No. 2, pp. 275-294, 2024. [https://doi.org/10.24878/tkes.2024.19.2.275]
  • G. O. White III, O. Guldiken, T. A. Hemphil, W. He, and M. S. Khoobdeh, “Trends in International Strategic Management Research From 2000 to 2013: Text Mining and Bibliometric Analyses,” Management International Review, Vol. 56, pp. 35-65, November 2015. [https://doi.org/10.1007/s11575-015-0260-9]
  • H. I. Jo, J. W. Kim, and B. G. Lee, “A Study on Research Trends of Blockchain Using LDA Topic Modeling : Focusing on United States, China, and South Korea,” The Journal of Digital Contents Society, Vol. 20, No. 7, pp. 1453-1460, July 2019. [https://doi.org/10.9728/dcs.2019.20.7.1453]
  • W. S. Lee and S. Y. Sohn, “Topic Model Analysis of Research Trend on Spatial Big Data,” The Journal of Korean Institute of Industrial Engineers, Vol. 41, No. 1, pp. 64-73, December 2014. [https://doi.org/10.7232/JKIIE.2015.41.1.064]
  • K. C. Park and C. H. Lee, “A Study on the Research Trends for Smart City using Topic Modeling,” The Journal of Internet Computing and Services, Vol. 20, No. 3. pp. 119-128, June 2019. [https://doi.org/10.7472/jksii.2019.20.3.119]
  • E. J. Han and S. H. Cheon, “Comparative Analysis of Consumer Reviews for Electric Vehicles and Internal Combustion Engines Using Text Mining : A Case Study of Hyundai-Motor Company,” Korean Journal of Business & Management, Vol. 37, No. 3, pp. 123-154, 2023. [https://doi.org/10.34274/krabe.2023.37.3.006]
  • C. Ran, C.Zheng, W. Yuhang, and X. Jiameng, “A Study on Consumer Satisfaction with Hyundai Motors in the Chinese Market Using Text Mining: A Comparison with Other Brands,” in Proceedings of the Korean Society for Journalism and Communication Studies Conference, Seoul, pp. 173-175, 2023.
  • C. Ran and I. Nam, “Text Mining-Based Analysis of Hyundai Automobile Consumer Satisfaction and Dissatisfaction Factors in the Chinese Market: A Comparison with Other Brands,” The Journal of the Convergence on Culture Technology, Vol. 10, No. 1, pp. 539-549, January 2024. [https://doi.org/10.17703/jcct.2024.10.1.539]
  • Intel. In the field of the automotive industry AI (Artificial Intelligence) [Internet]. Available: https://www.intel.co.kr/content/www/kr/ko/learn/ai-in-automotive.html, .
  • Zdnet Korea. LG Electronics Conducts First Demonstration of Next-Generation In-Vehicle Voice Communication Solution Based on Satellite Technology [Internet]. Available: https://zdnet.co.kr/view/?no=20250516083838, .
  • Chosun Biz. Google Expands Its AI Model Gemini to Cars, TVs, and Smartwatches [Internet]. Available: https://biz.chosun.com/it-science/ict/2025/05/14/552ADD3TLFBCRHPNIZES4R5BII/, .
  • H. W. Hwa, J. Y. Han, “A Study on the Types and Characteristics of AI-Based Mobility Content in Driving Scenarios,” The Journal of Korea Intitute of Spatial Design, Vol. 19, No. 7, pp. 643-652, 2024.
  • B. R. Yu, “A Study on Emotional Content Direction of Automobile A.I Service Based on Driver's Situation,” Journal of Basic Design & Art, Vol. 20, No. 3, pp. 199-209, June 2019. [https://doi.org/10.47294/KSBDA.20.3.16]
  • S. Bai, D. Yu, C. Han, M. Yang, N. Islam, and Z. Yang, “Enablers or Inhibitors? Unpacking the Emotional Power Behind In-Vehicle AI Anthropomorphic Interaction: A Dual-Factor Approach by Text Mining,” IEEE Transactions on Engineering Management, Vol. 71, pp. 13149-13165, November 2023. [https://doi.org/10.1109/TEM.2023.3327500]
  • L. Stappen, J. Dillmann, S. Striegel, H. Vogel, N. Flores, and B. Schuller, “Integrating Generative Artificial Intelligence in Intelligent Vehicle Systems,” in Proceeding of 2023 IEEE 26th International Conference on Intelligent Transportation Systems (ITSC), Bilbao: Spain, pp. 5790-5797, 2024. [https://doi.org/10.1109/ITSC57777.2023.10422003]
  • J. S. Myung, D. J. Lee, and S. G. Lee, “A Korean Product Review Analysis System Using a Semi-Automatically Constructed Semantic Dictionary,” Journal of KISS : Software and Applications, Vol. 35, No. 6, pp. 392-403, June 2008.
  • A. Hotho, A. Nürnberger, and G. Paaß, “A Brief Survey of Text Mining,” The Journal for Language Technology and Computational Linguistics, Vol. 20, No. 1, pp. 19- 62, July 2005. [https://doi.org/10.21248/jlcl.20.2005.68]
  • H.-S. Kim, N.-O. Cho, and Y.-J. Lee, “Language Variation between Counselors and Clients Utilizing Topic Modeling in Counseling Process,” The Journal of Learner-Centered Curriculum and Instruction, Vol. 23, No. 20, pp. 801-818, October 2023. [https://doi.org/10.22251/jlcci.2023.23.20.801]
  • S. U. Park, “Artificial Intelligence Technology and Market Trends,” The Journal of KIICE, Vol. 19, No. 2, pp. 11-22, 2018.
  • S.-I. Bak, G.-G. Lim, and D.-S. Yu, “Exploring Social Impact of AI,” The Journal of Informatization Policy, Vol. 23, No. 4, pp. 3-23, December 2016. [https://doi.org/10.22693/NIAIP.2016.23.4.003]
  • S. E. Mun, S. B. Jang, J. H. Lee, and J. S. Lee, “Machine Learning and Deep Learning Technology Trends,” The Journal of Korean Institute of Communication Sciences, Vol. 33, No. 10, pp. 49-56, 2016.
  • H. I. Koo, “Trends in Artificial Intelligence and Deep Learning,” The Journal of Institute of Electrical Engineers, Vol. 67, No. 7, pp. 7-12, July 2018.
  • K. D. Kim, “Correlation Analysis of In-Vehicle Infortainment and System Complexity and Performance on Study,” in Proceeding of 2024 Fall Conference of the Korean Society of Automotive Engineers (KSAE), Jeju Island, pp. 909-913, 2024.
  • G. M. Jeong, T. Y. Lee, C. E. Park, and P. S. Kim, “Smart Car Market Change and Car Action Direction Following Appearance of Google,/Apple/Tesla/,” Journal of the Korean Institute of Communication Sciences, Vol. 33, No. 4, pp. 3-9, 2016.
  • A. Y. Park and J. H. Choe, “A Study on the Application Method of a Personalized Service on In-Vehicle Infotainment,” in Proceedings of the 2019 Spring General Conference of The Korea Contents Association, Seoul, Korea, pp. 347-348, 2019.
  • New Daily Economy. Electronics Industry 11% Annual Growth Seize the Automotive Infotainment Market [Internet]. Available: https://biz.newdaily.co.kr/site/data/html/2016/11/16/2016111610098, .
  • J. W. Kim, HCI 3.0: Centered on Human-AI Interaction (HAII), agbook, 2012.
  • Y. J. Lee, A study on Contextual Design for Smart Car Infotainment System : Focusing on Mobile Device UX and Context, Master’s Thesis, Ewha University, Seoul, 2016.
  • H. Ryu and K. Kim, “Global Trends and Developments on Automotive UX/Ul,” in Proceedings of the 2019 Autumn Conference of the Korea Information Processing Society, Jeju, pp. 1145-1148, 2019. [https://doi.org/10.3745/PKIPS.y2019m10a.1145]
  • H. S. Bae, “A Study on Copyright Issues in the Era of Generative AI: An Approach from Law-Related Education,” The Journal of Law-Related Education, Vol. 20, No. 1, pp. 147-181, 2025.

저자소개

신한솔(Han-Sol Shin)

2025년:동아대학교 (학사과정)

2020년~현 재: 동아대학교 기계공학과 학사과정

※관심분야:자동차, AI, 설계 등

이찬희(Chan-Hee Yi)

2025년:동아대학교 (학사과정)

2020년~현 재: 동아대학교 전기공학과 학사과정

※관심분야:자동차, AI 등

서상원(Sang-Won Seo)

2025년:동아대학교 (학사과정)

2020년~현 재: 동아대학교 기계공학과 학사과정

※관심분야:자동차, AI, 선박 등

전대일(Dae-Il Jeon)

2021년 8월:부산대학교 국어교육학과 (교육학박사)

2023년~현 재: 동아대학교 창업교육센터 조교수

※관심분야:독서 및 작문, AI 리터러시, AI 교육적 활동, 한국어 교육 등

Fig. 1.

Fig. 1.
Text mining process diagram

Fig. 2.

Fig. 2.
PRISMA flow diagram

Fig. 3.

Fig. 3.
Research trends by year

Fig. 4.

Fig. 4.
Research trends on AI and law

Fig. 5.

Fig. 5.
TF analysis results visualized as a word cloud*Displayed in Korean for readability

Fig. 6.

Fig. 6.
Keyword network analysis result output

Table 1.

Summary of paper characteristic

Key Word Number of Paper Characteristic
Vehicle 35 AV, EV, Connected Car
AI 34 Big Data, Natural Language, Speech Recognition
Infotainment 31 UX

Table 2.

Main code

Preprocessing stopwords=[], stopwords_combine stopwords+custom_stopwords+english_stopwords
TF & TF-IDF vectorizer=CountVectorizer(tokenizer=lambdax: x.split(", ")), np.array((tfidf_matrix>0) .sum(axis=0)).flatten()”, “np.log(total_documents(1+document_frequencies))
Topic Modeling num_topics=10, gensim lda_model= gensim.models.LdaModel(corpus,num_topics=num_topics,id2word=dictionary,passes=10)

Table 3.

TF analysis results

Rank Keyword Frequency Rank Keyword Frequency
1 Vehicle 367 16 Sensor 47
2 Drive 160 17 Interface 45
3 Intelligence 136 18 Supply 45
4 Driver 127 19 Performance 44
5 Autonomy 121 20 Situation 42
6 System 118 21 Design 41
7 Artificiality 115 22 Algorithm 40
8 Technique 108 23 Field 39
9 Development 93 24 Influence 39
10 Recognition 89 25 Control 38
11 Model 82 26 Learning 38
12 Voice 75 27 Function 35
13 Information 64 28 Society 35
14 Environment 58 29 Utilize 34
15 Location 48 30 conduct 33

Table 4.

Table 4. TF-IDF analysis results

Rank Keyword TF-IDF DF IDF
1 Recognition 7.794 35 1.284
2 Control 7.633 15 2.095
3 Autonomy 7.237 40 1.154
4 Voice 7.237 21 1.776
5 Electric Vehicle 7.062 7 2.788
6 Automation 7.012 20 1.823
7 Environment 6.972 31 1.402
8 Driving 6.874 49 0.956
9 Sensor 6.835 24 1.649
10 Learning 6.757 19 1.872
11 Data 6.718 43 1.083
12 Driver 6.653 39 1.179
13 Experience 6.611 18 1.929
14 Information 6.566 27 1.535
15 Image 6.524 8 2.670
16 Technology 6.496 41 1.130
17 Artificial 6.457 29 1.466
18 Intelligence 6.351 34 1.312
19 Interface 6.242 18 1.923
20 Charging 6.152 5 3.076
21 Future 6.034 13 2.228
22 Driving 5.913 9 2.565
23 Understanding 5.739 6 2.921
24 Access 5.669 11 2.383
25 Change 5.668 14 2.159
26 Scenario 5.648 12 2.302
27 Application 5.638 12 2.302
28 Design 5,627 10 2,470
29 Foundation 5,627 12 2,303
30 Center 5,602 14 2,159

Table 5.

Key Research topic clusters through network analysis

Cluster Classification Keywords
Social Impact of Technology Technology, Society, Danger, Policy
Autonomous Driving Technology Autonomy, Driving, Automobile, Information, Sensor
Driving Environment Recognition and Control Technology Vehicle, Recognize, Environment, Control

Table 6.

Results of topic modeling

Topic Identified Topics Keywords Paper Number Ratio
1 AI in Vehicles and User Interface Vehicle, AI, Driving, Data, User, Interface 46 35.4%
2 Development of In-Vehicle Speech Recognition Systems Technology, Vehicle, Society, AI, Information, Speech Recognition 28 21.6%
3 Autonomous Vehicles and Environmental Data Utilization Vehicle, Autonomous, Data, Route, Environment, Network 16 12.3%
4 Driver Safety and Risk Management Driving, Vehicle, Technology, Tracking, Driver, Risk 17 13.1%
5 Utilization of Electric Vehicles and Big Data Big Data, Electric Vehicle, Trust, Information, Cognition, Learning 23 17.7%