인공지능 인문데이터의 해석: 한국어 감정데이터를 중심으로
Copyright ⓒ 2024 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
초록
이 연구는 인문학적 관점을 인공지능에 통합하여, 한국어 감정데이터를 구축하고 활용하는 방안을 제안한다. 이를 위해 인문데이터의 범위를 정의하고 감정 음성데이터와 텍스트데이터를 구축하는 방법론을 제공한다. 이 연구는 감정데이터를 해석하고 활용하는 과정에서 인문학적 통찰력이 중요한 역할을 한다고 주장한다. 이 연구는 인공지능과 인문학을 결합한 통합적 접근법을 제안함으로써 한국어 감정데이터를 더욱 효과적으로 분석하며 인공지능 기술을 풍부하게 하도록 한다. 이는 인공지능인문학 분야에서 한국어 감정데이터의 해석과 인공지능 개발에 인문학적 통찰을 반영하는 데 중요한 의의가 있다.
Abstract
In this study, we propose newer approaches to integrate humanities perspectives into artificial intelligence (AI), with a specific focus on Korean emotional data. The aim is to achieve a more nuanced and comprehensive understanding of AI systems. We define the scope of humanities data and present detailed methodologies to construct and analyze emotional speech data and AI-generated emotional text data within the context of AI research. We emphasize the critical role of humanities insights in interpreting and utilizing emotional data to improve human-AI interactions. By suggesting integrative approaches combining AI and humanities, we aim to enhance the manner in which Korean emotional data are approached and analyzed, which in turn improves the integration of AI technologies with humanistic perspectives. These suggestions have significant implications for the interdisciplinary field of AI humanities, and they provide directions for effectively interpreting Korean emotional data and advancing the integration of humanities insights into AI development and application.
Keywords:
Korean Emotional Speech Data, Korean Emotional Text Data, Data Interpretation, AI Humanities, Humanities Data키워드:
한국어 음성 감정데이터, 한국어 텍스트 감정데이터, 데이터 해석, 인공지능인문학, 인문데이터Ⅰ. 서 론
이 연구는 인공지능(Artificial Intelligence, 이하 AI)을 위한 감정 인문데이터의 구축 방법을 제시하고 인문학적 관점에서 그 결과를 해석하는 것을 목적으로 한다. AI와 인문학을 융합한 학문 분야로서, 언어학, 역사학, 철학, 종교학 등이 포함된 인문데이터 해석학은 ‘인간성’ 탐구를 위한 빅데이터를 구축하는 데 중점을 둔다[1].
AI의 발전은 일상생활, 학문, 교육 등 전반에 혁신적인 변화를 불러오고 있다. 특히 인문학 분야에서 AI의 역할과 그 잠재력은 더욱 중요하게 되는데, AI가 단순히 기술적 도구에 그치지 않고 인간의 감정과 상호작용하는 능력을 갖추게 되면서 AI와 인간 사이에서 상호작용을 하면서 생성되는 데이터를 인문학적으로 해석해야 하는 필요성이 대두되고 있다. 이와 같은 데이터는 AI의 성능 향상뿐만 아니라 AI가 인간과 공존하기 위한 중요한 연구 자료로서도 가치가 크다.
이 연구에서는 다음의 세 가지 연구 과제를 제시한다.
- 첫째, 인공지능인문학이라는 융합 학문을 소개하고 인문데이터의 범위를 정의한다.
- 둘째, 한국어 감정데이터의 구축 및 분석 방법을 논의한다.
- 셋째, 한국어 감정데이터의 해석 및 활용 방안을 제안한다.
인공지능인문학은 인문학의 관점에서 AI가 인간과 사회에 미치는 영향에 대해 연구하는 융합 학문으로서 인공지능 윤리규범학, 인공지능 인문데이터 해석학, 인공지능 사회문화학, 인공지능 관계 소통학, 인공지능 기술비평학의 분과로 구분된다. 이 연구는 이 가운데 인문데이터 해석학의 분과에 속하는데 언어학, 철학, 역사학, 종교학과 연계되며 인공지능학, 빅데이터 기반의 정보학이 융합되는 연구 분야이다. 인문데이터 해석학은 인간의 경험과 관련된 빅데이터를 구축하여 이를 AI에 재현하고 인문학적으로 해석하는 것을 목표로 한다.
이 연구에서는 인간의 감정을 이해하고 해석하는 데이터로서의 인문 감정데이터를 중심으로 인문데이터의 구축과 분석 방법에 대하여 논의한다. 2장에서는 인공지능인문학의 하위 분야로서 인문데이터의 개념을 살펴보고 감정데이터를 중심으로 정의한다. 3장에서는 한국어 감정데이터 구축 방법론을 다룬다. 4장에서는 한국어 감정데이터의 효용성을 제안한다.
Ⅱ. 인문데이터의 정의
2-1 인문데이터
인문학의 토대에서 인공지능, 인문학의 내용, 인문학의 방법의 요소를 포함하며 인공지능 시대를 읽는 포스트휴먼 시대를 이끌어가는 학문으로서 ‘인공지능인문학(Artificial Intelligence Humanities)’을 규정한다. 인공지능인문학은 인공지능 시대에 기초인문학의 내용으로서 언어학, 문학, 역사학, 윤리학, 사회학, 문화학의 본 모습을 간직하면서 ‘인공지능’이라는 학문적 대상이 침투하여 인문학적 반성을 담고 있다. 인공지능인문학의 내용으로 ‘인공지능 기술비평학, 인공지능 관계소통학, 인공지능 사회문화학, 인공지능 규범윤리학’으로 구성되며, 방법론으로는 인공지능인문학의 내용에 디지털 기술을 이용하여 네 연구 영역을 견인하는 분야로 ‘인문데이터해석학’이 있다. 다시 말해, 인문데이터해석학은 인공지능인문학의 내용에 대하여 전산화, 시각화, 데이터 분석 등의 디지털인문학의 성과를 활용한 ‘인간성’과 관련된 빅데이터 구축 방법론에 관한 연구이며 인공지능에 대한 인문학적 반성을 포함한 인문콘텐츠의 체계적인 데이터 구축을 위한 방법적 토대를 제공한다[2].
‘인문데이터(Humanities Data)’란 인문학 연구 데이터를 말하는데, 인간의 언어, 문화, 경험, 사회적 맥락 등을 포함한다. 이는 컴퓨터 과학이나 자연어처리에서 사용하는 표준 숫자 데이터와는 달리, 인간과 AI가 원활하게 소통할 수 있도록 설계된다. 인문데이터는 AI가 인간의 복잡한 특성을 반영하여 상호작용할 수 있도록 하는 데에 필수적이다. 예를 들어, 인공지능스피커에 ‘이순신 장군은 어디에서 죽었나요?’와 같은 질문에 대한 답변을 요구할 때, 인간이 생각하는 답으로 ‘조선’, ‘경상우도’, ‘노량해협’ 등이 나올 수 있다. 이와 같이 맥락을 이해하는 ‘시맨틱 데이터(semantic data)’가 앞으로 필요한 인문데이터의 한 예시가 된다[3].
인문데이터는 AI 학습데이터로 사용되므로 인간 친화적으로 설계되어야 한다. 구축 단계에서부터 데이터 설계 과정이 투명하고 설명 가능하도록 제시되어야 하며 AI와 인간이 원활하게 공존하기 위해서는 인간을 위한 데이터가 구축되어야 한다. 이를 위해서는 인문학적 고찰이 반영되어야 하며 인공지능이 올바른 윤리적 판단을 하도록 한국어에 적절한 자연어처리가 가능하도록 데이터를 구축해야 한다[4]. 이는 기계가 생성하는 데이터와는 차별이 되며 인간의 복잡한 언어, 문화, 정서, 감정과 관련된 요소가 입체적이면서도 종합적으로 반영되므로 이산적(discrete)이지 않다는 특성이 있다.
한편으로 인문데이터는 디지털인문학에서 생산되는 데이터와도 밀접한 연관성이 있다. ‘디지털인문학(Digital Humanities)’이란 정보 기술의 도움으로 수행하는 인문학 연구와 교육, 이와 관계된 창조적인 저작 활동을 말한다[5]. 디지털인문학은 기계가독형 데이터 구축과 생성에 좀 더 초점을 두지만 AI 인문데이터는 데이터의 인문학적 구축과 분석, 해석에 초점을 둔다.
이는 전통적인 인문학 주제를 계승하면서 디지털 기술을 활용하는 연구 방법론을 포함하는데, 인공지능인문학에서의 인문데이터는 컴퓨터에서 인공지능으로 좀 더 고도화된 기술을 활용하여 생성되는 인문 지식 재생산의 총체라고 할 수 있다. 다시 말해, 인문데이터는 연구 방법론 측면에서 기존에 있었던 인문학적 성과를 AI라는 매체를 통해 확대 재생산, 창조적인 인문학적 활동을 전개하며, AI와 소통할 수 있는 데이터 처리를 하는 일련의 과정에서 도출되는 지식 정보를 말한다.
2-2 감정데이터
일반적으로 데이터는 정형 데이터와 비정형 데이터로 구분되며, 메타데이터, 시계열 데이터 등 다양한 형태로 존재한다. 앞서 살펴본 인문데이터 중에서도 감정데이터를 구축하는 것은 인간과 AI가 상호작용을 향상하는 데에 중요하다. AI가 인간의 감정을 이해하고 적절하게 반응함으로써, 사용자와의 공감대를 형성하고 의사소통의 질을 높일 수 있다. 또한, 개인의 감정 상태를 기반으로 맞춤형 추천과 지원을 제공하여, 보다 자연스럽고 유연한 상호작용이 가능해진다. 한편 AI는 이러한 상호작용을 통해 실시간으로 학습하고, 지속적으로 발전한다. 또한, 정신 건강 문제를 조기에 발견하고, 감정을 인식하는 AI를 개발하여 사용자 경험을 향상시킬 수 있다. 더하여, 문화 간 감정 표현의 차이를 이해하여 더욱 섬세하고 효과적인 지원을 제공할 수 있다. 이러한 맥락에서 인문데이터 가운데에서 인간의 감정을 다루는 ‘감정데이터’가 무엇보다 중요하다. 따라서 이 연구에서는 인문데이터 가운데 ‘감정데이터’에 초점을 두고 논의를 진행하고자 한다.
감정데이터는 인간의 감정, 윤리, 경험의 다면성과 복잡성을 반영한 데이터로, 어휘, 텍스트, 음성, 이미지 등을 통해 표현된다. 생성형 AI를 활용하여 데이터를 증강할 수 있지만, 인문학적으로 설계되고 구축된다는 점에서는 차별화된다. 감정데이터는 ‘인간의 감정’과 관련된 데이터로 AI가 인간의 감정을 이해하기 위한 학습데이터이다. 감정은 사회문화적 맥락에 따라 복합적으로 표출되므로 한국인의 감정은 Ekman의 기본 감정 이론과 다를 수밖에 없다[6]. 인간의 언어는 사회화된 표현 기제이며 감정 표현도 사회적 행위로 볼 수 있으므로[7], 한국어로 된 한국인의 다양한 정서를 반영하는 감정데이터를 구축해야 한다.
기존 감정데이터는 기계학습을 위하여 명시적 규칙 없이 비지도적으로 대규모의 데이터를 제공하여 기계가 스스로 데이터로부터 패턴을 추론하도록 하며, 감정 유형도 긍정, 부정, 중립 등 비교적 단순하게 감정 식별을 하도록 마련되었다. 그렇지만 인간의 인지 과정을 포함하는 감정은 명시적으로 식별되기 어려울뿐더러 복잡다단하므로 공통된 감정 유형이라도 표출되는 방식에 따라 다소 상이하게 나타난다.
- (1) a. 다이어트를 열심히 했는데 고작 1kg밖에 안 빠져서 웃프다.
- b. 오래 다니던 회사를 퇴사하니 시원섭섭하네.
- c. 졸업을 하니 기쁘지만 앞으로 뭘 하면서 살아야 할지 막막하기도 하다.
- d. 모처럼 혼자만의 시간이 생겨 자유롭지만 한편으로는 외롭다.
예시 (1)에서 보듯이, ‘웃프다’, ‘시원섭섭하다’, ‘기쁘지만 막막하다’, ‘자유롭지만 외롭다’와 같이 화자의 복합적인 감정이 드러나므로 단일한 감정 유형으로 수렴되지 않고 긍정과 부정이 함께 표출되기도 한다.
한국어를 기반으로 하는 감정데이터는 감정 정보가 포함된 단발성 대화에서 연속적 대화로 확대되었고, 주로 상품에 대한 긍정, 부정을 분류하는 감성 분석(sentimental analysis) 데이터로 구축되어 왔다. AI 허브에 공개된 최근 한국어 감정데이터는 다음과 같다.
Ⅲ. 한국어 감정데이터 구축
3-1 한국어 음성 감정데이터
지금까지 음성 감정데이터는 주로 독일어, 이탈리아어, 덴마크어 등 유럽 언어와 영어로 구축되어 왔다[8]. 아시아 언어의 경우, 중국어를 제외하면 데이터가 상대적으로 제한적이며, 한국어도 예외가 아니다.
다양한 언어를 포함하는 음성 감정 데이터베이스의 구축은 AI 시대의 인문 감정데이터에 대한 이해를 높이는 데 필수적이다. 특히 감정은 종류뿐만 아니라 강도에서도 차이가 있다. 기존의 많은 감정 데이터베이스는 감정 강도를 고려하지 않고 녹음되었으며, 감정 강도를 달리하여 녹음된 데이터는 드물고, 특히 한국어로 구축된 사례는 전무하다. 이에, Nam & Lee에서는 6가지 감정에 강도를 달리하여 녹음한 “중앙 한국어 음성 감정 데이터베이스(Chung-Ang Auditory Database of Korean Emotional Speech, 이하 CADKES)”를 구축하였다[9].
구체적으로 CADKES는 18명의 연기자가 중립, 슬픔, 행복, 분노, 두려움, 지겨움의 감정을 25문장을 사용하여 녹음하였으며, 각 감정의 발화 강도는 강한 것과 보통으로 나누어 녹음하였다. 그 결과 CADKES는 강한 발화 강도의 문장 2700개와 보통 발화 강도의 문장 2700개로 구성되었다. 또한, 음성 감정 발화의 타당성을 검증하기 위해 25명의 한국어 청자를 대상으로 감정 유형 식별과 감정의 자연스러움에 대한 지각 실험을 실시했다.
표 2와 표 3은 각각 강한 강도와 보통 발화 강도의 문장에 대한 지각 실험 결과를 제시하고 있다. 표 2에 따르면, 강한 발화 강도에서 감정 식별의 평균 정확도는 87%였다. 감정별로는 중립 감정(93.2%)이 가장 높은 정확도로 식별되었으며, 분노(90.4%), 슬픔(86.8%), 지루함(85.6%), 행복(83.4%), 두려움(81.2%)이 그 뒤를 이었다.
표 3에 나타난 바와 같이 보통 발화 강도에서의 평균 감정 식별 정확도는 78%였다. 감정별로는 강한 발화 강도와 마찬가지로 중립(89.5%)이 가장 높은 정확도를 보였으며, 그 다음으로는 행복(78.6%), 두려움(78.4%), 지루함(76.8%), 분노(75.6%), 슬픔(68.8%)의 순으로 정확도가 나타났다.
이러한 결과는 CADKES의 감정 발화가 기존 데이터베이스[10]-[12]와 비교하여 상당히 높은 식별 정확도를 보임으로써 그 타당성을 입증한다. 특히 CADKES는 한국어로 감정의 강도를 다르게 하여 녹음한 최초의 음성 감정 데이터베이스로, 일상 대화에서의 감정을 잘 반영할 수 있는 점에서 유용하게 활용될 수 있다. 더불어 청자는 식별 정확도가 높은 감정이 더 자연스럽게 표현된다고 평가하였다. 이는 CADKES의 감정이 청자가 감정을 인식하는 방식과 잘 일치하여 데이터의 품질을 뒷받침하며, AI 기반 감정 인식 시스템 훈련에서 효용성이 높을 것으로 기대할 수 있다. 또한, 이러한 지각 실험 결과는 음성 감정데이터를 평가할 때 감정 식별의 정확성과 자연스러움 모두를 고려할 필요가 있음을 시사한다. 나아가 이러한 포괄적인 접근은 음성 감정 데이터의 품질을 향상해 자동 음성 감정 인식 기술이 실제 감정 인식을 더 잘 반영하는 데 기여할 수 있을 것으로 본다.
3-2 한국어 텍스트 감정데이터
감정데이터는 음성, 이미지, 텍스트의 형태로 구축되어 왔다. 한국인의 정서와 복잡한 감정을 반영하기 위해서는 한국어 텍스트로 된 데이터가 구축되어야 한다. 분석 기술의 측면에서 감정데이터를 텍스트, 음성, 이미지 등 데이터 형태에 따라 구분하고 이 절에서는 텍스트를 중심으로 구축 방법을 논의하고자 한다.
‘GPT-4o’ 등의 공개로 생성형 AI를 활용한 데이터 구축이나[13] 데이터 증강 기법이 나타났다. 감정 분류 작업에서 적대적 신경망(GAN)을 이용하여 데이터 증강 방법을 제안하거나[14] 데이터 불균형을 해소하거나 작은 규모의 데이터를 증강하기 위하여 텍스트데이터 증강 연구가 진행되어 왔다[15]. 기계가 데이터를 생산하는 방법은 유용하게 활용되더라도 데이터 품질 측면에서는 여전히 미흡함이 있다.
- (2) a. 중요한 발표가 끝나고 나니 기대감이 김빠지게 사라졌다.
- b. 오랜 기다림 끝에 결과가 실망스러워서 기운이 김빠졌다.
- c. 친구랑 여행 계획 짰는데 갑자기 일이 생겨 못 가게 돼서 웃프다.
(2a-b)는 ‘섭섭’을 나타내는 감정어로 ‘김빠지다’를 사용하여 챗GPT 4o에게 감정 문장을 생성하도록 한 것이다. 표준국어대사전(웹)에서 ‘김빠지다’의 의미는 ‘의욕이나 흥미가 사라져서 재미없게 되다’로 기술되어 있다. 예시 (2b)에서와 같이 ‘김빠지게 사라지다’는 어색한 표현이 되는데 ‘수증기’ 등의 ‘김 빠지다’의 의미로 오인하여 표현된 듯하다. 이뿐만 아니라 ‘웃프다’는 신조어로 ‘웃기면서 슬프다’의 뜻으로 표면적으로는 웃기지만 실제로 처한 상황이나 처지가 좋지 못하여 슬플 때 사용하는 형용사이다. (2c)에서는 아쉬운 감정이 드러나는 문장으로 ‘웃프다’의 상황이 제대로 드러나지 않았다. 이처럼 생성형 AI가 산출한 문장은 품질 측면에서 자연스러운 한국어라고 보기 힘든 경우가 종종 있다.
이러한 기계 생성 데이터를 보완하기 위하여 프롬프트를 구조화하고 생성형 AI가 산출한 데이터를 인간이 검수하는 방식을 제안하고자 한다. 이와 같은 데이터 구축 방법론은 인간이 구축하는 데이터 비해서 비용과 시간을 단축할 수 있다는 장점이 있다. 인간이 설계한 프롬프트 구조화를 기반으로 생성형 AI를 활용하여 데이터를 생성하고 AI가 산출한 결과를 다시 인간이 검수함으로써 자연스러운 한국어 데이터 품질을 확보할 수 있다. 특히 ‘인간성’에 관련된 감정데이터는 더욱이 이와 같은 인간과 AI의 하이브리드 구축 방법이 요구된다. 선행연구에서는 감정데이터를 생성형 AI에 프롬프트 질문과 AI의 응답 결과를 인간이 검수하는 방식은 시도되었다[16]. 이러한 방법은 감정데이터의 품질을 높이고, 언어학적으로 타당성을 확보하여 인문데이터를 AI에 활용하는 데에 적합하다. 고품질의 데이터가 AI 성능을 높이는 데 중요하기 때문이다.
한국어 텍스트 감정데이터는 한국어 대규모 사전의 감정어 표제어를 기반으로 감정데이터를 구축하고, 이를 토대로 AI가 산출한 결과를 전문가가 검수하는 방식으로 진행한다.
표 4에서 보듯이, 1단계는 한국어 대규모 사전 ‘우리말샘’으로부터 감정어 표제어를 선정하고, 2단계로는 문장, 대화 등 감정데이터 생성 목적에 부합하도록 뜻풀이, 예문 등의 정보를 활용하여 프롬프트를 구조화한다. 3단계는 감정데이터의 활용 목적에 따라서 생성형 AI가 산출한 감정데이터를 분석하고 분류하는 과정이다. 감정데이터의 활용 목적에 따라 긍정, 부정, 중립 또는 기본형, 상태형, 반응형으로 구분할 수 있다. 4단계는 자연스러운 한국어 감정데이터로 산출되도록 검수하며 추가 작업을 실시한다. Lee & Cheong(2023)에서는 이와 같은 데이터 구축 방법으로 프롬프트 구조화를 제안하였는데 감정 문장 생성을 위한 필수적인 정보로 ‘감정 정보’, ‘형태 정보’, ‘의미 정보’, ‘용례 정보’를 두었다[16]. 감정데이터의 산출 결과가 미흡하면 용례 정보를 다양하게 제공하여 재산출하도록 할 수 있다. 또한 생성형 AI가 산출한 데이터를 인간이 검수 작업에서 한국인의 감정에 적합하게 일부 수정 보완할 수 있다. 이는 감정어를 제시하고 지침에 따라 생성하게 하는 방법에 비해서 데이터 품질을 유지하면서도 시간과 비용을 단축할 수 있다.
Ⅳ. 한국어 감정데이터의 해석
4-1 감정데이터의 다양성
AI가 인간과 공존하기 위해서는 다양한 문화적 배경과 심리적 상태를 반영한 감정 인문데이터가 필요하다. 이는 AI가 다양한 상황에서 정확한 감정을 인식하고 반응할 수 있도록 해준다. 인간의 복잡한 감정을 깊이 이해하기 위해서는 인문학적 해석이 중요하다.
감정데이터는 앞서 살펴보았듯이, 음성, 텍스트, 이미지 등으로 구축되며 최근에는 음성, 이미지의 합성 등의 기술로 인간 감정을 이해하고 이에 적절한 반응을 생성하는 모델 개발이 시도되는 추세이다. 카카오엔터프라이즈에서는 텍스트 대화 데이터 기반의 감정 분석 모델을 개발하고 대화 맥락에서 감정을 분석하여 다양한 음성 서비스, 콜봇 등에 활용하도록 했다. 네이버 클로바 센티멘트(CLOVA Sentiment)에서도 글에 담긴 감정을 분석하고 감정이 표현된 부분을 추출하는 서비스를 제공한다. 실제로 블로그, 실제로 블로그, 댓글, SNS 등 문서에서 쇼핑이나 비즈니스를 위하여 사용자 평가를 분석하도록 마련된 서비스이다. 이와 같은 감정 분석 모델은 감정이 드러난 표현을 탐지해 준다는 데에 유용하지만 긍정, 부정, 중립 등의 비교적 간단한 분류로 분석되므로 복잡하면서도 입체적인 감정을 그대로 반영하여 분석하지 못한다는 아쉬움이 있다. 주로 제품 특성이나 사용자의 반응에 관한 감정 분석이므로 ‘인간성’과 관련된 풍부하면서도 복잡다단한 감정은 제대로 분석해 내지 못한다.
인간과 AI가 원활한 상호작용하기 위해서 감정은 중요한 요소로 작용한다. AI가 인간의 감정을 인식하고 적절하게 반응하기 위해서는 감정을 표출하는 언어적, 비언어적 요소뿐만 아니라 이러한 표현의 사회문화적, 상황 맥락을 잘 이해해야 한다. 이와 같은 감정데이터의 인문학적 해석은 사회문화적, 상황 맥락적 요소를 통합하여 이해할 수 있도록 돕고 AI가 인간의 감정을 깊이 이해하고 자연스럽게 상호작용하도록 도울 수 있다.
인문데이터로서 감정데이터는 표면적인 감정 표현뿐만 그 이면에 존재하는 숨겨진 의미, 은유, 사회문화, 상황 맥락에 포함되는 담론을 포함한다. 한국어 감정데이터는 한국 사회에서 나타나는 사회적 규범, 정치적 권력관계, 성별에 따른 차이 등이 복합적으로 얽혀 있다.
- (3) a. 친했던 친구와 멀어져서 마음 한구석이 허전하다.
- b. 명절 때마다 친척들 만나 반갑지만, 결혼 계획을 묻는 이야기로 스트레스를 받아 마음이 무겁다.
- c. 선배 눈치를 보느라고 하고 싶은 말을 꾹 참으니까, 속이 답답하다.
- d. 다음 달에 남자 친구가 군대에 간다는 갑작스러운 소식에 가슴이 철렁 내려앉았다.
예시 (3a)에서 보듯이, ‘마음 한구석이 허전하다’라는 표현이 드러나 ‘섭섭함’, ‘쓸쓸함’의 감정이 나타났고, (3b)는 ‘반갑다’의 ‘정’의 감정이 드러나면서 ‘마음이 무겁다’는 표현이 드러나 ‘부담감’이 함께 나타난다. (3c)는 ‘속이 답답하다’라는 표현으로 ‘답답한’ 감정이 드러났으며, (3d)는 ‘가슴이 철렁 내려앉다’라는 표현으로 ‘놀람’, ‘슬픔’, ‘불안’ 등 복잡한 감정이 나타났다. 이처럼 인간의 감정은 시간에 따라서 변화하기도 하고 상황에 따라 복합적으로 실현되므로 이를 제대로 탐지하기 위해서는 한국인의 문화적 정서가 반영된 다양한 상황 맥락을 고려해야 한다.
특히 고도의 AI 개발을 위해서는 생성형 AI가 산출한 데이터의 객관적인 수치 분석을 넘어 인간의 인문학적 해석이 요구된다. 데이터의 해석 과정에서 발생하는 의미 생성과 분석 과정에서 나타나는 인문학적 고찰이 중요하다. 감정데이터는 참, 거짓을 판정하는 고정된 데이터가 아니기 때문에 기존 기계학습을 위한 데이터와는 다르게 접근해야 한다. 감정데이터를 분석하는 과정에서 해석자의 관점, 사회적인 맥락, 문화적 배경 등이 개입될 수 있는데 이를 분석하는 것이 필요한데 감정데이터의 인문학적 해석이야말로 데이터의 품질과 깊이를 더할 뿐만 아니라 인간을 위한 AI 개발을 위하여도 중요한 데이터 구축의 토대를 제공할 수 있다.
4-2 감정데이터 해석의 효용성
앞서 기술했듯이, 생성형 AI를 활용하여 감정데이터를 구축하는 과정에서 발생하는 오류를 인간이 수정함으로써 데이터 품질을 높일 수 있다. 궁극적으로는 AI가 인간의 복잡한 감정을 이해하고 적절하게 반응할 수 있도록 해야 하며, 이를 위해서는 인간의 인문학적 해석이 지속적으로 필요하다. 인문학적 해석을 통해서 AI가 인간과 자연스럽게 상호작용하는 데에 기여할 수 있으며, 인간의 감정을 인식할 수 있는 AI 개발에도 중요한 데이터로 자리매김할 수 있다.
감정데이터는 기술적 측면에서도 음성과 텍스트, 음성과 이미지, 텍스트와 이미지, 멀티모달 형식 등으로 실현될 수 있다. 감정 유형뿐만 아니라 감정 강도를 고려하여 데이터를 구축하면 특정 감정이 얼마나 강하게 표현되었는지 감정의 미세한 차이를 구별할 수 있고 정교한 감정 인식을 가능하게 해준다. Ekman의 기본 감정이라 하더라도 감정 강도에 따라 감정의 미묘한 변화를 포착할 수 있다. 예를 들어, 기쁨에 해당하는 감정이라 하더라도 ‘약간 기쁜’ 상태인지 ‘매우 기쁜’ 상태인지 구별함으로써 AI가 감정의 강약을 이해하여 더욱 자연스러운 반응을 산출하도록 돕는다. 이는 AI가 인간과 상호작용을 할 때 공감 능력을 향상하는 데 기여할 수 있다.
감정데이터에서 감정 강도를 고려하면 감정 분석의 정확도 및 신뢰성을 높일 수 있다. 특히 부정적 감정에 대하여 동일한 감정이라 하더라도 그 강도에 따라 사람의 행동이나 반응이 달라질 수 있다. ‘분노’에 해당하는 감정어로서, ‘노엽다’, ‘발끈하다’, ‘욱하다’, ‘터지다’, ‘울부짖다’ 등이 있는데, ‘욱하다’의 경우에 감정 강도에 따라 이어지는 돌발 행위를 예측할 수 있다는 장점이 있다. 이는 감정데이터를 활용한 챗봇이나 AI 모델 등 유용하게 적용될 수 있다. 감정 강도는 사용자의 경험(UX, User Experience)을 반영하므로 사용자 맞춤형 서비스를 제공하거나 개인의 감정 변화에 따라 맞춤 콘텐츠를 추천할 수 있다. 이처럼 감정 강도는 개인의 심리적 상태와 감정 변화에 따른 행동을 예측하는 데에 매우 효과적으로 작용할 수 있다. 특히, 감정 강도를 분석하여 감정에 따른 공격적인 행동을 미리 예방하고 이에 따른 대응 전략 등을 마련할 수 있게 된다.
정리하면, 감정데이터는 인문학적 해석이 동반되어 인간의 감정을 더 깊이 있게 이해하고 한국의 사회문화, 상황적 맥락에 적절한 데이터로 구축되어야 하며, 감정 유형의 다양성을 확보하고 감정 강도 등을 고려하여 그 효용성을 배가할 수 있다. 이는 개인화된 맞춤형 서비스를 제공하며, 감정 변화에 따른 위험 행동을 예측함으로써 더 나은 서비스를 제공하며 AI가 인간과 공감하는 대화로 소통함으로써 다양한 응용 분야에서 중요한 가치를 지닐 수 있다.
Ⅴ. 결 론
이 연구는 AI가 인간의 경험과 지식을 보다 깊이 이해하고 인간의 감정을 표출하는 자연어를 해석하고 처리하기 위해 인문학적 관점에서 감정데이터가 구축해야 함을 논의하였다. 특히 실제 음성 감정데이터와 생성형 AI를 활용한 텍스트 감정데이터의 구축 사례와 방법을 제시하였다. 인간성을 총체적으로 드러내는 감정의 정밀한 인식과 인문학적 해석이 AI와 인간의 상호작용에서 가지는 중요성을 주장하면서 앞으로 여러 분야에 활용되기에 적절한 감정데이터의 다양성 및 효용성을 제시하였다.
감정데이터의 인문학적 해석은 단순한 긍정, 부정을 포함한 기본 감정 분석을 넘어 인간의 경험과 가치관, 창의성, 복잡한 사고 및 행동에 영향을 미치는 요소를 이해하는 데에 중요하며 AI의 한계를 인식하고 보완하는 데에 기여할 수 있다.
AI가 인간과 공존하며 원활하게 소통하기 위해서는 인간의 감정, 주관성, 한국의 사회문화적 맥락을 이해하는 것이 필수적이다. 따라서 한국인의 정서에 맞는 감정데이터가 구축되어야 하며 감정데이터를 통해 얻은 결과를 인간의 관점에서 재평가하고 응용하는 접근 방법으로서 인문 데이터 해석학을 논의했다. 이 연구는 단순한 기술적 발전에 기여하는 것뿐만 아니라 AI가 인간의 복합적인 감정과 경험을 존중하면서 반영할 수 있는 새로운 지식의 생성과 인문학적 접근 방안을 모색했다는 점에서 의의가 있다.
결론적으로 AI 시대에 인문학적 고찰은 AI와 인간의 상호작용을 더욱 풍부하고도 의미 있게 만들어 가는 데에 견인차가 된다. 인간의 감정과 이를 반영한 다양한 복잡한 맥락에 인문학적인 해석을 더함으로써 AI 기술이 인간을 이롭게 하는 방향으로 발전하는 데에 핵심적인 역할을 할 것이다.
Acknowledgments
본 연구는 2017년 대한민국 교육부와 한국연구재단의 지원으로 수행되었음(NRF-2017S1A6A3A01078538).
References
- H. Kim and C. K. Lee, “Beyond the Posthumanism -A Try to Laying a Conceptional Foundation Artificial Intelligence Humanities-,” Philosophical Investigation, Vol. 53, pp. 51-80. February 2019. [https://doi.org/10.33156/philos.2019.53..003]
- Chung-Ang University Humanities Research Institute. Artificial Intelligence Humanities [Internet]. Available: http://aihumanities.org/ko/hk/project/, .
- B.-R. Kim, “Humanities Data for Age of Artificial Intelligence,” Journal of AI Humanities, Vol. 3, pp. 77-97, April 2019. [https://doi.org/10.46397/JAIH.3.4]
- W. Kang, Y. Nam, Y. Cheong, and H. Cho, AI Data Analysis, Paju: Thaehaksa, 2024.
- H. Kim, “Digital Humanities: Cooperative Scheme between Humanities and Cultural Contents,” Humanities Contents, Vol. 29, No. 6, pp. 9-24, June 2013.
- P. Ekman, E. R. Sorenson, and W. V. Friesen, “Pan-Cultural Elements in Facial Displays of Emotion,” Science, Vol. 164, No. 3875, pp. 86-88, April 1969. [https://doi.org/10.1126/science.164.3875.86]
- Y.-M. Yi, J.-Y. Park, and B.-R. Kim, “The Construction of Digital Ontology for Korean Emotions,” Korean Semantics, Vol. 68, pp. 131-162, June 2020. [https://doi.org/10.19033/sks.2020.6.68.131]
- S. Zhang, R. Liu, X. Tao, and X. Zhao, “Deep Cross-Corpus Speech Emotion Recognition: Recent Advances and Perspectives,” Frontiers in Neurorobotics, Vol. 15, 784514, November 2021. [https://doi.org/10.3389/fnbot.2021.784514]
- Y. Nam and C. Lee, “Chung-Ang Auditory Database of Korean Emotional Speech: A Validated Set of Vocal Expressions with Different Intensities,” IEEE Access, Vol. 10, pp. 122745-122761, November 2022. [https://doi.org/10.1109/ACCESS.2022.3221453]
- S. R. Livingstone and F. A. Russo, “The Ryerson Audio-Visual Database of Emotional Speech and Song (RAVDESS): A Dynamic, Multimodal Set of Facial and Vocal Expressions in North American English,” PLoS ONE, Vol. 13, No. 5, e0196391, May 2018. [https://doi.org/10.1371/journal.pone.0196391]
- T. S. H. Wingenbach, C. Ashwin, and M. Brosnan, “Validation of the Amsterdam Dynamic Facial Expression Set – Bath Intensity Variations (ADFES-BIV): A Set of Videos Expressing Low, Intermediate, and High Intensity Emotions,” PLoS ONE, Vol. 11, No. 1, e0147112, January 2016. [https://doi.org/10.1371/journal.pone.0147112]
- Z. Xiao, Y. Chen, W. Dou, Z. Tao, and L. Chen, “MES-P: An Emotional Tonal Speech Dataset in Mandarin with Distal and Proximal Labels,” IEEE Transactions on Affective Computing, Vol. 13, No. 1, pp. 408-425, January-March 2019. [https://doi.org/10.1109/TAFFC.2019.2945322]
- C. Kim and H. Jung, “GPT-based Data Augmentation Method for Improving Emotion Analysis Model Performance,” Journal of KIIT, Vol. 22, No. 1, pp. 61-69, January 2024. [https://doi.org/10.14801/jkiit.2024.22.1.61]
- X. Zhu, Y. Liu, J. Li, T. Wan, and Z. Qin, “Emotion Classification with Data Augmentation Using Generative Adversarial Networks,” in Proceedings of the 22nd Pacific-Asia Conference on Advances in Knowledge Discovery and Data Mining (PAKDD 2018), Melbourne, Australia, pp. 349-360, June 2018. [https://doi.org/10.1007/978-3-319-93040-4_28]
- H. Q. Abonizio, E. C. Paraiso, and S. Barbon, “Toward Text Data Augmentation for Sentiment Analysis,” IEEE Transactions on Artificial Intelligence, Vol. 3, No. 5, pp. 657-668, October 2022. [https://doi.org/10.1109/TAI.2021.3114390]
- N.-H. Lee and Y. Cheong, “Constructing Emotional Data Using Generative AI,” The Journal of Language & Literature, Vol. 95, pp. 35-72, September 2023. [https://doi.org/10.15565/jll.2023.9.95.35]
저자소개
2016년:고려대학교 대학원 (문학박사 - 국어학)
2021년~2024년: 중앙대학교 인문콘텐츠연구소 연구교수
2024년~현 재: 국립순천대학교 교양교육원/자유전공학부 조교수
※관심분야:의미론(Semantics), 자연어처리(NLP), AI 리터러시 등
2015년:맥길대학교 대학원 (언어학박사-음성학/말소리 지각)
2018년~현 재: 중앙대학교 인문콘텐츠연구소 연구교수
※관심분야:음성학, 말소리 지각, 언어습득, 감정인식, 화자인식, 이중언어