
3차원 가우시안 스플래팅 정밀 지도에서의 해시맵 탐색 기반 실시간 라이다 측위
Copyright ⓒ 2025 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
초록
최근 자율주행, 디지털 트윈 등 첨단 기술의 발전은 현실 공간을 가상으로 정밀하게 복제하는 것을 요구한다. 이를 위한 차세대 기술로 주목받는 3차원 가우시안 스플래팅(3DGS)은 다수의 2차원 이미지로부터 3차원 장면을 효과적으로 재구성한다. 그러나 3DGS로 구현된 가상 공간을 자율주행 등에 활용하기 위해서는, 차량의 현재 위치와 자세를 실시간으로 추정하는 정밀 측위 기술이 반드시 선행되어야 한다. 본 논문은 3DGS 환경에서 라이다 스캔 데이터를 직접 정합하는 새로운 프레임워크를 제안한다. 이를 위해 3차원 가우시안의 기하학적 분포 특성을 반영한 복합 비용 함수로 정합 정확도를 높였으며, 해시 맵 기반 공간 인덱싱을 도입하여 실시간 탐색 성능을 확보하였다. 실험을 통해 제안하는 시스템이 측위 정확성 측면에서 NDT 방식보다 우수한 성능을 보임을 입증하였으며, 3DGS가 렌더링과 측위를 위한 통합 정밀 지도로서의 활용 가능성을 제시하였다.
Abstract
The advancement of technologies like autonomous driving necessitates high-fidelity virtual replicas of real-world spaces. For this purpose, 3D Gaussian Splatting (3DGS) has emerged as a powerful scene reconstruction technology. However, leveraging 3DGS environments for real-time applications requires a precise localization system, which is a critical prerequisite that existing methods cannot fulfill due to the unstructured nature of 3DGS. This paper proposes a novel framework for directly registering LiDAR scan data within 3DGS maps. To achieve this, we enhance registration accuracy with a composite cost function that considers the geometric properties of each Gaussian, while a hash-map-based spatial indexing technique ensures real-time search performance. Experimental results demonstrate that our system significantly outperforms conventional NDT in localization accuracy, validating the potential of 3DGS as a unified map for both rendering and localization.
Keywords:
3D Gaussian Splatting, Localization, Hash Map, Autonomous Driving, LiDAR키워드:
3차원 가우시안 스플래팅, 측위, 해시맵, 자율주행, 라이다Ⅰ. 서 론
최근 자율주행, 디지털 트윈, 공장 자동화 등 다양한 첨단 기술의 발전에 따라 현실 공간 정보를 가상 공간으로 변환하고 이를 활용하는 중요성이 크게 부각되고 있다[1]. 이러한 기술을 효과적으로 구현하기 위해서는 현실 세계와 사전에 구축된 가상 공간 간의 정합성을 확보하고, 이를 기반으로 자신의 위치를 정밀하게 인식하는 것이 필수적이다. 특히 자율주행 분야에서는 이러한 가상 공간 정보를 기반으로 한 고정밀 지도(HD map; High-Definition map)가 안전하고 신뢰성 높은 주행을 가능하게 하는 핵심 요소로 주목받고 있다.
그림 1의 (a)와 같이, 이러한 고정밀 지도의 대표적인 표현 방식인 점군 데이터 기반 지도는 방대한 데이터 용량으로 인해 저장 및 처리 비용이 크며, 점 단위로만 색상 정보를 포함하기 때문에 시각적 정보가 희소하게 표현되는 한계가 있다. 이러한 문제를 극복하기 위한 대안으로 최근 3차원 가우시안 스플래팅(3DGS; 3D Gaussian Splatting)[2] 기법이 주목받고 있다. 3DGS는 다수의 2D 이미지를 활용해 장면을 명시적으로 3차원으로 재구성하며, 점군 기반 표현보다 높은 품질의 시각적 렌더링을 제공하는 장점이 있다. 또한, 동일한 기능을 수행하는 NeRF(Neural Radiance Fields)[3] 방식에 비해 학습 및 렌더링 속도가 매우 빠르기 때문에, 실시간 상호작용이 필수적인 자율주행 시뮬레이션, 증강현실, 로보틱스 등 다양한 분야에서 핵심 기술로 각광받고 있다.
(a) Point clouds map, (b) Gaussian map based depth rendering, (c) Gaussian map based visual rendering
뛰어난 시각적 렌더링 성능을 가진 3DGS를 고정밀 지도로 활용하여 자율주행 및 증강현실과 같은 실시간 애플리케이션에 적용하기 위해서는 3DGS 환경 내에서 차량의 현재 위치와 자세를 신속하고 정확하게 추정하는 기술이 필요하다. 이를 위해 일반적으로 카메라와 라이다(LiDAR) 등 다양한 인식 센서에서 측정한 데이터를 활용하여 맵 매칭(map matching) 기반의 측위를 수행한다[4]. 그러나 카메라 기반 측위는 조명 변화, 날씨 변화, 그림자와 같은 환경적 요인에 민감하며, 동적 객체(차량, 보행자 등)가 포함된 복잡한 장면에서는 특징 추출의 신뢰도가 저하되는 문제가 있다. 또한, 고속도로, 터널, 혹은 반복적인 패턴을 가진 도로와 같이 시각적 텍스처가 부족한 환경에서는 특징 기반 매칭의 성능이 급격히 저하되는 한계가 있다. 이러한 문제를 극복하기 위해 본 논문에서는 LiDAR 기반의 매칭 기법을 활용하여 3DGS 환경에서의 정밀 측위를 수행하고자 한다. LiDAR 센서는 주변 환경의 기하학적 구조 정보를 직접적으로 제공하므로, 조명 변화나 시각적 특징 부족에 덜 민감하며, 안정적이고 신뢰성 높은 위치 추정이 가능하다.
본 논문에서는 3DGS로 표현된 환경에서 LiDAR 기반 정밀 측위(Localization)를 수행하기 위한 새로운 매칭 프레임워크를 제안한다. 본 연구의 주요 기여 사항은 다음과 같다.
- • 해시 맵 기반 공간 인덱싱을 통한 실시간성 확보: 대규모 3DGS 환경에서의 효율적인 정합을 위해 해시 맵(hash map) 기반 공간 인덱싱 기법을 도입하였다. 이를 통해 대규모 가우시안 분포에 대한 고속 공간 질의가 가능해졌으며, 전체 측위 시스템의 실시간성을 효과적으로 보장한다.
- • 가우시안의 기하학적 분포를 고려한 비용 함수 설계: 개별 3차원 가우시안의 기하학적 분포 특성을 직접 고려하는 기하학적 특성을 반영한 잔차함수(residual cost function)를 설계하였다. 이를 통해 비정형적이고 복잡한 구조를 가진 정밀 지도 환경에서도 강건하고 정확한 위치 및 자세 추정이 가능하다.
- • 3DGS 가우시안의 물리적 정합성 실험적 검증: 기존 3DGS 연구는 주로 시각적 렌더링 품질 향상에 초점을 맞추었으나, 본 논문에서는 3DGS에서 생성된 가우시안이 LiDAR 점군과 물리적으로 일관성을 유지한다는 사실을 다양한 실험을 통해 검증하였다. 이를 통해 3DGS 가우시안이 단순한 시각적 표현을 넘어 LiDAR와의 정밀 매칭에도 활용 가능한 물리적 정보임을 실증적으로 입증하였다.
본 논문의 구성은 다음과 같다. 2장에서는 고정밀 지도의 주요 종류와 특징을 살펴보고, 3차원 가우시안 스플래팅을 정밀 지도에 활용할 가능성을 분석하며, 기존 3차원 공간에서의 측위 기술을 고찰한다. 3장에서는 제안하는 방법론을 상세히 설명하며, 3DGS 기반 정밀 지도 생성부터 전처리, Point-to-Gaussian 매칭, 새로운 잔차(residual) 함수 정의, 그리고 최적화 과정까지 기술한다. 4장에서는 제안 기법의 성능을 검증하기 위한 다양한 실험을 수행하고, 정량적 평가와 렌더링 품질 비교를 통해 기존 기법 대비 우수성을 입증한다. 마지막으로, 5장에서는 본 논문의 결론과 향후 연구 방향을 제시한다.
Ⅱ. 관련 연구
강건하고 정확한 측위를 수행하기 위해서는 사전에 구축된 3차원 정밀 지도의 활용이 필수적이다. 정밀 지도는 센서 데이터만으로는 얻기 어려운 풍부한 주변 환경 정보를 제공함으로써, 자세 추정의 정확도와 안정성을 크게 향상시킨다. 3차원 공간을 표현하는 방식에 따라 정밀 지도는 크게 점군 지도, 깊이 지도, 그리고 격자 기반 지도로 분류할 수 있다.
2-1 정밀 지도의 종류 및 특징
점군 데이터는 3차원 공간상의 점들의 집합으로 환경을 표현하는 가장 직관적인 방식이다. LiDAR 센서를 통해 직접적으로 얻거나, 카메라 이미지에 SfM(structure from motion) 또는 MVS(multi-view stereo) 기법을 적용하여 생성할 수 있다[5],[6]. 이는 실제 환경의 기하학적 정보를 정밀하게 담아낼 수 있다는 장점이 있다. 하지만 점군 데이터 그 자체로 비정형 데이터라는 본질적인 특성을 가진다[7]. 즉, 데이터 배열상에서 인접한 점들이 공간적으로도 인접함을 보장하지 않으며, 점들 간의 연결성이나 위상 정보가 전혀 없다. 이로 인해 특정 영역의 점들을 검색하거나 표면의 법선 벡터를 추정하는 등의 작업을 위해서는 옥트리(Octree)[8]나 KD-트리와 같은 별도의 공간 분할 자료구조를 구축하는 과정이 선행되어야 한다. 또한, 수백만 개 이상의 점으로 구성된 데이터는 저장 및 처리에 큰 비용을 요구하며, 원본 데이터는 기하학적 위치 외에 의미 정보를 포함하지 않는 한계를 가진다.
점군 데이터가 갖는 비정형적 구조와 그로 인한 탐색의 비효율성을 극복하고자, 3차원 공간을 균일한 크기의 정육면체 격자로 나누어 표현하는 격자 기반 지도가 제안되었다. 격자 기반 지도는 3차원 공간을 균일한 크기의 정육면체 격자로 나누어 표현한다. 이러한 격자 기반 지도는 각 격자에 어떤 정보를 저장하는지에 따라 점유 격자 지도와 정규 분포 지도로 나눌 수 있다. 점유 격자 지도는 각 격자의 점유 여부와 같은 이산적인 상태 정보를 저장하며, 이는 경로 탐색이나 충돌 회피에 직관적이고 효과적이다[9]. 반면, 정규 분포 지도는 각 격자 내 점군 데이터의 분포를 하나의 가우시안으로 표현하여, 데이터의 불확실성을 포함한 연속적인 정보를 담는다[10]. 하지만 이 두 방식 모두 연속적인 공간을 강제로 이산화한다는 공통적인 한계를 가진다. 따라서 지도의 정밀도를 높이기 위해 격자의 크기를 줄이면 메모리 사용량이 기하급수적으로 증가하는 해상도와 메모리 간의 트레이드오프(trade-off) 문제가 필연적으로 발생한다.
가우시안 분포 기반 지도는 점군 데이터를 3차원 가우시안 분포의 집합으로 표현하여 환경을 모델링한다. 이 방식은 격자 기반 지도와 달리, 정해진 격자에 종속되지 않고 자유롭게 3차원 공간에 분포하는 가우시안들로 지도를 구성하는 것이 핵심 특징이다[2]. 각 가우시안은 평균 μ과 공분산 Σ을 통해 위치뿐만 아니라 국소적인 형상과 불확실성까지 표현할 수 있다. 이러한 표현 방식은 장면의 복잡도에 따라 가우시안의 밀도를 조절할 수 있어 메모리 효율성이 높고, 연속적인 공간을 정밀하게 모델링 할 수 있다는 장점이 있다.
2-2 3차원 가우시안 스플래팅의 지도 활용 가능성
최근 NVS(novel view synthesis) 분야에서 주목받는 3DGS는 비록 고품질의 실시간 렌더링을 위한 기법이지만, 그 핵심인 3차원 가우시안의 집합이라는 장면을 표현하는 방식은 정밀 지도로서의 높은 잠재력을 내포한다. 이는 3DGS 정밀 지도는 점군 지도의 데이터처럼 상세한 기하 정보를 담으면서도, 각 가우시안이 고유의 크기, 형태, 방향성을 가진 분포로 표현되어 GND 정밀 지도[10]와 같이 데이터의 불확실성을 내포하기 때문이다. 특히, 격자 기반 지도와 달리 격자에 종속되지 않고 장면의 복잡도에 따라 가우시안이 자유롭게 분포하므로, 기존 지도 방식들의 한계를 극복할 잠재력을 가진다.
2-3 3차원 공간에서의 측위 기술
측위는 주어진 지도 내에서 현재 이동체의 위치와 방향, 즉 자세를 추정하는 기술을 의미하며, 이는 자율주행 및 로보틱스 시스템의 핵심 요소이다. 측위 기술은 측정 방식에 따라 절대 측위, 추측 항법, 그리고 상대 측위로 구분할 수 있다.
절대 측위는 외부 인프라를 통해 전역 좌표계 기준의 위치를 얻는 방식으로, 실외환경에서는 GPS가 대표적이다. GPS는 위성 신호를 수신하여 각 위성까지의 신호 전파 시간을 삼변측량 방식으로 계산함으로써 3차원 위치와 시각 정보를 산출하는 전역 좌표계 기준의 절대 위치를 제공한다[11]. 실내에서 사용하는 초광대역(UWB; ultra wideband) 기술 또한 센티미터 수준의 정밀한 절대 위치를 제공할 수 있는 대표적인 기술이다[12]. 하지만 이러한 절대 측위 방식들은 명백한 한계를 공유한다. GPS는 도심 빌딩 숲, 터널, 지하 구조물 등에서 위성 신호가 차단되거나 심하게 약해져 사용할 수 없으며, UWB는 태그와 앵커 간 가시선 확보 및 인프라 구축이 필수적이므로 설치되지 않은 공간에서는 활용이 어렵다.
이와 달리, IMU나 휠 오도메트리와 같은 추측 항법은 외부 인프라 없이 독립적으로 자세를 추정할 수 있다. 이 방식은 이동체의 가속도나 바퀴 회전 수를 적분하여 이전 상태로부터 현재 자세를 연속적으로 계산해서 추정한다[13]. 이러한 원리 덕분에 외부 도움 없이 독립적인 추정이 가능하지만, 바로 그 과정에서 센서의 미세한 측정 오차 또한 계속해서 누적 적분되기 때문에 시간이 지남에 따라 실제 위치와의 오차가 발산하는 근본적인 문제점을 안고 있다.
절대 측위 및 추측 항법 기술의 한계들을 보완하기 위해, LiDAR나 카메라 같은 센서로 현재 주변 환경을 스캔하고, 이를 사전 구축된 정밀 지도와 정합하여 상대적인 자세를 찾는 스캔 매칭 기법이 널리 사용된다.
가장 기초적인 스캔 매칭 알고리즘은 ICP(Iterative Closet Point)이다[14]. ICP는 현재 스캔 데이터의 각 점군 데이터를 지도 상의 가장 가까운 점군 데이터와 쌍으로 맺는 점-점(Point-to-Point) 방식으로, 두 점군 데이터 간의 오차를 반복적으로 최소화하여 자세를 찾는다. 이를 확률적으로 개선한 기법이 NDT(Normal Distribution Transformation)[15]이다. NDT는 3차원 지도 공간을 균일한 격자로 나누고, 각 격자 내 점군 데이터들의 분포를 하나의 가우시안으로 표현한다. 측위 시, 현재 스캔의 특정 점군 데이터가 어떤 좌표에 있는지 알면, 해당 좌표가 속한 격자의 인덱스를 통해 어떤 가우시안에 매칭되어야 하는지 즉시 가정할 수 있어 매우 빠른 정합 속도를 보인다[16]. 하지만 NDT의 이러한 접근 방식은 본 연구에서 활용하고자 하는 3차원 가우시안 정밀 지도에는 직접 적용하기 어렵다. 3DGS로 생성된 정밀 지도의 가우시안들은 NDT처럼 정형화된 격자 구조에 종속되지 않고, 장면의 복잡도에 따라 자유롭게 분포하기 때문이다. 따라서 현재 점군 데이터 주변에 어떤 가우시안이 실제 매칭되어야 할 대상인지 빠르게 탐색하고 결정하는 새로운 방법론이 요구된다.
Ⅲ. 방법론
3-1 3차원 가우시안 정밀 지도 생성
본 연구에서 측위를 위해 사용하는 3차원 정밀 지도는 LiDAR 점군과 깊이 지도를 함께 활용하는 LOD-3DGS 모델을 통해 생성하였다[17]. 이 방식은 SfM[5]이 어려운 대규모 환경에서 기하학적 정확도를 확보하기 위해, 우선 LiDAR 점군으로 3차원 가우시안을 초기화한다. 구체적으로, 원본 LiDAR 데이터를 사용하여 초기 3차원 가우시안의 평균 μ로 사용한다. 이후 최적화 과정에서는 LiDAR 기반의 초기 가우시안을 렌더링 손실과 기하 정합 손실을 동시에 최소화 한다. 이때 깊이 지도는 렌더링된 깊이와 실제 측정 깊이 간의 오차를 줄이는 데 사용되어, LiDAR 데이터만으로는 표현하기 어려운 조밀한 표현 정보를 보강하고 형상의 완성도를 높이는 핵심적인 역할을 수행한다. 이러한 밀집화 과정을 거쳐 최종 정밀 지도는 평균 μ, 공분산 Σ, 색상 c, 불투명도 α를 파라미터로 갖는 3차원 가우시안들의 집합 G로 다음과 같이 정의된다[2].
| (1) |
본 연구에서는 이 3DGS 정밀 지도 G를 LiDAR 스캔 정합을 위한 기하학적 참조 모델로 사용하는 동시에, 특정 자세에서의 2차원 이미지 렌더링을 통한 정성적 성능 검증에도 활용한다.
3-2 정밀 지도 전처리
원본 3DGS 정밀 지도는 렌더링 성능 극대화를 위해 밀집화 과정을 거치므로, 다수의 가우시안이 중첩된 고밀도 상태를 보인다. 이러한 고밀도 표현은 렌더링 성능을 크게 향상시키지만 측위 관점에서는 비효율적이며, 동일한 기하학적 정보의 중복성은 후보 탐색의 연산 효율을 저하시킬 뿐만 아니라 오정합 가능성을 높여 전체적인 측위 정확도를 저하시키는 문제로 이어진다. 이러한 문제를 해결하고 측위에 최적화된 정밀 지도로 전처리 하기 위해, 본 연구에서는 국소적으로 밀집된 가우시안 군집에서 대표성을 갖는 하나의 가우시안만 남도록 부표본추출(sub sampling)을 진행한다. 이는 개념적으로 3차원 공간에서 KD-트리 기반 거리 클러스터링을 사용하여[18], 클러스터 내의 가장 가까운 가우시안 하나만 선택하고 나머지는 제거하는 것과 유사한 효과를 목표로 한다. 상세한 알고리즘은 다음과 같다.
정밀 지도를 구성하는 모든 가우시안 Gi의 평균 위치 μi를 추출하여 효율적인 근접 이웃 탐색을 위한 KD-Tree를 생성한다. 각 가우시안 Gi를 중심으로, 사전에 정의된 유클라디안 거리 임계값 dthr내에 위치하는 모든 이웃 가우시안의 인덱스 집합 Ni를 KD-트리를 통해 빠르게 탐색한다.
| (2) |
| (3) |
| (4) |
탐색된 클러스터 Ni에 대해, 먼저 클러스터의 기하학적 중심점 μc,i를 계산한 후, 클러스터 내에서 이 중심점과 가장 가까운 위치의 가우시안을 해당 클러스터의 유일한 대표로 선정하고 나머지 가우시안을 제거한다. 이 과정을 통해 렌더링 품질을 위해 과도하게 밀집된 영역의 중복된 가우시안들이 효과적으로 제거되며, 각 국소 영역의 기하학적 특징을 대표하는 가우시안 Gi*로 구성된 필터링된 정밀 지도가 생성된다. 이는 후속 측위 과정에서 탐색 후보군의 수를 줄이고 계산 효율성을 높이며, 중복 정보로 인한 오차를 방지하는 데 핵심적인 역할을 한다.
또한 본 연구에서는 실시간 측위 성능을 극대화하기 위해, 대규모 3차원 가우시안 정밀 지도에 공간 분할 기법을 적용하여 격자 기반 3차원 가우시안 공간 인덱스를 구축하는 전처리 과정을 도입하였다. 이후 설명될 전처리 및 정합 과정에서 사용되는 격자 크기, 탐색 거리 임계값 등 주요 하이퍼파라미터는 실험적 분석을 통해 최적의 성능을 보이는 값으로 사전에 설정하였다. 방대한 수의 가우시안 전체를 대상으로 한 순차 탐색은 높은 계산 비용을 유발한다. 이러한 비효율을 해결하기 위해, 각 가우시안이 공간상에서 차지하는 범위를 격자 단위로 이산화하고, 이를 해시 지도(hash map) 구조의 인덱스로 구축하여 빠른 공간 질의가 가능하도록 설계하였다[19]. 인덱스 구축 과정은 다음과 같다.
알고리즘의 입력 파라미터는 공간을 분할하는 격자의 단위 크기인 svoxel와, 각 가우시안의 유효 범위를 결정하는 표준편차 계수 nσ이다. 이 계수는 가우시안의 전체 확률 분포 중 특정 비율을 포함하는 신뢰 구간을 결정하여, 해당 가우시안이 공간적으로 영향을 미치는 경계를 설정하는 역할을 하며[20], 본 연구에서는 nσ의 값을 신뢰 구간 약 15%인 0.189로 설정하였다. 전역적으로 사용될 격자 정밀 지도를 초기화한다. 각 3차원 가우시안 Gi*에 대하여, 평균 벡터 μi와 공분산 행렬 Σi를 기반으로 해당 가우시안이 영향을 미치는 공간적 범위를 산출한다. 먼저 공분산 행렬Σi의 고유값을 통해 주축 방향의 표준편차 벡터 를 계산한다. 이를 이용해 가우시안의 중심으로부터 nσ배의 표준편차만큼 확장된 경계 상자를 정의하고, 이 상자가 포함하는 격자 인덱스의 최소, 최대 범위를 아래 식과 같이 결정한다.
| (5) |
산출된 격자 범위 내의 모든 후보 격자 (ix, iy, iz)를 순회하며 해당 격자가 실제로 가우시안의 유효 타원체 내부에 포함되는지를 판별한다. 각 격자의 중심점과 가우시안의 평균점 사이의 변위 벡터 d를 계산한 후, 1차적으로 구면 거리 필터링을 적용하여 탐색 범위를 제한한다.
| (6) |
이후, 정규화된 타원체 거리를 계산하여 그 값이 1 이하인 경우에만 해당 격자가 가우시안 Gi*를 포함한다고 판정하고 전역 지도에 격자 인덱스와 가우시안 쌍을 추가한다. 이 과정을 통해 최종적으로 각 격자 인덱스 키가 해당 격자에 점유된 모든 가우시안의 리스트를 값으로 갖는 전역 인덱스 격자 정밀 지도가 완성된다.
3-3 Point to Gaussian Matching
전처리 과정에서 구축한 공간 인덱스를 활용하여, 임의의 3차원 질의점 p에 대해 가장 가까운 N개의 가우시안을 신속하게 찾는 과정은 다음과 같다.
질의점 p = (px, py, pz)가 속하는 기본 격자의 인덱스 를 계산한다. 탐색의 정확도를 높이기 위해, 기본 격자 b와 그를 둘러싼 26개의 인접 격자(3 × 3 × 3영역)에 접근한다. 이 27개의 격자에 할당된 모든 가우시안을 격자 정밀 지도에서 조회한다. 수집된 초기 후보군에 속한 각 가우시안 Gi*에 대하여, 질의점 p와 가우시안의 평균점 간의 유클리드 거리 dj = |p-μj|를 계산한다. 이 거리가 최대 유효 거리 dmax를 초과하는 후보들은 최종 결과에서 제외한다. 유효한 후보군을 거리 dj기준으로 상위 N개의 가우시안을 선택하여 최종 결과로 반환한다.
이러한 탐색 및 매칭 기법은 전체 Ntotal개의 가우시안에 대해 거리를 계산하는 O(NtotallogN시간 복잡도의 전수조사 방식과 달리, 격자 인덱스를 통해 후보군을 K개(K<Ntotal)로 효과적으로 축소한다. 따라서 최종 탐색의 시간 복잡도는 O(KlogK)수준으로 크게 개선되어, 전체 검색 대비 월등한 속도 향상을 가능하게 한다.
앞선 격자 쿼리 인덱싱을 통해 얻은 초기 가우시안 후보군을 단순히 기하학적으로 가깝게 위치한 집합일 뿐, 통계적으로 가장 높은 연관성을 갖는다고 보장할 수 없다. 따라서, 선택된 가우시안 후보군을 대상으로 마할라노비스 거리(Mahalanobis Distance)[21]를 계산하여 최종적으로 정합에 사용할 최적의 가우시안 K개를 선별한다. 단순히 두 점 사이의 직선 거리를 측정하는 유클리드 거리와 달리, 마할라노비스 거리는 각 가우시안이 가진 고유의 확률 분포, 즉 형상과 방향성(공분산 Σ)을 함께 고려하는 통계적 거리 척도이다. 예를 들어, 도로면처럼 길고 납작한 형태의 가우시안이 있을 때, 어떤 점이 가우시안의 중심에서는 멀리 떨어져 있더라도 분포의 주축 방향에 가깝게 위치한다면 마할라노비스 거리는 작게 계산된다. 반대로, 중심과는 매우 가깝지만 분포의 단축 방향으로 벗어나 있다면, 이는 통계적으로 발생 확률이 낮은 위치이므로 마할라노비스 거리는 매우 크게 계산된다. 이처럼 마할라노비스 거리를 사용하는 것은, 단순히 기하학적으로 가장 가까운 가우시안이 아닌 현재 관측점이 속할 확률이 가장 높은 가우시안 분포를 찾는 과정이다. 이를 통해 벽이나 바닥과 같은 이방성 구조에 대해 훨씬 강건하고 정확한 대응 관계를 설정할 수 있다.
3-4 Residual Function
정확한 6-DoF(자유도) 자세(회전 R, 이동 t) 추정을 위해, 본 연구에서는 단일 오차 지표에 의존하는 대신 여러 잔차 함수를 결합하는 다중 손실 전략을 채택하였다. 3차원 가우시안으로 표현된 실제 환경은 벽, 도로, 나무 등 다양한 기하학적 특성이 혼재된 복잡한 공간이다. 이러한 환경에서 Point-to-Point 거리와 같은 단일 유형의 오차 지표만을 최소화하는 방식은 특정 상황에서는 유효할 수 있으나, 모든 유형의 변환 오차를 균형 있게 제어하기 어렵다. 예를 들어, 평평한 바닥 면에서는 수직 방향의 이동 오차는 민감하게 측정되지만, 평면상에서의 미세한 회전이나 이동 오차는 측정하기 어렵다. 이처럼 단일 함수는 특정 기하학적 형상에 과적합되어 전체적인 정합 정확도를 저하하고, 불안정한 수렴을 야기할 수 있다. 본 연구에서는 이러한 한계를 극복하고자, 관측점 p를 추정된 포즈로 변환한 점 p′ = Rp+t와, 이와 연관된 3차원 가우시안의 평균 μi및 공분산 Σi를 이용하여 세가지 유형의 잔차(residual)를 정의한다. 이들을 결합함으로써 이동과 회전 오차를 종합적이고 강건하게 제어하는 최적화 프레임워크를 구축한다.
마할라노비스 잔차는 유클리드 거리와 달리, 각 3차원 가우시안이 가진 고유의 불확실성을 측정에 반영하는 핵심적인 역할을 한다. 가우시안의 공분산 행렬 Σi는 데이터의 분포 형태, 즉 어떤 방향으로 불확실성이 크고(분산이 큼), 어떤 방향으로 불확실성이 작은지(분산이 작음)에 대한 정보를 담고 있다[21]. 마할라노비스 거리는 변환된 점 p′과 가우시안 평균 μi사이의 오차 벡터 p′ - μi를 공분산의 역수 제곱근 행렬 를 통해 정규화한다. 이러한 정규화 과정은 오차 벡터를 “불확실성이 제거된” 표준 공간으로 변환하는 것과 같다. 결과적으로, 가우시안의 분산이 큰 방향으로의 오차는 작은 가중치를 부여받아 최적화 단계에서 해당 방향으로 더 자유롭게 파라미터를 업데이트할 수 있고, 가우시안의 분산이 작은 방향의 오차는 큰 가중치를 부여받아 엄격하게 제어된다. 이는 기하학적 제약이 강한 방향으로의 변위는 억제하고 제약이 약한 방향의 변위는 허용하는 방식으로, 잘못된 회전이나 이동으로 인해 해가 불안정하게 수렴하는 것을 방지한다. 이 손실은 이동과 회전 변환 모두에 민감하게 반응하여 전반적인 정합 정확도를 높이는 기반이 된다. 공분산 행렬 Σi를 고유값 분해(Eigen- decomposition)하여 Σi = VΛVT로 표현할 때, Σi의 역수 제곱근 행렬은 로 정의된다. 이를 이용한 마할라노비스 손실의 3차원 잔차 벡터 rM은 다음과 같다.
| (7) |
3차원 가우시안 정밀 지도 내에서 벽이나 바닥과 같은 평면부는, 대부분 평면을 따라 넓게 분포하고 법선 방향으로는 얇게 압축된 형태의 이방성 가우시안으로 이루어져 있다. 이처럼 가우시안 자체가 내재적으로 국소 평면 정보를 포함하고 있다는 특성은 점-평면(Point-to-Plane) 잔차를 매우 효율적으로 적용할 수 있는 강력한 기반을 제공하며, 이는 이동 오차(translational error)를 매우 빠르고 효율적으로 보정하기 위해 설계되었다. 이 잔차의 핵심 원리는 데이터의 분포로부터 자연스럽게 정의되는 국소 평면과 변환된 점 p′사이의 수직 거리를 최소화하는 것이다. 이 평면의 법선 벡터 n은 기하학적으로 가장 안정적인 방향, 즉 가우시안의 분포가 가장 얇게 압축된 방향으로 정의하는 것이 타당하다. 잔차 값은 점 p′에서 이 평면까지의 정사영하여 얻어지는 스칼라값으로 계산된다. 이 방법은 계산 비용이 매우 저렴하면서도 이동 성분을 명확하게 분리하여 교정할 수 있어 실시간 자세 추정 시스템에서 수렴 속도를 크게 향상시킨다. 가우시안의 법선 벡터 n을 Σi의 가장 작은 고유값에 대응하는 고유벡터로 정의한다. 점-평면 잔차의 스칼라 잔차 rp는 다음과 같다.
| (8) |
법선 정합 잔차는 회전 오차(rotational error)를 직접적으로 제어하기 위한 보완적인 장치이다. 점-평면 잔차가 이동 오차에 특화되어 있다면, 이 잔차는 회전의 정밀도를 높이는 데 집중한다. 잔차는 두 벡터 간의 방향 일치도를 측정한다. 첫 번째는 관측점 p′에서 가우시안의 중심 μi를 향하는 방향 벡터 d이고, 두 번째는 점-평면 잔차에서 사용된 가우시안의 국소 법선 벡터 n이다. 두 벡터가 완벽하게 정렬될수록(평행 또는 반평행), 두 벡터의 내적 |nTd|값은 1에 가까워지고 잔차는 0이 된다. 반대로 두 벡터가 수직에 가까워질수록 내적값은 0에 가까워지고 잔차는 1이 되어 큰 페널티를 부과한다. 이처럼 회전 불일치를 직접적으로 벌점함으로써, 특히 곡면이나 복잡한 구조물에서 발생하기 쉬운 회전 오차를 정밀하게 교정할 수 있다. 이는 점-평면 잔차와 결합되었을 때 이동과 회전 추정이 상호 보완적으로 안정화되는 시너지를 창출한다. 국소 법선 추정 시 발생할 수 있는 노이즈의 영향을 줄이기 위해, 일반적으로 강건한 비용 함수와 함께 사용된다. 방향 벡터 d를 정규화하여 정의하고, 이를 이용한 법선 정합 손실의 스칼라 잔차 rN은 다음과 같다.
| (9) |
이와 같이, 본 연구에서는 세 가지 잔차 함수를 결합하여 각기 다른 기하학적 제약조건: 타원체의 확률적 분포(마할라노비스), 국소 평면과의 접촉(점-평면), 그리고 방향성의 일치(법선 정합)을 균형 있게 최적화에 반영한다.
3-5 Optimization
앞서 3-4절에서 정의한 세 가지 유형의 기하학적 잔차들을 통합하여, 3차원 가우시안 정밀 지도와 관측 데이터 간의 정합 오차를 최소화하는 최적의 자세 파라미터(회전 및 이동)를 추정한다. 이 과정은 비선형 최소제곱(Non-linear Least Squares) 문제로 정형화되며, 강건하고 효율적인 해법을 통해 최종 자세를 계산한다. 본 연구의 목표는 모든 관측점 pi(i = 1,...,N)에 대해 마할라노비스 rM, 점-평면 rP, 그리고 법선 정합 rN 잔차의 총합을 최소화하는 것이다. 최적화될 파라미터 벡터는 쿼터니언(quaternion)으로 표현된 회전 와 이동 벡터 를 결합한 7차원 벡터, 즉 로 정의된다.
전체 목적 함수(Objective Function)는 각 잔차의 제곱 오차에 강건 비용 함수를 적용한 총합으로 구성되지만, 실제 LiDAR 데이터에는 잘못된 측정값이나 오정합으로 인한 이상치(outlier)가 포함될 수 있다. 이러한 이상치가 전체 최적화에 과도한 영향을 미치는 것을 방지하기 위해, 각 잔차 항에 강건 비용 함수(robust cost function) ρ를 적용한다. 최종 목적 함수는 아래 식과 같이 정의된다.
| (10) |
여기서 ρM, ρP, ρN은 각 잔차 유형에 맞게 선택된 강건 비용 함수로, 본 연구에서는 Cauchy Loss를 채택하였다. 잔차 r과 튜닝 파라미터 c에 대해 다음과 같이 정의된다.
| (11) |
여기서 파라미터 c는 손실 함수가 L2 손실처럼 동작하는 범위, 즉 이상치로 간주하지 않을 잔차의 임계값을 결정한다. Cauchy Loss는 잔차의 크기 (r)가 c보다 작을 때는 일반적인 L2 손실과 유사하게 동작하지만, c를 초과하면 로그 함수 형태에 따라 해당 오차가 전체 비용에 미치는 영향을 점진적으로 감소시키는 특성을 가진다. 이를 통해 예상치 못한 큰 이상치의 영향은 효과적으로 무시하여 최적화 과정의 안정성과 강건성을 크게 향상시킨다. 또한, 상기 목적 함수와 같은 비선형 최소제곱 문제를 풀기 위해, 본 연구에서는 핵심 알고리즘으로 LM(Levenberg-Marquardt)를 채택한다. LM 알고리즘은 각 반복 단계에서 현재 추정치에 대한 최적의 보정량 를 계산하여 파라미터를 점진적으로 갱신한다. 이 과정은 다음과 같다. 현재 파라미터 x주위에서 전체 잔차 벡터 r(fx)를 1차 테일러 근사를 통해 선형화한다.
| (12) |
여기서 J는 잔차 벡터 r을 파라미터 벡터 f(x)에 대해 편미분한 자코비안 행렬이다. 그 다음으로 선형화된 문제를 기반으로 보정량 δ를 찾기 위한 정규 방정식을 수립한다.
| (13) |
가우스-뉴턴 방법에서 JTWJ는 헤시안 행렬의 근사치로 작용하며, 여기에 강건 비용 함수 ρ*의 도함수로부터 유도된 대각 가중치 행렬 W를 곱함으로써 잔차가 큰 이상치에 대한 가중치를 동적으로 낮춰 최적화의 강건성을 확보한다. LM 알고리즘에서는 이 JTWJ에 감쇠 계수 λ를 더해 시스템을 풀게 되는데, λ의 크기에 따라 경사 하강법과 가우스-뉴턴 방법 사이를 절충하여 수렴의 안정성과 속도를 조절한다. 이때 감쇠의 스케일을 조정하는 양의 정부호 대각 행렬 D는 보통 단위 행렬이나 JTWJ의 대각 성분으로 설정되어, 전체 시스템의 스케일을 적절히 맞추는 역할을 수행한다. 파라미터 갱신 단계에서는 계산된 보정량 δ를 이용해 상태 파라미터 xf(x)를 다음과 같이 갱신한다.
| (14) |
여기서 ⊕연산은 회전의 기하학적 특성을 보존하는 리트랙션(retraction)을 의미하며, 이동 성분은 벡터 덧셈으로, 회전 성분은 지수 사상과 재정규화를 통해 갱신된다. 이 과정은 보정량 δ가 수렴하거나 최대 반복 횟수에 도달할 때까지 반복 수행되어 강건성을 확보하고, 동적 감쇠 계수로 수렴 안정성을 높인다.
Ⅳ. 실험 및 결과
4-1 실험 환경 및 구성
제안하는 3차원 가우시안 정밀 지도 기반 측위 시스템의 성능을 검증하기 위해, 대규모 도심 환경을 다루는 KITTI-360 데이터셋[22]을 사용하여 실험을 진행하였다. KITTI-360은 복잡한 실제 도로 환경과 함께 고정밀 GNSS/INS 장비로 측정된 정확한 정답 자세를 제공하므로, 제안하는 시스템의 우수성을 객관적으로 입증하기 위해, 전통적인 정밀 측위 기법인 NDT를 베이스라인으로 설정하여 성능을 비교하였다. 공정한 비교를 위해 베이스라인의 NDT 정밀 지도 또한 동일한 KITTI-360 점군 데이터를 사용하여 표준 방식에 따라 구축하였다. 본 실험은 단순히 개별 알고리즘을 비교하는 것을 넘어, ‘3DGS 정밀 지도와 제안하는 알고리즘’으로 구성된 격자-독립적 측위 솔루션과 ‘NDT 정밀 지도와 표준 NDT 알고리즘’으로 구성된 격자기반 측위 솔루션 간의 전체 시스템 성능을 비교하는 것을 목표로 한다. 두 시스템의 성능을 평가하기 위해, 본 연구에서는 측위 정확도와 연산 시간이라는 두 가지 핵심 지표를 사용하였다. 측위 정확도는 KITTI-360 데이터셋에서 제공하는 정답 자세를 기준으로, 추정된 자세와의 좌표 오차, 종/횡방향 오차, 헤딩 오차를 계산하여 정밀도를 정량적으로 분석하였다[23]. 이와 함께, 단일 LiDAR 스캔 당 자세를 추정하는 데 소요되는 연산 시간을 측정하여 제안하는 시스템의 실시간성을 평가하였다. 또한 격자 쿼리 인덱싱의 성능을 평가하기 위해 기존의 검색 알고리즘인 KD-트리와 비교하여 측위 정확도 및 실시간성을 평가하였다. 나아가, 제안하는 시스템의 측위 정확도를 시각적으로 검증하기 위해 렌더링 이미지 비교를 추가로 진행하였다. 이는 추정된 최종 자세를 이용해 3차원 가우시안 정밀 지도에서 해당 시점의 2차원 이미지를 렌더링하고, 데이터셋의 실제 RGB 카메라 이미지와 비교하는 방식이다. 이 과정을 통해 수치적인 오차뿐만 아니라, 실제 시각적 결과물에서도 두 이미지가 얼마나 일치하는지를 직관적으로 평가할 수 있다.
4-2 정량적 평가
실험 결과는 제안하는 격자-독립적 측위 시스템이 3DGS 정밀 지도라는 비정형적 환경에서 성공적으로 동작할 뿐만 아니라, 전통적인 격자-기반 NDT 방식과 비교하여 전반적으로 더 우수한 정확도를 달성했음을 보여준다. 표 1은 각 시스템의 성능을 요약하여 MAE(Mean Absolute Error)로 표현한 결과이다. 측위 정확도 측면에서, 제안하는 시스템은 Translation Error가 0.1165m로, NDT의 0.1792m 대비 약 35.0% 감소하여 위치 추정의 정밀도가 크게 향상되었음을 입증하였다. 특히 차량의 차선 유지와 직결되는 Lateral Error는 0.0821m로 안정적인 수준의 결과를 보였다. Heading Error의 경우 0.1181˚로 NDT의 0.1565˚보다 더 나은 성능을 보였다. 그림3은 시간에 따른 오차 변화를 보여주며, 제안 시스템의 안정성을 더욱 명확히 입증한다. NDT(녹색 선)는 종방향(Longitudinal) 및 헤딩(Heading) 오차에서 순간적으로 오차가 크게 튀는 구간이 빈번하게 관찰된다. 예를 들어, 40초 부근에서 NDT의 종방향 오차는 –0.5 m를 초과하며 급격히 불안정해진다. 반면, 제안 시스템(적색 선)은 이러한 최대 오차(Max Error)를 효과적으로 억제하며, 전 구간에 걸쳐 오차의 변동 폭이 훨씬 작고 안정적인 성능을 유지한다. 이는 제안 시스템이 평균적인 정확도뿐만 아니라, 예측 불가능한 상황에 대한 강건성 측면에서도 NDT보다 뛰어나다는 것을 의미한다. 연산 시간의 경우, 제안 시스템은 평균 53.10ms가 소요되었다. 이는 NDT의 20.29ms대비 정확도와 속도 간의 trade-off가 존재하지만, 일반적인 라이다 센서의 동작 주기(10Hz 기준 100ms)를 충분히 만족시키는 실시간 성능이다. 확보된 여유 연산 시간은 향후 정확도를 더욱 개선하기 위한 알고리즘을 추가할 수 있는 공간을 제공한다.
Time-series localization performance of the proposed system: This figure presents a comparative analysis of localization error and computation time on a specific sequence from the KITTI-360 dataset. The performance of our proposed method (ours) is shown in red, while the NDT baseline is shown in green. The dashed line for each color indicates the mean value for that metric. From top to bottom, the plots respectively depict: (a) overall position error, (b) lateral error, (c) longitudinal error, (d) heading angle error, and (e) the processing time per scan.
본 연구에서 제안하는 공간 인덱싱 기법이 실시간 측위 성능에 미치는 영향을 정량적으로 분석하기 위해 측위 시간 비교 연구를 수행하였다. 제안하는 시스템에서 ‘격자 쿼리 인덱싱’을 사용했을 때와 이를 제거하고 전체 가우시안 정밀 지도를 대상으로 KD-트리 기반의 탐색을 수행했을 때의 성능을 비교하였다. 표 2는 구성 요소 분석 연구의 결과를 보여준다. KD-트리 탐색 방식은 단일 스캔 당 평균 122.96ms의 연산 시간이 소요되어 LiDAR 센서의 일반적인 동작 주기(100 ms)를 초과하므로 실시간성을 보장하기 어렵다. 반면, 제안하는 복셀 쿼리 인덱싱을 적용했을 때 연산 시간은 53.10ms로 약 56.8% 감소하여 실시간성을 안정적으로 확보하였다. 또한, 이러한 연산 속도 향상과 더불어 측위 정확도 또한 크게 개선되었다. 표 2에서 볼 수 있듯이, 제안하는 인덱싱 방식은 Translation Error와 Heading Error를 각각 0.1928m에서 0.1165m로, 0.1517˚에서 0.1181˚로 향상시켰다. 이러한 정확도 개선은 두 탐색 방식의 근본적인 차이점에서 비롯된다. KD-트리 탐색은 3차원 가우시안의 평균 위치만을 점으로 간주하여 기하학적으로 가장 가까운 후보를 찾는다. 반면, 제안하는 복셀 쿼리 인덱싱은 각 가우시안의 평균과 공분산을 모두 고려하여 확률적 분포 특성을 기준으로 후보를 선별한다. 이처럼 탐색 단계에서부터 가우시안의 분포를 고려하는 것이 더 적합한 후보군을 제공하여, 최종적인 측위 정확도 향상으로 이어진 것으로 분석된다.
4-3 렌더링 평가
본 연구에서 제안하는 측위 시스템의 정확도를 시각적으로 검증하기 위해, 추정된 자세를 사용하여 렌더링한 이미지의 품질을 정성적 및 정량적으로 평가하였다. 평가 기준이 되는 이미지는 KITTI-360 데이터셋에서 제공하는 정답 자세를 이용해 렌더링 하였으며, 본 시스템이 추정한 자세와 NDT가 추정한 자세로 각각 렌더링한 이미지의 품질을 PSNR, SSIM, LPIPS 지표를 통해 비교 분석하였다. 아래 그림 4는 실제 주행 이미지와 각기 다른 자세로 렌더링한 결과물을 시각적으로 비교하여 보여준다. 각 행은 동일한 시간대의 이미지를 나타내며, 위쪽부터 순서대로 (A) 실제 카메라 이미지, (B) NDT 추정 자세 렌더링 이미지, (C) 본 시스템 추정 자세 렌더링 이미지 결과이다. NDT로 추정한 자세의 렌더링(B)을 보면, 미세한 자세 오차로 인해 건물의 가장자리나 도로 경계선이 원본 이미지에 비해 다소 흐릿하거나 어긋나 보이는 것을 확인할 수 있다. 반면, 본 시스템으로 렌더링한 결과(C)는 이러한 왜곡이 현저히 적으며, 정답 자세 렌더링(B)과 매우 유사한 시각적 품질을 보여준다. 이는 제안하는 시스템이 NDT보다 더 정확한 자세를 추정했음을 정성적으로 입증한다. 위 표 3은 NDT로 추정된 자세와 본 연구에서 제시한 측위 시스템에서 추정된 자세로 렌더링한 이미지의 정량적 성능 비교를 보여준다. 본 연구에서 제안하는 시스템으로 렌더링한 이미지는 PSNR 16.170, SSIM 0.565로, NDT로 추정된 자세에서의 렌더링 성능보다 PSNR 10.6%, SSIM 17.2%, LPIPS 12.4% 높은 성능을 보이며, 이는 NDT의 측위 정확도보다 본 연구에서 제안하는 측위 시스템의 측위 정확도가 우수하다는 것을 명시적으로 나타낸다.
4-4 정밀 지도 노이즈에 따른 측위 정확도 분석
본 논문에서 제안하는 측위 시스템은 사전에 구축된 고품질의 3DGS 정밀 지도를 기반으로 동작한다. 그러나 실제 환경에서는 데이터 취득 과정에서의 센서 노이즈, SfM의 부정확성, 라이다 데이터의 밀도 부족 등 다양한 요인으로 인해 지도의 품질이 저하될 수 있다. 따라서, 이러한 비이상적인 지도 환경에서의 측위 강건성을 검증하기 위해, 지도에 인위적인 노이즈를 추가하여 성능을 분석하는 시뮬레이션을 수행하였다. 본 실험에서는 가우시안의 기하학적 위치를 변형시키는 노이즈와 데이터의 일부가 소실되는 노이즈 두 가지 시나리오를 가정하여 진행하였다.
첫 번째 실험에서는 3DGS 정밀 지도를 구성하는 각 가우시안의 기하학적 위치 정보가 불확실한 상황을 모사하였다. 이를 위해, 지도 내 모든 가우시안의 평균점 μ 위치에 평균이 0이고 표준편차가 σ인 정규 분포 노이즈를 추가하여 정밀 지도를 의도적으로 왜곡시켰다. 그림 5는 노이즈의 표준편차 σ(x축)를 점진적으로 증가시켰을 때, 측위 정확도(y축)가 어떻게 변화하는지를 보여준다. 실험 결과, 노이즈의 표준편차가 0.3m이하인 구간에서는 측위 오차가 0.2m 수준으로 소폭 증가하여, 제안하는 시스템이 일정 수준의 지도 위치 오차에 대해 강건하게 동작함을 확인하였다. 그러나 표준편차가 0.3m를 초과하는 지점부터는 오차가 급격히 증가하였으며, 이는 과도한 정밀 지도의 기하학적 변형이 정합 성능을 저하시키는 주요 원인이 됨을 의미한다.
두 번째 실험에서는 정밀 지도 데이터의 밀도가 낮거나 일부 영역의 데이터가 누락되어 정밀 지도의 완성도가 떨어지는 상황을 가정하였다. 원본 정밀 지도에서 특정 비율의 가우시안을 무작위로 선택하여 제거하는 방식으로 노이즈를 구현하였다. 그림 6은 원본 지도에서 삭제된 가우시안의 비율(x축)에 따른 측위 오차(y축)의 변화를 보여준다. 분석 결과, 전체 가우시안의 15%가 소실될 때까지는 측위 정확도가 비교적 안정적으로 유지되었다. 이는 제안하는 복합 비용 함수가 정밀 지도의 일부 정보가 누락된 환경에서도 주변의 유효한 가우시안 분포를 통해 안정적으로 자세를 추정할 수 있음을 보여준다. 하지만 삭제 비율이 15%를 넘어서면서부터는 정합에 필요한 기하학적 특징 정보가 절대적으로 부족해져 오차가 크게 증가하는 경향을 나타냈다.
종합적으로, 위 두 실험은 제안하는 측위 프레임워크가 일정 수준의 지도 품질 저하에 대해서는 높은 강건성을 유지함을 입증한다. 하지만 동시에, 신뢰성 높은 측위 성능을 보장하기 위해서는 고품질의 센서 장비를 통해 정확하고 밀도 높은 데이터를 확보하고, 이를 기반으로 정밀한 지도를 구축하는 과정이 여전히 중요함을 시사한다.
Ⅴ. 결 론
본 논문은 실시간 고품질 렌더링으로 주목받는 3차원 가우시안 스플래팅(3DGS)을 차세대 고정밀 지도로 활용하고자 할 때 발생하는 근본적인 문제, 즉 기존 격자-기반 측위 알고리즘과의 비호환성을 해결하고자 하였다. 이를 위해 3DGS 지도의 고유한 비정형적, 확률적 특성을 직접 활용하는 새로운 실시간 측위 프레임워크를 제안하였다.
연구의 핵심 기여 사항은 다음과 같이 요약된다. 첫째, 해시 맵 기반 공간 인덱싱을 통해 대규모 3DGS 환경에서도 빠른 공간 질의를 가능하게 하여 시스템의 실시간성을 확보하였다. 둘째, 가우시안의 기하학적 분포 특성을 직접 반영하는 복합 잔차 함수를 설계하여, 비정형적인 지도에서도 강건하고 정확한 정합을 구현하였다. 마지막으로, 실험을 통해 3DGS의 가우시안이 단순한 시각적 표현을 넘어 LiDAR 점군과 물리적으로 일관성을 갖춘 모델임을 실증적으로 검증하였다.
KITTI-360 데이터셋 기반의 정량적 및 정성적 평가에서, 제안하는 시스템은 전통적인 NDT 방식보다 뛰어난 측위 정확도를 보였다. 그럼에도 불구하고 본 연구는 몇 가지 한계점을 가지며, 이를 극복하기 위한 향후 연구 방향은 다음과 같다. 정적 환경이라는 현재의 가정을 넘어 동적 환경에서의 강건성을 확보하는 것이다. 이를 위해, 동적 객체까지 렌더링하는 4DGS 정밀 지도 환경에서 직접 측위를 수행하는 기술을 개발하고자 한다. 4DGS 환경에서는 움직이는 차량이나 보행자 또한 가우시안으로 표현되는데, 여기에 착안하여 AWV-MOS-LIO[24]와 같은 기법을 응용하여 동적 환경 대응 능력을 확보할 계획이다. 또한, NDT 대비 느린 연산 속도를 개선하기 위한 GPU 기반 병렬 처리 최적화와, 악천후 상황에서 LiDAR의 한계를 극복하기 위한 카메라, 레이더 등 이종 센서와의 융합 연구도 병행할 것이다. 이처럼 동적 환경 대응 및 타 센서와의 융합 연구를 통해 시스템의 전반적인 안정성과 신뢰성을 높여, 궁극적으로 본 기술은 자율주행, 디지털 트윈 등 다양한 미래 산업의 핵심 기술로 발전할 수 있을 것으로 기대된다.
Acknowledgments
이 논문은 2025년도 정부(산업통상자원부)의 재원으로 한국산업기술진흥원의 지원을 받아 수행된 연구임(P0020536, 2025년 산업혁신인재성장지원사업). 본 연구는 과학기술정보통신부 및 정보통신기획평가원의 인공지능융합혁신인재양성사업 연구 결과로 수행되었음(IITP-2023-RS-2023-00256629). 이 논문은 전남대학교 학술연구비(과제번호: 2023-0487) 지원에 의하여 연구되었음.
References
-
F. Tao, H. Zhang, A. Liu, and A. Y. C. Nee, “Digital Twin in Industry: State-of-the-Art,” IEEE Transactions on Industrial Informatics, Vol. 15, No. 4, pp. 2405-2415, April 2019.
[https://doi.org/10.1109/TII.2018.2873186]
-
B. Kerbl, G. Kopanas, T. Leimkühler, and G. Drettakis, “3D Gaussian Splatting for Real-Time Radiance Field Rendering,” ACM Transactions on Graphics, Vol. 42, No. 4, pp. 1-14, July 2023.
[https://doi.org/10.1145/3592433]
-
B. Mildenhall, P. P. Srinivasan, M. Tancik, J. T. Barron, R. Ramamoorth, and R. Ng, “NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis,” in Proceedings of the 16th European Conference on Computer Vision (ECCV), Glasgow: UK, pp. 405-421, August 2020.
[https://doi.org/10.1007/978-3-030-58452-8_24]
-
T. Shan, B. Englot, D. Meyers, W. Wang, C. Ratti, and D. Rus, “LIO-SAM: Tightly-coupled Lidar-Inertial Odometry via Smoothing and Mapping,” in Proceedings of the IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS), Las Vegas: NV, pp. 5135-5142, October 2020.
[https://doi.org/10.1109/IROS45743.2020.9341176]
-
J. L. Schönberger and J.-M. Frahm, “Structure-from-Motion Revisited,” in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Las Vegas: NV, pp. 4104-4113, June 2016.
[https://doi.org/10.1109/CVPR.2016.445]
-
Y. Furukawa and J. Ponce, “Accurate, Dense, and Robust Multiview Stereopsis,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 32, No. 8, pp. 1362-1376, August 2010.
[https://doi.org/10.1109/TPAMI.2009.161]
-
X. Huang, G. Mei, J. Zhang, R. K. S. Ho, S. H. Poon, T. H. Tsang, and Y. H. Wong, “A Comprehensive Survey on Point Cloud Registration,” arXiv Preprint arXiv:2103.02690, , March 2021.
[https://doi.org/10.48550/arXiv.2103.02690]
-
A. Hornung, K. M. Wurm, M. Bennewitz, C. Stachniss, and W. Burgard, “OctoMap: An Efficient Probabilistic 3D Mapping Framework Based on Octrees,” Autonomous Robots, Vol. 34, No. 3, pp. 189-206, April 2013.
[https://doi.org/10.1007/s10514-012-9321-0]
-
J. McCormac, A. Handa, A. Davison and S. Leutenegger, “SemanticFusion: Dense 3D Semantic Mapping with Convolutional Neural Networks,” in Proceedings of the IEEE International Conference on Robotics and Automation (ICRA), Singapore, pp. 4628-4635, May 2017.
[https://doi.org/10.1109/ICRA.2017.7989538]
-
C. Kim, S. Cho, M. Sunwoo, P. Resende, B. Bradaï, and K. Jo, “Cloud Update of Geodetic Normal Distribution Map Based on Crowd-Sourcing Detection against Road Environment Changes,” Journal of Advanced Transportation, Vol. 2022, 4486177, April 2022.
[https://doi.org/10.1155/2022/4486177]
- P. Misra and P. Enge, Global Positioning System: Signals, Measurements, and Performance, 2nd ed. Lincoln, MA: Ganga-Jamuna Press, 2006.
-
S. Maranò, W. M. Gifford, H. Wymeersch, and M. Z. Win, “NLOS Identification and Mitigation for Localization Based on UWB Experimental Data,” IEEE Journal on Selected Areas in Communications, Vol. 28, No. 7, pp. 1026-1035, September 2010.
[https://doi.org/10.1109/JSAC.2010.100907]
-
J. Borenstein and L. Feng, “Measurement and Correction of Systematic Odometry Errors in Mobile Robots,” IEEE Transactions on Robotics and Automation, Vol. 12, No. 6, pp. 869-880, December 1996.
[https://doi.org/10.1109/70.544770]
-
P. J. Besl and N. D. McKay, “A Method for Registration of 3-D Shapes,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 14, No. 2, pp. 239-256, February 1992.
[https://doi.org/10.1109/34.121791]
-
T. Stoyanov, M. Magnusson, H. Andreasson, and A. J. Lilienthal, “Fast and Accurate Scan Registration Through Minimization of the Distance Between Compact 3D NDT Representations,” The International Journal of Robotics Research, Vol. 31, No. 12, pp. 1377-1393, 2012.
[https://doi.org/10.1177/0278364912459934]
-
T. Stoyanov, M. Magnusson, H. Andreasson, and A. J. Lilienthal, “Fast and Accurate Scan Registration Through Minimization of the Distance Between Compact 3D NDT Representations,” The International Journal of Robotics Research, Vol. 31, No. 12, pp. 1377-1393, October 2012.
[https://doi.org/10.1177/0278364912460895]
-
J. Cui, J. Cao, F. Zhao, Z. He, Y. Chen, Y. Zhong, ... and J. Yu, “LetsGo: Large-Scale Garage Modeling and Rendering via LiDAR-Assisted Gaussian Primitives,” ACM Transactions on Graphics (TOG), Vol. 43, No. 6, pp. 1-18, December 2024.
[https://doi.org/10.1145/3687762]
-
J. L. Bentley, “Multidimensional binary search trees used for associative searching,” Communications of the ACM, Vol. 18, No. 9, pp. 509-517, September 1975.
[https://doi.org/10.1145/361002.361007]
- M. Teschner, B. Heidelberger, M. Müller, D. Pomeranets, and M. Gross, “Optimized Spatial Hashing for Collision Detection of Deformable Objects,” in Proceedings of the 8th International Conference on Virtual Reality and Graphical Simulation (VMV), Munich, Germany, pp. 47-54, November 2003.
- C. M. Bishop, Pattern Recognition and Machine Learning, New York, NY: Springer, 2006.
- P. C. Mahalanobis, “On the Generalised Distance in Statistics,” Proceedings of the National Institute of Sciences of India, Vol. 2, No. 1, pp. 49-55, 1936.
-
Y. Liao, J. Xie, and A. Geiger, “KITTI-360: A Novel Dataset and Benchmarks for Urban Scene Understanding in 2D and 3D,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 45, No. 3, pp. 3292-3310, March 2023.
[https://doi.org/10.1109/TPAMI.2022.3179507]
-
A. Geiger, P. Lenz, and R. Urtasun, “Are We Ready for Autonomous Driving? The KITTI Vision Benchmark Suite,” in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Providence: RI, pp. 3354-3361, June 2012.
[https://doi.org/10.1109/CVPR.2012.6248074]
-
S. Kim, C. Kim, and K. Jo, “AWV-MOS-LIO: Adaptive Window Visibility-Based Moving Object Segmentation with LiDAR-Inertial Odometry,” IEEE Transactions on Intelligent Vehicles, Vol. 10, No. 5, pp. 3027-3042, 2024.
[https://doi.org/10.1109/TIV.2024.3446038]
저자소개
2016년 3월~2022년 2월: 조선대학교 기계시스템 미래자동차공학부 (공학사)
2023년 9월~현 재: 전남대학교 인공지능융합학과 석사과정
※관심분야:자율주행(Autonomous Driving), 3D 컴퓨터 비전(3D Computer Vision)
2016년 3월~2022년 2월: 동국대학교 기계로봇에너지공학과 (공학사)
2022년 3월~2024년 2월: 건국대학교 스마트운행체공학과 (공학석사)
2024년 3월~현 재: 전남대학교 인공지능융합학과 박사과정
※관심분야:자율주행(Autonomous Driving), 3D 컴퓨터 비전(3D Computer Vision)
2013년:한양대학교 기계공학부 (공학사)
2020년:한양대학교 대학원 (공학박사-미래자동차공학과)
2020년 3월~2021년 2월: 한양대학교 미래자동차연구소 박사후연구원
2021년 3월~2021년 8월: 현대자동차 로보틱스랩 로봇지능팀 책임연구원
2021년 9월~현 재: 전남대학교 AI융합대학 지능형모빌리티융합학과 조교수
※관심분야:자율주행, SLAM, 센서 퓨전, 3차원 렌더링 등




