| Browse Archives | About | For Contributors |
Sorry.
You are not permitted to access the full text of articles.
If you have any questions about permissions,
please contact the Society.
죄송합니다.
회원님은 논문 이용 권한이 없습니다.
권한 관련 문의는 학회로 부탁 드립니다.
| [ Article ] | |
| Journal of Digital Contents Society - Vol. 26, No. 6, pp. 1495-1506 | |
| Abbreviation: J. DCS | |
| ISSN: 1598-2009 (Print) 2287-738X (Online) | |
| Print publication date 30 Jun 2025 | |
| Received 15 May 2025 Revised 12 Jun 2025 Accepted 23 Jun 2025 | |
| DOI: https://doi.org/10.9728/dcs.2025.26.6.1495 | |
| 디지털 트윈을 위한 머신러닝 기반 3D 객체 메쉬 재구성 기법: 입력 데이터 형식에 따른 접근 방식 비교 분석 | |
신해인1 ; 김명진2, *
| |
| 1전남대학교 컴퓨터정보통신공학과 학사과정 | |
| 2전남대학교 지능전자컴퓨터공학과 교수 | |
Machine Learning-Based 3D Mesh Reconstruction for Digital Twin: A Comparative Analysis by Input Data Type | |
Haein Shin1 ; Myeongjin Kim2, *
| |
| 1Bachelor’s Course, Department of Computer Engineering, Chonnam University, Gwangju 61186, Korea | |
| 2Professor, Department of Intelligent Electronics and Computer Engineering, Chonnam University, Gwangju 61186, Korea | |
| Correspondence to : *Myeongjin Kim Tel: +82-62-530-1814 E-mail: myeongjin@chonnam.ac.kr | |
Copyright ⓒ 2025 The Digital Contents Society
| |
Funding Information ▼ | |
디지털 트윈(Digital Twin)은 현실 세계의 객체를 가상 환경에서 정밀하게 재현하고 시뮬레이션하기 위한 핵심 기술로 주목받고 있다. 디지털 트윈의 구현을 위해서는 실제 객체의 형상과 구조를 효과적으로 디지털화하는 3D 메쉬 재구성 기술이 필수적이다. 최근에는 머신러닝을 활용한 고정밀 메쉬 재구성 기법이 활발히 연구되고 있다. 본 논문에서는 최근 5년간 발표된 머신러닝 기반 메쉬 재구성 기법을 입력 데이터 형식에 따라 단일 뷰 이미지, 다중 뷰 이미지, 점군, 복셀, 복합 입력 기반으로 분류하여 분석하였다. 각 접근 방식의 장단점과 구조적 특징과 한계를 비교하고, 디지털 트윈 응용에 적합한 방향을 도출하였다. 분석 결과, 머신러닝 기반 기법은 전통적인 알고리즘에 비해 더 정밀한 3D 복원이 가능하며 DT의 현실감을 향상할 수 있는 잠재력을 지니고 있다. 다만, 높은 연산 비용과 일반화 성능 등의 과제가 여전히 존재하며, 이에 대한 후속 연구가 필요하다.
Digital twin (DT) is a key technology for accurately replicating and simulating real-world objects in a virtual environment. Three-dimensional (3D) mesh reconstruction is crucial for effective digitization of objects. However, traditional mesh reconstruction algorithms have limitations in representing complex shapes. Recently, high-precision mesh reconstruction methods utilizing machine learning (ML) have been actively researched. This paper classifies and analyzes ML-based mesh reconstruction from the past five years, based on input data types: single image, multi-view images, point clouds, voxels, and hybrid inputs. The structural characteristics and limitations of each approach are analyzed. The analysis revealed that ML-based methods offer more precise 3D reconstruction than traditional algorithms, with potential to enhance the realism of DT. However, challenges such as high computational costs and generalization remain, requiring further research.
| Keywords: Mesh, Surface Reconstruction, Digital Twin, 3D Object Reconstruction, Machine Learning 키워드: 메쉬, 표면 재구성, 디지털 트윈, 3D 객체 재구성, 머신러닝 |
|
디지털 트윈(Digital Twin; DT)은 현실의 물리적 환경을 가상 환경에 복제하고, 물리적 환경의 변화를 실시간으로 동기화하는 기술이다. 이를 통해 현실에서 직접 실험하기 어려운 다양한 시뮬레이션을 수행할 수 있다. DT는 시스템 동작을 초기에 분석하여 가설을 검증하고, 문제 해결을 지원하며, 최적의 의사 결정을 도출하는 데 활용될 수 있다[1]. 이러한 특성 때문에 비용을 절감할 수 있고, 시뮬레이션 데이터를 활용해 효율적으로 가상 프로토타입을 설계할 수 있어 다양한 산업 분야에서 DT를 활용한 연구가 진행되고 있다[2],[3].
효율적이고 사실적인 DT를 설계하기 위해서는 실제 환경 속 물체를 가상 환경으로 가져오는 모델링 기술이 필수적이다. 모델링 기술은 물리적 환경의 객체를 디지털 환경에서 재현하는 과정으로, 3D 모델을 표현하는 방식은 메쉬이다. 기존의 메쉬 생성 기술로는 스칼라 필드에서 메쉬를 생성하는 Marching cubes (MC)[4]와 점군에서 메쉬를 생성하는 Poisson surface reconstruction (PSR)[5],[6], Ball-pivoting Algorithm (BPA)[7], Delaunay triangulation[8]이 있다. 그러나 이러한 전통적인 방법들은 매끄러운 표면과 복잡한 객체를 표현하는 데 한계가 있어 DT의 사실감을 높이는 데에는 부족하다. 최근 머신러닝 기술의 발전으로 여러 메쉬 재구성 방법들이 개발되었으며, 이 기술들을 활용하면 DT의 현실감을 향상할 수 있을 것으로 기대한다[9]-[12]. 하지만 DT가 적용되는 산업 분야에 따라 사용할 수 있는 데이터 유형이 다르므로, 입력 데이터 형식에 따른 머신러닝 기반 메쉬 재구성 기법을 체계적으로 분석할 필요가 있다. 따라서 본 논문에서는 최근 5년간 발표된 머신러닝 기반의 메쉬 재구성 기법을 조사하고, 입력 데이터의 유형에 따라 단일 뷰 이미지, 다중 뷰 이미지, 점군, 복셀(Voxel), 여러 종류의 입력을 받는 기법으로 나누어 분석한다. 각 기법의 특성과 한계를 정리하고, 향후 DT 분야에서의 활용 가능성을 논의하고자 한다.
머신러닝이 등장하기 전, 메쉬 재구성에는 전통적인 메쉬 생성 알고리즘들이 사용되었다. Marching cubes(MC)는 3D 스칼라 필드에서 등치면(isosurface)을 추출하여 메쉬를 생성하는 방법으로, 복셀 데이터를 시각화하는 데 효과적이다. Poisson Surface Reconstruction(PSR)은 점군과 법선 정보를 이용하여 연속적인 폐곡면을 생성하는 방법으로, 노이즈에 강하고 자연스러운 표면 재구성이 가능하다. Ball-Pivoting Algorithm(BPA)은 일정 반지름의 공을 점군 위에 굴리며 삼각형을 생성하는 방법으로, 간단한 구조에서는 효율적이지만 복잡한 형상 재구성에는 한계가 있다. Delaunay Triangulation은 외접원이 다른 점을 포함하지 않도록 삼각형을 생성하는 방법으로, 균형 잡힌 삼각형 표면을 생성하지만 노이즈에 민감하다는 한계가 있다. 이러한 기법들은 현재도 메쉬 재구성에 사용되지만, 최근 머신러닝 기반 기법들이 전통적인 알고리즘보다 정교한 재구성이 가능하도록 발전하고 있다.
메쉬 재구성은 사용하는 데이터 종류에 따라 크게 다중 뷰 이미지, 점군, 복셀, 단일 뷰 이미지 기반 기법으로 분류될 수 있다. 다중 뷰 이미지 기반의 메쉬 재구성 기법은 한 객체를 다양한 시점에서 촬영해 나온 2D 이미지들을 이용하여 객체를 재구성한다. 객체에 대한 많은 정보를 담고 있어 기존의 단일 뷰 이미지 기반 접근보다 더 높은 정밀도를 확보할 수 있다는 장점이 있다. 이에 반해 단일 뷰 이미지는 객체의 한 면만 보여주기 때문에, 다중 뷰 이미지에 비해 알아낼 수 있는 정보가 한정적이다. 점군은 3차원 공간에 퍼져있는 점들의 집합으로, 점을 이용해 객체를 표현한다. 복셀은 픽셀을 입체화시킨 것으로 정육면체를 이용해 객체를 표현한다. 각 데이터 형식에 따라 접근하는 방식이 다르므로 본 논문에서는 최근 제안된 메쉬 복원 기법들을 검토하고, 입력 데이터의 형식에 따라 각 기법의 핵심 아이디어와 기여점을 중심으로 그 특성과 차별점을 분석하였다.
Henderson et al.[13]은 3D ground truth 없이 2D 이미지들만으로 메쉬를 학습하는 구조를 제안하였다. 모델은 입력 이미지 속 객체의 형상, 색상, 자세 및 배경 정보를 추출하며, 이는 그림 1의 feature extractor 모듈(초록색)에서 수행된다. 추출된 특징들을 바탕으로 3D 메쉬 객체를 생성하고, 이를 가상 카메라 앞에 배치한 후 배경에 렌더링하여 가상 이미지 x를 생성한다(그림 1의 분홍색 부분). 이 가상 이미지 x와 실제 입력 이미지를 비교해 손실을 최소화하는 방식으로 학습이 진행된다. 이러한 구조는 3D 정보 없이 메쉬를 생성할 수 있는 것이 장점이지만, 3D 정보를 사용한 메쉬 재구성 기법들에 비해 정밀한 형상 복원이 어렵다는 한계가 있다. 또한 한 번에 하나의 이미지로만 학습하는 모델 특성상 단일 뷰 이미지로도 메쉬 재구성이 가능하지만, 사용할 수 있는 정보가 적은 단일 뷰 이미지 특성상 다중 뷰 이미지를 사용할 때 높은 정확도를 얻을 수 있다.
LASR[14]는 클래스 정보나 사전 메쉬 없이 단안 영상(monocular video)만을 이용하여 관절 구조를 포함한 객체의 메쉬를 재구성하는 방법을 제안한다. 이 방법은 analysis–by-synthesis 구조를 기반으로 입력 이미지와 렌더링 이미지 간의 시각적 일치를 통해 메쉬 형상, 관절 파라미터, 카메라 정보를 동시에 추정하며, 객체의 실루엣과 움직임 정보를 효과적으로 활용한다. 네트워크 구조는 그림 2에 나타나 있다. 객체의 움직임에 따라 메쉬가 관절 구조를 반영해 변형되며, 관절 움직임은 뼈대로부터 메쉬를 만드는 방법은 선형 스키닝(linear blend skinning)으로 모델링된다. LASR는 사전에 훈련된 클래스나 자세 정보 없이도 사람이나 동물처럼 동적인 객체의 형태를 재구성할 수 있다는 점에서 높은 일반화 능력과 유연성을 보여준다. 그러나 실루엣 정보에 의존하기 때문에 객체의 외곽선이 불분명할 경우 성능이 저하될 수 있다는 한계점이 있다.
투명 객체의 표면은 공기와 투명 재료 사이에서 발생하는 복잡한 굴절과 반사광을 통해 간접적으로 관찰된다. 이 때문에 표면 색상 관찰을 기반으로 이루어진 3D 모델 재구성을 투명한 물체에 적용할 수 없다. Xu et al.[15]은 이러한 문제를 해결하기 위해 메쉬와 Multi-Layer Perceptron(MLP)을 결합한 하이브리드 모델을 제안하였다. 초기 메쉬는 다중 뷰 실루엣을 통해 추정되며, 이후 그림 3에서 보이듯 각 정점 주변의 로컬 영역(클러스터)은 MLP를 통해 보완된다. 특히, 서로 다른 영역 간의 불연속 문제를 해결하기 위해 geodesic distance[16] 기반의 융합 층이 도입되었고, 전체 구조는 Vertex Displacement Field(VDF)로 정의된다. 이 모델은 투명하거나 광학적으로 복잡한 재질을 가진 객체를 안정적으로 재구성할 수 있다는 장점이 있지만, 네트워크 구조가 복잡하고 학습 시간이 길다는 단점이 존재한다.
Munkberg et al.[17]은 메쉬뿐 아니라 재질(material)과 조명 정보까지 동시에 복원하는 신경망 렌더링 구조를 제안하였다. 이 방법은 Signed Distance Field(SDF)를 활용해 메쉬를 표현하고, 이를 Deep Marching Tetrahedra[18]를 통해 표면으로 변환한다. 재질은 체적 텍스처링을 사용하여 물체 내부의 색상과 재질 정보를 3차원적으로 추정하며, 조명은 물체 표면에 도달하는 빛의 양을 근사하여 추정된다. 체적 텍스처링 기법은 일반적인 표면에 색을 입히는 것과 달리, 물체 내부의 모든 위치에 색상 정보를 기록하는 방식으로, 투명하거나 반투명한 객체의 색과 질감을 정밀하게 표현하는 데 효과적이다. 이와 같이 하나의 학습 구조 안에서 물체의 형상과 시각적 특성을 함께 복원할 수 있으며, 렌더링 환경과의 호환성이 뛰어나 다양한 후처리 작업에 용이하다. 다만 그림 4에 나와 있듯 재질과 조명 정보를 동시에 학습해 학습 과정이 복잡하고, 조명 추정의 정확도가 메쉬 품질에 큰 영향을 미치기 때문에 다양한 조명 환경에 대한 일반화 성능을 확보하는 것이 과제로 남아있다.
NDS[19]는 Neural Deferred Shading (NDS) 기법을 도입하여 기존 신경망 렌더링 기반 메쉬 재구성의 효율성을 크게 개선하였다. 이 방법의 전체적인 과정은 그림 5에서 볼 수 있다. NDS는 입력 이미지로부터 먼저 카메라 매개변수와 메쉬를 추정한 뒤, 해당 메쉬를 격자화하고 이를 바탕으로 신경망 기반의 셰이더가 최종 이미지를 생성한다. 이후 출력 이미지와 입력 이미지의 차이를 최소화하는 방식으로 학습이 진행되며, 기존 analysis-by-synthesis 구조를 실시간 렌더링에 적용할 수 있도록 구성되어 있다. 결과적으로 빠른 속도와 안정적인 품질을 동시에 달성할 수 있지만, 메쉬 복잡도가 증가할수록 셰이딩 단계에서 성능 저하가 발생할 수 있다.
점군에서 메쉬를 재구성하는 문제는 최근 10여 년간 다양한 접근법이 개발되지만[20], 대부분 prior(사전에 넣는 정보)를 수동으로 정의해야 하는 한계가 있었다. 딥러닝의 등장으로 prior를 수동으로 지정하지 않아도 재구성할 수 있게 되었다. Point2Mesh[21]는 사전 정보를 Convolutional Neural Network(CNN)에 의해 자동으로 정의하는 self-prior를 사용하여, 훈련 데이터나 사전 학습 없이 점군으로부터 메쉬를 생성하는 기법이다. 이 방법은 coarse-to-fine 방식으로 수행하며, 입력 점군 크기의 초기 메쉬를 생성하면서 시작한다. 네트워크는 메쉬 정점들을 점군을 향해 이동시켜 메쉬가 점군을 감싸도록 변형시킨다. 재구성된 메쉬는 점군으로 다시 변환되어 입력 점군과 업데이트된 메쉬의 점군 간의 거리 차를 측정하여 손실을 계산한다(그림 6). 이 손실은 역전파되어 self-prior 네트워크의 가중치를 업데이트한다. Point2Mesh는 전체 형상을 CNN의 매개변수로 인코딩하기 때문에 노이즈와 이상값을 효과적으로 제거할 수 있으며, 비정상적인 조건(정렬되지 않은 법선, 잡음 및/또는 누락된 영역 등)이 자주 존재하는 현실 세계의 스캐닝에서 강력한 성능을 발휘한다. 하지만 대부분의 최적화 기법과 마찬가지로 계산 시간과 메모리 사용 측면에서 비효율적이라는 단점이 존재한다.
앞서 언급했듯이, 딥러닝이 등장하기 전에는 수동으로 prior를 정의해야 했고, 학습 기반 방법들은 많은 데이터를 통해 prior를 직접 학습한다 [22]-[26]. 그러나 대부분의 기법은 객체 수준에서 prior를 학습하기 때문에 학습하지 않은 클래스의 객체를 재구성하는 데 한계가 있으며, 객체의 자세가 바뀌면 성능이 저하되는 문제가 있다. 이를 해결하기 위해 Badki et al.[27]은 메쉬의 작은 조각인 meshlet이라는 개념을 도입하여 국소적 특징을 학습하는 방식을 제안하였다. 이 기법은 학습 중에 보지 못한 클래스의 객체를 재구성할 수 있고, 객체의 자세와 네트워크가 학습한 매개변수를 분리하여 자세 변화에 강하다. 그러나 meshlet을 서로 독립적으로 점군에 적용하면 물 샐 틈 없는 표면을 형성하지 못한다. 이를 해결하기 위해 모든 meshlet에 전역 일관성을 적용하는 교대 최적화 반복과정을 사용하며, 그 과정은 그림 7에 나타나 있다. 그 후 ground truth 메쉬와 재구성된 메쉬 간의 차이를 계산해 메쉬를 최적화한다. 높은 일반화 성능은 큰 장점이지만, 계산량이 많고 속도에 최적화되어 있지 않아 전체 최적화 작업을 실행하는 데 수 시간에서 수십 시간까지 걸릴 수 있다.
PointTriNet[28]은 고정된 점 집합을 입력으로 받아 점들을 이은 삼각형 집합을 생성하는 점 집합 삼각분할을 통해 메쉬 표면을 생성한다. 점 집합은 정렬되어 있지 않으므로 주어진 점을 적절히 결합해서 삼각형 조합을 생성해야 한다. 이를 위해 PointTriNet은 두 가지 주요 네트워크로 구성되어 있다(그림 8). 첫 번째는 분류 네트워크로, 후보 표면 삼각형을 입력으로 받아 해당 삼각형이 삼각분할에 포함될 확률을 계산한다. 두 번째는 제안 네트워크로, 기존 삼각형의 이웃이 될 가능성이 높은 삼각형을 제안한다. 이 두 네트워크는 번갈아 가며 작동하면서 후보 삼각형을 분류하고 새로운 후보를 제안하면서 반복적으로 출력 메쉬를 생성한다. 그러나 PointTriNet이 생성한 메쉬는 상대적으로 매끄럽지 않고 구멍이 발생할 수 있어 후처리가 필요할 수도 있다.
Liu et al.[29]은 삼각형 면의 중간 표현(intermediate representation)을 활용하여 점군에서 메쉬를 재구성하는 새로운 기법을 제안한다. 그림 9에서 볼 수 있듯 3D 점군 P가 주어졌을 때 먼저 k-Nearest Neighbor(k-NN) 그래프를 구성한 다음, 재구성된 메쉬의 표면 요소가 될 수 있는 후보 삼각형 면을 제안한다. 그 후 신경망을 사용하여 잘못된 후보를 거르고, 두 정점 사이의 내부적 거리(intrinsic metric)와 외부적 거리(extrinsic metric)의 비율을 구해 나머지 후보를 정렬한다. 이 방식은 국부 연결성을 추정하여 메쉬를 재구성하므로 학습하지 않은 카테고리도 높은 성능으로 일반화할 수 있지만, 계산이 복잡하고 비율 예측의 정확도에 따라 결과가 달라질 수 있다는 한계가 있다.
Wei et al.[30]은 색상 정보가 포함된 입력 점군이 주어졌을 때 기하학적 형상과 텍스처의 세부 사항을 모두 포함하는 표면 메쉬를 재구성하는 처리 방법을 제안한다(그림 10). 이 작업은 제약 조건이 매우 약하기 때문에 prior가 매우 중요한데, 본 기법은 2D-3D 하이브리드 self-prior를 이용하여 전체 메쉬를 재구성한다. 먼저 3D prior를 활용해 3D MeshCNN[31]으로 텍스처가 없는 초기 3D 메시 모델을 생성한 뒤, 점군의 위치와 색상 정보를 텍스처 좌표계인 UV 공간으로 변환시켜 각각 희소 위치 UV 맵과 희소 색상 UV 맵을 생성한다. 그 후 두 개의 독립적인 2D self-prior 네트워크가 XYZ 좌표 정제와 RGB 색상 생성을 위해 훈련되며, 해당 희소 맵을 지도 학습에 활용한다. 마지막으로 예측된 밀집 정보 UV 맵을 사용하여 3D 메쉬의 정점 위치를 업데이트하고, 이를 3D self-prior 네트워크에 다시 입력하여 추가 정제를 수행한다. 이러한 2D-3D 하이브리드 self-prior 네트워크는 입력 점군과 재구성 메쉬의 거리 차를 줄이며 반복적으로 실행된다. 후처리 과정 없이 메쉬의 텍스처까지 재구성하는 장점이 있지만, 이에 따라 복잡해진 네트워크 구조는 많은 메모리와 연산 시간이 필요하다.
의료 영상 분야에서는 전자현미경, CT(Computed Tomography), MRI(Magnetic Resonance Imaging) 등에서 얻은 3D 영상 데이터를 기반으로 물체의 외형을 재구성하는 일이 많다. 이때의 3D 영상은 일반적으로 복셀(voxel)이라는 단위를 사용해 저장된다. 복셀은 ‘volumetric pixel’의 줄임말로, 2D 이미지의 픽셀이 평면상의 한 점을 의미한다면, 복셀은 3차원 공간의 한 단위 부피를 나타낸다. 예를 들어 CT나 MRI 스캔은 인체 내부를 수천 개의 복셀로 이루어진 큐브 형태의 데이터로 저장하며, 각 복셀은 해당 위치의 밀도나 조직 정보를 포함한다.
이러한 복셀 데이터를 시각적으로 이해하거나 후속 처리를 하기 위해선 복셀을 삼각형 메쉬로 변환해야 한다. 기존에는 Marching Cubes[4]와 같은 알고리즘을 사용해야 하고, 미분 불가능한 후처리를 해야 하므로 전과정 학습(end-to-end) 학습이 매우 어려웠다. 여기서 전과정 학습이란, 입력 데이터에서 최종 출력 결과까지 모든 과정을 하나의 신경망 모델 내에서 학습할 수 있는 방식을 의미한다. Voxel2Mesh[32]는 체적 영상에서 나온 복셀 데이터를 3D 표면 메쉬로 직접 전환할 수 있는 전과정 학습 구조를 제안한다. 그림 11에 나타나 있듯 입력 체적 영상은 먼저 인코딩 과정을 거치며 정보를 추출하고, 복셀 디코더를 거치며 복셀들의 특징 벡터를 포함한 큐브 피라미드를 생성한다. 메쉬 디코더는 삼선형 보간을 사용해서 특징 벡터를 추출하고, 특징 벡터를 사용하여 초기 구형 메쉬를 점점 정밀하게 변형시킨다. 이때 Voxel2mesh는 성능을 위해 2가지의 핵심 기능을 사용한다. 첫 번째는 Learned Neighborhood Sampling이다. 메쉬 디코더는 특정한 곳만 샘플링하는 것이 아니라 그곳 주위 영역까지 샘플링해 과적합을 방지한다. 두 번째 Adaptive Mesh Unpooling은 메쉬의 복잡도를 효율적으로 조절하는 기법으로, 곡률이 높은 영역은 세밀하게 표현하고 평탄한 부분은 단순하게 유지해 메모리 사용량을 크게 줄이면서도 고품질 메쉬 생성을 가능하게 한다. 그러나 구형 메쉬를 변형하기 때문에 복잡한 위상(topology)을 가진 데이터(구멍, 가지 구조 등)를 재구성하는 데는 한계가 있다.
사면체 메쉬는 그래픽스에서 3D 객체를 위한 주요 표현 중 하나이며[33]-[35], 물리 기반 시뮬레이션에서도 널리 사용된다[36]. DEFTET[37]은 정육면체를 사면체 메쉬로 분할하고, 그림 12에서 볼 수 있듯 3D 형태를 이 사면체 메쉬 안에 3차원적으로 표현한다. 논문에서는 이 데이터 구조를 Deformable Tetrahedral Mesh(DEFTET)로 부른다. DEFTET은 입력으로 2D 이미지와 점군을 받을 수 있고, 각 사면체의 점유 여부를 예측하는 방식으로 접근했다. 사면체의 모든 정점은 경계 공간 내에서 정의된 3D 좌표를 가진다. 그 후 사면체의 점유 여부를 평가하는데, 점유 여부는 사면체가 재구성 객체의 내부에 있는지 외부에 있는지를 식별하는 데 사용한다. 점유 라벨이 다른 두 사면체(내부 라벨과 외부 라벨)는 객체의 표면을 정의한다. 2D 이미지가 입력으로 들어왔을 때는 재구성된 객체가 렌더링 된 이미지와 입력 이미지 간의 차이를 L1 거리로 측정하고 손실 함수를 최적화한다. 점군이 입력으로 들어왔을 때는 PointVoxel CNN[38]-[39]을 사용해 점군을 복셀로 변환한 후 MLP를 이용해 점유 여부를 비교한다. 그러나 사면체 메쉬를 사용하는 DEFTET 구조상 연산량이 크고 메모리 사용이 높을 수밖에 없으며, 점유 여부로 표면을 결정하기 때문에 표면 표현의 정밀도가 떨어질 수 있다.
메쉬가 실제 객체처럼 상호작용을 하기 위해서는 매니폴드한 특성을 가져야 한다. 여기서 매니폴드란, 국소적으로는 평탄한 구조를 가지지만 전체적으로는 곡선이나 곡면 등 복잡한 구조일 수 있는 공간을 말한다. 쉽게 말해, 지구는 구형이지만 우리가 지도를 펼쳐 보면 한 부분(예: 서울 근처)은 평면처럼 보인다. 이처럼 어떤 3D 형태든, 아주 작게 잘라보면 평면처럼 보이는 성질을 매니폴드라고 한다. 3D 메쉬에서 매니폴드란, 메쉬의 각 면과 정점들이 논리적이고 연속적으로 잘 연결되어 있어, 구멍이 없고 겹치지 않으며, 어떤 부분을 확대해도 평면처럼 동작하는 구조를 의미한다. 이전 메쉬 재구성 방법들은 뛰어난 기하학적 정확성을 제공했지만, 매니폴드가 부족했다. Neural mesh flow[40]는 2-매니폴드 메쉬를 생성하기 위해 여러 Neural Ordinary Differential Equation (NODE) 블록으로 구성된 오토인코더를 제안하였다. NODE 블록은 그림 13의 노란 부분으로, 여러 개의 MLP 레이어로 구성되어 있다. 이 블록들은 초기 매니폴드 메쉬의 정점들을 목표 형태로 변형시키기 위해 가역적이고 매끄러운 변형 흐름(diffeomorphic flow)을 학습한다. 그 후 점진적으로 메쉬 품질을 개선한다. 이 모델은 훈련 데이터셋의 3D 모델을 ground truth로 놓고 학습하며, 학습이 완료되면 2D 이미지나 점군에서 메쉬를 재구성할 수 있게 된다. 다만 이 방법은 초기 메쉬가 매니폴드 구조를 가져야 하고, 여러 번 반복해서 NODE 블록을 거치기 때문에 연산량이 높고 학습 속도가 느리다.
Li et al.[41]은 ground truth 데이터 없이도 단일 이미지에서 3D 메쉬를 복원할 수 있는 자기 지도 학습 모델을 제안한다. 이 방법은 3D ground truth 객체, 2D 키포인트, 다중 뷰 이미지, 범주별 기본 메쉬 등 없이, 단지 2D 이미지와 실루엣 모음만을 활용한다. 특히, 범주별 기본 메쉬[42]나 2D 키포인트[22] 없이 단일 이미지로 3D 객체를 복원한 첫 시도라는 점에서 의의가 있다. 모델은 그림 14에 나타나 있으며, 먼저 입력 이미지를 SCOPS (Self-supervised Co-part Segmentation)[43] 기법을 이용해 구성 요소(semantic parts)로 분할한다. 이후, 메쉬 변형(mesh deformation), 텍스처 흐름(texture flow), 그리고 카메라 자세를 추정하여, 복원할 메쉬의 형상과 메쉬 위 텍스쳐를 입히기 위한 구성 요소의 UV 맵(canonical semantic UV)을 생성한다. 학습 과정에서는 2차원 이미지 속의 구성 요소와 3D에서 복원된 모델의 구성 요소 간의 유사성을 극대화하도록 자기 지도 방식으로 학습한다. 이 방법은 객체의 형상과 카메라 자세를 예측하는 과정에서 모호성을 줄일 수 있는 장점이 있다. 다만 구성 요소 분할이 정확하지 않으면 메쉬를 제대로 생성해 내지 못한다. 또한 카메라가 객체에 너무 가까울 때 학습에 어려움을 겪는다.
Pixel2Mesh[44]는 단일 뷰 이미지에서 메쉬를 추출하는 연구인 Pixel2Mesh[24]의 후속 연구이다. [24]와 비교하여 네트워크 구조를 수정하였고, 정점별 속성(예: 색상)을 예측하도록 확장되었다. Pixel2Mesh의 모델은 단일 뷰 이미지를 입력으로 받아 카메라 좌표계에서 3D 메쉬 모델을 생성하는 전과정 학습 네트워크 구조이다. 입력 이미지가 들어오면 2D CNN을 통해 입력 이미지에서 특징을 추출한다. 이후 기본 타원체 메쉬를 점진적으로 변형시키며 정점 수를 늘리고, 그림 15의 아래쪽에서 볼 수 있듯 세부 사항을 추가하는 coarse-to-fine 방식으로 학습한다. 본 모델은 여러 3D 데이터셋을 사용해 훈련하며, 훈련 데이터셋의 3D 메쉬를 ground truth로 놓고 메쉬 관련 오차 함수인 표면 법선 오차, 라플라시안 정규화 오차, 모서리 길이 오차 값을 최소화하도록 모델을 학습시킨다. 모델 학습이 완료되고 나면 ground truth 없이 단일 뷰 이미지에서 3D 메쉬를 생성할 수 있게 된다. 다만 단일 뷰 이미지만을 입력으로 넣기 때문에 입력 이미지의 품질에 예민하다는 점과 복잡한 모양은 재구성하기 힘들다는 단점이 있다.
기하학적 딥러닝은 continuous Deep Implicit Field[45]-[47]의 출현으로 많은 진전을 이뤘다. 함수 기반 공간 표현은 임의의 형태도 상세한 물 샐 틈 없는 표면 모델링을 가능하게 하며 해상도에 제한이 없다. 그러나 이러한 방식은 메쉬를 사용하지 않으므로 메쉬 기반 표현이 필요한 응용 프로그램에는 적합하지 않아 함수 기반 공간 표현을 메쉬 표현으로 변환하는 과정이 필요하다. 대부분은 Marching Cubes[4] 알고리즘을 사용하는데, 이 알고리즘은 미분 가능하지 않기 때문에 딥러닝 학습에서 사용하기 어렵다. DeepMesh[48]는 MeshSDF[25]를 확장한 연구이며, 임의의 암시적 함수(ex. occupancy fields)에 대해서 메쉬를 추출할 수 있다. 또한 MeshSDF에서는 메쉬를 생성할 때 Marching Cubes 알고리즘같이 미분 가능하지 않은 방법을 썼지만, DeepMesh에서는 메쉬 변환 과정을 미분 가능하게 만들어 딥러닝 모델이 직접 메쉬 생성 과정을 최적화할 수 있다.
본 장에서는 제2장에서 분류한 입력 데이터 형식별 메쉬 재구성 기법의 특징을 정리하고, 디지털 트윈에 어떻게 기여할 수 있는지 분석한다. 기법별 비교 분석 결과는 표 1에 정리되어 있으며, 입력 데이터 유형에 따라 고유한 특성과 강점이 나타난다.
| Input | Features | Advantage | Disadvantage |
|---|---|---|---|
| Reconstructs 3D objects with texture and color only using images[13] | No 3D data required, Easy to learn [13] | ||
| Reconstructs 3D objects using monocular video[14] | Using easily accessible data as input[14] | ||
| 3D transparent object reconstruction [15] | Transparent objects can be reconstructed with better quality and detail[15] | ||
| 3D shape, material, and lighting are learned separately[17] | Generate objects that allow relighting or scene editing [17] | ||
| Uses deferred shading, which is an analysis-by-synthesis approach[19] | Possible to reconstruct detailed meshes[19] | ||
| Voxel | The vertices of high curvature areas are increased using adaptive mesh unpooling | LN Sampling is used to prevent overfitting, Adaptive Mesh Unpooling is used to reduce memory usage | The increase in computational cost makes it challenging to handle large data |
| Generates a watertight mesh by shrinking the initial mesh, utilizing self-prior[21] | Robust against noise and outliers[21] | ||
| Reconstructs 3D objects using meshlet, a small patch of mesh[27] | Robust to pose changes and reconstruction of unlearned objects[27] | ||
| Compute surface triangles using the classification network and suggestion network alternately[28] | Possible to reconstruct objects with complex shapes[28] | ||
| Uses k-NN and the ratio of the geometric distance to the Euclidean distance between two vertices to reconstruct the surface[29] | Capable of generalizing unseen categories[29] | ||
| Location and color UV maps are used to update the reconstructed mesh vertex locations[30] | No need for ground truth, Suitable for various types of objects[30] | Expensive in terms of time and memory | |
| No need for supervision (ground truth 3D shapes, 2D semantic key points, multi-view images, or category-level templates)[41] | Uses segmentation to improve the alignment between the input and output[41] | ||
| Extract mesh from SDF, a type of Deep Implicit Field [25] | Implicit fields can be easily converted into mesh[25] | ||
| Mesh generation is possible from arbitrary implicit functions[48] | End-to-end reconstruction of arbitrary implicit functions is possible[48] | ||
| Reconstructs 3D objects by measuring the occupancy of a cube divided into tetrahedron [37] | Fast, Complex shapes can also be restored [37] | ||
| Reconstructs 3D objects while considering manifold[40] | Guarantees manifold[40] | ||
| Deforms a basic ellipsoid mesh by increasing the number of vertices[44] | Generates high-resolution mesh[44] | Difficult to handle complex shapes |
단일 뷰 이미지는 수집하기 쉽고 실시간으로 입력할 수 있어 DT에서 실시간성을 확보할 수 있다. 그러나 다른 데이터에 비해 알 수 있는 정보량이 제한적이기 때문에 재구성한 객체의 정밀도가 떨어진다는 한계가 있다. 이는 실시간으로 가상 물체와 상호작용하는 환경에서 사용자의 몰입감을 저해할 수 있다.
다중 뷰 이미지 기반 기법은 객체를 다양한 시점에서 촬영한 이미지들을 사용하기 때문에 정밀도가 높은 3D 재구성이 가능하다. 이는 고해상도 모델링이 필요한 DT에 사용하기 적합하다. 하지만 대규모 이미지 수집 및 정합 과정이 필요하고, 실시간으로 적용하기 위해선 별도의 최적화가 필수적이라는 제약이 있다.
점군은 실제 환경에서 직접 데이터를 획득하기 때문에 현실 세계와의 정합도가 높아 DT에서 사용하기 적합한 데이터 형식이다. 그러나 고차원의 비정형 데이터 구조와 노이즈 때문에 연산량이 많아 실시간으로 사용하기 어렵다는 단점이 있다.
복셀은 공간을 격자로 나누는 방식이기 때문에 컴퓨터 그래픽이나 시뮬레이션의 연산 최적화에 유리하다. 실시간 동기화 되어야 하는 DT에서 계산 효율성을 높이는 데 기여할 수 있다. 그러나 해상도가 증가할수록 연산량이 기하급수적으로 증가하고, 정육면체 구조 특성상 곡면이나 복잡한 형상 표현에 한계가 있다.
최근에는 이미지, 점군 등 여러 데이터 형식을 입력으로 받을 수 있는 기법들이 등장하고 있다. 이는 입력 데이터 형식의 제약을 줄여 다양한 환경 조건에서도 일관된 성능을 발휘할 수 있게 돼 예측 불가능한 현실 세계와의 안정적인 동기화가 필수인 DT에 유용하게 사용할 수 있다.
한편, 입력 데이터와 관계없이 메쉬 재구성 기법은 구조적인 한계가 있다. 메쉬는 수많은 정점(vertex), 선(edge), 면(face)으로 구성되어 있고, 형상의 정밀도가 높아질수록 정점 수가 기하급수적으로 증가하기 때문에 연산량과 메모리 사용량이 늘어날 수 밖에 없다. 메쉬는 단순히 형상을 표현하는 것을 넘어 정점 간 위상(topology) 정보를 유지해야 하므로 데이터 구조가 복잡하고 처리가 까다롭다. 또한 노이즈에 민감하여 데이터에 오류가 존재할 경우 비정상적인 연결이나 구멍이 생기는 등의 위상 오류가 발생할 수 있다. 이를 보정하기 위해 메쉬 스무딩(smoothing), 간소화(simplification), 재위상화(retopology) 등 후처리 과정이 필수적인데, 이는 전체 시스템의 복잡성과 연산 비용을 더욱 증가시키는 요인이 된다.
본 논문에서는 머신러닝 기반의 3D 메쉬 재구성 기법을 입력 데이터 형식에 따라 분류하고, 각 기법의 특징과 한계점을 중심으로 분석하였다. 디지털 트윈(DT)은 물리적 세계와 가상 세계 간의 정밀한 동기화를 전제로 하며, 이를 위해서는 3D 재구성 기법이 정밀도뿐 아니라 실시간성, 안정성, 범용성을 모두 충족해야 한다. 최근 딥러닝 기술의 발전으로 전통적인 알고리즘 방법의 한계를 극복할 수 있는 새로운 접근 방식들이 제안되고 있다. 특히 고정밀 재구성, 복잡한 형상 처리, 비선형 관계 학습 측면에서 뚜렷한 성과를 보인다.
그러나 본 연구의 비교 분석 결과에 따르면 현재 대부분의 기법은 특정 데이터 형식에 최적화되어 있거나 오프라인 상황에서 고정밀 재구성에 집중되어 있어 실시간 처리나 다양한 환경에서의 적용은 여전히 한계로 존재한다. 메쉬 재구성 과정에서 발생하는 높은 연산 비용, 복잡한 위상(topology) 정보 처리, 후처리 단계의 필요성은 DT 환경에서의 활용을 어렵게 하는 요인이다. 따라서 DT에 적용하기 위해서는 단순한 성능 개선뿐만 아니라 경량화된 구조 설계, 실시간 추론 가능성, 그리고 노이즈나 데이터 불완전성에 대한 강인성 확보도 중요하게 다뤄야 한다.
향후 연구에서는 기술 개발뿐만 아니라 실제 적용 가능성에 기반한 검증도 진행해야 할 것이다. 다양한 분야에서 쓰일 수 있는 DT의 특성상 다양한 환경에서 다양한 작업에 적용될 것이다. 예를 들어 스마트 팩토리 내 로봇의 실시간 연동, 의료 분야에서 환자의 해부학적 모델링 확인 등 폭넓은 응용이 가능하다. 이를 고려해 각 분야별 특성에 맞게 최적화된 재구성 기법에 대해 생각해봐야 한다. 또한 다양한 센서 및 입력 장치로부터 들어오는 데이터를 하나의 메쉬로 재구성하는 멀티모달 기법도 후속 연구 과제가 될 수 있다.
결론적으로 머신러닝 기반 3D 메쉬 재구성은 DT 구현에 활용하기 좋지만, 실질적인 DT의 시스템과 현장에 적용하기 위해선 앞서 언급한 과제 해결이 우선적으로 해결되어야 한다.
본 연구는 정부(과학기술정보통신부)의 재원으로 한국연구재단(No. 2022R1F1A1072309, 40%), 정보통신기획평가원의 지역지능화혁신인재양성사업(IITP-2024-00156287, 40%) 및 인공지능 혁신허브 연구개발(No.RS-2021-II212068, 20%) 지원을 받아 수행된 연구임.
| 1. | D. M. Botín-Sanabria, A. S. Mihaita, R. E. Peimbert-García, and M. A. Ramírez-Moreno, “Digital Twin Technology Challenges and Applications: A Comprehensive Review,” Remote Sensing, Vol. 14, No. 6, 1335, March 2022.![]() |
| 2. | Y. Liu, J. Feng, J. Lu, and S. Zhou, “A Review of Digital Twin Capabilities, Technologies, and Applications Based on the Maturity Model,” Advanced Engineering Informatics, Vol. 62, 102592, October 2024.![]() |
| 3. | M. Javaid, A. Haleem, and R. Suman, “Digital Twin Applications toward Industry 4.0: A Review,” Cognitive Robotics, Vol. 3, pp. 71-92, April 2023.![]() |
| 4. | W. E. Lorensen and H. E. Cline, “Marching Cubes: A High Resolution 3D Surface Construction Algorithm,” Seminal Graphics: Pioneering Efforts That Shaped the Field, pp. 347-353, July 1998.![]() |
| 5. | M. Kazhdan, M. Bolitho, and H. Hoppe, “Poisson Surface Reconstruction,” in Proceedings of the fourth Eurographics Symposium on Geometry Processing, Cagliari, Italy, pp. 61-70, June 2006.![]() |
| 6. | M. Kazhdan and H. Hoppe, “Screened Poisson Surface Reconstruction,” ACM Transactions on Graphics (TOG), Vol. 32, No. 3, pp. 1-13, July 2013.![]() |
| 7. | F. Bernardini, J. Mittleman, H. Rushmeier, C. Silva, and G. Taubin, “The Ball-Pivoting Algorithm for Surface Reconstruction,” IEEE Transactions on Visualization and Computer Graphics, Vol. 5, No. 4, pp. 349-359, 1999.![]() |
| 8. | S. Fortune, “Voronoi Diagrams and Delaunay Triangulations,” in Handbook of Discrete and Computational Geometry, 3rd ed. London, UK: Chapman and Hall/CRC, pp. 705-721, 2017.![]() |
| 9. | N. Lei, Z. Li, Z. Xu, Y. Li, and X. Gu, “What’s the Situation with Intelligent Mesh Generation: A Survey and Perspectives,” IEEE Transactions on Visualization and Computer Graphics, Vol. 30, No. 8, pp. 4997-5017, August 2024.![]() |
| 10. | G. Fahim, K. Amin, and S. Zarif, “Single-View 3D Reconstruction: A Survey of Deep Learning Methods,” Computers & Graphics, Vol. 93, pp. 164-190, February 2021.![]() |
| 11. | J. Wu, O. Wyman, Y. Tang, D. Pasini, and W. Wang, “Multi-View 3D Reconstruction Based on Deep Learning: A Survey and Comparison of Methods,” Neurocomputing, Vol. 582, 127553, May 2024.![]() |
| 12. | A. Farshian, M. Götz, G. Cavallaro, C. Debus, M. Nießner, J. A. Benediktsson, and A. Streit, “Deep-Learning-Based 3-D Surface Reconstruction—A Survey,” Proceedings of the IEEE, Vol. 111, No. 11, pp. 1464-1501, November 2023.![]() |
| 13. | P. Henderson, V. Tsiminaki, and C. H. Lampert, “Leveraging 2D Data to Learn Textured 3D Mesh Generation,” in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Seattle: WA, pp. 7495-7504, June 2020.![]() |
| 14. | G. Yang, D. Sun, V. Jampani, D. Vlasic, F. Cole, H. Chang, ... and C. Liu, “LASR: Learning Articulated Shape Reconstruction from a Monocular Video,” in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Nashville: TN, pp. 15975-15984, June 2021.![]() |
| 15. | J. Xu, Z. Zhu, H. Bao, and W. Xu, “Hybrid Mesh-Neural Representation for 3D Transparent Object Reconstruction,” Computational Visual Media, Vol. 11, No. 1, pp. 123-140, February 2025.![]() |
| 16. | K. Crane, C. Weischedel, and M. Wardetzky, “The Heat Method for Distance Computation,” Communications of the ACM, Vol. 60, No. 11, pp. 90-99, October. 2017.![]() |
| 17. | J. Munkberg, W. Chen, J. Hasselgren, A. Evans, T. Shen, T. Müller, ... and S. Fidler, “Extracting Triangular 3D Models, Materials, and Lighting from Images,” in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), New Orleans: LA, pp. 8270-8280, June 2022.![]() |
| 18. | T. Shen, J. Gao, K. Yin, M.-Y. Liu, and S. Fidler, “Deep Marching Tetrahedra: A Hybrid Representation for High-Resolution 3D Shape Synthesis,” in Proceedings of the 35th International Conference on Neural Information Processing System, Red Hook: NY, pp. 6087-6101, December 2021. |
| 19. | M. Worchel, R. Diaz, W. Hu, O. Schreer, I. Feldmann, and P. Eisert, “Multi-View Mesh Reconstruction with Neural Deferred Shading,” in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), New Orleans: LA, pp. 6177-6187, June 2022.![]() |
| 20. | M. Berger, A. Tagliasacchi, L. M. Seversky, P. Alliez, G. Guennebaud, J. A. Levine, ... and C. T. Silva, “A Survey of Surface Reconstruction from Point Clouds,” Computer Graphics Forum, Vol. 36, No. 1, pp. 301-329, January 2017.![]() |
| 21. | R. Hanocka, G. Metzer, R. Giryes, and D. Cohen-Or, “Point2Mesh: A Self-Prior for Deformable Meshes,” ACM Transactions on Graphics (TOG), Vol. 39, No. 4, pp. 1-12, August 2020.![]() |
| 22. | A. Kanazawa, S. Tulsiani, A. A. Efros, and J. Malik, “Learning Category-Specific Mesh Reconstruction from Image Collections,” in Proceedings of the European Conference on Computer Vision (ECCV), Munich: Germany, pp. 371-386, September. 2018.![]() |
| 23. | S. Goel, A. Kanazawa, and J. Malik, “Shape and Viewpoint without Keypoints,” in Computer Vision–ECCV 2020: 16th European Conference, Glasgow: UK, pp. 88-104, August 2020.![]() |
| 24. | N. Wang, Y. Zhang, Z. Li, Y. Fu, W. Liu, and Y. G. Jiang, “Pixel2mesh: Generating 3D Mesh Models from Single RGB Images,” in Proceedings of the European Conference on Computer Vision (ECCV), Munich: Germany, pp. 55-71, September 2018.![]() |
| 25. | E. Remelli, A. Lukoianov, S. Richter, B. Guillard, T. Bagautdinov, P. Baque, and P. Fua, “MeshSDF: Differentiable Iso-Surface Extraction,” in Proceedings of the 34th International Conference on Neural Information Processing Systems, Red Hook: NY, pp. 22468-22478, December 2020.![]() |
| 26. | H. Kato, Y. Ushiku, and T. Harada, “Neural 3D Mesh Renderer,” in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Salt Lake City: UT, pp. 3907-3916, June 2018.![]() |
| 27. | A. Badki, O. Gallo, J. Kautz, and P. Sen, “Meshlet Priors for 3D Mesh Reconstruction,” in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Seattle: WA, pp. 2846-2855, June 2020.![]() |
| 28. | N. Sharp and M. Ovsjanikov, “PointTriNet: Learned Triangulation of 3D Point Sets,” in Computer Vision–ECCV 2020: 16th European Conference, Glasgow: UK, pp. 762-778, Augist 2020.![]() |
| 29. | M. Liu, X. Zhang, and H. Su, “Meshing Point Clouds with Predicted Intrinsic-Extrinsic Ratio Guidance,” in Computer Vision–ECCV 2020: 16th European Conference, Glasgow: UK, pp. 68-84, August 2020.![]() |
| 30. | X. Wei, Z. Chen, Y. Fu, Z. Cui, and Y. Zhang, “Deep Hybrid Self-Prior for Full 3D Mesh Generation,” in Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), Montreal: Canada, pp. 5785-5794, October. 2021.![]() |
| 31. | R. Hanocka, A. Hertz, N. Fish, R. Giryes, S. Fleishman, and D. Cohen-Or, “MeshCNN: A Network with an Edge,” ACM Transactions on Graphics (TOG), Vol. 38, No. 4, pp. 1-12, July 2019.![]() |
| 32. | U. Wickramasinghe, E. Remelli, G. Knott, and P. Fua, “Voxel2Mesh: 3D Mesh Model Generation from Volumetric Data,” in Medical Image Computing and Computer Assisted Intervention–MICCAI 2020: 23rd International Conference, Lima: Peru, pp. 299-308, October 2020.![]() |
| 33. | C. Doran, A. Chang, and R. Bridson, “Isosurface Stuffing Improved: Acute Lattices and Feature Matching,” in ACM SIGGRAPH 2013 Talks, Anaheim: CA, July 2013.![]() |
| 34. | S. Hang, “TetGen, a Delaunay-Based Quality Tetrahedral Mesh Generator,” ACM Transactions on Mathematical Software (TOMS), Vol. 41, No. 2, pp. 1-36, February 2015.![]() |
| 35. | Y. Hu, Q. Zhou, X. Gao, A. Jacobson, D. Zorin, and D. Panozzo, “Tetrahedral Meshing in the Wild,” ACM Transactions on Graphics (TOG), Vol. 37, No. 4, pp. 1-14, July 2018.![]() |
| 36. | E. Sifakis and J. Barbic, “FEM Simulation of 3D Deformable Solids: A Practitioner's Guide to Theory, Discretization and Model Reduction,” in ACM Siggraph 2012 Sourses, Los Angeles: CA, pp. 1-50, August 2012.![]() |
| 37. | J. Gao, W. Chen, T. Xiang, A. Jacobson, M. McGuire, and S. Fidler, “Learning Deformable Tetrahedral Meshes for 3D Reconstruction,” in Proceedings of the 34th International Conference on Neural Information Processing Systems, pp. 9936-9947, December 2020 |
| 38. | S. Peng, M. Niemeyer, L. Mescheder, M. Pollefeys, and A. Geiger, “Convolutional Occupancy Networks,” in Computer Vision–ECCV 2020: 16th European Conference, Glasgow: UK, pp. 523-540, August 2020.![]() |
| 39. | Z. Liu, H. Tang, Y. Lin, and S. Han, “Point-voxel CNN for Efficient 3D Deep Learning,” in Proceedings of the 33rd International Conference on Neural Information Processing Systems, Red Hook: NY, pp. 965-975, December 2019. |
| 40. | K. Gupta and M. Chandraker, “Neural Mesh Flow: 3D Manifold Mesh Generation via Diffeomorphic Flows,” in Proceedings of the 34th International Conference on Neural Information Processing Systems, Red Hook: NY, pp. 1747-1758, December 2020. |
| 41. | X. Li, S. Liu, K. Kim, S. De Mello, V. Jampani, M.-H. Yang, and J. Kautz, “Self-supervised Single-View 3D Reconstruction via Semantic Consistency,” in Computer Vision–ECCV 2020: 16th European Conference, Glasgow: UK, pp. 677-693, August 2020.![]() |
| 42. | N. Kulkarni, S. Tulsiani, and A. Gupta, “Canonical Surface Mapping via Geometric Cycle Consistency,” in Proceedings of the IEEE/CVF International Conference on Computer Vision, Seoul: Korea, pp. 2202-2211, October 2019.![]() |
| 43. | W.-C. Hung, V. Jampani, S. Liu, P. Molchanov, M.-H. Yang, and J. Kautz, “Scops: Self-supervised Co-Part Segmentation,” in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Long Beach: CA, pp. 869-878, June 2019.![]() |
| 44. | N. Wang, Y. Zhang, Z. Li, Y. Fu, H. Yu, W. Liu, ... and Y.-G. Jiang, “Pixel2Mesh: 3D Mesh Model Generation via Image Guided Deformation,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 43, No. 10, pp. 3600-3613, October 2021.![]() |
| 45. | J. J. Park, P. Florence, J. Straub, R. Newcombe, and S. Lovegrove, “DeepSDF: Learning Continuous Signed Distance Functions for Shape Representation,” in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Long Beach: CA, pp. 165-174, June 2019.![]() |
| 46. | L. Mescheder, M. Oechsle, M. Niemeyer, S. Nowozin, and A. Geiger, “Occupancy Networks: Learning 3D Reconstruction in Function Space,” in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Long Beach: CA, pp. 4455-4465, June 2019.![]() |
| 47. | Z. Chen and H. Zhang, “Learning Implicit Fields for Generative Shape Modeling,” in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Long Beach: CA, pp. 5932-5941, June 2019.![]() |
| 48. | B. Guillard, E. Remelli, A. Lukoianov, P. Yvernay, S. R. Richter, and T. Bagautdinov, “DeepMesh: Differentiable Iso-Surface Extraction,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 46, No. 11, pp. 7072-7087, November 2024.![]() |
저자소개
2022년~현 재: 전남대학교 컴퓨터정보통신공학과 학사과정
※관심분야:혼합현실(Mixed Reality), 모델링(Modeling), 디지털 트윈(Digital Twin) 등
2010년:부산대학교 기계공학부(학사)
2012년:한국과학기술원 기계항공시스템공학부(석사)
2019년:한국과학기술원 기계공학과(박사)
2019년: 한국과학기술원 연수연구원
2019년~2021년: Imperial College London, Research Associate
2022년~현 재: 전남대학교 지능전자컴퓨터공학과 조교수
※관심분야:가상현실(Virtual reality), 증강현실(Augmented reality), 햅틱(Haptic)