단일 자연 영상에서 그림자 검출 및 제거를 위한 선형 회귀 기반의 1D 불변 영상
Copyright ⓒ 2018 The Digital Contents Society
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-CommercialLicense(http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
초록
그림자는 자연 경관에서 관찰되는 일반적인 현상이지만 물체 인식, 특징 검출 및 장면 분석 등과 같은 영상 분석에 부정적인 영향을 미치는 요소이므로 디지털 영상에 포함된 그림자 처리는 디지털 영상 분석 과정에서 필수적으로 고려되어야 한다. 본 논문에서는 단일 자연 영상에 포함된 그림자를 검출하고 제거하기 위한 특징 요소 중의 하나인 1D 불변 영상의 획득을 위한 기존 방법들에 대해 기술하고, 선형 회귀 기반의 1D 불변 영상 획득 방법을 제안하였다. 제안하는 방법은 RGB 칼라 영상의 각 채널 간의 밴드 비의 로그를 계산한 후 선형 회귀를 통해 그레이스케일 영상 라인을 획득하고, 최종 1D 불변 영상은 밴드 비의 로그 영상들을 추정된 그레이스케일 영상 라인으로 투영시켜 획득하였다. 실험 결과, 제안하는 방법이 기존의 엔트로피 최소화 기반의 투영 각도를 계산하는 방법보다 계산 복잡도가 낮았으며, 1D 불변 영상을 이용한 그림자가 검출 및 제거가 효과적으로 수행됨을 보였다.
Abstract
Shadow is a common phenomenon observed in natural scenes, but it has a negative influence on image analysis such as object recognition, feature detection and scene analysis. Therefore, the process of detecting and removing shadows included in digital images must be considered as a pre-processing process of image analysis. In this paper, the existing methods for acquiring 1D invariant images, one of the feature elements for detecting and removing shadows contained in a single natural image, are described, and a method for obtaining 1D invariant images based on linear regression has been proposed. The proposed method calculates the log of the band-ratio between each channel of the RGB color image, and obtains the grayscale image line by linear regression. The final 1D invariant images were obtained by projecting the log image of the band-ratio onto the estimated grayscale image line. Experimental results show that the proposed method has lower computational complexity than the existing projection method using entropy minimization, and shadow detection and removal based on 1D invariant images are performed effectively.
Keywords:
Invariant image, Illuminant-invariant Image, Linear regression, Shadow detection, Shadow removal키워드:
불변 영상, 조도 불변 영상, 선형 회귀, 그림자 검출, 그림자 제거Ⅰ. 서론
그림자(shadow)는 자연 경관에서 관찰되는 일반적인 현상으로 자연 영상(natural scene image)의 구조와 의미를 이해하는데 효과적지만 특징 검출(feature detection), 물체 인식(object recognition) 및 장면 분석(scene analysis)등과 같은 인식을 복잡하게 할 수 있다 [1][2]. 따라서 그림자 검출 및 제거는 디지털 영상 분석 과정에서 필수적으로 고려되어야 한다.
그림자는 장면의 조명에서 가장 두드러진 효과 중의 하나로 주요 특징은 크게 밝기(intensity), 국부블록의 최대치(local max) 및 왜도(skewness) 등과 같은 변형성과 근접화소의 조도불변(illumination-invariant), 기울기(gradient)와 텍스처(texture) 유사도 등과 같은 불변성 특징을 갖는다 [2-4].
본 논문에서는 RGB 칼라 모델 기반의 단일 자연 영상에서 그림자 특징인 1D 불변 영상(1D invariant image, 이하, 불변 영상)을 획득하는 기존의 방법들을 기술하고, 칼라 영상의 각 채널의 밴드 비의 로그(the log of the band-ratios)와 선형 회귀(linear regression)를 통한 불변 영상 획득 방법을 제안한다. 본 논문의 구성은 다음과 같다. 2장에서는 기존의 불변 영상들을 설명하고, 3장에서 선형 회귀 기반의 불변 영상을 획득하는 제안하는 방법을 기술한다. 4장에서는 기존과 제안 방법을 비교 분석하고, 5장에서 결론을 맺는다.
Ⅱ. 기존의 불변 영상들
본 장에서는 단일 자연 영상에서 그림자를 검출하고 제거하는 과정에서 특징요소로 적용되는 불변 영상들에 대해 기술한다. 불변 영상은 다양한 선행 연구들에서 Planckian locus와 Lambertian surface 이론을 적용하였으며 [5][6], 선행 연구들은 단일 자연 영상의 각 채널의 밴드 비의 로그를 이용한다는 점에서 공통점을 갖는다.
2-1 디지털 영상의 형성 모델 기반의 불변 영상
선행 연구 [7]에서 디지털 영상은 그림 1의 Planckian locus의 스펙트럼 분포와 3개의 빛 파장에 의해 Lambertian surface에 반사되어 형성되며, 이때 이미지화되는 조도불변 영상은 식 1에 의해 획득할 수 있다. 식 1에서 빛 파장의 센서 응답 R1, R2 및 R3는 Planckian light에 따라 RGB 칼라 모델의 blue, green 및 red 채널과 상관되며 [7], α는 3채널 카메라의 빛 파장 응답으로 결정된다. 따라서 RGB 칼라 모델 기반의 영상에서 조도불변 영상 ℑ는 식 2에 의해 획득할 수 있다.
(1) |
(2) |
2-2 Finlayson의 불변 영상
선행연구 [8]에 의하면 Planckian light가 Lambertian surface에 이미지화된다면 RGB 칼라 영상의 각 채널의 밴드 비의 로그 영상은 점으로 표출되고, 식 3과 식 4에 의해 계산된다.
(3) |
식 3에서 p는 RGB 칼라 영상의 하나의 채널을 나타내며, k는 나머지 두 채널을 의미한다. 식 4는 식 3에 로그를 취한 것으로 그림 2와 같이 그레이스케일(grayscale) 영상으로 투영(projection) 시 최상의 방향을 찾기 위해 적용된다.
(4) |
그림 2에서 보여주듯이 직교 방향 e⊥≡(ek - ep) 으로 ρk를 투영한 후 지수함수를 취하면 불변 영상을 획득 할 수 있으며 [8], 식 5와 같다. 보정되지 않은 카메라의 경우 투영 방향이 지정되지 않기 때문에 식 5에 의해 구해진 불변 영상 ℑ의 엔트로피(entropy)를 최소화할 수 있는 각도 θ 방향으로 투영하여야 하며, 최종 불변 영상은 식 6에 의해 획득된다.
(5) |
(6) |
식 6에서의 각도 θ는 ρ1과 ρ2 간의 엔트로피 ηk를 계산한 후 최소값을 취득하며 [9], 투영 각도 θ는 식 7에 의해 구해진다.
(7) |
그림 3은 RGB 칼라 영상을 식 3부터 식 7에 의해 획득한 주요 결과 영상들과 불변 영상을 보이고 있으며, 식 3에서 p는 blue, k = 1,2는 각각 red와 green 채널로 설정하였다.
2-3 기하 평균 기반의 불변 영상
기하 평균(geometric mean)은 n개의 양수 값을 모두 곱한 것의 n제곱근으로, 집합 {a1,a2,...,an}의 기하 평균은 식 8과 같이 정의할 수 있다.
(8) |
RGB 칼라 영상에서의 기하 평균은 를 나타내며, 식 3은 식 9와 같이 재정의 된다.
(9) |
(10) |
RGB 칼라 영상의 기하 평균을 이용한 선행 연구 [10]에서는 그림 4에서와 같이 로그 공간에서 ρ는 에 직교하며, 식 11과 같이 투영자 를 정의하였다.
(11) |
여기서 U는 2×3 크기의 직교 행렬이며, 식 12에서와 같이 U는 χ = 2×1 좌표계로 로그 공간 ρk를 로그 공간으로 회전시키고 있다. 최종 불변 영상은 식 7과 식 13에 의해 구해지며, 주요 결과 영상들과 불변 영상은 그림 5에서 보이고 있다.
(12) |
(13) |
그림 5의 영상들은 그림 3(a)의 RGB 칼라 영상을 이용하여 획득한 결과 영상들로 최종 불변 영상은 투영 각도 θ = 35°로 출력되었다.
Ⅲ. 제안하는 불변 영상
본 논문에서 제안하는 불변 영상을 획득하는 과정은 그림 6과 같다. 먼저 식 14의 RGB 칼라 영상의 각 채널의 밴드 비의 로그 ρk=1,2 간의 선형 회귀를 통해 그레이스케일 라인(line)으로 투영 시 최적의 기울기를 획득한다.
(14) |
(15) |
선형 회귀는 집합 에 대해 yi와 p개의 변수 xi 사이의 선형 관계를 모델링하며 [11], 1차 함수인 경우 식 15와 같이 직선의 방정식을 구할 수 있다. 식 14에서 계산된 2차원 행렬 ρ1과 ρ2 간의 분포는 그림 7에서 보이고 있으며, 그림 3(a)의 RGB 칼라 영상을 이용하였다. 또한 2차원 행렬 ρ1과 ρ2를 각각 1차원 벡터로 변환한 후 선형 회귀를 수행하면 기울기 β와 종속 변수 y의 오차 요인인 ϵ을 획득할 수 있다. 그림 7에서 보이는 일차 함수는 최종 그레이스케일 영상을 나타내며, 일차 함수의 기울기 β는 -1.0396, ϵ은 1.9966으로 계산되었다. 그림 8은 그림 3(a)의 RGB 칼라 영상을 이용한 제안한 방법의 불변 영상들을 보이고 있다.
(16) |
Ⅳ. 실험 및 고찰
본 논문의 2장에서 그림자 검출 및 복원을 위한 특징요소 중의 하나인 불변 영상을 획득하는 기존의 방법들을 설명하였다. 3장에서는 제안하는 방법인 RGB 칼라 영상의 각 채널의 밴드 비의 로그 {log(R/G),log(B/G)} 간의 선형 회귀 기반의 최적의 기울기로 일차 함수를 검출한 후 밴드 비의 로그 ρk의 화소들을 일차 함수, 즉 그레이스케일 영상 라인으로 투영시켜 불변 영상을 획득하는 과정을 제안하였다.
그림 9는 기존의 방법과 제안하는 방법으로 획득한 불변 영상들을 보이고 있다. 그림 9(b) 영상들은 [7]의 방법으로 식 2의 α 값은 표 1의 α 값들의 평균값을 적용하여 출력된 불변 영상들이다. 그림 9(c)와 (d)는 Finlayson이 제안한 방법으로 그림 4에서와 같이 투영자 를 이용하여 밴드 비의 로그 ρk를 회전시켜 불변 영상을 획득하고 있다. 이때 투영 각도 θ는 그림 1의 Lambertian surface에 반사되는 각도로 식 7과 같이 엔트로피 최소화 기반으로 추정된다. 그림 9(e)는 제안하는 방법으로 밴드 비의 로그 영상 ρk 정보 간의 선형 회귀를 통해 식 15와 같이 일차 함수를 취득하고, 식 16을 이용하여 ρk를 그레이스케일 영상 라인으로 투영시켜 불변 영상을 획득하였다. 그림 10은 기존 방법들과 제안방법의 불변 영상 획득 시간 비용을 비교한 것으로 [7]의 방법, 제안 방법 및 [10]의 방법 순으로 계산 복잡도가 낮음을 알 수 있었다.
그림 10에서 [7]의 방법이 불변 영상 획득을 위한 시간 비용이 우수하지만 α의 값 추정이 적응적이지 않고, 그림자 제거 시 별도의 그림자 검출 과정이 필요하다. 반면 [10]의 방법과 제안하는 방법은 불변 영상을 이용한 그림자 검출 및 제거 과정에서 불변 영상을 활용한다는 장점을 가진다. [10]의 방법은 식 10의 밴드 비의 로그 ρk를 그레이스케일 영상 라인으로 투영하기 위해 0°부터 180°사이의 엔트로피 최소값으로 투영 각도 θ를 추정하였다. 반면 제안하는 방법은 ρk 간의 선형 회귀를 통해 최적의 그레이스케일 영상라인을 획득하고, 이 일차함수로 ρk를 투영하였다. 그림 10에서 보여주듯이 [10]의 방법보다 제안하는 방법이 계산 복잡도가 낮음을 알 수 있다. 그림 11(a)와 (b)는 제안하는 방법으로 획득한 불변 영상과 그레이스케일 영상간의 차이를 통해 얻어진 그림자 후보군들이며, 그림 11(c)부터 (f) 까지는 [12]의 방법으로 그림자 영역 또는 그림자 에지 영역을 이용하여 그림자가 제거되고 복원된(re-integrated) 영상들을 보이고 있다. 그림 11의 결과 영상들에서 보여주듯이 그림자 제거 및 복원을 위해서는 그림자 후보군 검출이 정확하게 이루어져야 한다. 향후, 본 논문에서 제안한 불변 영상을 이용한 그림자 후보군 검출 정확도를 높이고, 그림 11(e)와 (f)와 같이 부정확한 그림자 제거 및 복원을 개선하는 연구를 계속하고자 한다.
Ⅴ. 결론 및 향후 연구
본 논문에서는 단일 자연 영상에 포함된 그림자를 검출하고 제거하는 주요 특징요소 중의 하나인 불변 영상을 획득하는 기존의 방법들을 기술하였고, 밴드 비의 로그 영상들 간의 선형 회귀 기반의 그레이스케일 영상 라인을 추정하여 불변 영상을 획득하는 방법을 제안하였다. [7]의 방법은 카메라의 종류마다 식 2의 α 값을 추정해야 하는 단점을 가진다. [10]의 방법과 제안하는 방법은 밴드 비의 로그 영상들을 그레이스케일 영상 라인으로 투영시키는 방법론은 동일하지만, 제안하는 방법이 선형 회귀 기반 그레이스케일 영상 라인을 획득함으로서 엔트로피 최소화를 통한 투영 각도를 계산하는 [10]의 방법보다 계산 복잡도를 줄일 수 있었다. 향후, 불변 영상 기반의 그림자 영역 검출의 정확도를 향상시키는 연구와 [12]의 그림자 제거 및 복원 과정을 개선하고자 한다.
Acknowledgments
이 성과는 2017년도 정부(미래창조과학부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임(No. 2017R1C1B5018143).
References
- M. Xu, J. Zhu, Lv P., B. Zhou, M. F. Tappen, and R. Ji, “Learning-Based Shadow Recognition and Removal From Monochromatic Natural Images”, in Proceedings of IEEE Transactions on Image Processing, 26(12), p5581-5824, Dec.), (2017. [https://doi.org/10.1109/TIP.2017.2737321]
- Zhj, J., Samuel, K. G. G., Masood, S. Z., Tappen, M. F., “Learning to recognize shadows in monochromatic natural images,”, in Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR), p223-230, San Francisco, CA, June), (2010. [https://doi.org/10.1109/CVPR.2010.5540209]
- J.-F. Lalonde, A. A. Efros, and S. G. Narasimhan, , in European Conference on Computer Vision (ECCV), LNCS, 6312, p322-335, Sep.), (2010.
- K. H. Park, and Y. S. Lee, “Definition and Analysis of Shadow Features for Shadow Detection in Single Natural Image,”, The Journal of Digital Contents Society, 19(1), p165-171, Jan.), (2018.
- Wikipedia, Planckian locus [Internet], Available: https://en.wikipedia.org/wiki/Planckian_locus.
- Wikipedia, Lambertian reflectance [Internet], Available: https://en.wikipedia.org/wiki/Lambertian_reflectance.
- W. Maddern, A. Stewart, C. McManus, B. Upcroft, W. Churchill, and P. Newman, “Illumination invariant imaging: Applications in robust vision-based localisation, mapping and classification for autonomous vehicles,”, in Proceedings of the Visual Place Recognition in Changing Environments Workshop, IEEE Intl. Conf. on Robotics and Automation, (2014).
- M. S. Drew, G. D. Finlayson, and S. D. Hordley, "Recovery of Chromaticity Image Free from Shadows via Illumination Invariance", in IEEE Workshop on Color and Photometric Methods in Computer Vision (ICCV), p32-39, Oct.), (2003.
- G. D. Finlayson, M. S. Drew, and C. Lu, “Intrinsic Images by Entropy Minimization,”, in European Conference on Computer Vision (ECCV), LNCS, 3023, p582-595, May), (2004.
- G. D. Finlayson, M. S. Drew, and C. Lu, “Entropy Minimization for Shadow Removal”, International Journal of Computer Vision, 85(1), p35-57, Oct.), (2009. [https://doi.org/10.1007/s11263-009-0243-z]
- Wikipedia, Linear regression [Internet], Available: https://en.wikipedia.org/wiki/Linear_regression.
- A. Criminisi, P. Perez, and K. Toyama, “Object Removal by Exemplar-Based Inpainting”, in Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR), Madison, WI, p739-743, June), (2003. [https://doi.org/10.1109/CVPR.2003.1211538]
박 기 홍(Ki-Hong Park)
2005년: 목원대학교 일반대학원 IT공학과 (공학석사)
2010년: 목원대학교 일반대학원 IT공학과 (공학박사)
2008년~2009년: 방재정보통신지역혁신센터 연구원
2010년~2012년: ㈜인코넥스 책임연구원
2012년~현 재: 목원대학교 융합컴퓨터·미디어학부 교수
2014년~현 재: 안전문화운동추진 대전시연합회 생활안전 분과위원장
2015년~현 재: 안전모니터봉사단 대전시연합회 부회장
※관심분야: 컴퓨터비전, 패턴인식, 영상코덱(H.26x), 디지털콘텐츠, 항공응용기술, 방재응용기술 등