WO2015005577A1

WO2015005577A1 - 카메라 포즈 추정 장치 및 방법

Info

Publication number: WO2015005577A1
Application number: PCT/KR2014/004355
Authority: WO
Inventors: 이선민; 이형욱; 이영범
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2013-07-09
Filing date: 2014-05-15
Publication date: 2015-01-15
Anticipated expiration: 2016-01-09
Also published as: KR20150006958A; US9875545B2; KR102137264B1; US20160171703A1

Abstract

카메라 포즈 추정 장치가 제공된다. 상기 장치는 입력 깊이 영상 및 입력 칼라 영상 중 어느 하나를 이용하여 초기 카메라 포즈를 추정하고, 다른 하나를 이용하여 상기 초기 카메라 포즈를 개선한다. 상기 입력 깊이 영상을 이용하여 초기 카메라 포즈가 추정되는 경우, 매칭 대상이 되는 적어도 하나의 제1 포인트의 깊이 값의 분포에 따라 상기 개선을 위해 칼라 정보가 매칭되는 제1 영역의 반경은 적응적으로 설정될 수 있다.

Description

카메라 포즈 추정 장치 및 방법

카메라 포즈 추정에 연관되며, 보다 특정하게는 입력 깊이 영상 및/또는 입력 칼라 영상을 이용하여 카메라의 포즈를 추정하는 장치 및 방법에 연관된다.

카메라 포즈 추정(Pose estimation of camera)은 기준이 되는 동적으로 변하는 카메라 시점의 이동(Translation) 및 회전(Rotation) 정보를 결정하는 것이다. 이러한 카메라 포즈 추정은, 혼합현실(Mixed reality), 증강현실(Augmented Reality), 로봇 내비게이팅(Robot navigating), 3D 장면 재구성(3-Dimensional Scene Reconstruction) 등 활용 분야가 증가하고 있다.

종래에는 주로 칼라 영상의 매칭을 이용하여 카메라 포즈를 추정하였으나, 칼라 영상 내에 텍스처(Texture) 정보가 풍부하지 못한 경우 특징 추출(Feature extracting)이 어렵고, 유사한 패턴이 반복되는 신(Scene)에서는 오류가 발생할 수 있었다.

한편, 최근 보급되고 있는 깊이 카메라(Depth camera)에 의해 획득되는 깊이 영상(Depth image)를 이용한 카메라 추정도 연구되고 있으나, 깊이 센싱 과정의 노이즈로 인한 오류 가능성이 존재한다.

일측에 따르면, 입력 깊이 영상 및 입력 칼라 영상 중 어느 하나인 제1 영상에 대해, 제1 프레임에 속하는 적어도 하나의 제1 포인트와 상기 제1 프레임과 상이한 제2 프레임에 속하는 적어도 하나의 제2 포인트를 매칭하여, 상기 제1 영상에 연관되는 카메라의 초기 포즈를 추정(Estimate)하는 추정부; 및 상기 입력 깊이 영상 및 상기 입력 칼라 영상 중 상기 제1 영상과 다른 하나인 제2 영상을 이용하여, 상기 초기 포즈를 개선하여(Refine) 개선된 포즈를 제공하는 개선부를 포함하는 카메라 포즈 추정 장치가 제공된다.

일실시예에 따르면, 상기 추정부는, ICP(Iterative Closet Point) 기법을 이용하여 상기 적어도 하나의 제1 포인트와 상기 적어도 하나의 제2 포인트를 매칭할 수 있다.

일실시예에 따르면, 상기 제1 영상은 상기 입력 깊이 영상에 대응하고, 상기 제2 영상은 상기 입력 칼라 영상에 대응할 수 있다.

이 경우, 상기 추정부는, 상기 입력 깊이 영상에 포함되는 포인트 클라우드 중 상기 제1 프레임에 속하는 상기 적어도 하나의 제1 포인트 및 상기 제2 프레임에 속하는 상기 적어도 하나의 제2 포인트를 선택할 수 있다.

또한, 상기 추정부는, 상기 포인트 클라우드 중 깊이 편차가 임계 편차 이하인 적어도 하나의 포인트를 상기 제1 프레임 및 상기 제2 프레임에서 선택할 수 있다.

일실시예에 따르면, 상기 개선부는, 상기 적어도 하나의 제1 포인트의 주변의 제1 반경 내에 포함되는 제1 영역 내에서 상기 칼라 영상을 고려하여 상기 초기 포즈를 개선할 수 있다.

이 경우, 상기 제1 반경은 상기 적어도 하나의 제1 포인트의 깊이 값이 클수록 더 크게 설정될 수 있다.

다른 일측에 따르면, 입력 깊이 영상 및 입력 칼라 영상 중 적어도 하나의 특성을 분석 하여, 상기 입력 깊이 영상 및 상기 입력 칼라 영상에 연관되는 카메라의 포즈 추정 모드를 결정하는 결정부; 상기 결정되는 모드가 상기 입력 깊이 영상 및 상기 입력 칼라 영상을 모두 이용하는 포즈 추정에 대응하는 경우, 상기 입력 깊이 영상에 대해, 제1 프레임에 속하는 적어도 하나의 제1 포인트와 상기 제1 프레임과 상이한 제2 프레임에 속하는 적어도 하나의 제2 포인트를 매칭하여, 상기 제1 프레임과 상기 제2 프레임 간의 초기 포즈를 추정하는 추정부; 및 상기 입력 칼라 영상을 이용하여, 상기 적어도 하나의 제1 포인트 주변의 칼라 정보와 상기 적어도 하나의 제2 포인트 주변의 칼라 정보를 매칭하여, 상기 초기 포즈를 개선하여 개선된 포즈를 제공하는 개선부를 포함하는 카메라 포즈 추정 장치가 제공된다.

일실시예에 따르면, 상기 결정부는, 상기 입력 깊이 영상의 깊이 값으로부터 추출되는 깊이 특징점이 제1 임계치 이상이고 상기 입력 칼라 영상의 칼라 값으로부터 추출되는 칼라 특징점이 제2 임계치 이상인 경우, 상기 모드는 상기 입력 깊이 영상 및 상기 입력 칼라 영상을 모두 이용하는 포즈 추정에 대응하는 것으로 결정할 수 있다.

한편, 상기 개선부는, 상기 적어도 하나의 제1 포인트의 주변의 제1 반경 내에 포함되는 제1 영역 내에서 상기 칼라 영상을 고려하여 상기 초기 포즈를 개선할 수 있다.

또 다른 일측에 따르면, 카메라 포즈 추정 장치의 추정부가, 입력 깊이 영상에 대해 제1 프레임에 포함되는 적어도 하나의 제1 포인트와 제2 프레임에 포함되는 적어도 하나의 제2 포인트를 ICP(Iterative Closet Point) 기법으로 1차 매칭하여 상기 입력 깊이 영상에 연관되는 카메라의 초기 포즈를 추정하는 단계; 및 상기 장치의 개선부가, 상기 입력 깊이 영상에 연관되는 입력 칼라 영상을 이용하여 상기 ICP 기법으로 2차 매칭하기 위해, 상기 제1 포인트를 포함하는 제1 영역의 제1 반경을 결정하는 단계 - 상기 2차 매칭은 상기 제1 영역 내의 칼라 특징 매칭을 이용하는 것임 - 를 포함하는 카메라 포즈 추정 방법이 제공된다.

일실시예에 따르면, 상기 제1 반경은 상기 적어도 하나의 제1 포인트의 깊이 값이 클수록 더 크게 설정될 수 있다.

일실시예에 따르면, 상기 카메라 포즈 추정 방법은, 상기 장치의 결정부가, 상기 입력 깊이 영상으로부터 추출되는 깊이 특징 정보 및 상기 입력 칼라 영상으로부터 추출되는 칼라 특징 정보를 이용하여, 상기 카메라 포즈 추정을 위한 모드를 결정하는 단계를 더 포함할 수 있다.

일실시예에 따르면, 상기 적어도 하나의 제1 포인트 및 상기 적어도 하나의 제2 포인트는 깊이 분포를 고려한 신뢰도가 임계치 이상인 포인트에 대응할 수 있다.

도 1은 일실시예에 따른 카메라 포즈 추정 장치를 도시한 블록도이다.

도 2는 일실시예에 따른 카메라 포즈 추정 방법을 설명하기 위해 예시적으로 구성된 가상의 장면(Scene)을 도시한다.

도 3은 일실시예에 따라 카메라, 복수 개의 프레임에서 입력되는 칼라 영상과 깊이 영상을 도시한다.

도 4는 일실시예에 따른 초기 포즈 추정 과정을 설명하기 위한 도면이다.

도 5는 일실시예에 따른 포즈 개선(Refining) 과정을 도시하기 위한 도면이다.

도 6은 포즈 개선을 위해 칼라 값 매칭을 수행하는 제1 영역의 반경을 적응적으로 설정하는 과정을 설명하기 위한 그래프이다.

도 7은 일실시예에 따른 카메라 포즈 추정 방법을 도시하는 흐름도이다.

도 8은 다른 일실시예에 따른 카메라 포즈 추정 장치를 도시하는 블록도이다.

도 9는 일실시예에 따른 카메라 포즈 추정 방법을 도시하는 흐름도이다.

도 10은 일실시예에 따라 카메라 포즈 추정 모드를 결정하는 과정을 설명하기 위한 예시적 장면들을 도시한다.

이하에서, 일부 실시예들를, 첨부된 도면을 참조하여 상세하게 설명한다. 그러나, 이러한 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.

도 1은 일실시예에 따른 카메라 포즈 추정 장치(100)를 도시한 블록도이다.

일실시예에 따르면, 카메라 포즈 추정 장치(100)은 깊이 영상을 이용하여 프레임 간의 포인트 클라우드 매칭을 수행하여 카메라의 초기 포즈를 추정하는 추정부(110) 및 칼라 영상을 이용하여 상기 초기 포즈를 개선(Refining)하는 개선부(120)를 포함할 수 있다. 다만, 추정부(110)가 칼라 정보를 이용하여 추정을 수행하고, 개선부(120)가 깊이 정보를 이용하여 초기 정보를 개선하는 다른 실시예도 가능하므로, 이하에서는 별다른 언급이 없더라도 이러한 실시예도 포함되는 것으로 해석되어야 한다.

일실시예에 따르면, 상기 추정부(110)는, ICP(Iterative Closet Point) 알고리즘을 이용하여 입력 깊이 영상에 포함되는 적어도 하나의 제1 포인트에 대해 프레임 간의 포즈 추정을 수행한다.

이 경우, 추정이 수행되기 전의 일정 개수의 프레임들 동안, 깊이 영상의 각 픽셀에서의 평균 및 편차(mean and variation)이 참조되어, 편차가 일정 수준 이하로 작은 픽셀들만이 샘플링 될 수 있으며, 이 샘플링된 픽셀들에 대응하는 3D 포인트 클라우드의 일부가 포즈 추정에 이용되는 적어도 하나의 제1 포인트일 수 있다.

또한, 일부 실시예에서는 칼라 영상을 참조하여, 칼라가 어두운 색이거나, 칼라 인텐시티(Intensity)가 작거나, 및/또는 깊이 영상 결정에 이용된 적외선 수신 인텐시티가 작은 등의 픽셀은 포즈 추정에 이용되는 포인트에서 제외하여 정확성을 높일 수도 있다.

개선부(120)는 추정부(110)에 의해 추정된 카메라 초기 포즈를 개선한다.

이 경우, 깊이 영상의 기하 정보에 노이즈가 있을 수 있는 점을 고려하여, 초기 포즈 추정에 이용된 적어도 하나의 제1 포인트들 각각의 주변에 제1 반경을 갖는 제1 영역을 설정하고, 상기 제1 영역 내의 포인트들을 매칭에 이용할 최종 포인트로 결정할 수 있다.

일실시예에 따르면, 여기서 상기 제1 반경은 적응적으로(adaptively) 설정될 수 있으며, 예시적으로 제1 포인트가 카메라 시점으로부터 멀리 떨어져 있을수록 (깊이 값이 클수록) 더 크게 설정될 수 있다. 본 실시예에서는 깊이 값이 큰 경우에 오차가 증가할 수 있음을 고려하였다.

개선부(120)는 칼라 영상을 이용하여 카메라의 초기 포즈 추정 결과의 정밀도를 향상 시킨다.

추정부(110)의 초기 포즈 추정 과정 및 개선부(120)의 포즈 개선 과정은 도 2 내지 도 7을 참조하여 상세히 후술한다.

도시된 장면에서 카메라 시점(210)은 제1 프레임인 i번째 프레임에 대응하고, 카메라 시점(220)은 제1 프레임과 상이한 제2 프레임, 이를테면 i+1번째 프레임에 대응한다.

이 카메라 시점들(210, 220) 사이의 변환(202)은 변환 행렬 M = [R | T]로 표현될 수 있다. 카메라 포즈 추정은 이러한 변환 행렬 M을 결정하는 것에 대응될 수 있다.

오브젝트(201) 및 장면에 포함되는 칼라 텍스처 정보, 깊이 특징 등에 따라 카메라 포즈에 칼라 영상만 이용될 수도 있고, 깊이 영상만 이용될 수도 있으며, 또는 칼라 영상과 깊이 영상이 모두 이용될 수도 있다. 이러한 선택은 도 8 내지 도 10을 참조하여 후술한다. 도 3 내지 도 7에서는 칼라 영상과 깊이 영상이 모두 이용되는 경우에 대해 상세히 설명한다.

i번째 프레임에서 입력되는 칼라 영상(311) 및 깊이 영상(312)는 서로 매칭되어 있을 수 있다. 또는, 촬영 당시부터 칼라 센싱과 깊이 센싱이 모두 가능한 형태의 센서에 의해 획득된 것일 수도 있다.

i+1번째 프레임에서 입력되는 칼라 영상(321) 및 깊이 영상(322)도 서로 매칭되어 있을 수 있다.

칼라 영상만을 이용하는 경우, 칼라 영상(311)과 칼라 영상(312)의 칼라 특징이 추출되고 서로 매칭됨으로써 i번째 프레임과 i+1번째 프레임 간의 카메라 포즈 추정이 수행될 수 있다.

그리고, 깊이 영상만을 이용하는 경우, 깊이 영상(312)과 깊이 영상(322)의 기하학적 특징이 추출되고, 서로 매칭됨으로써 i번째 프레임과 i+1번째 프레임 간의 카메라 포즈 추정이 수행될 수 있다.

일실시예에 따르면, 칼라 영상들(311, 321)과 깊이 영상들(312, 322)이 모두 카메라 포즈 추정에 이용될 수 있다.

일실시예에 따르면, 도 1의 추정부(110)는 깊이 영상들(312, 322)을 이용하여 ICP 알고리즘을 수행함으로써 카메라 초기 포즈를 추정할 수 있다. 이 경우, 깊이 영상의 노이즈 특성 등으로 인해, 상기 초기 포즈는 정밀도가 만족할 만 하지 않을 수도 있다.

따라서, 개선부(120)는 칼라 영상들(311, 321)을 이용하여, 상기 초기 포즈를 개선한다. 일실시예에 따르면, 3D 포인트 클라우드 중 초기 포즈 추정에 이용된 적어도 하나의 제1 포인트 주변의 일정 반경에 대해 칼라 정보의 매칭이 수행됨으로써, 보다 정밀한 매칭 결과가 도출될 수 있고, 따라서 개선된 카메라 포즈가 제공될 수 있다.

이러한 실시예들에 따라, 칼라 영상의 장점과 깊이 영상의 장점을 모두 이용하여 카메라 포즈 추정의 정확도가 높아질 수 있다. 또한, 장면의 특징에 따라, 칼라 영상, 깊이 영상 중 어느 하나를 적응적으로 선택하여 이용하거나, 경우에 따라서 모두 이용하는 등 유연한(flexible) 처리가 가능하다.

포즈 추정 과정 및 개선 과정은 도 4 내지 도 7을 참조하여 상세히 설명한다.

깊이 영상을 이용한 초기 포즈 추정 과정이 도시된다. 포인트 클라우드 중 i번째 프레임에서 선택되는 적어도 하나의 제1 포인트들(왼쪽)과 i+1번째 프레임에서 선택되는 적어도 하나의 제 2 포인트들(오른쪽) 사이의 매칭에 따라 카메라 초기 포즈 P1이 추정될 수 있다.

그러나, 상술한 바와 같이, 깊이 영상은 노이즈 특성이 열악하고, 깊이 접힘(depth folding) 등의 여러 원인에 의한 깊이 값 오류가 존재할 수 있으므로, 일실시예에서는 후술하는 포즈 개선 과정이 수행된다.

i번째 프레임의 깊이 영상(511) 내의 제1 포인트와 i+1번째 프레임의 깊이 영상(521) 내의 제2 포인트는 처음에 서로 매칭되는 것으로 결정되었다.

이 경우, 개선부(120)는 상기 제1 포인트 주변의 반경 r 만큼의 영역과 상기 제2 포인트 주변의 반경 r 만큼의 영역의 칼라 정보를 참조하여 추가적 매칭을 수행한다. 이 경우, 칼라 정보는 각각 i번째 프레임의 칼라 영상(512) 및 i+1번째 프레임의 칼라 영상(522)로부터 이용될 수 있다.

일실시예에 따르면, 이 경우, 설정되는 반경 r은 제1 포인트 및/또는 제2 포인트의 깊이 값에 따라 적응적으로 다르게 설정될 수 있다. 이 과정이 도 6을 참조하여 설명된다.

렌더링 되는 카메라 시점의 가상 평면(plane)과 포즈 추정에 이용되는 포인트 사이의 거리(X축)가 증가할수록, 깊이 표준 편차(Y축)도 증가하는 것을 볼 수 있다. 따라서, 일실시예에 따르면, 노이즈 특성이 열악한 상황인 깊이 값이 큰 상황에서는 도 5를 통해 설명한 반경 r을 크게 설정하여 보다 많은 매칭 후보들(candidate points for matching)을 고려할 수 있다.

실시예들에 따른 카메라 포즈 추정 과정을 도 7의 흐름도를 참조하여 설명한다.

일실시예에 따르면, 2-Pass ICP(Iterative Closet Point)에 따라 카메라 포즈가 추정된다. 상기 2-Pass는 깊이 영상으로부터 획득되는 포인트 클라우드(Point Cloud)(701)의 기하학적 매칭을 이용하여 카메라의 초기 포즈를 추정하는 첫 번째 패스(710), 및 칼라 영상(702)을 이용하여 상기 초기 포즈를 개선(Refining)하여 보다 정밀한 카메라 포즈를 결정하는 두 번째 패스(720)을 포함할 수 있다.

예시적으로, 그러나 한정적이지 않게, 이러한 도 7의 흐름도는 연속적인 및/또는 병렬적인 카메라 포즈 추정을 위한 파이프라인 알고리즘(Pipeline algorithm)으로 이해될 수 있다.

ICP는 서로 다른 시점들로부터 획득되는 3D 포인트 클라우드를 정렬(align)하기 위한 알고리즘으로 알려져 있다. 이러한 ICP는 원래 완전히 오버랩 되는 컴퓨터 생성 데이터의 처리를 위한 것이지만, 부분적으로 오버랩되는 깊이 데이터의 상관관계 분석 등 다른 변형에도 유용할 수 있다.

일실시예에 따르면, 이러한 ICP를 2 개의 패스로 진행하여, 첫 번째 패스(710)에서는 포인트 클라우드를 이용하여, 빠르고 개략적으로(rapidly and roughly) 초기 카메라 포즈를 추정한다. 이 1차 패스(710)에서 입력 깊이 영상에 포함되는 적어도 하나의 제1 포인트를 프레임 별로 매칭하여 카메라 포즈를 추정하는 과정은 통상의 ICP 알고리즘에 의해 쉽게 이해될 수 있다.

ICP 알고리즘은, 매칭에 사용할 제1 포인트들을 선택하는 선택 단계(Selection)(711), 3D 포인트 클라우드를 프레임 간에 매칭하는 매칭 단계(Matching)(712), 매칭에 연관되는 가중치를 부여하는 가중 단계(Weighting)(713), 및 매칭에서 아웃라이어를 제거하는 제거 단계(Rejection)(714) 및 매칭 에러를 최소화 하는 결과를 도출하는 최소화 단계(Minimizing or Error minimizing)(715) 과정으로 이루어 질 수 있다. 일실시예에 따르면, 위 가중치 부여는 제1 포인트의 깊이에 따라 부여될 수 있다. 이를테면, 깊이 값이 클수록(카메라 시점에서 멀수록) 가중치는 작게 부여될 수 있다. 깊이 값이 크면 노이즈 특성이 열악할 수 있기 때문이다.

여기서, 3D 포인트 클라우드가 서로 수렴하는가의 여부(whether matching result is converged)에 따라 상기 매칭 단계(712) 내지 최소화 단계(715)는 여러 번 회귀적으로 반복될 수 있다(can be repeated iteratively). 이 실시예에서는 1차 패스(710) 동안 칼라 영상(702)은 이용되지 않을 수 있다.

한편, 매칭 단계(712)에서는 모델 포인트 클라우드 Q = {Qi | i = 1, 2, 3, ... , n}와 타켓 포인트 클라우드 P = {Pj | j = 1, 2, 3, ... , n} 사이의 유클리디언 거리가 에러 메트릭(error metric)으로 고려될 수 있다. 여기서 n은 매칭에 이용되는 포인트 클라우드의 포인트 수일 수 있다. 그리고, 본 명세서 전반에 걸쳐서 언급되는 적어도 하나의 제1 포인트는 상기 모델 포인트 클라우드 Q에 대응하고, 적어도 하나의 제2 포인트는 상기 타켓 포인트 클라우드 P에 대응하는 것으로 이해될 수 있다.

따라서, 유클리디언 거리를 최소화 하는 매칭 결과를 제1 패스(710)의 결과로 도출하면, 카메라 시점들 사이의 변환 행렬(transformation matrix) M = [R | T]이 계산될 수 있다.

예시적으로, R은 3x3의 회전 행렬(rotation matrix)이고, T는 3x1의 이동 벡터(translation vector)일 수 있다.

이론적으로는, 이 변환 행렬 M에 의해 Q를 이동한 결과가 P와 완전히 일치하고, 칼라 정보도 동일해야 하지만, 깊이 영상의 해상도를 업스케일 하는 과정에서의 깊이 오차, 깊이 영상 촬영 과정에서 발생하는 깊이 오차, 노이즈 등으로 인하여, 실제로는 완전한 일치가 되지 않을 수 있다.

일실시예에 따르면, 개선부(120)는 이러한 1차 패스(710)에서 구한 변환 행렬 M을 개선(refine)하는 2차 패스(720)를 수행하여, 최종 카메라 포즈를 높은 정밀도로 계산한다. 이 2차 패스(720)에서 칼라 영상(710)이 이용되며, 보다 구체적으로는 포인트 클라우드 Q 및/또는 P에 포함되는 포인트 Qi 또는 Pj 주변 일정 반경의 영역의 칼라 정보가 이용된다. 2차 패스(720)의 경우, 매칭 정보에 칼라 특징(color feature)이 이용된다는 것 외에는 매칭 단계(721), 가중 단계(722), 제거 단계(723) 및 최소화 단계(724)는 1차 패스(710)와 유사하게 ICP 알고리즘에 따라 수행된다.

한편, 2차 패스(720)에서는 유클리디언 거리를 최소화 하는 Pj 뿐만 아니라, Pj 주변의 일정 영역 Ω 에 포함되는 여러 이웃 포인트들이 Qi에 매칭되는 후보들(candidates)로 고려되어, 칼라 매칭이 잘 되는 후보 포인트가 상기 Qi에 최종 매칭되는 포인트로 결정된다.

일실시예에 따르면, 도 6을 참조하여 상술한 바와 같이, 이 과정에서 일정 영역 Ω의 반경 r은 적응적으로(adaptively) 설정될 수 있다. 시점으로부터 멀리 떨어져 있는 포인트(깊이 값이 큰 포인트)에서는 깊이 오차(depth error)나 노이즈의 영향이 클 것이므로, 보다 큰 반경의 이웃 포인트들을 후보로 고려하여 매칭에 이용하는 것이다. 상세한 내용은 도 6을 참조하여 설명한 바와 같다.

일실시예에 따른 카메라 포즈 추정 장치(800)의 결정부(810)는 카메라 추정에 칼라 영상만 이용할 것인지, 깊이 영상만 이용할 것인지, 또는 칼라 영상과 깊이 영상을 모두 이용할 것인지의 여부를 결정한다. 이러한 결정을 추정 모드(Estimation mode) 결정으로 표현할 수 있다.

깊이 영상과 상기 깊이 영상에 매칭되는 칼라 영상이 입력되면, 결정부(810)는 깊이 영상으로부터 3D 좌표를 계산하여 기하학적 특징(Geometric feature)을 추출하고, 칼라 영상으로부터 칼라 특징(Color feature or Visual feature)을 추출한다.

실시예들에 따르면, 기하학적 특징 추출과정에서 3D 포인트 클라우드에 NARF(Normal Aligned Radial Feature), 3D Harris Corner, 3D SIFT(3-Dimensional Scale-Invariant feature transform) 등의 알고리즘이 이용될 수 있다. 그리고, 칼라 특징을 추출하는 과정에는 Harris Corner, SIFT(Scale-Invariant feature transform), SURF(Speeded up robust features), FAST(Fast Corner) 등의 방식을 이용할 수 있다.

이 경우, 추출된 기하학적 특징이 미리 지정된 일정 수준 이상이면 상기 입력 깊이 영상은 카메라 포즈 추정에 이용될 수 있는 정도로 신뢰도가 높은 것으로 판단된다. 또한, 추출된 칼라 특징이 미리 지정된 일정 수준(상기 기하학적 특징과는 서로 다른 기준에 따른 수준일 수 있음) 이상이면 입력 칼라 영상이 카메라 포즈 추정에 이용될 수 있는 정도로 신뢰도가 높은 것으로 판단된다. 이 과정에서는 RANSAC (RANdom SAmple Consensus) 알고리즘을 이용하여 평면 영역이 정의되고, 평면 영역에 존재하는 2D 특징에 대한 정보가 참고되어 판단될 수 있다. 또한, PTAM (Parallel Tracking and Mapping)이 활용되는 실시예도 가능하다.

결정부(810)는 칼라 영상만이 신뢰도가 높은 경우에는 칼라 영상만 이용하는 모드(Color-only mode)로 결정하고, 깊이 영상만이 신뢰도가 높은 경우에는 깊이 영상만 이용하는 모드(Depth-only mode)로 결정하며, 둘 다 신뢰도가 높은 경우에는 칼라 영상 및 깊이 영상 사용 모드(Color and depth mode)로 결정한다.

칼라 영상 및 깊이 영상 사용 모드로 결정되는 경우, 추정부(820)는 깊이 영상을 이용하여 도 7에서 설명한 1차 패스(710)를 진행할 수 있고, 개선부(830)는 이렇게 추정된 카메라 초기 포즈에 대해 2차 패스(720)를 진행하여 개선된(Refined) 최종 카메라 포즈를 결정할 수 있다.

추정부(820) 및 개선부(830)의 동작은 도 1 내지 도 7을 참조하여 상술한 바와 같다. 또한, 결정부(810)의 동작은 도 9 내지 도 10을 참조하여 더 설명한다.

단계(910)에서 카메라 포즈 추정 장치에 칼라 영상 및 깊이 영상이 수신된다. 상기 칼라 영상 및 깊이 영상은, 해상도나 시점이 서로 매칭되어 있는 것일 수 있다.

그러면, 단계(920)에서 깊이 영상으로부터 3D 좌표를 계산하여 기하학적 특징이 추출되고, 칼라 영상으로부터 칼라 특징이 추출된다.

그리고 단계(930)에서 도 8의 결정부(810)는 상기한 바와 같이 추정 모드를 결정한다.

여기서, 추출된 기하학적 특징이 미리 지정된 일정 수준 이상이면 상기 입력 깊이 영상은 카메라 포즈 추정에 이용될 수 있는 정도로 신뢰도가 높은 것으로 판단된다. 또한, 추출된 칼라 특징이 미리 지정된 일정 수준 이상이면 입력 칼라 영상이 카메라 포즈 추정에 이용될 수 있는 정도로 신뢰도가 높은 것으로 판단된다.

도 8의 결정부(810)는 칼라 영상만이 신뢰도가 높은 경우에는 칼라 영상만 이용하는 모드(Color-only mode)로 결정하고, 깊이 영상만이 신뢰도가 높은 경우에는 깊이 영상만 이용하는 모드(Depth-only mode)로 결정하며, 둘 다 신뢰도가 높은 경우에는 칼라 영상 및 깊이 영상 사용 모드(Color and depth mode)로 결정한다.

그리고 단계(940)에서는 추정부(820) 및 개선부(830)가 도 1 내지 도 7을 이용하여 상술한 바와 같이 카메라 포즈를 추정한다.

추정 모드 결정을 위해 참조 되는 기하학적 특징과 칼라 특징을 설명하기 위해 도 10이 제시된다.

예시적 장면(1010)은 기하학적 패턴이 단순하여 복잡도가 높지 않은 장면에 대응한다. 이러한 장면(1010)으로부터 칼라 특징을 추출하는 경우에는 매칭 대상이 되는 특징이 일정 수준 이상이 되어 칼라 영상은 신뢰도가 높으나, 기하학적 특징은 매칭이 될 수 있는 정도로 추출되지 못할 수 있다. 따라서, 도 8의 결정부(810)는 이러한 장면(1010)에 대해서는 칼라 영상만 이용하는 모드(Color-only mode)로 카메라 포즈 추정 모드를 결정할 수 있다.

다른 예시적 장면(1020)은 기하학적 패턴은 비교적 복잡하나, 칼라 톤이 단순하여 칼라 특징이 일정 수준 이상으로 추출되지 못할 수 있다. 이러한 장면(1020)에서는 카메라 포즈 추정을 위해 칼라 특징이 이용되기 부적절하기 때문에, 결정부(820)는 깊이 영상만 이용하는 모드(Depth-only mode)로 카메라 포즈 추정 모드를 결정할 수 있다.

또 다른 예시적 장면(1030)은 칼라 텍스처도 풍부하고, 기하학적 복잡도도 높아, 결정부(810)가 칼라 영상 및 깊이 영상 사용 모드(Color and depth mode)로 카메라 포즈 추정 모드를 결정할 수 있다. 이러한 장면(1030)에서는 도 1 내지 도 7을 참조하여 설명한 실시예들에 의해, 깊이 정보 및 칼라 정보가 함께 고려되어 카메라 포즈 추정이 수행될 수 있다.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims

입력 깊이 영상 및 입력 칼라 영상 중 어느 하나인 제1 영상에 대해, 제1 프레임에 속하는 적어도 하나의 제1 포인트와 상기 제1 프레임과 상이한 제2 프레임에 속하는 적어도 하나의 제2 포인트를 매칭하여, 상기 제1 영상에 연관되는 카메라의 초기 포즈를 추정하는 추정부; 및

상기 입력 깊이 영상 및 상기 입력 칼라 영상 중 상기 제1 영상과 다른 하나인 제2 영상을 이용하여, 상기 초기 포즈를 개선하여 개선된 포즈를 제공하는 개선부

를 포함하는 카메라 포즈 추정 장치.
제1항에 있어서,

상기 추정부는, ICP(Iterative Closet Point) 기법을 이용하여 상기 적어도 하나의 제1 포인트와 상기 적어도 하나의 제2 포인트를 매칭하는 카메라 포즈 추정 장치.
제1항에 있어서,

상기 제1 영상은 상기 입력 깊이 영상에 대응하고, 상기 제2 영상은 상기 입력 칼라 영상에 대응하는 카메라 포즈 추정 장치.
제3항에 있어서,

상기 추정부는, 상기 입력 깊이 영상에 포함되는 포인트 클라우드 중 상기 제1 프레임에 속하는 상기 적어도 하나의 제1 포인트 및 상기 제2 프레임에 속하는 상기 적어도 하나의 제2 포인트를 선택하는 카메라 포즈 추정 장치.
제4항에 있어서,

상기 추정부는, 상기 포인트 클라우드 중 깊이 편차가 임계 편차 이하인 적어도 하나의 포인트를 상기 제1 프레임 및 상기 제2 프레임에서 선택하는 카메라 포즈 추정 장치.
제3항에 있어서,

상기 개선부는, 상기 적어도 하나의 제1 포인트의 주변의 제1 반경 내에 포함되는 제1 영역 내에서 상기 칼라 영상을 고려하여 상기 초기 포즈를 개선하는 카메라 포즈 추정 장치.
제6항에 있어서,

상기 제1 반경은 상기 적어도 하나의 제1 포인트의 깊이 값이 클수록 더 크게 설정되는 카메라 포즈 추정 장치.
입력 깊이 영상 및 입력 칼라 영상 중 적어도 하나의 특성을 분석 하여, 상기 입력 깊이 영상 및 상기 입력 칼라 영상에 연관되는 카메라의 포즈 추정 모드를 결정하는 결정부;

상기 결정되는 모드가 상기 입력 깊이 영상 및 상기 입력 칼라 영상을 모두 이용하는 포즈 추정에 대응하는 경우, 상기 입력 깊이 영상에 대해, 제1 프레임에 속하는 적어도 하나의 제1 포인트와 상기 제1 프레임과 상이한 제2 프레임에 속하는 적어도 하나의 제2 포인트를 매칭하여, 상기 제1 프레임과 상기 제2 프레임 간의 초기 포즈를 추정하는 추정부; 및

상기 입력 칼라 영상을 이용하여, 상기 적어도 하나의 제1 포인트 주변의 칼라 정보와 상기 적어도 하나의 제2 포인트 주변의 칼라 정보를 매칭하여, 상기 초기 포즈를 개선하여 개선된 포즈를 제공하는 개선부

를 포함하는 카메라 포즈 추정 장치.
제8항에 있어서,

상기 결정부는, 상기 입력 깊이 영상의 깊이 값으로부터 추출되는 깊이 특징점이 제1 임계치 이상이고 상기 입력 칼라 영상의 칼라 값으로부터 추출되는 칼라 특징점이 제2 임계치 이상인 경우, 상기 모드는 상기 입력 깊이 영상 및 상기 입력 칼라 영상을 모두 이용하는 포즈 추정에 대응하는 것으로 결정하는 카메라 포즈 추정 장치.
제8항에 있어서,

상기 개선부는, 상기 적어도 하나의 제1 포인트의 주변의 제1 반경 내에 포함되는 제1 영역 내에서 상기 칼라 영상을 고려하여 상기 초기 포즈를 개선하는 카메라 포즈 추정 장치.
제10항에 있어서,

상기 제1 반경은 상기 적어도 하나의 제1 포인트의 깊이 값이 클수록 더 크게 설정되는 카메라 포즈 추정 장치.
카메라 포즈 추정 장치의 추정부가, 입력 깊이 영상에 대해 제1 프레임에 포함되는 적어도 하나의 제1 포인트와 제2 프레임에 포함되는 적어도 하나의 제2 포인트를 ICP(Iterative Closet Point) 기법으로 1차 매칭하여 상기 입력 깊이 영상에 연관되는 카메라의 초기 포즈를 추정하는 단계; 및

상기 장치의 개선부가, 상기 입력 깊이 영상에 연관되는 입력 칼라 영상을 이용하여 상기 ICP 기법으로 2차 매칭하기 위해, 상기 제1 포인트를 포함하는 제1 영역의 제1 반경을 결정하는 단계 - 상기 2차 매칭은 상기 제1 영역 내의 칼라 특징 매칭을 이용하는 것임 -

를 포함하는 카메라 포즈 추정 방법.
제12항에 있어서,

상기 제1 반경은 상기 적어도 하나의 제1 포인트의 깊이 값이 클수록 더 크게 설정되는 카메라 포즈 추정 방법.
제12항에 있어서,

상기 장치의 결정부가, 상기 입력 깊이 영상으로부터 추출되는 깊이 특징 정보 및 상기 입력 칼라 영상으로부터 추출되는 칼라 특징 정보를 이용하여, 상기 카메라 포즈 추정을 위한 모드를 결정하는 단계

를 더 포함하는 카메라 포즈 추정 방법.
제12항에 있어서,

상기 적어도 하나의 제1 포인트 및 상기 적어도 하나의 제2 포인트는 깊이 분포를 고려한 신뢰도가 임계치 이상인 포인트에 대응하는 카메라 포즈 추정 방법.
제12항 내지 제15항 중 어느 한 항의 카메라 포즈 추정 방법을 수행하는 프로그램을 수록한 컴퓨터 판독 가능 기록 매체.