视觉SLAM中相机详解

视觉SLAM中，通常是指使用相机来解决定位和建图问题。

SLAM中使用的相机往往更加简单，不携带昂贵的镜头，以一定的速率拍摄周围的环境，形成一个连续的视频流。

相机分类：

单目相机：只是用一个摄像头进行SLAM的做法成为单目SLAM。

单目相机的数据就是照片，照片就是拍照时的场景在相机的成像平面上留下的一个投影，它以二维的形式反映了三维的世界，在这个过程中丢掉了一个维度即深度（距离）。我们无法通过单张照片计算场景中的物体与我们之间的距离。（照片：近小远大原理）

如果想要通过单目相机拍摄的照片恢复三维结构，必须改变相机的视角（移动相机，才能估计它的运动和场景中物体的远近与大小）。

通过移动，我们知道“近处的物体移动快，远处的物体移动慢”从而得知物体的远近，但这仍然是相对值。

单目SLAM无法仅凭图像确定物体的真实尺寸。即尺度不确定性。

平移之后，可以计算深度，但无法确定真实尺寸。这给单目SLAM的应用造成了很大的麻烦。

双目相机：有两个摄像头，由两个单目相机组成（两个相机之间的距离叫“基线”是已知的），通过这个基线（进行大量计算并且是不太可靠的）来估计每个像素的空间位置来测量物体与我们之间的距离，客服单目相机无法知道距离的缺点。

双目相机测量到的深度范围和基线有关，基线距离越大，能够测量到的就越远。可用于室内也可用于室外。

缺点：配置与标定较为复杂，其深度和精度受双目的基线或者分辨率所限，并且视差的计算非常消耗计算机资源，在现有的条件下，计算量是双目的主要问题之一。

RGB-D（深度相机）：携带多个摄像头，可以采集到彩色图片，还可以读出每个像素与相机之间的距离。

最大的特点：可以通过红外结构光或Time-of-Flight原理，像激光传感器那样，通过主动向物体发射光并接收返回的光，测量物体与相机之间的距离。这是通过物理测量的方法来计算距离，相比双目相机通过软件计算距离来说深度相机可以节省大量的时间。

缺点：大多数深度相机的测量范围窄，噪声大，视野小，易受日光干扰，无法测量投射材质等。

在SLAM中，主要用于室内，室外则较难应用。

在相机的运动过程中，我们可以得到一些列连续变化的图像，视觉SLAM的目标就是通过这样的图像进行定位和地图重建。SLAM需要一个完善的算法框架，现在框架已经相对成熟了。

秒客网