从零开始一起学习SLAM | 学习SLAM到底需要学什么?

时间:2022-10-02 11:28:48

SLAM涉及的知识面很广,我简单总结了 “SLAM知识树” 如下所示:

从零开始一起学习SLAM | 学习SLAM到底需要学什么?

(公众号菜单栏回复 “树” 可获得清晰版)

可以看到涉及的知识面还是比较广的。这里放出一张SLAM圈子里喜闻乐见的表达悲喜交加心情的漫画图,大家可以感受一下:

从零开始一起学习SLAM | 学习SLAM到底需要学什么?

每个学SLAM的小伙伴可以说都是冒着“头顶凉凉”的巨大风险,勇气可嘉。下面结合SLAM知识树展开具体说说。

编程环境
首先先说电脑环境和编程。

1、电脑环境:Linux环境,推荐Ubuntu16.04。

有人问Windows行不行?这么说吧,如果你是一位SLAM领域的大牛,并且具有超强的解决bug能力,你可以用Windows,否则,非常不建议在Windows下编译,因为你早晚会被各种依赖库,各种bug搞崩溃的。而且大部分的SLAM开源代码都在Linux环境下编译,很多第三方依赖库在Linux下可以非常方便的安装。

如果之前没有接触过Ubuntu的,也不用担心。刚开始用命令行界面可能不太习惯,慢慢习惯后就会发现Linux的内在美。所以要学SLAM就先装一个Ubuntu系统吧,如果电脑本身是Windows系统,建议装双系统,不要装虚拟机。学习Linux的话,就看那本经典的书:《鸟哥的Linux私房菜》吧,书的内容比较多,建议先学习一下基本的文档操作指令。可以快速浏览一遍,不需要死记,以后用到了再去查就行。这书的作者鸟哥有个网站也可以查命令,挺方便的:

http://cn.linux.vbird.org/linux_basic/1010index.php

2、编程相关

编程语言:

主要是C++。推荐红宝书《C++ Primer》。内容非常多而全。如果是初学者没那么多时间学一遍,就重点选择前几章基础看看,动手敲一敲代码。然后了解后面几章常用的数据结构和C++的一些特性(重载、多态、继承)等。有时候也需要会一些python,网上资料很多,不多说。

集成开发环境:

CLion(用edu结尾邮箱可以申请免费使用一年)、kdevelop(免费),个人觉得前者好用一点。

编译工具:

cmake。统一使用cmake编译,好处很多,比如代码可以很方便的跨平台使用等。使用起来也很方便。有个小册子《CMake practice》照着学一下。

文档编辑:

有很多,比如gedit、Nano、vim等。

第三方函数库:

使用到的第三方库主要包括:OpenCV(计算机视觉),OpenGL(计算机图形学),Eigen(几何变换),Sophus(李代数),Ceres(非线性优化),G2o(图优化)等。

数学

从零开始一起学习SLAM | 学习SLAM到底需要学什么?

主要是大学里学的:线性代数、概率论和微积分。虽然很多人大学里学的早都还给老师了,不过也不用太担心,SLAM里也不需要非常难的数学问题。主要包括:

矩阵的性质。比如矩阵乘法、求逆、矩阵分解(SVD,QR,Cholesky)、反对称矩阵等。

李群李代数。这个可能很多人以前没接触过,也是挺重要的,不过高翔的十四讲里也讲的比较详细了,仔细推一下公式。

非线性优化问题。比如梯度下降、牛顿法、高斯-牛顿法、LM算法、bundle adjustment等。

此外,还有泰勒展开,求(偏)导,积分等。

计算机视觉相关
SLAM里涉及很多图像处理、计算机视觉知识,总结一下主要有:

相机相关:单目、双目、RGB-D等相机的物理参数意义、相机成像模型、相机的标定、去畸变等。双目的话还涉及到视差计算,RGB-D的话涉及到RGB和depth图像的对齐等。

图像处理相关。比如和特征点相关的有:特征点描述子、特征点提取、特征点匹配。图像梯度计算、边缘检测、直线检测等。

多视角几何相关。比如对极约束、本质矩阵、单应矩阵、光流估计、三角化等。

从零开始一起学习SLAM | 学习SLAM到底需要学什么?

英语
学习SLAM必须具备一定的英语阅读能力。因为SLAM相关的大部分资料(论文、书籍、技术文档等)都是英文的。不过即使英文不好也不用太担心,利用好查单词软件,遇到不认识的 就去查,时间长了也就都混的“脸熟”了,英语阅读速度和理解能力也会逐渐提升。

开源代码
虽然SLAM比较难,但是令人欣慰的是,SLAM领域有很多优秀的开源代码可以学习。列举几个主流的如下:

稀疏法:

ORB-SLAM2:支持单目,双目,RGB-D相机

https://github.com/raulmur/ORB_SLAM2

半稠密法:

LSD-SLAM:支持单目,双目,RGB-D相机

https://vision.in.tum.de/research/vslam/lsdslam

DSO:单目

https://vision.in.tum.de/research/vslam/dso

稠密法

Elastic Fusion:RGB-D相机

https://github.com/mp3guy/ElasticFusion

BundleFusion:RGB-D相机

https://github.com/niessner/BundleFusion

RGB-D SLAM V2:RGB-D相机

https://github.com/felixendres/rgbdslam_v2

多传感器融合:

VINS:单目 + IMU(惯性测量单元)

https://github.com/HKUST-Aerial-Robotics/VINS-Mono

OKVIS:(单目、双目、四目)+ IMU

https://wp.doc.ic.ac.uk/sleutene/2016/02/04/release-of-okvis-open-keyframe-based-visual-inertial-slam/

数据集
主要列举几个主流的数据集

1、TUM RGB-D SLAM Dataset and Benchmark

从零开始一起学习SLAM | 学习SLAM到底需要学什么?

德国慕尼黑理工大学计算机视觉组制作的数据集,使用Kinect相机采集的数据集,包括IMU数据,并且用高精度运动采集系统提供了groundtruth(真值)。提供测试脚本,可以方便的实现量化评估。

https://vision.in.tum.de/data/datasets/rgbd-dataset

2、KITTI Vision Benchmark Suite

从零开始一起学习SLAM | 学习SLAM到底需要学什么?

德国卡尔斯鲁厄理工学院和丰田工业大学芝加哥分校一起合作制作的用于自动驾驶的数据集。

使用一辆改装的汽车采集,该车配备了两台高分辨率彩色和灰度摄像机,还有Velodyne激光扫描仪和GPS定位系统,用来提供精确的groundtruth。主要采集区域是卡尔斯鲁厄市区、农村地区和高速公路。提供测试脚本可以方便的实现量化评估。

http://www.cvlibs.net/datasets/kitti/

3、EuRoC MAV Dataset

从零开始一起学习SLAM | 学习SLAM到底需要学什么?

苏黎世联邦理工大学制作的数据集,采用装备了双目相机和IMU的四旋翼无人机采集数据,使用高精度运动采集系统提供了groundtruth。提供测试脚本,可以方便的实现量化评估。

https://projects.asl.ethz.ch/datasets/doku.php?id=kmavvisualinertialdatasets

作业
题目1

我们知道SLAM是处理序列图像的,有时候需要格式化的图像名字用作输入。前面提到的TUM的RGB-D数据集中图像是根据时间命名的,请从下面链接下载数据集fr1/desk

https://vision.in.tum.de/data/datasets/rgbd-dataset/download#

并解压。请编程实现将文件夹/rgb下以时间命名的序列图片重新命名为0000-9999的格式。

本程序学习目的:

熟悉cmake的使用、OpenCV读写操作、C++的string操作

题目2

已知相机的位姿用四元数表示为q=[0.35,0.2,0.3,0.1],顺序为x,y,z,w,请编程实现:

输出四元数对应的旋转矩阵、旋转矩阵的转置,旋转矩阵的逆矩阵,旋转矩阵乘以自身的转置,验证旋转矩阵的正交性。

本程序学习目的:

熟悉cmake的使用、学习eigen的基本操作;根据实践验证旋转矩阵的约束

下图是用于参考的代码框架:

从零开始一起学习SLAM | 学习SLAM到底需要学什么?

参考输出如下,用于验证结果。

从零开始一起学习SLAM | 学习SLAM到底需要学什么?

欢迎留言讨论,或者在公众号:计算机视觉life菜单栏进入知识星球「从零开始学习SLAM」一起学习交流(有参考答案)~

相关阅读
从零开始一起学习SLAM | 为什么要学SLAM?

零基础小白,如何入门计算机视觉?

原文链接更精彩:从零开始一起学习SLAM | 学习SLAM到底需要学什么?
---------------------
作者:electech6
来源:CSDN
原文:https://blog.csdn.net/electech6/article/details/82597882
版权声明:本文为博主原创文章,转载请附上博文链接!

从零开始一起学习SLAM | 学习SLAM到底需要学什么?的更多相关文章

  1. slam学习资源

    从零开始学slam: http://blog.csdn.net/akunainiannian/article/details/45363731 史上最全的SLAM学习资料收集  http://www. ...

  2. ROS_RGB-D SLAM学习笔记--室内环境测试

    ROS_RGB-D SLAM学习笔记 RTAB-Map's ros-pkg. RTAB-Map is a RGB-D SLAM approach with real-time constraints. ...

  3. SLAM学习笔记(1)基本概念

    SLAM (simultaneous localization and mapping),也称为CML (Concurrent Mapping and Localization), 即时定位与地图构建 ...

  4. SLAM学习笔记 - ORB_SLAM2源码运行及分析

    参考资料: DBow2的理解 单目跑TUM数据集的运行和函数调用过程 跑数据集不需要ros和相机标定,进入ORB_SLAM目录,执行以下命令: ./Examples/Monocluar/mono_tu ...

  5. IT人的自我导向型学习:学习的4个层次

    谈起软件开发一定会想到用什么技术.采用什么框架,然而在盛行的敏捷之下,人的问题逐渐凸显出来.不少企业请人来培训敏捷开发技术,却发现并不能真正运用起来,其中一个主要原因就是大家还没有很好的学习能力.没有 ...

  6. IT人的自我导向型学习:学习的3个维度

    看到大家对我的文章赞了不少,看来大家还比较喜欢看.园子里的一些朋友和我说:”终于又看到你要在园子里发原创文章了.几年前就受益匪浅,经过几年的成长分享来的东西肯定也是精品.“ 感谢大家对我的信任,如果你 ...

  7. 深度学习-tensorflow学习笔记(1)-MNIST手写字体识别预备知识

    深度学习-tensorflow学习笔记(1)-MNIST手写字体识别预备知识 在tf第一个例子的时候需要很多预备知识. tf基本知识 香农熵 交叉熵代价函数cross-entropy 卷积神经网络 s ...

  8. 这几天开始,先学习一些 java 基础吧,学的有点累

    这几天开始,先学习一些 java 基础吧,学的有点累

  9. Deep Learning(深度学习)学习笔记整理系列之(五)

    Deep Learning(深度学习)学习笔记整理系列 zouxy09@qq.com http://blog.csdn.net/zouxy09 作者:Zouxy version 1.0 2013-04 ...

随机推荐

  1. SQL/T-SQL实例参考

    ,D.[Score] B_Score ,'Distince'= CASE WHEN C.Score > D.Score THEN C.[Score] - D.[Score] WHEN C.Sco ...

  2. AX2012导Demo数据

    看到这篇文章后http://www.cnblogs.com/duanshuiliu/archive/2012/07/18/2597645.html,为了大家的方便就分享下 关于AX2012的导Demo ...

  3. mobaxterm ssh command

    ssh -qTfnNg -D 7070 demouser@echo.supportedns.com -p 2233

  4. CentOS 7 firewalld使用简介

    1.firewalld简介 firewalld是centos7的一大特性,最大的好处有两个:支持动态更新,不用重启服务:第二个就是加入了防火墙的“zone”概念   firewalld有图形界面和工具 ...

  5. 【转】关于oracle with as用法

    原文链接:关于oracle with as用法 with as语法–针对一个别名with tmp as (select * from tb_name) –针对多个别名with   tmp as (se ...

  6. PageHeap,调试Heap问题的工具

    <Windows用户态程序高效排错>第二章主要介绍用户态调试相关的知识和工具.本文主要讲了PageHeap,调试Heap问题的工具. AD:51CTO学院:IT精品课程在线看! 2.4.2 ...

  7. presto 函数中使用子查询

    我们已知 在sql中子查询可以配合  in 或者 exists 来使用,但是如何把子查询的结果传给函数呢? 场景: 我们有一个  省份表  数据如下: id   province 1    广东 2  ...

  8. K8S学习笔记之二进制部署Kubernetes v1&period;13&period;4 高可用集群

    0x00 概述 本次采用二进制文件方式部署,本文过程写成了更详细更多可选方案的ansible部署方案 https://github.com/zhangguanzhang/Kubernetes-ansi ...

  9. android&lowbar;双击退出

    /** * 设置高速双击退出程序 */ @Override public boolean onKeyDown(int keyCode, KeyEvent event) { // TODO Auto-g ...

  10. myql update from 语句

    (6)UPDATE 语句与 SELECT 语句中的 TOP 子句一起使用对来自表 authors 的前十个作者的 state 列进行更新 UPDATE authors SET state = 'ZZ' ...