【读论文】2018-机载LiDAR 点云数据降维与分类的随机森林方法

时间:2021-10-16 00:55:20


摘要

考虑到现有的点云分类算法在提取依赖结构的特征参数时面临邻域尺度的选择难、数据维度高、计算复杂,并且缺乏对分类特征参数的重要性评估和选择等问题。

  • 选取了归一化高度、高度统计量、表面特征、空间分布特征、回波特性、强度特征6大类特征参数,并构建多尺度特征参数
  • 使用随机森林的特征选择算法对分类特征进行优化,然后进行点云分类

实验表明,归一化高度特征在点云分类中所起作用最大

归一化高度

  • 基于布料模拟算法对点云构建栅格化的DTM模型。点云中的某一点到该点投影所在的DTM栅格内的高程之差就是该点的归一化高度,如图所示。(来自论文,侵删)

    该特征在区分地面点和非地面点方面具有很好的效果,如建筑物离地面的高度通常较高且比较有规律,而其他地物的高度特征则比较复杂

高程统计特征

  • 高程极差
  • 高程标准差
  • 高程峰度
  • 高程偏度

表面相关特征

  • 平面粗糙度
  • 平面极差
  • 平面标准差
  • 平面法向量与竖直方向的夹角

空间分布特征

  • 空间分布特征主要描述当前点在邻域内服从一维、二维、三维空间分布的程度。如图所示。

基于随机森林的特征选择

  • 为了删除冗余特征

优化计算方法

  • 为了提高空间查询的效率,采用八叉树结构进行点云数据的存储和空间查询优化。
  • 为了减少随机森林分类器的训练或者测试时间,在训练或分类之前先对训练与测试样本进行抽稀(空间均匀采样),利用采样后的样本进行训练和进行预测,对采样前的点云根据空间最近邻原则决定,这样就实现了对原始数据的分类。将测试样本点的类别按照空间最近邻原则赋给去噪点云时,涉及最近邻查询,本文采用的是==KD(k-dimension)==树来提高最近邻点的搜索效率。

精度评价

  • 混淆矩阵
  • 总体精度(OA)
  • Kappa系数

    其中,N是点云总数;nii代表对角线上的总点数;ni表示第i行的总点数;ni代表第i列的总点数。