-
概述
本次实验采用多源遥感影像数据,结合ENVI遥感影像处理软件,建立面向对象决策树、自动阈值决策树的规则,实现决策树分类,并对分类结果做精度评价,最后将决策树分类方法与传统监督分类方法进行比较,简要分析了这两类分类方法的优劣。
-
分类方法
面向对象决策树分类,又称基于专家知识决策树分类,是根据遥感影像数据和其它空间数据,通过专家总结、统计方法和总结归纳等,获得决策树分类的规则并实现决策树分类。决策树能够利用多源遥感影像数据实现分类,其规则和分类过程也易于理解。实现面向对象决策树分类的步骤可为5步:分类对象识别、决策树规则建立、规则输入、运行和精度评定。其中最关键步骤就是分类对象识别及决策树规则建立。决策树规则的建立有多种方法,如专家经验总结、传统统计方法等。
自动阈值决策树分类方法是利用遥感影像数据及其他空间数据,通过选取训练集数据自动获得分类规则并进行遥感影像数据分类的一种分类方法。
监督分类,又称训练样本分类,是用已分类完成的类别样本像素去分类其它未知类别像素的过程。在分类之前通过目视解译和野外调查,对遥感影像上样地的影像地物类别进行明确的定义,其次根据分类类别选取一定量的训练样本,通过软件计算并统计训练样区的信息,同时用这些产生的类别判定方式对判决函数进行训练,使需要分类的子类别符合判断要求,随后用训练好的判决函数去对其它待分类数据进行分类。把每个像素与训练样本作比较,按不同的判断规则将其划分到相类似的样本类中,就可以完成对整个图像的监督分类。
-
技术路线
-
面向对象决策树分类
对于面向对象决策树分类,需要目视解译来选取分类对象的样本,采用 ENVI 软件提取对象分类类别的阈值,并用图像统计功能对选中的对象提取分类地物的阈值,运用解译人员对地物识别的经验制定决策树规则。最后,根据建立的规则对遥感影像进行分类。
本次分类对象的识别是以目视解译结果为依据,以中等分辨率影像(landsat8 影像)为例,不难看出,影像中城市地物具有良好的识别效果。先显示第 3 波段,可以明显看出有少量水体存在,采用 543波段组合,可以看出全图具有大量植被覆盖,采用 752 波段组合可以凭借植被将样地分为荒地和耕地这两类地物。在选择完水体(Water)、城市(Urban)、荒地(Waste land)和耕地(Arable land)这 4 类对象之后,需要确认样本的可分离度,通常情况下样本的可分离度不能低于1.8,当样本的可分离度低于1.8 时,需考虑是否将此样本归为其他类别,否则决策树规则会被影响。
建立规则的方法是根据目视解译的结果,在预处理后的影像中选取4类分类对象,并用感兴趣区域选取4 类分类对象样本,这 4 类对象分别为城市、耕地、水体、荒地。当样本数达到一定数量后,用图像统计功能统计各波段信息,并输出统计数值,保留各波段的均值来做数值统计,将提取的统计结果绘制折线图以便更直观地获取规则。两个地区分类阈值折线图如图2所示。
A地区分类阈值折线图
B地区分类阈值折线图
根据获得的各波段折线图来实现规则输入。由图2可知,b4波段4类分类对象有明显的区别,水体在b4波段的12000闭值以下,由此可优先建立分类水体和非水体的决策树规则定义,定义b4小于12000为第一个决策树分类规则;剩余的3类分类对象,可由b2波段进行分类,b2波段的植被处于一个闭值,分类中的耕地与荒地都属于植被这一类,因此可以用b2波段进行决策树分类,进而分类出城市类别;建立b2大于10000闭值这一个定义规则,就可以完成植被与非植被的决策树规则定义;采用b5波段将耕地与荒地区分开,建立b5小于并等于8400这一定义规则,即可分类出耕地与荒地,完成最后一步决策树分类。采用同样的方法完成图B地区的高分辨影像规则输入。
A地区原始影像与分类结果
B地区原始影像与分类结果
-
监督分类
为便于几种方法的分类结果比较,同样将A和B地区划分为城市、水体、荒地和耕地四类。选择具有代表性和典型性的样本点作为训练样本,并计算其可分离度,选择最大似然值法进行监督分类,结果如图所示。
A地区原始影像与分类结果
B地区原始影像与分类结果
-
自动阈值决策树分类
运用ENVI软件基于CART算法的决策树规则自动获取扩展工具RuleGen实现决策树规则的构建。首先,选择与面向对象决策树分类方法相应的样本,便于对分类结果进行效果比较。然后运用RuleGen模块运行决策树分类规则的定义,并显示出决策树,依次完成自动闭值决策树分类,结果如图所示。
A地区原始影像与分类结果
B地区原始影像与分类结果
-
精度评定
分类精度评价是先通过建立地面验证数据(Ground Truth)的混淆矩阵或误差矩阵(Confusion Matrix or Error Matrix)然后再计算各种分类精度的测度指标,如Kappa系数、分类总精度等来进行的。采用自定义的ROI区域进行分类精度评定。A地区三种分类方法精度评定结果如图所示,B地区三种分类方法精度评定结果如图所示。
A地区监督分类
A地区自动阈值决策树分类
A地区面向对象决策树分类
B地区监督分类
B地区自动阈值决策树分类
B地区面向对象决策树分类
从分类精度结果看,中等分辨率A地区影像分类中,传统分类方法比两种决策树分类方法分类总精度高,Kappa系数也远远高于两种决策树方法。A地区监督分类法的分类精度为82.8798%, Kappa系数为0. 7471;自动闭值决策树分类法的分类精度为71. 4095%, Kappa系数为0. 5689。
面向对象决策树分类法精度仅为26.4628%, Kappa系数只有0. 0124。在两种决策树方法中,面向对象决策树方法相对于自动闭值决策树方法有较高的分类精度和较好的分类效果,可以很清晰地目视地物类别。传统分类方法的精度在中等分辨率(A地区)影像分类中的分类效果均优于决策树分类方法,由于中等分辨率的影像分辨率较低,因此无法在面向对象决策树分类法的初期建立良好的决策树规则,所以会出现其分类结果不如传统的监督分类结果。
在高分辨率(B地区)影像分类中,面向对象决策树分类方法分类总精度和Kappa系数均比传统分类方法和自动闭值决策树分类方法高。B地区监督分类法的分类精度为87.3171%, Kappa系数为0. 6660;自动闭值决策树分类法的分类精度为63.9956%, Kappa系数为0. 3316;面向对象决策树分类法精度为91.9594%, Kappa系数为0. 7355。自动闭值决策树分类方法可能需要借助一些特征信息才能达到较高的精度,决策树分类法的结果优于传统监督分类法,特别是面向对象决策树分类法具有很高的分类精度,且能清晰的分类出地物。
更多遥感知识,请关注我的个人微信公众号:遥感加油站!