一、引言(What):矢量数据的空间分析
空间分析是综合分析空间数据技术的统称,是地理信息系统的核心部分,在地理数据的应用中发挥着举足轻重的作用。从数据类型上看,空间分析分为矢量数据的空间分析和栅格数据的空间分析两种。
GIS不仅能满足使用者对地图的浏览与查看,而且可以解决诸如哪里最近、周围有什么等有关地理要素位置和属性的问题,这些都需要利用矢量数据的分析功能。
与栅格数据的空间分析相比较,矢量数据的空间分析有自身的特性 ①一般不存在模式化的处理方法;②表现为分析方法的多样性和复杂性,它主要基于点、线、面三种基本形式。
二、矢量数据的空间分析方法(How to)
①数据提取:
数据提取(extract):在给定的要素类中,依据空间或属性条件,通过数据裁剪(Clip)、分割、筛选和表筛选等操作,提取所需要的内容。
数据裁剪:
分割:
数据分割(split)是按照分割区域将输入要素类分割成多个输出要素类;
数据分割首先要确定分割区域数据。分割区域数据是由一个多边形要素类来确定的,且这个要素类必须由文本型字段值来定义分割区域,该字段被称为拆分字段。
注意事项:a) 分割要素必须是面:
b) 拆分字段数据类型必须是文本型;
c)拆分字段的唯一值必须以有效字符开头。如果目标工作空间是文件地理数据库、个人地理数据库或ArcSDE地理数 据库,则字段值必须以字母开头。
d)输出要素类的总数等于拆分字段唯一值的数量,其范围为输入要素与分割要素的叠加部分。
e)每个输出要素类的要素属性表所包括的字段必须与输入要素属性表中的字段相同。
筛选:
筛选(select)是从输入要素类中提取满足指定条件的要素,并将其存储为输出要素类中的过程。通常使用SQL表达式表示提取条件:
或者利用【查询构建器】对话框构建,在【查询构建器】对话框中,设置筛选要素的SQL语句,单击【确定】按钮,返回【筛选】对话框。若表达式为空,表示不指定筛选条件,即将全部输入要素保存到输出要素类中。
表筛选(table select)是从表格或表格视图中筛选出满足指定属性条件(或表达式)的记录或要素,并将其保存在一个新输出表的过程。输入表可以是INFO表格、dBASE表格、Geodatabase表格、要素类或者表格视图。如果输入表为要素类,那么输出表就是要素类的属性表中只包含满足属性条件(或表达式)的记录。
②统计分析:
统计(statistics)分析用于对表格或者属性表进行统计计算,如频率、平均值、最小值、最大值和标准差等。在实际应用中,统计分析常用来探索数据。例如,检查特定属性值的分布或者查找异常值(极高值或极低值)。统计分析的另一个用途是汇总数据,通常按照类型进行汇总,如分别计算每种土地利用类型的面积等。
通过汇总数据可以更好地了解研究区域的情况。统计分析工具集包含两个工具:频数工具和汇总统计数据工具。
频数(frequency):
是指在表格或者图层的属性表中,某个属性值或者属性值组合出现的次数。频数工具的主要作用是读取表格中的一组字段,计算字段的每个唯一值出现的频数,并创建一个包含唯一字段及其频数的新表。
(1)
(2) ArcGIS10.4 统计分析模块中,添加了一项交集制表模块。
(3)
(4) 输出结果中的FREQUENCY字段记录的是土地利用类型的唯一值频数。其结果为:城市用地1块、旱地3块、水田2块、水域1块、未利用地2块。另外频数操作还可以完成更复杂的统计,如统计每个区域的每一种土地利用类型的面积各是多少,即A、B、C三个区域内的城市用地、旱地、水田、水域和未利用地的面积各是多少,各有多少块等。可以先用【频数】工具,指定【频数字段】为“土地类型”和“所在区域”,在【汇总字段(可选)】中选择“面积”为求和字段。
频数统计对面积求和的结果
汇总统计数据(summary statistics):对输入表格中的字段进行汇总计算,输出结果为表格,表格由包含统计运算结果的字段组成。在输出表格中,使用“统计类型_字段名称”命名约定来为每种统计类型创建字段,可用的统计类型。
交叉制表: (新知识点)
计算两个要素类之间的交集并对相交要素的面积、长度或数量进行交叉制表。
用法
-
区域由输入区域要素中区域字段值相同的所有要素组成。同样,类由输入类要素中类字段值相同的所有要素组成。在同一区域或类中要素不必相连。此工具用于按每个类计算相交区域的大小(面积和区域面积百分比)。
-
如果未指定类字段,输入类要素内的所有要素都将被视为单个类。输出表对每一区域都将包含一条记录。
-
如果已指定类字段,则输出表将包含各区域的 n 条记录,其中 n 表示该区域内类的数目。例如,如果某个区域包含四个类,则输出表中对于该区域将有四条记录。
-
使用求和字段参数可按区域对输入类要素的数值属性进行求和。类的总和值表示总和值基于类与区域相交的百分比的比例(类似于比率策略的工作原理)。
-
警告:
只应将具有绝对值(百分比或密度等非相对的正态值)的字段用作求和字段,因为可对这些值进行分割或将其分配到不同区域。
-
不支持使用比输入区域要素的维度更高的输入类要素。不支持的组合:
- 区域 = 点,类 = 面或线
- 区域 = 线,类 = 面
-
当输入区域要素和输入类要素都为面时,输出表将基于面积计算的结果进行统计。
当输入类要素为线时,输出表将基于线性计算的结果进行统计。
当输入类要素为点时,输出表将基于要素计数进行统计。
-
当输入区域要素和输入类要素具有相同的维度(同为面、同为线或同为点)时,输出“百分比”字段记录区域要素与类相交的百分比。
如果输入区域要素和输入类要素具有不同的维度(面区域具有线类、面区域具有点类或线区域具有点类),则输出“百分比”字段记录类与区域面相交的百分比。
如果输入区域要素或输入类要素中存在重叠要素,则“百分比”字段中要记录的百分比值可能大于 100%。
-
当输入区域要素和输入类要素为面时,输出表中仅包括“面积”字段。“面积”字段包含输入区域要素与输入类要素相交的面积。
当输入类要素为线时,输出表中包括“长度”字段。“长度”字段包含输入区域要素和输入类要素之间相交的长度。
当输入类要素为点时,输出表中包括 PNT_COUNT 字段。PNT_COUNT 字段包含输入类要素点与输入区域要素相交的次数计数。
-
使用要素图层时,如果选中了任何要素,则计算中将只使用选中的要素。
-
确定区域和类要素的相交部分所遵循的规则与相交工具的规则相同。
-
使用数据透视表工具可将输出表转换成包含每个区域的一条记录并将类属性作为单独的属性字段的表。按下列方式填充数据透视表工具的参数:
- 输入表 - 制表交集 输出表
- 输入字段 - 制表交集区域字段
- 透视表字段 - 制表交集类字段
- 值字段 - 制表交集求和字段或面积、长度、百分比。
③缓冲区分析:(buffer analysis)
为了识别某一地理实体对周围地物的影响而在其周围建立的一定宽度多边形区域。
缓冲区分析是用来确定不同地理要素的空间邻近性或接近程度的一种分析方法。
作为GIS的空间分析功能之一,缓冲区分析的应用非常广泛,常用于分析矢量实体的某种属性对周围的影响。如:城市中工厂排放的废水废气所影响的空间范围,交通噪音污染影响的空间范围,湖泊对周围耕地的影响等,可以分别描述为点、线、面的缓冲区。
缓冲区buffer
缓冲区是围绕地理要素一定宽度的区域,这个宽度称为缓冲距离。地理要素通常抽象为点、线、面。因此,缓冲区分析主要基于点、线和面进行。
从空间变换的观点来看,缓冲区分析就是将点、线、面状地物分布图变换为这些地物的扩展距离图,图上每一点的值代表离该点最近的某种地物的距离。
空间目标主要是点目标、线目标和面目标,以及点目标、线目标和面目标组成的复杂目标。因此,空间目标的缓冲区分析包括点目标缓冲区、线目标缓冲区、面目标缓冲区和复杂目标缓冲区。
轴线:
轴线是线目标坐标点的有序串构成的迹线,或面目标的有向边界线。沿轴线前进方向的左侧和右侧分别称为轴线的左侧和右侧。
多边形的方向
若多边形的边界为顺时针方向,则称为正向多边形,否则称为负向多边形。
缓冲区的外侧和内侧
位于轴线左侧的缓冲区称为缓冲区的外侧,反之为内侧。
轴线的凹凸性
对于轴线上的顺序三点P1,P2,P3。用右手螺旋法则,若拇指朝里,则中间点是凸的;若拇指朝外,中间点是凹的。
缓冲区算法(略)
缓冲区建立:
ArcGIS 中缓冲区的建立有两种方法:一种是用缓冲区向导建立,另一种是用缓冲区工具建立。点、线、面要素的缓冲区建立过程基本一致。在此以线状要素的缓冲区建立的方法和步骤。
①利用缓冲区向导建立缓冲区:
1)在ArcMap窗口中,单击【自定义】→【自定义模式】,打开【自定义】对话框,切换到【命令】选项卡。
2)在【命令】选项卡中,选择【类别】列表框中的【工具】,然后在【命令】列表框中选择【缓冲向导】,按住鼠标左键不放将其拖动到已经存在的工具栏中。
3)点击工具栏中缓冲区向导
① 使用选择工具选择要素要建立缓冲区的要素
② 单击缓冲区要素向导图标,打开【缓冲向导】对话框
③选中【图层中的要素】单击按钮,并在下拉框中选择建立缓冲区的图层。
④ 在【如何创建缓冲区】区域中,有三种建立缓冲区的方式。
⑤在【缓冲区输出类型】区域中,选择缓冲区输出的类型
⑥ 完成设置后,单击【完成】按钮,完成使用缓冲区向导建立缓冲区的操作。
②使用缓冲区工具建立缓冲区
5)多环缓冲区(省略)
点距离:
点距离(point distance)工具是在指定的搜索半径内,分析一个图层或要素类内的点与其他图层上所有点的距离。
近邻分析:
近邻(near)分析工具是在指定的搜索半径内,对于输入要素类中的每个要素,在近邻要素类中找出与其距离最近的要素,并计算器距离。
(1) 近邻分析之前
(2)近邻分析
(3)近邻分析之后(注意属性表的变化)
④叠加分析(overlay)
叠加分析是地理信息系统提取空间隐含信息常用的手段之一,它是在统一的空间参考系统下,通过对不同的数据进行一系列的集合运算,产生新数据的过程。
叠加分析的目的是在空间位置上分析具有一定关联的空间对象的空间特征和专属属性之间的相互关系。
从运算角度看,叠加分析是指两个或两个以上的地理要素图层进行空间逻辑的交、并、差的运算。
根据操作形式的不同,叠加分析可以分为擦除分析、相交分析、联合分析、标识分析、更新分析、交集取反和空间连接等七类。
擦除分析
擦除(erase)分析是在输入数据层中去除与擦除数据层相交的部分,形成新的矢量数据层的过程。
输入要素 :
擦除图层:
输出图层:
相交分析:是计算输入要素的几何交集的过程。由于点、线、面要素都可以进行相交操作,因此相交分析的情形可以分为7类:多边形与多边形、线与多边形、点与多边形、线与线、线与点、点与点、还有点、线、面三者相交。
联合分析:是计算输入要素的并集,所有的输入要素都将写入到输出要素类中。在联合分析过程中,输入要素必须是多边形。
空间连接:(spatical join)是基于两个要素类中要素之间的空间关系将属性从一个要素类传递到另一个要素类的过程。也就是说,两个图层之间根据图层之间根据图层中要素的相对位置关系建立连接,其结果为将一个图层的属性表添加到另一个图层中。
⑤泰森多边形
泰森多边形(thiessen polygon)是进行快速插值和分析地理实体影响区域的常用工具。判断一个离散点与其他哪些离散点相邻时,可根据泰森多边形直接导出,且若泰森多边形是n变形,则就与n个离散点相邻。
当某一数据点落入某一泰森多边形中时,它与相应的离散点最邻近,无需计算距离。
泰森多边形可用于定性分析、统计分析和邻近分析等。
泰森多边形有如下特性:
(1) 泰森多边形内仅含有一个离散点数据;
(2)泰森多边形内的点到相应离散点的距离最近;
(3)位于泰森多边形边上的点到其两边的离散点距离相等。
泰森多边形的构建方法:
三、矢量数据空间分析的应用
(1)数据
(2)待寻找地区的区位条件为:
(1)离城市主要交通线路50m以内,以保证商场交通的通达性;
(2)保证在居民区100m范围内,便于居民步行到达商场;
(3)距停车场100m范围内,便于顾客停车;
(4)距已经存在的商场500m范围之外,减少竞争压力。
(3) 操作步骤
(4)叠加分析,求出同时满足四个要求的区域
①首先获取同时满足三个条件的区域
② 求取同时满足四个条件的区域
(5)对整个城市商场的区位条件进行评价
对整个城市的商场区位进行评价分级。
分级标准为:四个条件都满足的为第一等级;
满足三个条件的为第二等级;
满足两个条件的为第三等级;
满足一个条件的为第四等级;
完全不满足条件的为第五等级;
第一步:属性赋值
分别在停车场的缓冲区、主要交通线路的缓冲区、居民地的缓冲区的属性列表分别添加“stops”、“mainstreet”和“resdentia”字段,并且全部赋值为1‘;
在商场缓冲区的属性列表,添加“markets”字段,赋值为-1.因为已存在商场缓冲区之外的区域才是满足要求的。
第二步、区域叠加
第三步:分级;
第四步:应用“class”字段进行分级显示