第三章 GIS数据的获取与处理
第一节 GIS数据的获取
数据获取就是运用各种技术手段,通过各种渠道收集数据的过程。服务于GIS的数据获取工作包括两方面内容:空间数据的获取和属性数据的获取,它们在过程上有很多不同,但也有一些具体方法是相通的。空间数据获取的方法主要包括野外数据获取、现有地图数字化、摄影测量方法、遥感图像处理方法等。属性数据获取包括获取及获取后的分类和编码,主要是从相关部门的观测、测量数据、各类统计数据、专题调查数据、文献资料数据等渠道获取。
一、空间数据的获取
(一)野外数据获取
野外数据获取是GIS数据采集的一个基础手段。对于大比例尺的城市GIS而言,野外数据获取更是主要手段。
1.平板测量
平板测量获取的是非数字化数据。虽然现在已不是GIS野外数据获取的主要手段,但由于它的成本低、技术容易掌握,少数部门和单位仍然在使用。平板仪测量包括小平板测量和大平板测量,测量的产品都是纸质地图。在传统的大比例尺地形图的生产过程中,一般在野外测量绘制铅笔草图,然后用小笔尖转绘在聚酯薄膜上,之后可以晒成蓝图提供给用户使用。当然也可以对铅笔草图进行手扶跟踪或扫描数字化使平板测量结果转变为数字数据,如图3-1所示。
2.全野外数字测图
全野外数据采集设备是全站仪加电子手簿或电子平板配以相应的采集和编辑软件,作业分为编码和无码两种方法。数字化测绘记录设备以电子手簿为主。还可采用电子平板内外业一体化的作业方法,即利用电子平板(便携机)在野外进行碎部点展绘成图。
全野外数据采集测量工作包括图根控制测量、测站点的增补和地形碎部点的测量。采用全站仪进行观测,如图3-2所示,用电子手簿记录观测数据或经计算后的测点坐标。每一个碎部点的记录,通常有点号、观测值或坐标,除此以外还有与地图符号有关的编码以及点之间的连接关系码。这些信息码以规定的数字代码表示。信息码的输入可在地形碎部测量的同时进行,即观测每一碎部点后按草图输入碎部点的信息码。地图上的地理名称及其他各种注记,除一部分根据信息码由计算机自动处理外,不能自动注记的需要在草图上注明,在内业通过人机交互编辑进行注记。
全野外空间数据采集与成图分为三个阶段:数据采集、数据处理和地图数据输出。数据采集是在野外利用全站仪等仪器测量特征点,并计算其坐标,赋予代码,明确点的连接关系和符号化信息。再经编辑、符号化、整饰等成图,通过绘图仪输出或直接存储成电子数据。数据采集和编码是计算机成图的基础,这一工作主要在外业完成。内业进行数据的图形处理,在人机交互方式下进行图形编辑,生成绘图文件,由绘图仪绘制地图。
图3-1 平板测量
图3-2 全站仪数据采集
通常工作步骤为:先布设控制导线网,然后进行平差处理得出导线坐标,再采用极坐标法、支距法或后方交会法等,获得碎部点三维坐标。
3.空间定位测量
空间定位测量也是GIS空间数据的主要数据源。目前,常用的空间定位系统主要有美国的全球定位系统(Global Positioning System,GPS),俄罗斯的GLONASS全球导航卫星系统,以及欧洲的伽利略(GALILEO)导航卫星系统。我国的北斗导航卫星系统也在逐步完善之中,它必将给我国用户提供快速、高精度的定位服务,也必将给我国范围内GIS空间数据提供更为丰富、高效的空间定位数据。
GPS自其建立以来,因其方便快捷和较高的精度,迅速在各个行业和部门得到了广泛的应用。它从一定程度上改变了传统野外测绘的实施方式,并成为GIS数据采集的重要手段,在许多应用型GIS中都得到了应用,如车载导航系统。GPS接收机如图3-3所示。
图3-3 GPS接收机
(二)地图数字化
地图数字化是指根据现有纸质地图,通过手扶跟踪或扫描矢量化的方法,生产出可在计算机上进行存储、处理和分析的数字化数据。
1.手扶跟踪数字化
早期,地图数字化所采用的工具是手扶跟踪数字化仪,见图3-4。这种设备是利用电磁感应原理,当使用者在电磁感应板上移动游标到图件的指定位置,按动相应的按钮
图3-4 手扶跟踪数字化
时,电磁感应板周围的多路开关等线路可以检测出最大信号的位置,从而得到该点的坐标值。这种方式数字化的速度比较慢,工作量大,自动化程度低,数字化精度与作业员的操作有很大关系,所以目前已基本上不再采用。
2.扫描矢量化
随着计算机软件和硬件价格降低,并且提供了更多的功能,空间数据获取成本成为GIS项目中最主要的成分。由于手扶跟踪数字化需要大量的人工操作,使得它成为以数字为主体的应用项目瓶颈。扫描技术的出现无疑为空间数据录入提供了有力的工具。
常见的地图扫描处理的过程如图3-5所示。由于扫描仪扫描幅面一般小于地图幅面,因此大的纸地图需先分块扫描,然后进行相邻图对接;当显示终端分辨率及内存有限时,拼接后的数字地图还要裁剪成若干个归一化矩形块,对每个矩形块进行矢量化(Vectorization)处理后生成便于编辑处理的矢量地图,最后把这些矢量化的矩形图块合成为一个完整的矢量电子地图,并进行修改、标注、计算和漫游等编辑处理。
图3-5 地图信息处理流程图
(三)摄影测量方法
摄影测量是指根据在飞行器上拍摄的地面像片,获取地面信息,测绘地形图。摄影是快速获取地理信息的重要技术手段,是测制和更新国家地形图以及建立地理信息数据库的重要资料源。摄影测量技术曾经在我国基本比例尺地形图生产过程中扮演了重要角色,我国绝大部分1∶1万和1∶5万基本比例尺地形图使用了摄影测量方法。随着数字摄影测量技术的推广,在GIS空间数据采集的过程中,摄影测量也起着越来越重要的作用。航空飞机拍摄示意见图3-6。
1.摄影测量原理
摄影测量包括航空摄影测量和地面摄影测量。地面摄影测量一般采用倾斜摄影或交向摄影,航空摄影一般采用垂直摄影。摄影机镜头中心垂直于聚焦平面(胶片平面)的连线称为相机的主轴线。航测上规定当主轴线与铅垂线方向的夹角小于3°时为垂直摄影。摄影测量通常采用立体摄影测量方法采集某一地区空间数据,对同一地区同时摄取两张或多张重叠的像片,在室内的光学仪器上或计算机内恢复它们的摄影方位,重构地形表面,即把野外的地形表面搬到室内进行观测。航测上对立体覆盖的要求是当飞机沿一条航线飞行时相机拍摄的任意相邻两张像片的重叠度(航向重叠)不少于55%~65%,在相邻航线上的两张相邻像片的旁向重叠应保持在30%。
2.数字摄影测量的数据处理流程
数字摄影测量一般指全数字摄影测量,它是基于数字影像与摄影测量的基本原理,应用计算机技术、数字影像处理、影像匹配、模式识别等多学科的理论与方法,提取所摄对象用数字方式表达的集合与物理信息的摄影测量方法。
图3-6 航空飞机拍摄
数字摄影测量是摄影测量发展的全新阶段,与传统摄影测量不同的是,数字摄影测量所处理的原始影像是数字影像。数字摄影测量继承立体摄影测量和解析摄影测量的原理,同样需要内定向、相对定向和绝对定向。不同的是数字摄影测量直接在计算机内建立立体模型。由于数字摄影测量的影像已经完全实现了数字化,数据处理在计算机内进行,所以可以加入许多人工智能的算法,使它进行自动内定向、自动相对定向、半自动绝对定向。不仅如此,还可以进行自动相关、识别左右像片的同名点、自动获取数字高程模型,进而生产数字正射影像。还可以加入某些模式识别的功能,自动识别和提取数字影像上的地物目标。
(四)遥感图像处理
遥感是通过遥感器这类对电磁波敏感的仪器,在远离目标和非接触目标物体条件下探测目标地物,获取其反射、辐射或散射的电磁波信息(如电场、磁场、电磁波、地震波等信息),并进行提取、判定、加工处理、分析与应用的一门科学和技术。
地面接收太阳辐射,地表各类地物对其反射的特性各不相同,搭载在卫星上的传感器捕捉并记录这种信息,之后将数据传输回地面,然后从所得数据,经过一系列处理过程,可得到满足GIS需求的数据。将计算机技术和遥感技术结合,使遥感制图从目视解释走向计算机化的轨道,并为GIS的地图更新、研究环境因素随时间变化情况提供了技术支持,也是GIS获取数据的重要手段。其工作过程如图3-7所示。
二、属性数据的获取
属性数据即空间实体的特征数据,一般包括名称、等级、数量、代码等多种形式,属性数据的内容有时直接记录在栅格或矢量数据文件中,有时则单独输入数据库存储为属性文件,通过关键码与图形数据相联系。
图3-7 遥感工作过程
属性数据一般采用键盘输入。输入的方式有两种:一种是对照图形直接输入;另一种是预先建立属性表输入属性,或从其他统计数据库中导入属性,然后根据关键字与图形数据自动连接。
(一)属性数据的来源
国家资源与环境信息系统规范在“专业数据分类和数据项目建议总表”中,将数据分为社会环境、自然环境和资源与能源三大类共14小项,并规定了每项数据的内容及基本数据来源。
1.社会环境数据
社会环境数据包括城市与人口、交通网、行政区划、地名、文化和通信设施五类。这几类数据可从人口普查办公室、外交部、民政部、国家测绘地理信息局,以及林业、文化、教育、卫生、邮政等相关部门获取。
2.自然环境
自然环境数据包括地形数据、海岸及海域数据、水系及流域数据、基础地质数据五类。这些数据可以从国家测绘地理信息局、海洋局、水利水电部以及地质、矿产、地震、石油等相关部门和结构获取。
3.资源与能源
资源与能源数据包括土地资源相关数据、气候和水热资源相关数据、生物资源相关数据、矿产资源相关数据、海洋资源相关数据五类。这几类数据可从中国科学院、国家测绘地理信息局及农、林、气象、水电、海洋等相关部门获取。
(二)属性数据的分类
空间数据的分类,是根据系统的功能以及相应的国际、国家和行业空间信息分类规范和标准,将具有不同空间特征和语义的空间要素区别开来的过程,是为了在空间数据的逻辑结构上将数据组织为不同的信息层并标识空间要素的类别。
空间数据一般采用线分类法对空间实体进行分类,即将分类对象按选定的空间特征和语义信息作为分类划分的基础,逐次地分成相应的若干个层级的类目,并排列成一个有层次的、逐级展开的分类体系。同级类之间是并列关系,下级类与上级类间存在着隶属关系,同级类不重复、不交叉,从而将地理空间的空间实体组织为一个层级树,因此也称作层级分类法。
(三)属性数据的编码
属性数据的编码是指确定属性数据的代码的方法和过程。代码是一个或一组有序的易于被计算机或人识别与处理的符号,是计算机鉴别和查找信息的主要依据和手段。编码的直接产物就是代码,而分类分级则是编码的基础。土地分类及编码见图3-8。
图3-8 土地分类及其编码
对于要直接记录到栅格或矢量数据文件中的属性数据,则必须先对其进行编码,将各种属性数据变为计算机可以接受的数字或字符形式,便于GIS存储管理。属性数据编码一般要基于以下几个原则:
(1)编码的系统性和科学性。
(2)编码的一致性和唯一性。
(3)编码的标准化和通用性。
(4)编码的简捷性。
(5)编码的可扩展性。
(四)属性数据的采集
属性数据在GIS中是空间数据的组成部分。属性数据的录入主要采用键盘输入的方法。
当属性数据的数据量较小时,可以在输入几何数据的同时,用键盘输入;当数据量较大时,一般与几何数据分别输入,并检查无误后转入到数据库中。
为了把空间实体的几何数据和属性数据联系起来,必须在几何数据与属性数据之间有一公共标识符。标识符可以在输入几何数据或属性数据时手工输入,也可以由系统自动生成。
(五)属性数据的处理
属性数据校核包括两部分:
(1)属性数据与空间数据是否正确关联,标识码是否唯一,不含空值。
(2)属性数据是否准确,属性数据的值是否超过其取值范围等。
对属性数据进行校核很难,因为不准确性可能归结于许多因素,如观察错误、数据过时和数据输入错误等。属性数据错误检查可通过以下方法完成:
(1)可以利用逻辑检查,检查属性数据的值是否超过其取值范围,属性数据之间或属性数据与地理实体之间是否有荒谬的组合。在许多数字化软件中,这种检查通常使用程序来自动完成。例如有些软件可以自动进行多边形结点的自动平差,属性编码的自动查错等。
(2)把属性数据打印出来进行人工校对,这和用校核图来检查空间数据准确性相似。
对属性数据的输入与编辑,一般在属性数据处理模块中进行。但为了建立属性描述数据与几何图形的联系,通常需要在图形编辑系统中设计属性数据的编辑功能,主要是将一个实体的属性数据连接到相应的几何目标上,亦可在数字化及建立图形拓扑关系的同时或之后,对照一个几何目标直接输入属性数据。一个功能强的图形编辑系统可提供删除、修改、拷贝属性等功能。