区域经济与理论方法

地理科学中数据空间重构最新研究进展

  • 夏天 , 1, 2 ,
  • 吴文嘉 1 ,
  • 吴文斌 , 2, ,
  • 周清波 3 ,
  • 杨鹏 2
展开
  • 1.华中师范大学 城市与环境科学学院&地理过程分析与模拟湖北省重点实验室,中国湖北 武汉 430079
  • 2.中国农业科学院 农业资源与农业区划研究所&农业部农业信息技术重点实验室,中国 北京 100081
  • 3.中国农业科学院 农业信息研究所,中国 北京 100081
※吴文斌(1976—),男,湖北潜江人,博士,研究员。主要研究方向为农业遥感基础与应用基础、空间建模理论与技术和农业生态系统对全球变化响应与反馈评估等。E-mail:

夏天(1981—),男,湖南武冈人,博士,副教授。主要研究方向为农业定量遥感、土地资源与环境遥感和空间模型等。E-mail:

收稿日期: 2019-11-16

  修回日期: 2020-08-09

  网络出版日期: 2025-04-22

基金资助

国家重点研发计划项目(2017YFE0104600)

湖北省自然科学基金项目(2016CFB558)

中央高校基本科研业务费项目(CCNU19TS045)

Research Progress of Geographic Data by Space Reconstruction

  • XIA Tian , 1, 2 ,
  • WU Wenjia 1 ,
  • WU Wenbin , 2, ,
  • ZHOU Qingbo 3 ,
  • YANG Peng 2
Expand
  • 1. College of Urban & Environmental Sciences & Key Laboratory for Geographical Process Analysis and Simulation,Hubei Province,Central China Normal University,Wuhan 430079,Hubei,China
  • 2. Institute of Agricultural Resources and Regional Planning & Key Laboratory of Agri-Informatics,Ministry of Agriculture,Chinese Academy of Agricultural Sciences,Beijing 100081,China
  • 3. Institute of Agricultural Information,Chinese Academy of Agricultural Sciences,Beijing 100081,China

Received date: 2019-11-16

  Revised date: 2020-08-09

  Online published: 2025-04-22

摘要

地理数据是反映地理特征—空间—时间三位一体的综合信息数据,随着计算机科学、地理信息系统(GIS)和空间建模等技术的发展,地理数据进行空间重构表达已经成为地理学发展一个方向。目前,基于地理数据重构研究成为地理学研究中的热点问题,重构研究主要分为数据源改进和重构方法(算法)探索。文章从地理数据重构的应用对象、空间尺度、重构方法、精度检验方法,以及存在的问题和展望等几个方面进行论述,阐明了各种方法的优缺点,并讨论该领域的未来发展方向。研究发现,地理数据重构文章中自然地理与人文地理数量比为6.3∶3.7,并且这些文献中有45.5%的研究尺度(空间分辨率)为1 km。地理数据重构方法中多源数据融合法和空间插值法较适合人文地理数据重构,波谱分析法和空间插值法较适合自然地理数据重构,“3S”数据空间分析法可适用大部分研究类型。数据重构的精度验证方法大体上有三种,但87.1%的研究中采用的是多源数据空间对比分析法。现阶段地理数据空间重构研究方向存在方法创新性不足、可适宜空间重构数据类型少和部分重构方法精度较低等问题,以数据融合空间化为代表的普适性强的方法为主要方向,未来该领域发展方向主要数据重构将会从进一步提高辅助空间数据产品的质量,以及挖掘数据融合算法这两个角度来提高数据重构的精度。

本文引用格式

夏天 , 吴文嘉 , 吴文斌 , 周清波 , 杨鹏 . 地理科学中数据空间重构最新研究进展[J]. 经济地理, 2020 , 40(11) : 47 -55 . DOI: 10.15957/j.cnki.jjdl.2020.11.006

Abstract

Geographical data reflects the comprehensive information data of geographic features,space and time. With the development of computer science,geographic information system (GIS) and spatial modeling,the spatial reconstruction of geographic data has become a director for the development of geography. The reconstruction research on,based on geographic data,has become a hot topic in current geography research. Reconstruction research is mainly divided into two direction: data source improvement and reconstruction method (algorithm) exploration. This article discusses the application objects,spatial scales,reconstruction methods,accuracy inspection methods,existing problems and prospects of geographic data reconstruction,clarifies the advantages and disadvantages of various methods, and discusses development of the field direction in the future. The results of the study found that the number ratio of physical geography to human geography in geographic data reconstruction articles is 6.3∶3.7,and 45.5% of these documents have a research scale (spatial resolution) of 1km. In the reconstruction methods of geographic data,multi-source data fusion method and spatial interpolation method are more suitable for the reconstruction of human geographic data,spectral analysis method and spatial interpolation method are more suitable for the reconstruction of natural geographic data,and "3S" data space analysis method is suitable for most research types. In general,there are three accuracy verification methods for data reconstruction,but 87.1% of the studies adopted multi-source data space comparison analysis method. There are some problems in the research direction of spatial reconstruction of geographic data,such as the lack of innovation of reconstruction methods,the lack of data types suitable for spatial reconstruction and the low accuracy of partial reconstruction methods. The main direction is the universal method represented by the spatialization of data fusion. In the future,we will further improve the quality of auxiliary spatial data products and mining data fusion algorithm to improve the accuracy of data reconstruction.

地理数据是地表某一个点或区域上直接或间接的关联数据,是表示地理位置、分布特征的自然和社会等方面数据,是各种地理特征和现象间关系的符号化表示。地理学研究中使用的数据依据其获取途径大致可分为观测数据、实验数据和统计数据三种类型。这些数据是开展地理学研究的重要基础和前提,同时也不断地促进地理学及其相关学科交叉融合。然而,在研究地理数据的过程中,研究者发现大量的观测数据、实验数据或者统计数据只能进行定量化的数据分析,但要深入分析这些地理数据(属性数据)的时空变化过程或环境效应时缺少地理空间信息。因此,需要构建适宜地理数据空间化的方法,将这些数据进行空间网格展示,实现高空间分辨率地理数据库构建,进一步推进地理数据空间分析研究。
近年来,随着计算机科学、地理信息系统(GIS)和空间建模技术的发展,地理数据空间重构已经成为地理学研究的发展趋势。为推进地理空间变化研究,很多学者致力于将一些传统的统计数据利用数据重构方法进行空间化表达与分析。数据重构方法是利用相关参数因子与已知条件,建立适当的模型,将数据从一种几何形态转移到另一种几何形态的方法。在应用方面通常采用选取相关影响因子与数据源进行分析,对某个区域中的某种或多种数据对象通过GIS技术和空间建模手段将数据进行空间化表达,以期获得较好精度的空间数据。地理数据重构的应用十分广泛,特别是在社会经济、人文环境等方面均具有较多的研究,作为地理学中重要的组成部分,这些数据重构对空间分析起着非常重要的基础作用。数据重构应用主要分为两个方面:①地理数据进行缺失年份数据的空间插补,常用于降水量、气温等气象数据的重构[1-11];②统计数据进行空间化表达,如人口、GDP等社会经济数据的重构[12-18]。国内外学者在地理数据重构方面进行了大量的研究,无论从重构的理论还是方法都取得了显著进展。然而,目前暂未有文献对这些研究进行系统性梳理和总结,对于地理数据重构研究进展仍不清晰。因此,本研究通过中国知网、百度学术以及Google scholar等搜索平台收集2000—2020年文献共253篇,对近20年来地理数据空间重构方法进行评述。

1 地理数据空间重构研究基本概况

1.1 数据空间重构对象

按照文献中数据空间重构的对象分为7类:人口、土地利用、气象气候、社会经济、农作物和其他类型(如:COD污染、PM2.5、微量元素等),另有少量介绍重构原理方法文献不参与分类统计[19-23]。这些文章中研究人口数据空间重构占24.1%,土地利用类型重构占22.9%,气象气候数据重构占16.2%,社会经济数据重构占12.6%,农作物种植格局重构占4.0%,其它类型重构占20.2%(图1)。按照地理数据的内容要素分类法,可分为自然地理数据和人文地理数据,分别占比例为63.2%和36.8%。自然地理类研究相对较多,而人文地理类研究主要集中在人口和社会经济方面,也是近年来研究的热点和趋势,特别是针对人口分布和GDP数据重构方法的研究较多[24-27]。地理数据重构的基础主要来源于与地理数据构成相关的各影响因子的组合,因此重构使用资料的类型和数量直接决定重构数据研究的深度和广度。部分研究统计资料较多、种类丰富(如:人口、GDP和土地利用等),为数据重构奠定了较好的数据基础,也为模型和精度检验提供了数据支持;然而有些统计资料和空间数据集缺失,以至于研究者无法通过建立统计数据与空间数据关系进行数据重构工作。
图1 数据重构文献分类所占比例

Fig.1 The proportion of data reconstruction literature classification

1.2 数据重构的空间尺度

依据重构研究的空间尺度大小,对收集的国内外文献进行统计分类:①小尺度,空间分辨率< 500 m;②中尺度,空间分辨率500 m~1 km;③大尺度,空间分辨率>1 km。近年来数据空间重构研究的空间尺度差异比较大,最大的空间分辨率达到3°×3°[28],而最小分辨率为1 m×1 m[29]。这些研究中采用中尺度的较多,特别是1 km分辨率研究占到了45.5%,小尺度和大尺度的比例分别为29.6%和15.0%。中尺度研究较多的主要原因是,大量的省域范围研究通常选取这个尺度,这与当下省域研究成为热点也相印证。省域范围研究采用中尺度进行数据重构,无论从数据收集与空间化表达都较为便利,结果也具有一定的代表性[30-32];以市域或县域范围研究采用小尺度格网重构,较小的分析单元则更有利于地域特征的表达,以此空间尺度来进行空间化表达的文献也较多[29,33-36]。相较而言,全球尺度的空间重构由于数据残缺、统计范围较大等诸多限制因素影响,研究较难开展,研究成果较少[37-40]

2 地理数据空间重构技术方法

基于数据空间重构研究侧重点可分为数据源改进和重构方法(算法)改进两大类(图2):①数据源改进方法从数据源出发,通过对各种数据源进行提取、叠加、修正使其重构数据具有较高的精度,如:多源数据融合法和“3S”数据空间分析法;②基于重构方法(算法)改进的研究则更侧重于算法,即数据处理的方法和过程,如:“3S”数据空间分析法、波谱分析法和空间插值法,这些方法的选取和处理正确性对空间重构精度会有较大影响,其中“3S”数据空间分析法由于功能强大、覆盖面广,在基于数据源改进和基于方法改进的两类方法上均占据重要地位。两类重构研究方向相互支撑,数据源改进为方法(算法)提供重构保障,方法(算法)改进为数据源改进提供技术手段。以下详细介绍4类重构方法。
图2 数据重构主要方法分类

Fig.2 The framework used for literature review on data reconstruction

2.1 多源数据融合法

地理多源数据融合的空间重构方法使用较多,利用不同空间数据源(如土地利用数据、气象数据、DMSP/OLS夜间灯光数据等)与重构数据进行空间数据融合,如:郭雨臣利用人口统计数据、自然环境数据、土地覆盖数据和交通路网数据构建人口空间化模型,从城镇人口和农村人口两个角度进行数据融合,实现全国1 km栅格人口空间化表达[41]。杨小唤以耕地面积、城市居民点面积和农村居民点面积为自变量,以统计人口为因变量构建回归模型,推演城镇居民点用地、农村居民点用地人口分布系数,模拟县级人口分布模式[42]。王勇采用苏锡常地区的PM2.5浓度观测资料和同期苏锡常及周边地区的气象资料,构建了基于气象要素的多元线性回归模型,模拟2013年春季苏锡常地区PM2.5的空间分布状况[43]。张学儒选用高程、坡度、坡向、GDP、人口、温度、降雨量、河流距离、城市距离和海岸线距离等10个土地利用变化驱动因子,构建CA-Markov模型参数,重建泛长三角地区历史土地利用空间数据[44]。此外,还有利用约束性元胞自动机模型,集成邻域思想、约束条件、空间聚类、Logistic回归等思路构建空间模拟模型进行地理数据重构[45]。这些方法重构效果较好,但多元回归的算法复杂,为了保证精度需要的数据量比较大,实现起来比较困难。
DMSP/OLS夜间灯光数据最初是美国国家航空航天局(NASA)地球观测站根据苏奥米国家极轨伙伴卫星获得的数据制作的一张测绘地图,该地图用于展示地球进入黑夜状态下城市灯光分布情况。目前,夜间灯光数据主要运用于人口和GDP方面空间重构研究。人口空间重构的常用方法是将夜间灯光数据与土地利用数据相结合,分别建立人口与土地利用分布图和夜间灯光数据的线性模型,将其结果进行空间化处理。但由于线性模型的相关性较弱,近年来一些学者提出改进方法,如闫庆武基于夜间灯光数据采用空间滞后的模型进行江苏省的人口空间分布模拟,进一步提高重构精度[46];朱秀芳考虑多地理因子的影响因素,通过建立多因子的加权分配模型构建指数建立相关关系,也大大提高了重构精度[47];L.Imhoff运用设置阈值转换的方法改良的夜间灯光数据来进行美国人口空间化模拟[48];S.Amaral通过建立夜间灯光数据集与人口数据集的相关关系重构亚马逊河流域的城市人口空间分布[49]。GDP数据空间重构常用方法是选用一些代用数据,如夜间灯光数据、不同尺度的人口密度数据来建立代用数据与GDP统计数据之间的统计回归模型来重构GDP分布[50]。有些学者运用DMSP/OLS数据研究与人口、GDP的相互影响程度,如Wang利用夜间灯光数据,通过建立空间自相关模型探讨了全球尺度下人均GDP、纬度、人口空间分布对DMSP/OLS的影响程度,修正DMSP/OLS与人口和GDP的相关关系[51]。Yao运用异速生长模型建立在中国地级城市尺度下DMSP-OLS图像与人口总量和GDP综合因素的相关关系,分别探讨人口和GDP对DMSP/OLS的定量关系[52]。通过建立灯光强度和人口密度的关系模型能正确反映人口空间分布状况,尤其对于人口较为密集的地区具有很高的数据重现精度,但在乡镇等不发达的地区,人口的空间分布异质性大、灯光强度微弱,会导致数据重现的准确性下降。利用本方法除了可以进行人口空间化提供数据集之外,还可以进行交通道路、居民点、城市等因素的空间分布分析,能在一定程度上反映省域经济分布状况,但它只适合用于县级以上的大中城市社会发展和规划作为参数指标,不适用于乡镇级别区域[53]

2.2 “3S”数据空间分析法

本方法将遥感(RS)影像与GIS空间分析的功能相结合,遥感影像可直接或间接提供地表的多种参数信息,而通过GIS空间分析建立地理因子库,可以提供大量的分析方法和途径。因此,RS与GIS结合的强大功能几乎可以解决大部分类型的数据重构研究工作,具有适用范围广、精度高等特点。本方法中遥感影像是研究基础和关键环节,根据数据处理方法可以分为:多源信息融合法、基于像元特征空间化法和相关关系网格化法。
多源数据融合法是将多种数据源通过一定的算法融合成数据集,建立地理数据与相关因子的相关性。首先筛选出指示性因子,再建立指示性因子与地理数据之间的权重值,最后通过建立各指示因子权重值与地理数据的相关关系来实现数据的空间化,如Zhang利用1∶10万的土地利用数据、乡镇人口和县级工业数据,构建人口和经济空间模型,生成200 m分辨率的网格人口和经济密度图[54];熊俊楠基于多源数据融合的方法将四川省的第一、第二和第三产业分别建立了对应的模型与土地利用进行相关分析得出了四川省GDP空间分布图[55];龙晓君使用SRTM DEM、土地覆被、冻融侵蚀、河流沟谷等多源数据,以指标地物的平均海拔为依据,对陆地地貌进行切割划分,插值重构分级参考曲面[56]。该方法注重社会经济数据的客观量化,弥补了单一数据集的缺陷,但选取的指标过多会造成问题复杂化,可能产生一些不必要的信息,夸大因子的影响程度,因子的选取也具有明显的区域性。
基于像元特征空间化法是目前研究的主流,它通过直接建立地理空间重构数据与遥感影像像元特征之间的相关关系来直接进行空间化,如Lu通过从美国Indiana州的Marion县ETM+多光谱影像中提取不透水面的信息,根据一定的相关关系建立人口密度预测模型,对Marion县的人口密度空间化[57]。其方法简单,精度高,但其缺陷在于遥感影像的分辨率直接影响结果精度的高低,分辨率越高的遥感影像其重构的精度越高。
相关关系格网化法是通过建立重构数据相关的统计资料与遥感解译数据集之间的相关关系来进行空间化,包括线性回归、空间分析模型或权重分配等方法建立相关关系,Pongratz在基于可持续发展与全球环境数据(SAGE)、全球环境历史数据库(HYDE)和GIS软件分析功能的基础上对全球过去1 000年的农区土地覆盖进行了数据空间化表达,总体精度较高,但同一种类型之间表现出同质性,过于理想化,在分布过于分散的地区重构精度较低[40]。“3S”数据空间分析法操作方便,功能强大,是现阶段最为成熟的重构方法。但目前受限于高分辨率的遥感影像较少,以及同谱异物等遥感成像普遍问题的出现,其重构精度往往达不到理想结果。

2.3 波谱分析法

利用波谱分析法进行地理数据重构的主要方法有:S-G滤波、D-L法和A-L法。S-G滤波算法是一种移动窗口的加权平均算法,它通过确定移动窗口的大小以及平滑多项式的阶数来保证数据的拟合性,常用于NDVI等光谱指数和土地利用数据类型的重构,如沈润平等在基于RS的像元质量分析上,通过S-G滤波对江苏省2001—2003年的植被覆盖指数数据进行了重构,与自适应的S-G重构结果相比,新方法能够获得更加准确的植被覆盖数据[31]。A-L(非对称性高斯函数拟合)与D-L(双-Logistics函数拟合)也是两种常见的NDVI重构方法,前者是一个从局部拟合到整体拟合的过程,使用分段高斯函数来拟合植物生长过程,最后通过平滑连接各高斯函数曲线来实现时间序列重构,后者是一种半局部拟合方法,将分成多个区间的时间序列进行局部拟合。Hamid探讨了时间序列谐波分析(HANTS)算法和多通道奇异谱分析(M-SSA)算法在宽间隙缺失数据重建中的性能,利用从陆地卫星TM反演的归一化差异植被指数(NDVI)时间序列,结合MODIS NDVI数据产品进行数据重构[58]。李晶利用BISE-WT滤波器对原始NDVI时间序列进行滤波处理,分析NDVI时序轨迹,获得扰动年际信息,重构扰动历史地图[59]。周玉科采用三次样条函数法、D-L和奇异谱分析法对2000—2015年的MODIS归一化差异植被指数(NDVI)数据进行分析,重构青藏高原地区的106个气象站点覆盖范围内地表覆盖NDVI时序数据[60]。Ma通过系统测试比较了8种(M-BISE、S-G、MVI、A-G、D-L、CW、IDR和WS)方法对NDVI数据的去噪平滑技术,实验结果证明S-G滤波的综合效果最好[61]。以上三种方法都是NDVI重构的最主要方法,三种方法均具有较好的去噪能力,但重构效果具有较强的随机性,即重构精度不稳定,这与三种滤波的参数设置有很大关系。

2.4 空间插值法

空间插值法常用有克里金(Kriging)插值法、反距离加权插值(Inverse Distance Weighting)法和面积权重内插法。Kriging插值法可以对空间未抽样点或未抽样区进行线性无偏估计;反距离加权平均法基于2个物体的相似性随着它们距离的增大而减小的假设确定权重公式;面积权重内插法的原理是假设数据在各个区域中是均匀分布的,将目标区域叠加到源区域上,找出源区域在各个目标区域中的比重,按照该比重值将源区域的属性值分配到目标区域上。Wu利用括反距离加权(IDW)、普通克里金(OK)、径向基函数(RBF)和局部多项式插值(LPI)等多种方法对美国密西西比河流域进行河道空间重构,并对比几种方法的精度[39];Romaric采用反距离加权插值和Kriging插值法对喀麦隆杜阿拉电子废物场地铬和镉土壤污染模拟,对比分析两种方法在小区域上的模拟精度[62];刘洪提出一种新的反假频地震数据重构的两步算法,将最小加权范数插值(MWNI)方法与调制升频方法有效地结合起来,克服了以往AR模型预测高频走不远的限制,当数据存在严重的空间假频时,亦能获得较好的重构效果[63]。以上三种方法的优点在于算法简单,易于实现,能够很好地克服因数据空间分布不均而使估值出现偏差的缺点,但随着栅格单元尺度增加,模型的不稳定性随之增强,精度也逐渐下降,这主要与数据点所代表的范围有限有关。同时,采样点稀疏、环境变化剧烈的区域其计算精度很难保证,缺乏对研究环境特征的真实反映,容易造成较大的误差。因此,地理数据空间插值时仅从数学角度进行计算,很难保证其研究的现实性和理论性[27]
综上所述,数据重构的四类主要方法在适用范围及优缺点上各有异同(表2),在适用类型方面,“3S”数据空间分析法功能强大,几乎适用所有的数据类型;空间插值法和多源数据融合法适用的范围也较广,其中多源数据融合法较适合人文地理数据空间重构,波谱分析法较多应用于自然数据空间重构。从操作便捷程度上来看,多源数据融合法、“3S”数据空间分析法和空间插值法在算法上原理简单,易于分析重构。然而,四种方法都存在不同程度的局限性,如多源数据融合法和空间插值法的精度与研究区的特征有很大关系,前者主要受研究区范围的大小影响,后者受栅格分辨率大小、地形因素的影响较大;波谱分析法由于是纯算法运算,其结果受到研究环境各种驱动因素的影响,可能会导致重构的精度随机性大,时好时坏;相比而言,“3S”数据空间分析法和多源数据融合空间重构精度高,但前者对遥感影像数据源的精度依赖较大,而后者的算法复杂,实际操作过程较为困难。
表1 数据重构代表性论文

Tab.1 The typical literature of data reconstruction

数据源 研究方法 研究区域 尺度 重构类型 文献出处
遥感数据 波谱分析法 江西省 500 m×500 m 土地利用 [31]
观测数据 空间插值法 美国 10 m×10 m 土地利用 [39]
图形数据 “3S”数据空间分析法 全球 1°×1° 土地利用 [40]
遥感数据、图形数据 “3S”数据空间分析法、多源数据融合法 江苏省 1 km×1 km 人口 [46]
遥感数据、图形数据、统计调查数据 “3S”数据空间分析法、多源数据融合法 辽宁省 1 km×1 km 人口 [47]
遥感数据 “3S”数据空间分析法、多源数据融合法 美国 2.7 km×2.7 km 社会经济 [48]
遥感数据、统计调查数据 “3S”数据空间分析法、多源数据融合法 巴西亚马逊 4 km×4 km 人口 [49]
遥感数据、统计调查数据 “3S”数据空间分析法、多源数据融合法 中国 1 km×1 km 社会经济 [50]
遥感数据 “3S”数据空间分析法、多源数据融合法 全球 1°×1° 社会经济 [51]
遥感数据、统计调查数据 “3S”数据空间分析法、多源数据融合法 中国 1 km×1 km 社会经济 [52]
遥感数据、统计调查数据 “3S”数据空间分析法 秦岭—华北平原过渡带 200 m×200 m 人口、经济 [54]
遥感数据、统计调查数据 “3S”数据空间分析法 四川省 1 km×1 km 社会经济 [55]
遥感数据 “3S”数据空间分析法 美国印第安那州 60 m×60 m 人口 [57]
遥感数据 波谱分析法 伊朗 250 m×250 m 土地利用 [58]
遥感数据 波谱分析法 内蒙古自治区 30 m×30 m 土地利用 [59]
遥感数据 波谱分析法 黑河流域 1 km×1 km 土地利用 [61]
遥感数据 空间插值法 喀麦隆 其它类型 [62]
遥感数据、统计调查数据 “3S”数据空间分析法 西藏自治区 1 km×1 km 人口 [41]
遥感数据、观测数据 “3S”数据空间分析法、多源数据融合法 苏锡常地区 1 km×1 km 气象 [43]
遥感数据 “3S”数据空间分析法、多源数据融合法 内蒙古克什克腾旗 30 m×30 m 其他类型 [44]

注:“-”表示无数据,由于该文献为方法研究,测试数据为图片。

表2 重构方法适宜范围及优缺点

Tab.2 The suitable range and relative merits of data reconstruction

重构方法 适用类型 优点 缺点
多源数据融合法 人口、气象、社会经济 涵盖多种地理因子信息,适用范围广,大中尺度重建精度较高 算法复杂,实现起来比较困难;只适合用于县级以上的大中城市社会发展和规划作为参数指标,不适用于乡镇级别区域
“3S”数据空间分析法 大部分可监测类型 适用范围广、精度高,操作方便,功能强大,是当下运用的最为成熟的重构方法 受数据源的影响较大
波谱分析法 NDVI等光谱指数、土地利用 具有较好的去噪能力 重构精度不稳定
空间插值法 人口、土地利用、气象、社会
经济
算法简单,易于实现,能够很好的克服因数据空间分布不均而使估值出现偏差的缺点 随着栅格单元尺度增加,模型的不稳定性随之增强,精度也逐渐下降。在采样点稀疏、环境变化剧烈的区域其计算精度很难保证

3 数据空间重构的精度验证

为了保障地理数据空间重构的精度,需对结果进行精度验证。目前,重构结果精度验证所采用的方法主要有三种:①多源数据空间对比分析;②基于空间插值的交叉检验;③参数因子与模型精细化。这三种方法文献所占比例分别为87.1%、5.0%和7.9%,其中多源数据空间对比分析检验方法使用最多,其它方法少有使用。

3.1 多源数据空间对比分析

多源数据空间对比分析法是数据空间重构检验最常用的方法,具体分为两种形式:一是空间重构结果与空间分布数据(或遥感影像)进行空间对比、残差分析或相关分析等对比分析,如陶和平选取四个乡镇作为样区共111个样点,利用研究区模拟人口分布栅格结果计算各个样本乡镇的总人口数,并与乡镇的统计年鉴的乡级人口数进行相关性分析,结果显示四个乡镇的相关系数均在0.84以上。除此之外,还对不同土地类型、地貌形态、距水系不同距离缓冲区中人口密度和居名点密度做相关性分析,相关系数均在0.85以上[36]。二是空间重构结果与统计数据进行对比分析,如闫庆武分别从县级和乡级尺度进行精度检验,依次选取县级和乡镇级行政区划矢量底图,对人口空间格网图进行分区统计,以县级统计人口数据为横坐标,空间化后汇总人数为纵坐标绘制散点图,相关系数分别为0.94和0.90[46]。这种检验方法简单便利,有较高的理论基础和现实依据,被广泛应用于重构效果检验之中,但仅凭借统计数据来鉴定模型效果,其统计数据可能由于数据缺失或来源不可靠而使实际效果低于检验效果,单一重构方法的检验也可能具有随机性。

3.2 空间插值交叉检验

交叉验证是指在给定的建模样本中,拿出大部分样本进行建模,留出小部分样本用于新建模型预测,并计算小部分样本的预测误差。这个过程持续进行,直到所有的样本都被预测了一次而且仅被预测一次。朱秀芳在原始昼夜LST数据集中随机选取250景LST数据,在这些数据中再随机选取5 000个像元,将像元值赋为0,生成LST昼夜数据集,将验证数据集进行基于背景值和波动值LST数据重构,并将重构结果中的插值结果与原始像元值进行对比,结果显示LST差值与原始像元值平均偏差为0.81k,偏差超过2k的像元占总数5.2%[64]。秦耀辰选取预测误差均值与标准均方根预测误差对插值精度进行全交叉检验,两者分别接近0和1则插值精度较好,结果显示年平均气温、最热月平均气温、0℃积温、最冷月平均气温和年降水量的倾向值的预测误差均值和准均方根预测误差均是分别接近0和1,表明农业水热气候条件倾向值的空间拟合效果较好[10]。此法的目的是为了得到可靠稳定的模型,常用于对空间插值的检验,精度较高,但操作复杂。参数因子的选择对结果影响很大,且该方法在长时间序列的原始数据插补时需要大量的样本数据,加之样本数据的选取具有随机性,可能会影响检验的精度。

3.3 参数因子与模型精细化

参数因子与模型精细化检验方法,由于没有原始统计资料作为检验依据,只能通过筛选最适合参数因子或者对重构模型进行修正来提高重构精度。王长耀采用Kriging插值的方法基于DEM数据实现地理、地形因子网格化和参数化,构建中国区域的1 km×1 km网格海拔高度、坡度和坡向等地形因子数据。同时,利用MODIS数据反演得到月均地表反照率数据和大气总透射率,并考虑地形和大气衰减因子,定量分析坡向、坡度和地形遮蔽因素对太阳辐射的影响,在此基础上建立坡地太阳辐射计算模型,该研究成果实现了中国区域气候环境信息空间化[65]。林联盛在按平原、丘陵和山地人口分布模型进行相应县市人口栅格化以后,再进行模型残差修正,使得人口空间化后各县市总人口保持不变,残差修正值以模型回归系数为权重进行相应土地利用类型的残差分配[66]。此种方法由于没有进行量化检验,只是定性地检验其重构效果,往往不能准确预估模型的好坏和误差,虽然重构结果充分考虑了各参数因子的权重及影响,但重构效果没有考虑数据分布的随机性,仅从理论的角度上来考虑,很难作为现实数据加以利用[67]

4 存在问题与研究展望

数据重构方法能够将地理数据进行更直观的空间化表达,在数据资料不全或残缺时,该方法对空间化研究发挥着重要作用。目前,地理数据空间重构多采取单一方法,除“3S”数据空间分析法能够适应较多领域的空间重构外,其他几种方法的适用范围均有限。虽然利用现有的空间重构方法,能够实现所需地理数据的空间化表达,但其结果具有一定局限性,甚至存在有些类型地理数据的重构精度不高的问题。此外,基础地理数据作为空间重构重要组成部分,存在有些地理数据科学性和准确性等方面问题,一定程度上限制着地理数据空间重构研究的发展。近年来,关于地理数据重构的研究已经取得了长足进步,重构的数据类型众多且用途广泛,但仍有一些不足以及需要未来解决的问题。
一是基础数据来源存在科学性与准确性不高的问题。数据重构参数与重构模型的选择往往需要基于科学、准确的原始数据,但现有统计数据经常会出现年份缺失或类型缺失的情况,甚至某个时间段内数据统计口径不一致、缺失等问题,这些都会影响重构结果精度。二是重构方法较少,且存在单一化问题。现阶段针对数据重构需求提出的方法大多是一些传统空间统计方法,如Kriging插值、S-G滤波、多元线性回归法等方法,这些方法侧重性强,考虑因子单一,适用范围较窄,对解决同一类型的数据重构问题不具有广泛代表性。另外,重构模型结构方法过于单一,虽然采用单因子的重构结果与原始数据重合度较高,但因其模型构造简单使其结果具有较大的偶然性和不稳定性,不能用于长期或长时间段的数据重构。三是重构数据类型具有一定的局限性。现有数据重构涉及的范围还是以社会经济数据为主,如:人口和GDP数据存在大量的统计数据作为支撑;气象数据能够基于气象站点获取长时间序列的观测数据。除以上常见数据类型外,关于农作物、环境污染等方向的数据重构研究较少,一方面这些类型的空间格局基础数据相对较贫乏,另一方面重构方法不足,导致数据重构研究范围受限,不能有效地进行这类数据空间重构研究。四是重构精度检验不足。重构数据的精度检验难度较大,存在原始数据或高分辨率影像稀缺、难以获取问题。此外,部分验证数据的科学性值得考究,导致校验结果不具有实际意义、检验不充分,只能进行简单参照性检验。另外,有些重构空间数据存在没有原始数据作为基础依托,仅通过优化模型和参数或对比多种重构方法结果,从理论基础上视为达到一定的精度,不具有很强现实意义。
未来数据重构研究势必成为地理空间数据研究中重要的方法,通过分析相关数据构建适宜模型,将数据从一种几何形态转移到另一种几何形态,为开展空间研究提供重要支撑。在数据重构类型方面,基于人文地理的学科特点、数据获取和调查方式的数据重构将会是未来的一个主要发展方面,其研究成果一定程度上将推进人文地理领域的空间化研究。同时,基于小区域研究的需求特点,中尺度分辨率研究也将会是未来研究的主流。目前基于空间信息技术的发展,利用高分辨率遥感影像直接构建重构地理数据模型已成为研究主流,如:基于“3S”数据空间分析法具有精度高、适用性广的优势是现阶段使用广泛的重构方法。在数据源方面,可以进一步挖掘DMSP/OLS夜间灯光数据的潜力或提供更为精确的数据源(产品),使其与空间重构数据构建最优重构模型,来进一步提高重构数据的精度。然而,现有的研究方法及结果精度还具有一定的局限性,未来数据重构从提高辅助空间数据产品的质量,以及挖掘数据融合算法这两个角度来提高数据重构的精度效果较为可行,它既能弥补统计数据信息缺失的问题,又能提高数据空间重构精度。
[1]
Jouzel J, Alley R B, Cuffey K M, et al. Validity of the Temperature Reconstruction from Water Isotopes in Ice Cores[J]. Journal of Geophysical Research, 1997, 102(C12):26 471-26 487.

[2]
Ge Q, Zheng J, Fang X, et al. Winter half-year temperature reconstruction for the middle and lower reaches of the Yellow River and Yangtze River,China,during the past 2000 years[J]. The Holocene, 2003, 13(6):933-940.

[3]
Hegerl G C, Crowley T J, Allen M, et al. Detection of human influence on a new,validated 1500-Year temperature reconstruction[J]. Journal of Climate, 2007, 20(4):650-666.

[4]
Bonnifait L, Delrieu G, Lay M L, et al. Distributed hydrologic and hydraulic modelling with radar rainfall input:reconstruction of the 8-9 September 2002 catastrophic flood event in the Gard region,France[J]. Advances in Water Resources, 2009, 32(7):1077-1 089.

[5]
Helrl O, Lotter A F. Holocene and Lateglacial summer temperature reconstruction in the Swiss Alps based on fossil assemblages of aquatic organisms:a review[J]. Boreas, 2005, 34(4):506-516.

[6]
Moore J J, Hughen K A, Miller G H, et al. Little Ice Age recorded in summer temperature reconstruction from varved sediments of Donard Lake,Baffin Island,Canada[J]. Journal of Paleolimnology, 2001, 25(4):503-517.

[7]
Aeschbach-Hertig W, Peeters F, Beyerle U, et al. Paleotemperature reconstruction from noble gases in ground water taking into account equilibrium with trapped air[J]. Nature, 2000, 405(6790):1040-1 044.

[8]
Dowsett H J, Robinson M M, Foley K M. Pliocene three-dimensional global ocean temperature reconstruction[J]. Clim. Past, 2009, 5(4):769-783.

[9]
Stahle D W, Cleaveland M K. Reconstruction and analysis of spring rainfall over the southeastern U.S. for the past 1000 Years[J]. American Meteorological Society, 1992, 73(12):1947-1 961.

[10]
宁晓菊, 秦耀辰, 崔耀平, 等. 60年来中国农业水热气候条件的时空变化[J]. 地理学报, 2015, 70(3):364-379.

DOI

[11]
廖顺宝, 张赛. 多年平均气温数据空间化误差的尺度效应[J]. 地球信息科学学报, 2014, 16(1):8-14.

DOI

[12]
Mcpherson T N, Brown M J. Estimating daytime and nighttime population distributions in U.S. Cities for emergency response activities[R]. AMS Annual Meeting, 2004.

[13]
Qi W, Liu S, Gao X, et al. Modeling the spatial distribution of urban population during the daytime and at night based on land use:A case study in Beijing,China[J]. Journal of Geographical Sciences, 2015, 25(6):756-768.

[14]
Badia-Miro M, Guilrea J, Lains P. Reconstruction of the Regional GDP of Portugal,1890-1980[R]. 2012.

[15]
Qiu F, Sridharan H, Chun Y. Spatial Autoregressive Model for Population Estimation at the Census Block Level Using LIDAR-derived Building Volume Information[J]. Cartography and Geographic Information Science, 2010, 27(3):239-257.

[16]
Fang Z D, Liang L M, Xiang-zheng D. Spatialization Model of Population Based on Dataset of Land Use and Land Cover Change in China[J]. Chinese Geographical Science, 2002, 12(2):114-119.

[17]
Tomas L, Fonseca L, Almeida C, et al. Urban population estimation based on residential buildings volume using IKONOS-2 images and lidar data[J]. International Journal of Remote Sensing, 2016, 37(S1):1-28.

[18]
廖一兰, 王劲峰, 孟斌, 等. 人口统计数据空间化的一种方法[J]. 地理学报, 2007, 62(10):1110-1 119.

[19]
Adam M, Anne G, Alexander G. Edge Detection from non-uniform Fourier data using the convolutional gridding algorithm[J]. Journal of Scientific Computing, 2014, 61(3):490-512.

[20]
Sha L, Guo H, Song A W. An improved gridding method for spiral MRI using nonuniform fast Fourier transform[J]. Journal of Magnetic Resonance, 2003, 162(2):250-258.

PMID

[21]
廖顺宝, 张赛. 属性数据空间化误差评价指标体系研究[J]. 地球信息科学学报, 2009, 11(2):176-182.

[22]
Martinez A, Gelb A, Gutierrez A. Edge detection from non-uniform Fourier data using the convolutional gridding algorithm[J]. Journal of Scientific Computing, 2014, 61(3):490-512.

[23]
Jiang B, Jiang X, Xiao N, et al. Gridding and fast Fourier transformation on non-uniformly sparse sampled multidimensional NMR data[J]. Journal of Magnetic Resonance, 2010, 204(1):165-168.

DOI PMID

[24]
叶宇, 刘高焕, 冯险峰. 人口数据空间化表达与应用[J]. 地球信息科学, 2006, 8(2):59-65.

[25]
杨小唤, 江东, 王乃斌, 等. 人口数据空间化的处理方法[J]. 地理学报, 2002, 57(z1):70-75.

[26]
柏中强, 王卷乐, 杨飞. 人口数据空间化研究综述[J]. 地理科学进展, 2013, 32(11):1692-1702.

DOI

[27]
李飞, 张树文, 杨久春, 等. 社会经济数据空间化研究进展[J]. 地理与地理信息科学, 2014, 30(4):102-107.

[28]
杨胜龙, 马军杰, 伍玉梅, 等. 基于Kriging方法Argo数据重构太平洋温度场研究[J]. 海洋渔业, 2008, 30(1):13-18.

[29]
Li X H, Li Z W, Feng R T, et al. Generating high-quality and high-resolution seamless satellite imagery for large-scale urban regions[J]. Remote sensing, 2020, 12(1):81.

[30]
杨续超, 康丽莉, 张斌, 等. 基于多源遥感信息的电力消费量估算与影响因素分析——以浙江省为例[J]. 地理科学, 2013(6):718-723.

DOI

[31]
李明, 沈润平, 王迪, 等. 基于像元质量分析的S-G滤波重建MODIS-NDVI[J]. 生态与农村环境学报, 2015, 31(3):425-431.

[32]
黄耀欢, 王建华, 江东, 等. 利用S-G滤波进行MODIS-EVI时间序列数据重构[J]. 武汉大学学报:信息科学版, 2009, 34(12):1440-1443.

[33]
朱红春, 张蕾, 刘海英, 等. 基于GIS的猕猴桃土壤养分评价与施肥建议模型研究[J]. 农业工程学报, 2007, 23(6):194-198.

[34]
孙丹峰, 王雅, 李红, 等. 基于MODIS NDVI年序列的区域化肥投入空间化方法[J]. 农业工程学报, 2010, 26(6):175-180.

[35]
余强毅, 吴文斌, 陈羊阳, 等. 农作物空间格局变化模拟模型的MATLAB实现及应用[J]. 农业工程学报, 2014, 30(12):105-114.

[36]
曹伟超, 陶和平, 谭理, 等. 基于多源空间数据的山区人口分布模拟[J]. 国土资源遥感, 2012, 24(2):61-67.

[37]
Poska A, Saarse L, Koppel K, et al. The Verijärv area,South Estonia over the last millennium:A high resolution quantitative land-cover reconstruction based on pollen and historical data[J]. Review of Palaeobotany and Palynology, 2014,207:5-17.

[38]
Rupp A J, Bailey B A, Shen S S P, et al. An error analysis for the hybrid gridding of Texas daily precipitation data[J]. International Journal of Climatology, 2010, 30(4):601-611.

[39]
Wu C Y, Joann M, Mao L, et al. Comparison of different spatial interpolation methods for historical hydrographic data of the lowermost Mississippi River[J]. Annals of GIS, 2019, 25(2):133-151.

[40]
Pongratz J, Reick C, Raddatz T, et al. A reconstruction of global agricultural areas and land cover for the last millennium[J]. Global Biogeochemical Cycles, 2008, 22(3):GB3018.

[41]
郭雨臣, 黄金川, 林浩曦. 多源数据融合的中国人口数据空间化研究[J]. 遥感技术与应用, 2020, 35(1):219-232.

DOI

[42]
李月娇, 杨小唤, 王静. 基于景观生态学的人口空间数据适宜格网尺度研究——以山东省为例[J]. 地理与地理信息科学, 2014, 30(1):97-100.

[43]
高飞, 王勇, 陈清祥, 等. 基于GIS的苏锡常地区PM2.5分布模拟[J]. 地理空间信息, 2015, 13(6):103-107.

[44]
张学儒, 周杰, 李梦梅. 基于土地利用格局重建的区域生境质量时空变化分析[J]. 地理学报, 2020, 75(1):160-178.

DOI

[45]
黄金川, 林浩曦, 漆潇潇, 等. 基于城市空间增长模拟的城镇规模体系预测——以常州市为例[J]. 经济地理, 2017, 37(10):49-58.

[46]
黄杰, 闫庆武, 刘永伟. 基于DMSP/OLS与土地利用的江苏省人口数据空间化研究[J]. 长江流域资源与环境, 2015, 24(5):735-741.

[47]
马钰琪, 朱秀芳, 刘宪锋, 等. 基于夜间灯光数据和多地理因子数据的人口空间化方法——以辽宁省为例[J]. 北京师范大学学报(自然科学版), 2015, 51(z1):57-61.

[48]
L. Imhoff M, Lawrence W T, Stutzer D C, et al. A technique for using composite DMSP/OLS “City Lights” satellite data to map urban area[J]. Remote Sensing of Environment, 1997, 61(3):361-370.

[49]
Amaral S, Monteiro A M V, Camara G, et al. DMSP/OLS night-time light imagery for urban population estimates in the Brazilian Amazon[J]. International Journal of Remote Sensing, 2006, 27(5):855-870.

[50]
李岩林, 程钢, 杨杰, 等. 夜光遥感数据支持下的区域经济空间格局精细化模拟——以河南省为例[J]. 地域研究与开发, 2020, 39(4):41-47.

[51]
Wu J, Wang Z, Li W, et al. Exploring factors affecting the relationship between light consumption and GDP based on DMSP/OLS nighttime satellite imagery[J]. Remote Sensing of Environment, 2013, 134(7):111-119.

[52]
Yao Y. Correlation of human activities with population and GDP in Chinese Cities-Based on the Data of DMSP-OLS[J]. International Journal of Economics and Management Engineering, 2012, 2(3):125-128.

[53]
杨妮, 吴良林, 邓树林, 等. 基于DMSP/OLS夜间灯光数据的省域GDP统计数据空间化方法——以广西壮族自治区为例[J]. 地理与地理信息科学, 2014, 30(4):108-111.

[54]
Zhang J J, Zhu W B, Zhu L Q, et al. Topographical relief characteristics and its impact on population and economy:a case study of the mountainous area in western Henan,China[J]. Journal of Geographical Sciences, 2019, 29(4):598-612.

[55]
熊俊楠, 韦方强, 苏鹏程, 等. 基于多源数据的四川省GDP公里格网化研究[J]. 应用基础与工程科学学报, 2013, 21(2):317-327.

[56]
龙晓君, 李小建. 基于多源数据的中国地形海拔分级指标调整研究[J]. 地理科学, 2017, 37(10):1577-1 584.

[57]
Lu D, Weng Q, Li G. Residential population estimation using a remote sensing derived impervious surface approach[J]. International Journal of Remote Sensing, 2006, 27(16):3553-3 570.

[58]
Hamid R G M, Hadi Z, Iman R, et al. Comparison of Harmonic Analysis of Time Series (HANTS) and Multi-Singular Spectrum Analysis (M-SSA) in reconstruction of long-gap missing data in NDVI time series[J]. Remote Sensing, 2020, 12(17):2747.

[59]
李晶, 邓晓娟, 杨震, 等. 基于时序多光谱影像的干旱草原区开采扰动信息提取方法[J]. 光谱学与光谱分析, 2019, 39(12):3788-3 793.

[60]
刘建文, 周玉科. 站点尺度的青藏高原时序NDVI重构方法比较与应用[J]. 地理科学进展, 2018, 37(3):427-437.

DOI

[61]
Geng L, Ma M, Wang X, et al. Comparison of eight techniques for reconstructing multi-satellite sensor time-series NDVI data sets in the Heihe River Basin,China[J]. Remote Sensing, 2014, 6(3):2024-2 049.

[62]
Romaric E O, Abimbola Y S, Mary B O. Assessment of ordinary Kriging and inverse distance weighting methods for modeling chromium and cadmium soil pollution in E-Waste sites in Douala,Cameroon[J]. Journal of Health & Pollution, 2020, 10(26):1-20.

[63]
石颖, 刘洪. 最小加权范数插值与调制升频结合的地震数据重建研究[J]. 地震学报, 2010, 32(3):340-350.

[64]
李天祺, 朱秀芳, 潘耀忠, 等. MODIS陆地表面温度数据重构方法研究[J]. 北京师范大学学报:自然科学版, 2015, 51(z1):70-76.

[65]
林文鹏, 王长耀, 钱永兰, 等. 遥感和地面数据驱动下的农业气候环境信息网格化技术研究[J]. 农业工程学报, 2005, 21(9):129-133.

[66]
刘木生, 林联盛, 张其海, 等. 基于RS和GIS的江西省人口统计数据空间化[J]. 江西科学, 2008, 26(6):928-931.

[67]
王雪梅, 李新, 马明国. 基于遥感和GIS的人口数据空间化研究进展及案例分析[J]. 遥感技术与应用, 2004, 19(5):320-327.

文章导航

/