区域经济与理论方法

人文地理研究中时间阶段划分的量化工具与应用

  • 陈小强 , 1, 2, 3 ,
  • 袁丽华 1, 2, 3 ,
  • 宋长青 , 2, 3, ,
  • 程昌秀 1, 2, 3 ,
  • 王翔宇 1, 2, 3 ,
  • 梁晓瑶 1, 2, 3 ,
  • 王元慧 1, 2, 3 ,
  • 曹丹萍 1, 2, 3 ,
  • 易红 4
展开
  • 1.北京师范大学 地表过程与资源生态国家重点实验室,中国 北京 100875
  • 2.北京师范大学 地理科学学部,中国 北京 100875
  • 3.北京师范大学 地理数据与应用分析中心,中国 北京 100875
  • 4.哈尔滨师范大学 地理科学学院,中国黑龙江 哈尔滨 150025
※宋长青(1961—),男,黑龙江哈尔滨人,博士,教授,主要研究方向为全球化与地缘关系。E-mail:

陈小强(1996—),男,江西九江人,博士研究生,主要研究方向为全球化与地缘关系。E-mail:

收稿日期: 2020-11-16

  修回日期: 2021-01-08

  网络出版日期: 2025-04-23

基金资助

第二次青藏高原综合考察研究项目(2019QZKK0608)

Quantitative Tools and Applications of Time Stages Division in Human Geography Research

  • CHEN Xiaoqiang , 1, 2, 3 ,
  • YUAN Lihua 1, 2, 3 ,
  • SONG Changqing , 2, 3, ,
  • CHENG Changxiu 1, 2, 3 ,
  • WANG Xiangyu 1, 2, 3 ,
  • LIANG Xiaoyao 1, 2, 3 ,
  • WANG Yuanhui 1, 2, 3 ,
  • CAO Danping 1, 2, 3 ,
  • YI Hong 4
Expand
  • 1. State Key Laboratory of Earth Surface Processes and Resource Ecology,Beijing Normal University,Beijing 100875,China
  • 2. Faculty of Geographical Science,Beijing Normal University,Beijing 100875,China
  • 3. Center for Geodata and Analysis,Beijing Normal University,Beijing 100875,China
  • 4. School of Geographical Science,Harbin Normal University,Harbin 150025,Heilongjiang,China

Received date: 2020-11-16

  Revised date: 2021-01-08

  Online published: 2025-04-23

摘要

时间阶段划分是人文地理研究中认识人文地理现象和人类活动发生发展过程以及探索其动态演化特征的重要基础手段。传统人文地理研究通常采取等间隔分段、关键事件节点和指标曲线判断三类定性方法划分人文地理现象的时间阶段。引入时间约束聚类和多元断点分析两大定量分析工具划分时间阶段,能够更加客观地反映研究对象的阶段性特征。通过中国经济发展阶段划分的实践案例进行验证,结果表明:时间约束聚类和多元断点分析均能根据多维时间序列数据组合特征的变化识别出合理的阶段划分;时间约束聚类适用于小样本量的低频时间序列数据,不受限于不同类别变量的组合;多元断点分析适合大样本量的同类变量组合的高频时间序列的分析。二者将是在地理学多要素综合研究和大数据时代对传统时间阶段划分手段的重要补充。

本文引用格式

陈小强 , 袁丽华 , 宋长青 , 程昌秀 , 王翔宇 , 梁晓瑶 , 王元慧 , 曹丹萍 , 易红 . 人文地理研究中时间阶段划分的量化工具与应用[J]. 经济地理, 2021 , 41(1) : 21 -29 . DOI: 10.15957/j.cnki.jjdl.2021.01.003

Abstract

The division of time stages is an important basic means to understand the occurrence and development process of human activities and explore their dynamic evolution characteristics in studies of human geography. It widely adopts three types of qualitative methods to divide time stages of human geography phenomenon in traditional studies of human geography,such as equal intervals,key event nodes,and diagram of curves. Two quantitative tools,time-constrained clustering and multivariate change point analysis,are introduced to more objectively reveal discriminative characteristics of research object while dividing time stages. The practical cases of China's economic development show that: both time-constrained clustering and multivariate change point analysis can identify reasonable stages according to changes of multi-dimensional characteristics of sample data. Time-constrained clustering is suitable for low-frequency time series data with small sample size,and is not limited to combination of different types of variables. Multivariate change point analysis is applicable for high-frequency time series consisting of similar variable with large sample size. Both two quantitative tools will be an efficient supplement of the traditional means to divide time stages in the era of the multi-element comprehensive research and big data.

人文地理学是研究地球表层各种人文现象与人类活动发生发展过程、动态演化特征及其地域分异规律的科学[1]。时间阶段划分是认识人文现象和人类活动的发生发展过程以及探究其动态演化特征的重要基础手段,始终贯穿在人文地理学的诸多分支的研究中。例如,经济地理学研究中对人口增长[2]、贸易发展[3-4]、产业升级[5]等要素时间变化的刻画以及对区域总体经济发展水平的发展阶段判断[6];城市地理学研究中对城市土地利用[7]、城市化水平[8]以及城镇体系发展[9]的阶段划分;政治地理学研究中国家综合实力提升[10]和国家间关系演变的时间特征分析[11]。甚至在各个学科发展回顾的文献计量学分析中时间阶段划分也是一个重要的基础工作。总而言之,由于人文现象和人类活动的在时间上连续的固有特征和人文地理学研究面向社会发展服务的现实导向,时间阶段划分始终是面对人文地理问题时认识、理解和探究其时间过程演化特征的关键基础手段。
在传统人文地理学研究中,学者们采取了广泛的手段和方法来划分时间阶段以刻画不同要素变化和现象发展的特征,大致可以归纳为三种:等间隔分段、关键事件节点和指标曲线判断。从研究起始时间节点到终止时间节点采用等长时间间隔作为阶段或者等间隔选取时间截面是人文地理学中采用最广泛的手段,尤其是在涉及社会经济要素的格局演化方面的研究中。如齐元静等在研究中国区域经济发展阶段及其空间格局演变特征时选取了1990—2010年每隔五年的时间断面进行分析[12];周扬等在研究1982—2010年中国县域经济发展时空格局演变时采用了每隔十年的时间截面[13];潘峰华等在分析中国与周边国家贸易网络演化特征时也采取了每隔五年的时间截面[14]。等时长间隔分段广泛应用的原因除了简单直观外,其合理性在于国家和地方发展一般都制定相等时长的阶段性规划,如中国长期实施国民经济和社会发展五年规划,很大程度决定了经济发展的大体脉络。但是大量事实证明,很多人文现象的发生和人文要素的时序演化与各类发展规划的实施存在着时间上的不一致性,等时长间隔划分时间阶段的方法无法解释不同区域政治和经济因素演进的客观进程。
另外,以关键事件发生的时间节点来划分阶段也是人文地理学研究中经常采用的方法,广泛使用在地缘政治和经济的研究中,如2001年中国加入WTO[15]和2008年全球金融危机[16]等影响国际关系变动和国家经济社会发展的重大事件经常被作为时间节点来划分阶段。重大事件对政治经济活动深远的影响力和持续性是使用这一方法的合理性支撑。但是,以关键事件作为阶段特征的划分依据在一定程度忽视了每一个阶段人文地理现象的特征,以及不同阶段之间的特征差异。况且在精细化的时间序列研究中,很多人文现象研究中无法寻找出相当影响力的事件来锚定演化阶段,从而导致了阶段划分的局限性。
此外,诸多研究通过对简单指标的时间序列曲线的涨跌起落进行主观判断,或者按一定的标准要求来划分时间阶段。如在很多以人口转变五阶段理论、企业生命周期理论为基础的研究中都是分别根据人口出生死亡率、企业销售额的时间序列曲线的形态进行阶段的划分。事实上,人文要素的时间演化受多种外在因素的影响,而且通常无法确定主导要素。因此由多要素指标混合形成复杂交错的曲线簇,给研究者主观分段带来巨大的难度。
综上所述,人文地理研究中普遍采用的等间隔分段、关键事件节点和指标曲线判断三种方法有其突出的优点,但同时都存在着不同的局限性,尤其是面临当前地理学多要素综合研究的挑战时略显乏力,需要借鉴和引入其他领域中时间阶段划分的方法进行补充。为应对人文地理研究中要素多元化和综合定量分析的方法需求,本文引入时间约束聚类和多元断点分析两种可以有效处理多要素综合时段划分的数学工具,补充传统的时间阶段划分方法,并通过中国经济发展阶段划分的实践案例,表明两种工具在人文地理研究中的适用性及其应用潜力。

1 工具介绍及方法原理

1.1 时间约束聚类

时间约束聚类是将地层约束聚类分析应用于时间序列数据上的一种改进方法。地层约束聚类分析(Stratigraphically Constrained Cluster Analysis)是定量划分地层分带的有序聚类方法,广泛应用于植物生态学等领域[17-18]。不同于普通的凝聚层次聚类,地层约束聚类的过程中只能将相邻的类别合并,保证样本聚类结果的连续性,这一特性十分适合多元时间序列数据等有序样本的分析。其基本思想是:采用类内方差作为类内相似性的度量,首先将每个样品看成独立的一类,然后根据合并后类内方差增量最小的原则与相邻样本合并的约束条件进行凝聚聚类,直至所有样本聚成一类[19]。根据聚类结果可以进行多元样本的时间序列分段。其数学过程如下。
p类类内离差平方和定义为 D p
D p = i = 1 n p j = 1 m x p i j - x - p j 2
式中: n p为第p类包含的样本数量,即p阶段的时间长度;m为变量数; x p i j为第p类第i个样本的第j个变量的观测值,即p阶段内第i时间的第j个变量的观测值; x - p jp类中变量j观测值的平均值,也即变量jp阶段内的平均值。
将样本划分为k类后的总离差平方和为D
D = p = 1 k D p
若将相邻的第p类和第q类合并,组成新的第pq类,总类内离差平方和增量为 I p q
I p q = D p q - D p - D q
每次合并时,选择合并后方差增量 I p q最小的两类进行合并,直到最后合并成一类。
基于这一思想,在聚类算法实现过程中会采用更加高效的计算方式。默认每一个样本自成一类,计算原始数据中每对样本间欧氏距离的平方,生成一个相异性矩阵(dissimilarity matrix)。在聚类的每一步中,通过查询异性矩阵将相异性最小即 d p q最小的两类 p q合并,合并后方差的增量 I p q = 1 2 d p q,同时更新相异性矩阵中其它类rpq类的距离,r类与合并后新类pq的相异性为:
d r p q = n r + n p d r p + n r + n q d r q - n r d p q n r + n p + n q
式中: n r , n p , n q分别为;rpq类中样本数量。重复上述查询、合并和更新的步骤,直至所有样本合并为一类[20]。在计算欧氏距离之前可以对原始数据进行变换,从而产生不同性质的相异性度量,如将样本标准化为均值为0标准差为1、将样本向量进行单位长度归一化、平方根变换等,不同的数据变换会带来不同的效果,可以根据样本数据性质权衡采用。

1.2 多元断点分析

经典的断点分析作为检测时间序列分布变化的过程,被广泛应用于金融分析[21]、基因检测[22]和国际关系[23]等领域。在这一基础上,David等于2014年提出一种非参数的多元断点分析方法[24],能够基于多元时间序列的分布变化确定断点的数量和位置。断点是指时间序列前后的分布发生了显著变化的时间节点,根据断点的位置和数量可以进行时间序列的分段。其数学过程如下。
对于多维随机变量XY,其分布差异定义为:
D X , Y ; α = R d   Φ x t - Φ y t 2 ω t d t
ω t ; α = 2 π d / 2 Γ 1 - α / 2 α 2 α Γ d + α / 2 t d + α - 1
式中: Φ x Φ y分别是XY的特征函数; ω t为权重函数; α为自定义参数,取值范围为(0,2];在满足假设条件 E X α , E Y α 下, D X , Y ; α可以近似计算:
D X , Y ; α m n m + n ε ^ X , Y ; α
ε ^ X , Y ; α = 2 m n i = 1 n j = 1 m X i - X j α - n 2 - 1 1 i k n X i - X k α - n 2 - 1 1 i k n X i - X k α
式中:nm分别表示XY的观测值个数; α为自定义参数,取值范围为(0,2]。
在分布差异计算的基础上,多元断点分析利用迭代二分法和置换检验对断点位置和数量进行估计,具体步骤包括:
①单个断点的估计。设多元时间序列为 Z 1 , Z 2 , , Z T R d;设tk为两个常数且 1 t k T;设X= Z 1 , Z 2 , , Z t - 1Y= Z t , Z t + 1 , , Z k,则断点位置 t ^可以根据以下公式确定:
t ^ , k ^ = a r g m a x 1 t k n D X , Y ; α
②多个断点的估计。假设已确定k-1个断点: t ^ 1 , t ^ 2 , , t ^ k - 1 0 t ^ 1 t ^ 2 t ^ k - 1 T,将时间序列划分成k段: C 1 , C 2 , , C k ; C i = Z t ^ i - 1 + 1 , Z 2 , , Z t ^ i i = 1,2 , , k,其中 t ^ 0 = 0 t ^ k = T。对于 C 1 , C 2 , , C k中的每一段,重复步骤(1)中的方法找出对应的断点 t ^  ,然后在k t ^  中选择 D X , Y ; α最大的确定为最终的第k个断点 t ^ k
③利用置换检验确定断点的显著性。在迭代步骤(1)和步骤(2)时,每估计一次断点位置之后进行置换检验:假设估计出 Z i , Z i + 1 , , Z j中的断点 t ^ k,记 d ^ k = D X , Y ; α t = t ^ k;将 Z i , Z i + 1 , , Z j重新随机排列1次构成一个新的等长的时间序列,重新估计断点 t ^ k 1并计算 d ^ k 1;重复499次上述步骤得到 d ^ k r , r = 1,2 , , 499;定义断点 t ^ k的显著性水平 p = # r : d ^ k r d ^ k / 499 + 1。设定阈值为 p 0 = 0.05,在进行步骤(1)和步骤(2)迭代二分的过程中,若估计出的断点 p p 0则停止迭代,保留已估计的具有显著性的断点。

2 应用实践

2.1 经济发展阶段划分的问题由来

探究国民经济发展阶段特征是人文地理研究中的重要内容,也是研究很多社会经济要素和人文现象发展演化过程的基础。而且对经济发展阶段的划分及其特征的认识,是一国制定科学的经济发展战略和促进经济发展的重要前提之一[25]。经济发展阶段的探索起源于二十世纪初期西方经济学者们从不同角度对经济发展阶段进行划分,以罗斯托[26]、钱纳里[27]、霍夫曼[28]等人的理论观点为代表。此后国内学者也借鉴西方经济学的理论广泛探讨了中国经济发展阶段划分内涵和标准。
综观诸多不同的经济阶段划分标准,有学者将其概括成三类观点:总量主义的观点、结构主义的观点和综合主义的观点[29]。总量主义观点认为经济发展过程最终体现在经济总量的扩张,总量或人均产出是一个更为明确的经济增长尺度,通常采用人均GDP作为划分经济阶段的标准。结构主义观点则认为经济发展的本质是生产结构的变化,应构建不同生产部门的结构性指标作为判断经济发展阶段的标准。持该观点的代表人物罗斯托认为:经济发展过程是“主导部门”序列变化的过程,对于每一个发展阶段都有与之相适应的起引领作用的主导部门[25]。综合主义的观点认为经济发展的内涵丰富,不能以单一指标作为经济发展阶段的划分标准,而是若干指标的综合。尽管三类不同观点对经济发展阶段的划分标准不尽相同,但对于解释经济发展阶段性的普遍规律都具有启发意义。
在经济发展阶段划分的具体研究中,遵循不同理论观点进行实践的差异主要表现为选取的指标类型和指标数量的不同。从结构主义观点出发需要选取多部门的生产指标,而综合主义观点则需要更多维和全面的指标,这恰恰是传统时间阶段划分方法的应用局限所在。因此本文试图分别从结构主义观点和综合主义观点出发,构建经济增长结构性指标和经济发展综合指标,结合时间约束聚类和多元断点分析的定量分析方法,对中国的国民经济发展阶段进行划分。

2.2 结构主义视角下的中国经济发展阶段划分

改革开放以来,中国国民经济的持续发展伴随着产业结构的演进与升级,而产业结构的升级又推动国民经济的发展,促进一国经济进入新的发展阶段[30]。评价产业结构对国民经济发展动态影响的最直接指标是三种产业类型的贡献率,它表征了三种产业类型对GDP增长的贡献大小。从产业类型贡献率的视角考察国民经济发展阶段对评价产业政策的实施效果和未来产业调整计划具有重要的基础性价值。

2.2.1 数据来源及方法

产业类型贡献率是指第一、第二、第三产业对GDP增长速度的贡献率,等于各产业类型增加值的增量与GDP增量之比,按不变价格计算。1992年国务院发出《关于实施新国民经济核算体系方案的通知》,正式开始在中国实行联合国推荐的源于市场经济的国民经济核算体系,GDP成了中国最为重要的经济指标。因此为确保样本数据的口径统一及规范性,本文从国家统计局网站上获取了1992—2019年全国层面年度和季度两个时间尺度的三种产业类型的贡献率数据。本文利用时间约束聚类在年度数据上进行实验,利用多元断点分析在季度数据上进行实验。其中时间约束聚类通过Tilia软件实现,多元断点分析通过R软件中ecp程序包实现。

2.2.2 基于时间约束聚类的中国经济发展阶段年度划分

对全国1992—2019年年度三次产业贡献率数据进行时间约束聚类的结果如图1所示。图中左侧面积图展示了三种产业类型贡献率的年际变化。从总体来看,1992年以来第一产业对GDP增长的贡献率一直处于很低的水平,国民经济的增长主要依靠第二产业和第三产业的发展带动,其中第二产业对GDP增长的贡献率呈现下降的趋势,而第三产业越来越成为国民经济增长的动力源。图1右侧树状图展示了时间约束聚类的完整过程。时间约束聚类的过程属于自下而上的凝聚层次聚类,总的类内离差平方和会随着聚类数的减少而增加。换言之,随着分段数量的减少,阶段内样本的属性相似度必然会降低,在确定最合理的分段数时须尽量保证段内样本的属性相似度。
图1 1992—2019年中国三次产业贡献率年度阶段划分

Fig.1 Annual stage division of contribution rates of China's three industries from 1992 to 2019

在聚类过程中总类内方差随聚类数变化的曲线如图2所示。曲线在聚类数=3处出现了明显的拐点,当聚类数进一步减小时总类内离差平方和激增,说明当样本分段数量小于3时,无法保证每段内部样本的属性相似度。由此可以确定比较合理分段数量为3,再根据聚类树进行剪枝得到分段结果。结果表明中国1992—2019年三次产业对国民经济增长的贡献演变可划分为三个阶段:第一阶段(1992—2000年)、第二阶段(2001—2014年)和第三阶段(2015—2019年)。第一阶段是中国市场化转型和工业化发展的阶段,这一阶段中电子信息产业迅速崛起、重工业加速发展使得第二产业是推动国民经济增长的主要动力,对GDP增长的贡献达到了60%以上。同时第二产业的贡献率有所提高,第一产业对GDP增加的贡献较低。进入第二阶段,第三产业的蓬勃发展为经济增长注入了强劲动力,与第二产业共同成为中国经济发展的两大支柱,而第一产业的贡献更加微薄。在第三阶段随着产业结构进一步调整和优化,劳动密集型产业向海外转移,能源资源开采加工等行业发展速度减缓,生产性服务业呈现加快发展态势[31-32],导致第二产业的贡献率显著降低,而第三产业对贡献率迅速上升且远超第二产业,取代第二产业成为经济增长最主要的贡献力量。
图2 三次产业贡献率聚类过程中总类内离差平方和的变化

Fig.2 The change of total within-cluster dispersion in the process of clustering to contribution rates of China's three industries

2.2.3 基于多元断点分析的中国经济发展阶段季度划分

多元断点分析的原理是基于时间序列的分布变化,而且需要通过置换检验确定断点的数量,因此对样本时间序列的长度或频率有一定的要求。在此实验中,1992—2019年的年度数据样本量太小无法满足方法的基本应用条件,因此将全国1992—2019年三种产业类型贡献率时间序列的频率由年度提高至季度进行分析。本文利用R软件中ecp包进行多元断点分析,设置显著性水平阈值为0.05,所得结果如图3所示。
图3 1992—2019年中国三次产业贡献率季度阶段划分

Fig.3 Quarterly stage division of contribution rates of China's three industries from 1992 to 2019

在1992—2019年季度三种产业类型贡献率时间序列的多元断点分析中检测出两个断点,分别是2001年第1季度和2012年第3季度,将1992—2019年划分成三个阶段。第一阶段为1992年初至2000年底,在这一阶段中第二产业的贡献率虽然呈现下降的趋势,但始终保持在60%左右,是国民经济增长的主要助推器。而第三产业的贡献率稳步上升,从30%左右提高到了40%,第一产业贡献率持续走低,因此这一阶段可以概括为工业化加速发展阶段。第二阶段起于2001年第一季度止于2012年第三季度,阶段内三次产业贡献率总体上保持稳定,第二产业的贡献率略高于第三产业,共同成为国民经济增长的两大动力。在这一时期内,虽然第二产业贡献率变化不大,但是在第二产业内部结构在不断调整。尤其2001年中国加入WTO之后,电子产品加工、玩具、服装、制鞋等劳动密集型制造产业辐射全球,制造业在第二产业中的占比平稳上升,而能源和原材料工业比重逐渐降低。中国的经济发展从2012年第四季度进入第三阶段,第三产业的贡献率迅速上升达到60%以上,与第二产业贡献率的差距逐渐拉大,成为国民经济的主导产业。

2.3 综合主义视角下的中国经济发展阶段划分

综合主义的观点认为对经济发展阶段的准确把握来自于对经济发展丰富内涵的深刻认识。经济发展的内涵包括许多方面,如生产扩大、技术进步、产业结构升级、制度提升、价值观的变化等方面。从经济发展过程的复杂性和多面性特征中凝练和总结出合适的指标体系作为划分经济发展阶段的标准是关键。本文对中国经济发展阶段进行综合划分时,采用梁炜等[24]划分经济发展阶段的标准,将经济发展的动态过程概括为产出总量的持续上升、经济结构的日益改善、制度水平的不断提高和创新能力的突飞猛进四个方面,并借鉴其构建的指标体系进行中国经济发展阶段的综合划分与判断。

2.3.1 指标构建和处理

根据划分经济发展阶段的总量水平、经济结构、制度水平和创新能力四个标准,按照指标代表性和数据可获取性的原则筛选合适的指标。总量水平标准评价经济发展中总量的扩张,选取人均GDP这一广泛采用的指标来反映一个国家经济水平的总体规模。经济结构的变化是经济发展的内核,包括产业结构、分配结构、消费结构、就业结构等多方面的内容。考虑指标选取的代表性和可获取性,采用工业化程度和第三产业比重两个指标对产业结构进行刻画,采用城乡收入差距指标反映分配结构变化,在消费结构刻度方面选取城镇居民和农村居民的恩格尔系数两个指标,选择非农就业量比重表征就业结构,并且结合城市化水平指标衡量人口城乡结构的变化。制度水平的变化也是反映经济发展的阶段特征之一,完善的市场经济与开放的对外经贸是促进经济增长的极佳条件。因此在制度水平标准中,选取非国有经济比重衡量中国经济发展过程中的市场化水平,并且选取外贸依存度和外资依赖度两个指标反映经济发展的对外开放度水平。此外,国家的经济发展水平与其科技发展水平和创新能力水平密切相关,教育和研发的投入是提高科技创新水平的关键,在长期经济增长中扮演重要角色。选取教育经费占比和研发投入占比作为反映创新水平的两个关键指标。本文共计选取13个年度指标对中国经济发展阶段进行划分,各个指标的具体描述见表2
表2 不同阶段划分结果对比

Tab.2 Comparison between different division of stages

研究视角 数据指标 研究方法 划分结果
结构主义视角 年度三产结构指标 时间约束聚类 第一阶段(1992—2000年)
第二阶段(2001—2014年)
第三阶段(2015—2019年)
季度三产结构指标 多元断点分析 第一阶段(1992Q1—2000Q4)
第二阶段(2001Q1—2012Q3)
第三阶段(2012Q4—2019Q4)
综合主义视角 时间约束聚类 时间约束聚类 第一阶段(1992—1999年)
第二阶段(2000—2008年)
第三阶段(2009—2018年)
考虑到指标的完整性,本文选取的样本时间跨度为1992—2018年,数据主要来源于国家统计局网站,部分缺失数据查自《中国统计年鉴》《中国工业统计年鉴》和《新中国六十年统计资料汇编》等资料。为消除统计指标不同量纲的影响,对所有指标进行如下归一化处理:
x - i = x i - m i n x i m a x x i - m i n x i
式中: x - i表示指标归一化后的值; x i表示指标的实际观测值; m a x   x i表示该指标观测值中最大值; m i n   x i表示该指标观测值中最小值。将所有指标归一化至[0,1]区间之后,作为属性变量进行时间约束聚类,对中国经济发展阶段进行综合划分。

2.3.2 基于时间约束聚类的中国经济发展阶段综合划分

对1992—2018年中国经济发展综合指标的时间约束聚类结果如图4所示。根据聚类过程中总类内方差随聚类数量变化的曲线(图5)判断出拐点位置出现在聚类数=3处,可将1992—2018年中国的经济发展划分为三个阶段:第一阶段为1992—1999年、第二阶段为2000—2008年、第三阶段为2009—2018年。从经济发展的综合指标来看,第一阶段中经济发展的总量水平不断积累,在产业结构中工业化程度处于鼎盛时期而第三产业的发展仍处于起步阶段。此外在消费结构方面城镇和农村居民的恩格尔系数都处于较高的水平,就业结构和人口城乡结构中仍旧围绕着农业和农村为主。此外市场化水平、开放度水平和创新水平均处于有待提升的较低水平。到了第二阶段,随着中国对外开放水平的提高和市场化改革的深入,生产力水平进一步提高,经济总量保持快速的增长,同时产业结构也得到了有效的升级调整。尤其是随着中国加入WTO,对外贸易(I10)突飞猛进成为经济发展的强劲动力。但是同时值得关注的是第二阶段的城乡收入差异(I4)处于顶峰的时期,经济发展不平衡是这一阶段的突出特征之一。而在第三阶段中,中国经济发展进入了由“量变”到“质变”的转换时期。在保持经济总量稳步增长的同时,经济结构得到进一步优化,经济发展的城乡差异也日益缩小,城市化水平、市场化水平和创新水平都连创新高,中国经济朝着高质量发展的方向稳步迈进。
图4 1992—2018年中国经济发展阶段综合划分

Fig.4 Division of China's economic development stages from 1992 to 2018

图5 多指标聚类过程中总类内离差平方和的变化

Fig.5 The change of total within-cluster dispersion in the process of clustering to multivariate

表1 中国经济发展阶段划分的指标

Tab.1 Indicators for the division of China's economic development stages

经济发展标准 经济发展内涵 指标 具体描述
总量水平 经济总量 人均GDP(I1) GDP/人口数量
经济结构 产业结构 工业化程度(I2) 工业增加值/GDP
第三产业比重(I3) 第三产业增加值/GDP
分配结构 城乡收入差距(I4) 城镇居民人均可支配收入/农村居民人均可支配收入
消费结构 城镇居民恩格尔系数(I5) 城镇居民食品支出/城镇居民消费总支出
农村居民恩格尔系数(I6) 农村居民食品支出/农村居民消费总支出
就业结构 非农就业量比重(I7) 第二和第三产业就业人员数/就业人员总数
人口城乡结构 城市化水平(I8) 城镇人口/总人口
制度水平 市场化水平 非国有经济比重(I9) 非国有工业企业资产/工业企业总资产
开放度水平 外贸依存度(I10) 进出口总额/GDP
外资依赖度(I11) 外商直接投资总额/GDP
创新水平 教育水平 教育经费占比(I12) 教育总经费/GDP
研发水平 研发经费占比(I13) 研发经费/GDP

2.4 不同案例对比下的方法特点

通过前文中三个中国经济发展阶段定量划分案例的对比结果(表2)可以发现:同一结构主义视角下,采用不同时间尺度的样本数据,时间约束聚类和多元断点分析得到中国经济发展阶段划分结果基本是一致的;基于时间约束聚类方法,采用三维结构性指标和多维综合指标得到的划分结果存在差异,但二者划分结果都能很好地体现出各自指标的阶段特征差异。
上述应用案例表明,时间约束聚类和多元断点分析均能根据多维时间序列数据组合特征的变化识别出合理的阶段划分。除了所选指标反映的内涵和特征不同,值得关注的是二者在基本原理和适用条件方面也存在一些差异。在数学原理上,时间约束聚类本质是以离差平方和作为相似性度量的层次聚类方法,而多元断点分析是基于样本分布差异的统计检验方法。在适用范围方面,时间约束聚类在计算类内离差平方和之前可以根据研究需要对数据进行标准化等转换处理,能够消除不同变量之间量纲和量级差异带来的影响,因此适用于不同类别属性组合的多维时间序列数据的耦合分析;此外时间约束聚类本质属于凝聚层次聚类,当样本量过大时容易陷入局部最优的陷阱,所以在应用时适合小样本的时间序列数据。多元断点分析由于需要对多维时间序列的联合分布变化进行统计判断,因此在实际研究中应尽量保证各个维度是同一类变量。而且时间序列长度越长、频率越高,越能够检验出具有高度统计显著性的断点,不适用于较短的时间序列数据,这也是选择季度数据而非年度数据作为多元断点分析案例的原因。

3 结论与讨论

本文在归纳总结人文地理研究中时间阶段划分三大传统手段的基础上,结合当前地理学多要素综合与跨学科交叉研究的发展潮流,引入其他学科领域中可用于时间阶段划分的两种定量化工具,并通过结构主义和综合主义两个视角下中国经济发展阶段划分的三个实践案例验证其适用性,结果发现:
①时间约束聚类和多元断点分析针对不同的时间尺度数据和不同维度的指标组合均能根据多维时间序列数据组合特征的变化识别出合理的阶段划分,是对传统时间阶段划分手段的有效补充,在精细的时间阶段划分上具有明显的优势。
②时间约束聚类和多元断点分析由于自身数学原理的差异,二者的适用条件和范围有所不同。时间约束聚类适用于小样本量的低频时间序列数据,不受限于不同类别变量的组合。多元断点分析适合大样本量的同类变量组合的高频时间序列的分析。
诚如有学者提出地理“复杂性”已成为新时代地理学的核心特征之一[33],人文现象日益表现出内部各要素间、要素不同组合间的相互作用关系多样的复杂性,人地互动与社会经济活动也随着社会发展和技术变革衍生出更加复杂的内涵,为人文地理学研究方法的拓展、补充和进步提出了重大挑战。而且在当前“大数据”热潮下,数理统计等研究方法也被广泛运用于人文地理学的研究中[34]。因此本文引入两种不同的数理工具,能够根据不同时间尺度和多要素组合的数据变化特征划分时间阶段,更加科学有效地认识人文现象和人类活动发生发展过程,很好地补充了传统人文地理学研究中的阶段划分方法。
本文在展示两种方法在人文地理研究中的适用性中,对于时间约束聚类选取了低维度时间序列和高维度时间序列两个案例进行检验,但由于案例中综合指标的季度数据难以获取,只采用三维季度时间序列对多元断点分析进行检验,虽然实践结果充分证明了上述方法在解决地理时间分段问题的功能性,但是对于多元断点分析在高维度时间序列上的表现仍有待论证和探索,这也是本文的局限所在。此外,时间约束聚类和多元断点分析目前尚不能解决不同尺度嵌套的时间序列组合分段问题,这也是二者在实际应用中的局限,所以寻找和开发能有效解决多尺度嵌套时间序列分段的数据工具是未来值得探索的方向。
[1]
方创琳, 周尚意, 柴彦威, 等. 中国人文地理学研究进展与展望[J]. 地理科学进展, 2011, 30(12):1470-1478.

[2]
冯健, 周一星. 近20年来北京都市区人口增长与分布[J]. 地理学报, 2003, 58(6):903-916.

[3]
程中海, 南楠, 张亚如. 中国石油进口贸易的时空格局、发展困境与趋势展望[J]. 经济地理, 2019, 39(2):1-11.

[4]
Wang Y H, Song C Q, Sigley G, et al. Using social networks to analyze the spatiotemporal patterns of the rolling stock manufacturing industry for countries in the Belt and Road Initiative[J]. International Journal of Geo-Information, 2020, 9(7):1-29.

[5]
范文祥. 国际产业转移对我国产业结构升级的阶段性影响分析[J]. 经济地理, 2010, 30(4):619-623.

[6]
李娟文, 王启仿. 区域经济发展阶段理论与我国区域经济发展阶段现状分析[J]. 经济地理, 2000, 20(4):6-9.

[7]
杨奎, 张宇, 赵小风, 等. 乡村土地利用结构效率时空特征及影响因素[J]. 地理科学进展, 2019, 38(9):1393-1402.

DOI

[8]
方创琳, 刘晓丽, 蔺雪芹. 中国城市化发展阶段的修正及规律性分析[J]. 干旱区地理, 2008, 31(4):512-523.

[9]
于涛方, 顾朝林, 李志刚. 1995年以来中国城市体系格局与演变:基于航空流视角[J]. 地理研究, 2008, 27(6):1407-1418.

[10]
曹原, 葛岳静, 马腾. 2000年以来中国及周边国家综合国力评价与格局变化[J]. 经济地理, 2018, 38(4):45-54.

DOI

[11]
陈小强, 袁丽华, 沈石, 等. 中国及其周边国家间地缘关系解析[J]. 地理学报, 2019, 74(8):1534-1547.

DOI

[12]
齐元静, 杨宇, 金凤君. 中国经济发展阶段及其时空格局演变特征[J]. 地理学报, 2013, 68(4):517-531.

[13]
周扬, 李宁, 吴文祥, 等. 1982—2010年中国县域经济发展时空格局演变[J]. 地理科学进展, 2014, 33(1):102-113.

[14]
潘峰华, 赖志勇, 葛岳静. 经贸视角下中国周边地缘环境分析:基于社会网络分析方法[J]. 地理研究, 2015, 34(4):775-786.

DOI

[15]
周延, 杜运苏. 入世前后中国制成品产业内贸易发展的对比分析[J]. 世界经济研究, 2006(2):54-58.

[16]
孙根年, 舒镜镜, 马丽君, 等. 五大危机事件对美国出入境旅游的影响——基于本底线模型的高分辨率分析[J]. 地理科学进展, 2010, 29(8):987-996.

[17]
宋长青, 王琫瑜, 孙湘君. 内蒙古大青山DJ 钻孔全新世古植被变化指示[J]. 植物学报, 1996, 38(7):568-575.

[18]
Waller M, Grant M J, Bunting M J. Modern pollen studies from coppiced woodlands and their implications for the detection of woodland management in Holocene pollen records[J]. Review of Palaeobotany & Palynology, 2012, 187(1):11-28.

[19]
Ward J, Joe H. Hierarchical grouping to optimize an objective function[J]. Journal of the American Statistical Association, 1963, 58(301):236-244.

[20]
Grimm E C. CONISS:A FORTRAN 77 program for stratigraphically constrained cluster analysis by the method of incremental sum of squares[J]. Computers & Geosciences, 1987, 13(1):13-15.

[21]
Talih M, Hengartner N. Structural learning with time-varying components:tracking the cross-section of financial time series[J]. Journal of the Royal Statistical Society Series B (Statistical Methodology), 2005, 67(3):321-341.

[22]
Muggeo V M R, Adelfio G. Efficient change point detection for genomic sequences of continuous measurements[M]. Oxford: Oxford University Press, 2011.

[23]
庞珣, 刘子夜. 基于海量事件数据的中美关系分析——对等反应、政策惯性及第三方因素[J]. 世界经济与政治, 2019,(5):53-79.

[24]
Matteson D S, James N A. A nonparametric approach for multiple change point analysis of multivariate data[J]. Journal of the American Statistical Association, 2014, 109:334-345.

[25]
梁炜, 任保平. 中国经济发展阶段的评价及现阶段的特征分析[J]. 数量经济技术经济研究, 2009(4):3-18.

[26]
Rostow W W. The stages of economic growth:a non-communist manifesto[M]. Cambridge, UK: Cambridge University Press, 1960.

[27]
Chenery H, Robinson S, Syrquin M. Industrialization and growth:a comparative study[M]. Oxford: Oxford University Press, 1986.

[28]
Hoffmann W. Growth of industrial economics[M]. Manchester: Manchester University Press, 1958.

[29]
陈刚, 金通. 经济发展阶段划分理论研究述评[J]. 北方经贸, 2005(4):12-14.

[30]
刘伟, 李绍荣. 产业结构与经济增长[J]. 中国工业经济, 2002(5):14-21.

[31]
何德旭, 姚战琪. 中国产业结构调整的效应、优化升级目标和政策措施[J]. 中国工业经济, 2008(5):46-56.

[32]
陈彦光. 中国人口转变、城市化和产业结构演变的对应关系研究[J]. 地理研究, 2010, 29(12):2109-2120.

DOI

[33]
宋长青, 程昌秀, 史培军. 新时代地理复杂性的内涵[J]. 地理学报, 2018, 73(7):1189-1198.

[34]
甄峰, 王波. “大数据”热潮下人文地理学研究的再思考[J]. 地理研究, 2015, 34(5):803-811.

DOI

文章导航

/