城市地理与新型城镇化

城市结构对轨道交通系统与房地产价格关系的影响——以北京、杭州、南京、成都4个城市为例

  • 郑燕巧 , 1 ,
  • 焦世泰 , 2, ,
  • 张晓奇 1
展开
  • 1.浙江财经大学 金融学院,中国浙江 杭州 310018
  • 2.百色学院 管理科学与工程学院,中国广西 百色 533000
※ 焦世泰(1981—),男,甘肃永登人,博士研究生,副教授。主要研究方向为区域经济学。E-mail:

郑燕巧(1988—),女,浙江宁波人,讲师。主要研究方向为城市经济学、空间计量、应用计量。E-mail:

收稿日期: 2018-11-14

  修回日期: 2019-03-19

  网络出版日期: 2025-04-24

基金资助

国家自然科学基金(71471161)

国家自然科学基金(71631005)

国家社会科学基金项目(13CMZ038)

Impact of Urban Structure on Subway System and Real Estate Price:Evidence from Beijing, Hangzhou, Nanjing and Chengdu

  • ZHENG Yanqiao , 1 ,
  • JIAO Shitai , 2, ,
  • ZHANG Xiaoqi 1
Expand
  • 1. Zhejiang University of Finance and Economics,School of Finance,Hangzhou 310018,Zhejiang,China
  • 2. School of Management Science and Engineering,Baise University,Baise 533000,Guangxi,China

Received date: 2018-11-14

  Revised date: 2019-03-19

  Online published: 2025-04-24

摘要

文章构建衡量地铁通勤时间节省度的指标——地铁指数。基于该指标的回归分析显示,多数城市房价对交通便捷度的溢价为负。这一反直觉结果反映了城市多中心结构对地铁房价关系的影响。为识别不同的中心区块,提出一种带约束的聚类算法。该算法的优势在于其分区结果完全是数据导向的,相对于传统的行政分区,更能反映各区块的内在联结程度。同时,相较于传统的聚类算法,该算法在最小化组内距离的同时,加入一个在地铁指数的基础上构建的约束条件,该约束条件使得聚类分区结果能够同时反映城市经济学中关于交通便捷度溢价的基本假说和房地产市场的空间连续性特征。在分区的基础上重估模型,研究发现,在多中心城市的不同区块,地铁所带来的交通便捷度增益与其带来的居住环境恶化两种力量的对抗导致十分复杂的溢价效果。同时,诸如城市是否存在多个中心、城市核心区的大小、多中心城市的副中心与核心区距离的远近、不同中心区块经济发展程度的差异等城市结构因素也都会对地铁溢价的方向与大小产生影响。而这些复杂关系是在使用常系数特征价格模型分析单一城市的地铁房价关系时无法得到体现的。最后,基于约束聚类算法的分区结果还反映城市内不同区域间的经济地理一体化趋势与隔离趋势,因而可以为城市规划领域的有关问题提供有价值的建议。

本文引用格式

郑燕巧 , 焦世泰 , 张晓奇 . 城市结构对轨道交通系统与房地产价格关系的影响——以北京、杭州、南京、成都4个城市为例[J]. 经济地理, 2019 , 39(6) : 75 -85 . DOI: 10.15957/j.cnki.jjdl.2019.06.009

Abstract

This paper constructs an index system of time saving level of metro commuting to measure the improvement of commuting efficiency induced by living close to a metro station. Based on the regression analysis, the results find that except for Beijing, subway systems in Hangzhou, Chengdu and Nanjing all have negative impact on real estate price, which reflects the impact of the poly-centric structure of the three cities on their housing markets. To identify the correct housing submarket associated with every subcenter, this paper develops a constrained clustering algorithm which can partition the urban area into a set of subregions, this algorithm is fully data-oriented and can reflect deep-level features of urban structure. Compared with the standard K-means clustering, this clustering algorithm adds a constraint based on metro index. It is this constraint that can simultaneously reflect the space continuity of real estate market and the basic hypothesis which is the premium of transportation convenience. From the estimation, we find a complicated relationship between metro stations and real estate prices, the complexity is arising from the interaction of positive effect of subway system in terms of its commuting efficiency and its negative impact on living environment nearby. In addition, many structural features of cities can also significantly affect both the direction and scale of premiums of metro stations, such as the size of urban core, the distance between subcenters and urban core and so on. The complexity found in this paper is not detectable when it is used to analyze the real estate prize of single city based on the hedonic price model with constant coefficient. Finally, apart from pinpointing housing submarkets, constrained clustering can also shed light on the economic integration and segregation trend among different subregions of a city, which are useful information for urban planners.

自1970年代起世界各主要城市掀起了大规模的地铁轨道交通系统的修建潮[1]。由于地铁系统可以显著提升交通便捷度、减少通勤时间,是否临近地铁站成为了影响住房市场价格的一个重要因素,因此地铁与房地产价格的关系也吸引了经济学家、地理学家以及城市规划专家的广泛关注[2-3]。在各种研究地铁溢价的方法中,房产的特征价格模型具有明显的分析优势,因为这一模型建立在线性回归模型的基础上,模型参数可以利用最小二乘法进行估计,从而为量化研究打下了基础。另一方面,通过将房价的影响因素作为解释变量纳入回归方程,各个变量的回归系数可以直接视为相应的影响因素的溢价,便于理解。
在利用特征价格模型研究地铁与房价关系的文献中,地铁的可得性变量(包括给定房屋是否临近地铁、房屋距最近地铁站的距离等由房屋与地铁站点间的空间距离及其变体所构成的变量)通常被当作重要的解释变量。针对地铁的可得性,大量实证文献支持这样一个观点[4-6],即临近地铁站会给房产带来正向的溢价,并且这一溢价会随着距地铁站距离的延长而递减。然而,也有部分实证文献发现,房产价格与地铁可得性之间的关系并不总是正向的,并且这一关系会受到很多其他因素的影响,例如,临近地铁站导致的恶犯罪率上升化、拥挤、噪声等[7-10]。因此,地铁的可得性与房产溢价之间的正向关系并不总是十分稳健,在极端情况下,这种正向关系甚至会被逆转。事实上,很多文献中单纯考虑地铁可得性的做法等同于将地铁站的可得性程度与地铁的便捷性划等号,从而忽略了地铁站可得性并不总是带来实际交通便捷性提升,以及地铁可得性越高往往引致居住环境恶化的事实,因此简单对地铁可得性变量进行回归分析不能全面地反映地铁系统对房产市场的影响[2-3,5,11]。对此,本文将提出一个新的有助于更加直观地刻画轨道交通系统对居民交通便捷度影响的变量——地铁指数,并将该指数加入特征价格模型,以期将地铁站对于交通便捷度的正面效应从由地铁可得性变量所代表的总效应中分离出来,从而更加细致地刻画地铁与房价的关系。在引入地铁指数的基础上,利用北京、杭州、南京以及成都4个城市的房价数据的特征价格分析显示,除北京外,其他城市的房价与地铁指数的相关性为负。特别是杭州,除与地铁指数的负相关外,房价与地铁可得性的关系亦显著为负,这一结论与文献中的经典结论相悖[5]
针对上述“反常”的结论,本文引入房产市场内部的自市场分割和空间异质性加以解读。市场分割问题与空间异质性在房产价格的文献中已得到了广泛的探讨[12-14],常用的分析方法包括空间加权回归分析(GWR)[15-16]和房产子市场的聚类划分[12-13,19]等。然而仅仅引入空间异质性与市场分割等因素,并不足以解释北京与杭州、成都、南京在地铁—房价关系上的差异,即为何北京具有“正常”的地铁房价相关性而其他3个城市或多或少地存在“反常”的相关性?同时,对于杭州、成都、南京,在加入市场分割时,如何选择“合理”的分割方式才能确保房价与地铁的关系能够恢复正常?针对上述两个问题,本文认为地铁房价关系的空间异质性其实只是反映了更深层次的城市结构对地铁—房价关系的影响,只有将城市的结构特征加入分析框架,才能合理地选择一个城市的市场分割结构以及理解不同城市间地铁—房价关系的差异。
在将城市结构纳入特征价格模型的过程中,一个主要问题是城市结构是一个非数量化的影响因素,它不像地铁可得性,可以通过衡量到地铁站的距离这样简单的方式来进行量化。针对这一问题,研究者提出了不同的解决方案,如考虑不同邮政编码分区对应的地理分割的房产子市场[12-13]、基于房产特征向量的聚类分析[20-21]以及基于引入距城市多中心距离变量的特征价格模型[22]等。尽管以上方法都能在某个侧面刻画城市的结构特征,但一个普遍的问题是,这些方法并不能提供一个天然的连接城市结构特征与地铁—房价关系的纽带。为了使子市场的划分结果能够更好地反映城市结构的影响及其与地铁—房价之间的关系,本文通过改良传统的K-means聚类算法,发展一个带约束的聚类算法,该算法可用于自动识别城市的结构特征中与地铁—房价有关的信息,并基于这部分信息进行房地产子市场的划分。利用房价及地铁站分布的数据,它可以自动化地决定城市房地产子市场的数量以及每个子市场的地理边界。事实上,基于数据和带约束聚类算法的分区不仅是分析地铁—房价关系的一个手段,其分区结果也同样有着重要的意义,因为分区结果本身就蕴含了关于同一城市内部不同区域的发展程度差异、一体化程度差异,以及不同城市的结构差异等重要信息。有效利用这些信息,我们可以对城市结构的差异及其演变趋势的做出有意义的统计推断,为城市规划的相关议题提供有效的建议。

1 数据描述与研究方法

1.1 数据描述

本文主要考虑4个城市的地铁—房价关系,包括:北京、杭州、南京和成都。因为这4个城市分布于我国的不同区域并且均为各区域内的核心城市。并且这4个城市彼此间距离较远、独立性较高,它们有着各具特色的城市结构和发展历史。因此,对比这4个城市的地铁—房价关系有助于更好地刻画城市结构的潜在影响。4个城市的概况见表1
表1 四大城市概况

Tab.1 Background of four cities

城市 经纬度(东经北纬) GDP(万亿RMB) 人口(百万) 面积(km2 县级行政单位数量 地铁概况:第一条开通年份;现总条数
北京 (39.9,116.4) 2.80 21.70 16 808 16 1970;18
杭州 (30.2,120.1) 1.26 9.46 16 596 11 2011;3
南京 (32.1,118.8) 1.17 8.48 6 597 11 2003;7
成都 (30.7,104.1) 1.39 16.04 14 605 20 2013;3

注:数据来源为中国城市统计年鉴[23]

数据方面,针对北京、杭州、南京和成都4城,本文从搜房网获得了自2017年10月29日起持续一周的逐日的二手房销售价格数据。由于本文的分析侧重于房价对空间变量的依赖性,因此需要截取截面数据。我国主要城市近年来均经历了房价的飞速上涨,根据搜房网数据,本文关注的4个城市在2017年房价的平均月度波动幅度均超过10%,因此即使选择月度数据也难以保障价格的稳定性,这违反了截面数据的要求。为了规避时间对房价的影响,本文选择更短的时间窗口,仅截取了从2017年10月29日开始的1周之内的数据,该数据集内的全部在售二手住宅有效覆盖了北京、杭州、成都、南京4个城市的主城区全境、城市近郊及主要远郊区等重要区域,因此数据量可以支撑有效的统计分析。此外,采集期内,各城市各主要位置的房价波动幅度较小,满足截面数据要求。选择二手房作为分析对象则是为了确保数据的空间分布的合理性,因为对于北京、杭州、南京、成都这样高度发达的城市,在售新房通常分布于城郊,因此,只关注新房会忽视老城区的情况。在剔除掉经纬度坐标定位不精确的二手房记录后,4个城市的样本量分别为:北京2 625,杭州4 120,南京3 068,成都3 395。
对于每一套在售二手房,除被解释变量(单位面积的价格)之外,本文截取了房产的建筑面积、房龄、户型结构等房屋属性变量,附近学校、医院、购物中心等社区属性变量,并且通过使用百度地图的导航API,本文计算了从每套房产到达城市主要交通目的地的通勤时间。其中城市主要目的地涵盖了城市中央商务区、大学城、主要商业街以及经济技术开发区等。为了统一并且精简不同城市的解释变量个数,本文运用主成分分解法(PCA),提取了对应于上述通勤时间变量的前5个主成分的特征向量,由此为每个城市构建了5个通勤时间变量,以此反映房产的区位属性。针对全部4个城市,通勤时间变量排名前五的主成分的方差可以覆盖全方差的90%以上,这说明选择前5个主成分足以刻画通勤时间的主要信息。与地铁和公共交通有关的变量中,我们主要考虑地铁的可得性变量与公交车的可得性变量。地铁的可得性方面,遵循文献[5]的做法,本文囊括了距最近地铁站的直线距离、房屋周边1 km及1~2 km内范围内是否有地铁站以及房屋两公里内的地铁站是否为中转站点等变量。公交的可得性则囊括了距最近公交车站的距离、周边1 km范围内是否有公交站点以及1 km范围内公交站点上的公交线路数量。最后,为了衡量地铁所带来的实际通勤便捷度,本文构建了房屋的地铁指数(metro index)。正式地,地铁指数被定义为从该房屋出发选择不坐地铁的通勤线路去往城市各主要通勤目的地的通勤时间与选择地铁优先的通勤线路的通勤时间之比的平均值。不坐地铁线路与地铁优先线路的通勤时间可以通过百度地图的导航API进行批量计算。上述变量的定义和样本描述性统计见表2表3
表2 变量的定义

Tab.2 Definition of variables

变量 定义
log unit price 每平方米房价的对数值
公共交通 transfer metro 1 km范围内是否存在地铁站(1:是,0:否)
log dist subway 离最近地铁站的直线距离的对数值(Log km)
metro lt 1 周围1 km范围内是否有地铁站(1:有,0:无)
metro lt 2 周围2 km范围内是否有地铁站(1:有,0:无)
log dist bus 里最近的公交车站的直线距离的对数(Log km)
num bus routes 最近公交站点所提供的公交车线路数
bus in 1 km 周围1 km范围内是否有公交车站(1:有,0:无)
metro index 去往城市各个主要目的地的无地铁路线的通勤时间与地铁优先线路的通勤时间之比的平均值
房屋属性 log area 建筑面积的对数值
age 房龄(2017-建筑年代)
South 房屋朝向是否为南方或偏南方(1:是,0:否)
lobby num 客厅数
room num 卧室数
log stair 房屋所在楼层数的对数值
区位属性(log duration_PCA 0 去往城市各个主要目的地的对数通勤时间的第一主成分
duration_PCA 1 去往城市各个主要目的地的对数通勤时间的第二主成分
duration_PCA 2 去往城市各个主要目的地的对数通勤时间的第三主成分
duration_PCA 3 去往城市各个主要目的地的对数通勤时间的第四主成分
duration_PCA 4 去往城市各个主要目的地的对数通勤时间的第五主成分
社区属性(log km) log dist school 距附近最近学校的直线距离的对数(Log km)
log dist mall 距附近最近购物中心的直线距离的对数(Log km)
log dist hospital 距附近最近医院的直线距离的对数(Log km)
表3 变量的描述性统计

Tab.3 Summary statistics of variables

变量 北京 杭州 南京 成都
Min Max Mean Std. Min Max Mean Std. Min Max Mean Std. Min Max Mean Std.
log unit price -0.82 7.21 3.39 1.35 -0.26 7.44 1.93 1.18 -0.64 7.44 1.79 1.20 -0.70 7.37 1.59 1.23
公共交通
transfer metro 0 1 0.15 0.36 0 1 0.07 0.25 0 1 0.05 0.22 0 1 0.01 0.11
log dist subway -2.23 4.31 0.29 1.24 -2.18 7.25 0.52 1.20 -1.92 7.25 0.49 1.18 -1.83 4.79 1.40 1.12
metro lt 1 0 1 0.54 0.50 0 1 0.39 0.49 0 1 0.44 0.50 0 1 0.13 0.34
metro lt 2 0 1 0.18 0.39 0 1 0.25 0.43 0 1 0.18 0.39 0 1 0.12 0.32
log dist bus -2.29 4.23 -0.70 1.35 -2.26 7.23 -1.25 1.01 -2.25 7.23 -0.65 1.45 -2.19 4.68 -0.09 1.60
num bus routes 0 312 77.36 59.88 0 400 111.90 80.26 0 400 60.95 52.95 0 214 47.29 54
bus in 1km 0 1 0.83 0.37 0 1 0.95 0.22 0 1 0.77 0.42 0 1 0.60 0.49
metro index 1.08 2.38 1.77 0.24 1.15 2.38 1.58 0.30 0.58 2.38 2.13 0.48 1.36 2.38 1.66 0.21
房屋属性
log area 2.31 4.60 3.50 0.76 2.31 4.60 3.66 0.78 2.31 4.60 3.64 0.86 2.31 4.60 3.49 0.83
age 0 59 11.81 6.96 0 47 11.94 8.72 0 47 9.99 7.71 0 32 7.20 5.02
South 0 1 0.80 0.40 0 1 0.95 0.21 0 1 0.94 0.24 0 1 0.73 0.45
lobby num 0 8 1.75 0.82 0 5 1.66 0.56 0 5 1.66 0.52 0 23 1.84 0.68
room num 1 9 2.86 1.24 1 9 2.64 0.99 1 9 2.59 0.85 1 42 2.85 1.33
log stair -2.30 4.04 1.28 1.45 -2.30 3.80 1.67 1.02 -2.29 3.80 1.48 1.05 -2.29 3.93 1.77 1.20
区位属性(log)
duration_PCA0 -32.90 -29.10 -30.60 1.01 -49.09 -42.79 -45.34 1.59 -34.81 -42.79 -32.50 1.12 -36.03 -32.76 -34.18 0.95
duration_PCA1 -1.15 1.06 -0.01 0.66 -2.31 3.90 0.01 1.36 -1.11 3.90 0.02 0.96 -0.61 1.40 0 0.49
duration_PCA2 -0.80 0.63 0.01 0.45 -1.68 2.32 0.02 0.86 -0.98 2.32 -0.01 0.66 -0.69 0.64 0 0.44
duration_PCA3 -0.93 0.36 -0.01 0.30 -0.78 1.89 0.01 0.49 -0.32 1.89 0 0.31 -0.44 1.09 0.01 0.39
duration_PCA4 -0.37 0.54 0.01 0.22 -0.76 1.24 0 0.44 -0.71 1.24 0 0.27 -0.37 0.63 0 0.26
社区属性(log km)
log dist school -2.30 4.25 -0.20 1.24 -2.30 7.23 -0.54 1 -2.30 7.23 -0.03 1.25 -2.23 4.72 0.48 1.26
log dist mall -2.17 4.29 0.29 1.29 -2.27 7.23 0.31 0.94 -2.14 7.23 0.59 1.18 -2.27 4.80 1.08 1.13
log dist hospital -1.86 4.35 1.01 0.95 -2.09 7.24 1.17 0.94 -2.14 7.24 1.33 0.96 -1.75 4.78 1.14 0.98
4个城市抽样房产的空间分布与地铁站点的空间分布如图1。从图1中,可以看出抽样房屋基本上覆盖了4个城市的主城区及近郊区域,并在一定程度上可以反映各城市内部各区域的经济发展程度。就北京而言,绝大多数抽样房产坐落于六环路以内,六环路外的房产基本上都集中在地铁沿线。同时,五环路以内区域的房产分布密度相对平均但显著高于以外的区域。这一点反映了北京目前的发展状态,即五环路以内的区域已经高度城市化,各片区的发展程度相对一致。相比之下,抽样房屋在其他3个城市的分布则不够平衡。在杭州,钱塘江西北岸的房屋分布密度明显高于江东北岸与南岸的分布密度,这种密度差反映了杭州老城中心区(钱塘江西北岸)与萧山新区(钱塘江南岸)、下沙、临平新区(钱塘江东北岸)在发展程度与人口密度的差异。南京和成都的抽样房屋分布则更加不规则,都呈现出多中心的特征。成都的多个副中心区呈现条带形状,并由城市核心区域向外放射。相比于成都,南京的多块中心区分布更为零散,没有放射特征。对于地铁站点的分布,北京和南京的地铁站点分布更加平均、密集,特别是北京五环路以内,地铁站点的分布十分密集,地铁可得性很高,几乎所有住宅2~3 km内都会有至少1个地铁站。相比之下,杭州和成都的地铁站分布呈现高度的非平衡性,截至数据搜集时,杭州西部与成都东部几乎没有地铁站点分布。4个城市地铁站点分布的差异反映了其轨道交通系统在发展程度上以及功能定位上的差异。北京地区的地铁修建始于1970年代,远远早于其他3个城市,在21世纪初,为适应2008年奥运会的需求,北京地铁经历了飞速扩建时期,这也使得北京轨道交通有着极高的普及程度。至今,北京的地铁系统已经成为城区居民出行的首选方式。相较之下,杭州、成都的轨道交通系统起步较晚,轨道交通的修建目的更多是为了加强中心城区与郊区卫星城之间的连接,促进卫星城当地的发展,而非作为城区内其他交通手段的替代品。杭州与成都地铁站点分布密集区域并非老城中心区而是郊区新城,这一分布特征印证了这两个城市轨道交通的功能定位。
图1 二手房与地铁站的空间分布

Fig.1 Spatial distribution of metro stations and second-hand house

1.2 特征价格模型与全样本回归结果

特征价格模型本质上是一个多元线性回归模型,它已被广泛应用于房产价格及其影响因素的研究之中[24-25]。本文主要考虑对数形式的特征价格模型,如式(1)所示:
l o g P i = β 0 + β 1 × Z i + β 2 × X i + μ i
式中:P表示房屋单价(万元/m2);Z代表一系列控制变量,包括房屋的建筑特征、社区特征以及区位特征等;解释变量X则代表了本文关心的变量集合,它包含了与公共交通有关的全部变量,如地铁的可得性变量、公交系统的可得性标量以及地铁指数。其中,为了便于理解回归系数的含义,所有非虚拟变量都已经进行了对数变换,因而其系数可以理解为房屋单价对相应变量的变化弹性。
表4报告了利用4个城市全样本估计出来的模型(1)的回归系数,其中只对与公共交通相关的变量系数进行了报告,而全部系数的报告可参见补充材料。通过表4可以看到,北京所有与公共交通相关的回归系数的符号都与预期相一致,其中metro lt 1与metro lt 2的系数为正,印证了地铁可得性与房屋售价的正相关关系,与多数文献的观察相一致[4-526-27]。然而,在杭州,metro lt 1与metro lt 2这两个虚拟变量的系数显著为负,负系数意味着在其他条件不变的情况下,靠近地铁站将压低房屋价格,这一发现不仅与北京的截然相反,而且也与多数研究北京、上海、深圳等一线城市的地铁—房价关系的文章中的结论相悖[5]。另一方面,除北京外,其余3个城市metro index的系数都具有显著的负系数。metro index的负系数意味着一种“荒谬”的关系,即其他条件不变时,邻近地铁站所带来的出行效率的提升越高,房屋售价反而越低。这种非正常的地铁—房价关系也削弱了metro lt 1与metro lt 2的正系数对南京、成都两地房产市场的解释力,因为这意味着房产市场的非理性,即购房者考虑房产价格时只看重尽可能邻近地铁站而无视地铁站实际上带来的效用提升。
表4 全样本回归结果

Tab.4 Full-sample regression result

变量 北京 杭州 南京 成都
Dist bus -0.0599** 0.0803*** -0.0910*** -0.0199
Bus in 1km 0.2589*** 0.1200*** -0.1481*** -0.0058
Num bus routes -0.1293*** 0.0669*** 0.0337*** -0.0714***
Dist subway -0.0734*** -0.0684*** -0.0497*** -0.0036
Transfer metro 0.0609*** 0.0149 0.0241* -0.0854**
Metro lt 1 0.0272 -0.0952*** 0.0376** 0.1106***
Metro lt 2 0.0139 -0.0773*** 0.0689*** 0.1004***
Metro index 0.0059 -0.122*** -0.1552*** -0.2958***
Adj.R2 0.85 0.883 0.923 0.837
F-Staitstics 679.4*** 1 434*** 1 684*** 795***
Obs. 2625 4 130 3 068 3 395

注:“*”、“**”、“***”分别代表10%、5%、1%显著程度。

针对以上反直觉的观察,本文认为一个更合理的解释是,存在一些隐变量,正是这些变量的变化决定了不同的地铁—房价关系。而在这些隐变量之中,最为重要的一个变量就是城市结构。从图1中,杭州、南京、成都这3个城市与北京最大区别在于这3个城市内部存在着明显的分区,并且不同区域间发展并不平衡。相对于高度发达且基础设施完备的老城中心区,发展相对滞后的卫星城或城郊中心区的房价整体水平相对较低,同时,由于城市的主要就业中心仍然聚集在老城区,地铁在这些新区的开通往往会带来更高的通勤效率,从而更高的metro index,这一反向因果会带来metro index与房价的负相关性。
以上城市多中心结构的假说尽管可以用于解释metro index与房价的反向关系,然而利用数据验证这一假说的有效性则十分困难。主要的难点在于:①如何确定一个城市究竟有多少个中心;②每个中心辖区的边界如何确定。尽管也有相关研究试图考虑将城市分区与房产市场的分割联系起来,借此考察同一城市内部的房产子市场的差异。然而此类研究中的分区是通过行政区或邮政编码分区而先验地决定[12-13,28],这种利用行政或地理因素的先验分区方法的一大弊病是其分区结果并不能很好地刻画基于市场力量自发形成的房产子市场所对应的地理区域[29]。另一种被广泛应用的分区方式则是利用机器学习中的聚类算法与不同房屋间的“相似距离”来实现的自动化分区[19,29],这一分区方式的好处是减少了对先验信息的依赖,从而可以更好地利用数据本身的特征。但是聚类算法在识别房产子市场时,也有一定的局限。最重要的一个局限是,单一的“相似距离”函数无法同时刻画房屋之间的相似程度和地铁—房价之间的复杂关系。因此,直接使用传统的聚类算法进行分区,分区结果依然无法确保地铁与房价之间的扭曲关系得到剔除。对此,本文提出了一种改良的聚类算法,我们称之为带约束的聚类算法。通过引入合理的约束条件,该算法可以完全剔除房价与metro index之间的扭曲关系,同时过滤出地理位置上同质性最高的房产子市场。

2 带约束的聚类算法与基于分区的特征价格模型

2.1 带约束的聚类算法

带约束的聚类算法是对传统的基于K-means方法的聚类算法的一个拓展。相对于传统的K-means聚类,我们不仅要求不同房产之间地理距离的最小化,而且还要求每一个给定的类必须对应于一个“同质化”的房产子市场。利用城市经济学中的经典观点[31],本文中的“同质”定义为在每一个子市场中,房屋单价对于metro index的反应是正向的。这一同质化要求背后的逻辑是:如果是城市的多中心结构导致了房价与metro index的扭曲关系,那么在每一个被准确识别出来的中心区域内,房价与metro index的关系将恢复正常。因此,确保metro index与房屋售价的正相关性应当成为城市分区的一个必要条件。本文将采取这一必要条件作为带约束的聚类算法中的约束条件。正式地,一个带约束的K-means聚类算法等同于求解以下最优化问题:
m i n K , S K S S K x S x c - x c , S ¯ 2
P m x - 1 , S x - 1 , S T - 1 x - 1 , S T x S 1 > 0 d e t x - 1 , S x - 1 , S T 0 i 1 , , K ,   K 1
式(2)中: S K是一个关于全样本的K元分割; x是由房屋的所有特征变量所构成的向量,特征变量包含了所有表2中的所有变量以及由经纬度所刻画的房屋位置( x c),其中下标c表示向量 x中对应于经纬度的维度。与表2一致,我们假设特征向量的第一个维度的变量为房屋的价格并简记为 x 1,相应地, x - 1表示由向量 x除第一维度外的其余维度所构成子向量;m代表metro index所对应的维度; P m表示到第m维的投影;最后, x S表示由区块S中所有房屋的所有特征向量所构成的数据矩阵;上标T代表矩阵的转置运算;det代表方块矩阵的行列式。利用上述符号,式(3)中的第一个不等式左端实质上表示了每一个区块内,房价对metro index的最小二成的回归系数,因此该不等式是前一段中的约束条件的数学表达。而式(2)中的第二个不等式是一个纯粹的技术性假设,它要求每一区块内,房屋数量必须足够多,从而确保最小二成估计值的存在性。
为了确保一般性,我们要求式(2)中的极小化需要取遍所有的正整数K以及样本集的所有K元分割。不对分区的数量K做任何限制是因为在应用中,一个城市究竟应该分解成几个区域事先是不可知的。对于问题(2)的求解,本文采用一个在Lioyd算法基础上改进的启发式算法来实现
需要强调,上述带约束的聚类算法要求每一个分区所代表的房产子市场必须同时满足:①地域上的一致性,即在地理位置上,每个房产子市场内的房屋必须足够接近,这反映了经典文献中对于房产市场分割的基本要求[12-13,19,28,30],构成了本文选择K-means聚类作为基础聚类方法的原因;②同一子市场内部是同质的,以至于可以确保其他条件不变时地铁指数与房屋售价之间的正相关关系,而这一正相关关系也是经典城市经济学理论所要求的[31]。但也需要指出,尽管在本文的应用中,房价对metro index的回归系数的符号被用作唯一的约束条件,但上述带约束的聚类算法可以拓展至同时考虑多个约束条件下的聚类分析任务。事实上,在式(3)的基础上,我们还可以要求地铁指数的回归系数在一定的显著水平以上显著为正;或者要求轨道交通系统与公交系统的可替代性满足某种约束,等等。对这些额外约束条件的讨论已经超出本文主要关心的议题,本文将不再对此做深入探讨。

2.2 基于分区的特征价格模型

通过对杭州、南京、成都这3个存在多中心结构的城市运用带约束的K-means聚类分析,我们得到了如图2所示的房产子市场划分。其中,杭州被分割成两个区域,成都有3个子区域,而南京则被分割成了六个区域。南京具有最多的子市场这一结论也与我们对图2中南京抽样房屋的空间分布的观察相一致。为了检验分区结果的稳健性,本文将带约束的聚类算法反复运行了20次,并且每一次运行都使用了不同的随机初始化。在这20次分区计算中,杭州、南京、成都的分区数均未发生变化,而每个区域的范围与图2中的结果相比,变化不大,因此图2中的分区结果具有较高的稳健性。
表5~表7报告了杭州、南京、成都各区块的地铁相关变量的系数估计值以及拟合效果的统计量 。比较表5~表7表4中的调整后的R2可见,通过划分子市场,模型的解释力得到增强。同时,所有子市场中房价对metro index的反应回归正常,这正是约束条件(3)所要求的,也反映了带约束的聚类算法对上述3个城市的数据运行正常,每个城市的房产市场被完全地分割成了若干子市场。针对南京、杭州、成都的各个分区,本文进行了以下几方面的对比分析。
表5 南京聚类分区后的回归结果

Tab.5 Regression result by cluster-Nanjing

区块0 区块1 区块2 区块3 区块4 区块5
Dist bus 0.0026 0.0364 0.1460* -0.0559 -0.1102 -0.2411***
Bus in 1 km -0.3748** 0.3693*** -0.3626 0.098 -0.2485 -0.4484***
Num bus routes 0.1142*** 0.0026 0.1704 -0.0481 0.1274 0.1111**
Dist subway 0.0018 -0.0328 -0.1817** -0.0342 -0.0590 0.0283
Transfer metro 0.0477** 0.8917***
Metro lt 1 0.1045*** -0.0254 0.2448* 0.0667* 0.1875 -0.0750
Metro lt 2 0.0767*** 0.0267 0.2105 0.0019 -1.1426 0.0372
Metro index 0.0010 0.1337** 0.0269 0.0021 0.4389* 0.0014
Adj.R 0.9170 0.9600 0.9560 0.9510 0.9740 0.9200
F-statistics 382.5*** 702.1*** 661.2*** 382.5*** 342.1*** 230.6***
Obs. 760 638 639 430 159 442

注:1.“*”、“**”、“***”分别代表10%、5%、1%显著程度。2.对于部分区块,由于不存在临近的换成地铁站,transfer metro的系数估计值缺失。表6~表7同。

表6 杭州聚类分区后的回归结果

Tab.6 Regression result by cluster-Hangzhou

杭州 区块0 区块1
dist_bus 0.2430*** 0.1073***
bus_in_1 km 0.2047** 0.3375***
num_bus_routes 0.0032 0.0863***
dist_subway -0.0377 -0.0194
transfer_metro 0.0093 0.0602***
metro_lt_1 0.0563 -0.0536***
metro_lt_2 0.0903*** -0.0614***
metro_index1 0.0020 0.0021
Adj.R 0.9130 0.8920
F-statistics 341*** 1 255***
Obs. 1 699 2 431
表7 成都聚类分区后的回归结果

Tab.7 Regression result by cluster-Chengdu

区块0 区块1 区块2
dist_bus -0.0340 0.0549 0.0048
bus_in_1 km -0.0795 0.2769*** -0.0490
num_bus_routes -0.0224 -0.1024*** 0.0706**
dist_subway -0.2602*** 0.1377*** -0.1645***
transfer_metro 1.3171
metro_lt_1 -0.1093* 0.2074*** -0.0529
metro_lt_2 -0.0423* 0.1708*** -0.0350
metro_index1 0.0199 0.0117 0.2031*
Adj.R 0.8560 0.9070 0.8770
F-statistics 471.1*** 480.2*** 196.6***
Obs. 1 794 1 081 520
①基于南京城市分区的特征分析:从表5中可知,在南京,邻近区域内具有换乘站对房价有着极其显著的正向影响。特别是在图2c中由蓝点覆盖的区域(其边界与江宁区边界基本重合),换乘站点对房价的影响达到最大值。这一观察与江宁区的地理位置、地域分布以及发展近况相一致。事实上,江宁区位于南京老城区南侧,其北部区域相对发达并且毗邻南京老城区(图2c中黑点覆盖区域),此处聚集了南京航空航天大学等知名学府,并且坐落有南京的大学城,人流密集,地铁换乘站点也都分布于此。密集的人口与相对郊区的地理位置,使得选择江宁区北部作为居住地的居民有强烈的通勤需求;同时由于南京轨道交通系统覆盖全面,通过集中于江宁北部换乘站点的地铁站线路,居民几乎可以快速通达到南京其他各主要城区与近郊,这一显著的交通优势与该区域的高通勤需求相结合,造成了换乘站点周边的价格峰值。
图2 房产子市场划分

Fig.2 Housing sub-markets in Hangzhou, Chengdu and Nanjing

除换乘站点外,地铁的可得性变量(metro lt 1与metro lt 2)的回归系数也体现了不同区块的特征。如南京的江北区(图2c中红点覆盖区域)与栖霞区西端(图2c中绿点覆盖区域),邻近地铁站对房价的影响达到南京各区域的最大值。这两个区域的共同点在于距离南京主城区距离较远,均处于远郊区,而且经济发展程度与基础设施完备程度都与主城区或南京近郊地区(如江宁区北部)有着很大的差距。这种地理位置与经济发展的差异导致这两个区域与主城区之间有着较强的通勤需求,同时从这两个区域去往主城区的最快捷交通方式只能是轨道交通。所以,邻近地铁站将极大地提升通勤效率,从而推高房价。特别是栖霞区西端,该区域metro index的系数相对于南京其他城区取值最大,这也从侧面反映了出地铁当地通勤对地铁系统的依赖程度。
②基于杭州与成都城市分区的对比分析:经济发展水平的落差与地理位置的远离会带来地铁可得性的高溢价这一关系也在杭州和成都的分区结果中得到了验证。杭州的下沙与临平2个新区以及萧山新区部分地区(图2a中绿点覆盖区域)在发展水平上落后于杭州主城区(西湖东岸),然而在这两个区域所对应的子市场中,邻近地铁站对于房价有着更为明显的刺激作用。同样,在成都相对欠发达的西部城区(图2b中蓝点覆盖区域),靠近地铁站的溢价也更为明显,这印证了Plaut P O等[22]研究的观点。
然而,杭州和成都2个城市的案例也显示,邻近地铁站的溢价并不总是正的。在杭州的区块1、成都的区块0与区块2,metro lt 1和metro lt 2的系数均为负数,这也意味着其他条件不变时,临近地铁站会带来房价的下降。这一观察印证了文献[11]的观点,即靠近地铁站的住房周边恶劣的治安环境、噪声污染以及过于拥挤的地面交通会降低房屋的附加值。为了更好地验证这一理论观点,针对杭州与成都,本文将变量metro index的空间分布描绘在图3中。不难发现,杭州的区块1与成都的区块0具有一个明显的共同点,即在这2个区域内metro index的数值显著低于同城市的其他区域,表明位于这2个区域内的地铁站点并不能有效地改善周边居住区的交通便捷度,因此对于房产价值没有实质的影响。然而另一方面,这2个区块基本与杭州、成都的老城区以及城内经济发展较好的区域相重合,因而这2个区块内的人员流动性极高、公共交通系统十分发达,其中临近地铁站的区域更是经常会扮演局部交通枢纽的角色,这造成了邻近地铁站与居住环境的恶化高度相关,最终导致地铁站的负溢价,这一结论也与Knight R等[7]研究的观点相一致。
图3 地铁指数的空间分布

Fig.3 Spatial distribution of metro index in Hangzhou and Chengdu

③针对杭州区块1与成都区块0的对比分析:很明显,上述论证过程对于杭州区块1与成都区块0的地铁负溢价有着很好的解释力,但成都的区块2的负溢价并不支持这一论证。事实上,成都的区块2远离老城区,同时图3也显示该区域的metro index均值明显高于其他两个区块。但如果仔细观察这一区块的空间结构,不难发现,与成都市区的其他两个区块相比,该区块的内部结构更加零散,而且内部呈现多中心特征,并且这些内部中心在地理位置上都远离成都主城区(区块0)。所以,区块2内部各区域更可能形成独立于成都主城区的区域中心,这些区域中心不仅仅是居住中心,同时也是就业中心,这降低了这些区域中心及其辖区对成都主城区的依赖,同时也降低了与主城区之间的通勤需求,因此相比于邻近地铁站,靠近区域中心更具吸引力[32],然而通过对比图2b图1d,不难发现成都区块2内部的区域中心与该区块内的地铁站在空间分布上是互斥的,分布于区块2的地铁站点实际上起到了联通区块2和与之相隔离的成都主城区的作用。因此区块2的区域中心的相对独立性与靠近该区域中心的需求最终决定了邻近地铁的对房屋的负溢价。同时,如果我们关注区块2中metro index的系数,可以发现在成都的三个区块中,该系数在区块2达到最大。这一观察意味着,尽管与老城区联系松散,但轨道交通系统带来的交通便捷度仍然对当地房价具有很强的正向影响。只不过由于地铁站与区域中心的分离,这一影响无法通过邻近地铁站这一指标反映,而需要通过衡量地铁的通勤效率的metro index加以反映。所以,成都区块2的案例也印证了在特征价格模型中加入metro index这一变量的重要性。
综上,本文认为距离城市中心区(或主要功能区)的远近、城市的多中心结构(多中心的个数及彼此之间的距离)、城市局部中心的发展程度及其相对于城市主要功能中心的独立程度等城市结构性因素会通过影响城市不同地理位置的通勤需求来影响metro index取值,再在此基础上对房价与临近地铁站点和metro index的关系产生影响,并由此促成房产在地铁可得性与metro index这两维度上的特征价格与metro index之间的空间协同性特征。

2.3 区块与城市结构的进一步讨论

进一步探究约束条件(3)的经济、地理含义,不难发现,(3)不仅与metro index有关,房屋区位、建筑属性等一些列变量实质上都会对式(3)产生影响。这是因为,式(3)中的第一个不等式左端实际上是特征价格模型中metro index的回归系数的最小二乘估计值。线性回归模型中,一个解释变量系数的最小二乘估计并不仅依赖于这个变量本身与被解释变量的取值,还依赖于其他解释变量的取值。因此,约束式(3)已经包含了诸如公交相关变量、房屋所在社区的环境变量等一系列因素的对metro index的潜在影响。这其中也包含了由duration PCA变量所代表的城市经济地理结构的影响。所以,对分区结果的深入分析反过来也有助于我们对城市结构的深层特征做出有价值的推断。例如,城市内部各区域内的一体化程度和分割程度就是一个可以通过分区结果加以分析的重要的结构特征。
以杭州为例。图2a中杭州的分区结果显示,尽管位于钱塘江东南岸萧山区境内且正在开发中的钱江世纪城、亚运村等区域(图2a中阴影覆盖范围)被规划为杭州的新CBD,这一区域仍被带约束的聚类算法自动分入区块1,与下沙、临平等远郊新城分入同一区块,而与代表杭州老城区的西湖东南岸一带相隔离。对于“官宣”的新CBD与杭州自发形成的老中心城区的区别对待,实质上体现了钱江新城、世纪城所在区域发展起步较晚,在当前阶段其商务中心功能与老城区相比仍然欠缺,尚不具备规划中的商业集聚能力这一基本事实。这一结果也进一步地揭示了行政规划力量与市场力量的不同步甚至脱节的风险。因此,本文提出的带约束的聚类算法可以自动地识别城市内部不同区块彼此之间的一体化程度与分割程度,而且识别的准确度不会受到市场自发力量外的因素(如行政规划等)的干扰。
同样,通过图2b、2c,不难发现,成都和南京的分区结果也具有深入探究的价值。例如,成都区块0与区块1之间的高度规则化的地理边界传达了怎样的结构信息、南京的区块3与区块4在地理位置上高度接近但为何没有被合并等等都是很值得关注的经济地理现象,这些观察为未来的研究指明了方向。

3 结论

本文拓展了大量实证文献中关于地铁—房价关系的讨论。特别是通过在特征价格模型中加入衡量轨道交通系统建设实际带来的交通便捷度提升的指标(metro index),本文弥补了传统特征价格模型中仅利用单一的地铁可得性指标来度量地铁与房价关系这一做法的不足。通过考察metro index与房价的关系,本文发现地铁与房价的关系会随着城市结构的变化而出现显著不同,特别是城市的多中心结构以及不同中心区域在经济发展与地理位置上的差异在决定地铁—房价关系扮演着重要的角色。对此,本文将城市结构作为一个核心影响因素加以分析,并提出了一个带约束的聚类算法,以提取城市结构的数量特征。通过利用房价与地铁的回归关系将城市分成不同的子区域,并将每个子区域视为不同质的房产子市场,在每个子市场内重新估计特征价格模型,本文发现,地铁可得性与房价的关系并不总是正向的,特别是在城市存在多个中心区块时,邻近地铁站对于房价的影响机制十分复杂,地铁站的存在是否能够实际提升通勤效率以及城市的边缘区域与中心区的关系是否相对独立等因素,都会对地铁—房价之间的关系产生重要的影响。最后,通过深入分析杭州的分区结果,本文还发现,带约束的聚类算法产生的分区结果可以很准确地把握住城市内部各区域间的一体化趋势或分割趋势,这一趋势信息对于城市规划者有着重要的实践意义。
[1]
Duncan M. The impact of transit-oriented development on housing prices in San Diego,CA[J]. Urban Studies, 2011, 48(1):101-127.

[2]
Debrezion G, Pels E, Rietveld P. The impact of railway stations on residential and commercial property value:a meta-analysis[J]. The Journal of Real Estate Finance and Economics, 2007, 35(2):161-180.

[3]
Debrezion G, Pels E, Rietveld P. The impact of rail transport on real estate prices:an empirical analysis of the Dutch housing market[J]. Urban Studies, 2011, 48(5):997-1 015.

[4]
冯长春, 李维瑄, 赵蕃蕃. 轨道交通对其沿线商品住宅价格的影响分析——以北京地铁5号线为例[J]. 地理学报, 2011, 66(8):1055-1 062.

[5]
Dai X, Bai X, Xu M. The influence of Beijing rail transfer stations on surrounding housing prices[J]. Habitat International, 2016, 55:79-88.

[6]
Zhang Y, Zheng S, Song Y, et al. The spillover effect of urban village removal on nearby home values in Beijing[J]. Growth and Change, 2016, 47(1):9-31.

[7]
Knight R, Baldassare M, Swan S. Urban service and environmental stressor[J]. Environment and Behavior, 1979, 11(4):435-450.

[8]
Hui E C, Chau C K, Pun L, et al. Measuring the neighboring and environmental effects on residential property value:Using spatial weighting matrix[J]. Building and Environment, 2007, 42(6):2333-2 343.

[9]
聂冲, 温海珍, 樊晓锋. 城市轨道交通对房地产增值的时空效应[J]. 地理研究, 2010, 29(5),801-810.

[10]
Won J M, Son K B. Land price impact of subway[J]. Seoul University Capital Region Development Institute Yeongu Nonchong, 1993, 19:35-47.

[11]
Bowes D R, Ihlanfeldt K R. Identifying the impacts of rail transit stations on residential property values[J]. Journal of Urban Economics, 2001, 50(1):1-25.

[12]
Goodman A C, Thibodeau T G. Housing market segmentation[J]. Journal of Housing Economics, 1998, 7(2):121-143.

[13]
Goodman A C, Thibodeau T G. Housing market segmentation and hedonic prediction accuracy[J]. Journal of Housing Economics, 2003, 12(3):181-201.

[14]
Wu C, Ye X, Du Q, et al. Spatial effects of accessibility to parks on housing prices in Shenzhen,China[J]. Habitat International, 2017, 63,pp.45-54.

[15]
Farber S, Yeates M. A comparison of localized regression models in a hedonic house price context[J]. Canadian Journal of Regional Science, 2006, 29(3):405-420.

[16]
Yu D, Wei Y, Wu C. Modeling spatial dimensions of housing prices in milwaukee[J]. Environment and Planning B:Planning and Design, 2007, 34(6):1085-1 102.

[17]
Goodman A C. Housing submarkets within urban areas:definitions and evidence[J]. Journal of Regional Science, 1981, 21(2):175-185.

[18]
Islam K S, Asami Y. Housing market segmentation:a review[J]. Review of Urban & Regional Development Studies, 2009, 21(2-3):93-109.

[19]
Bourassa S C, Hoesli M, MacGregor B D. Defining residential submarkets:evidence from Sydney and Melbourne[R]. Dissertation. HEC/Université de Genève,1997.

[20]
Wu C, Sharma R. Housing submarket classfication:The role of spatial contiguity[J]. Applied Geography, 2012, 32(2):746-756.

[21]
Wu C, Ye X, Ren F, et al. Modified data driven framework for housing market segmentation[J]. Jounral of Urban Planning and Development, 2018, 144(4):172-182.

[22]
Plaut P O, Plaut S E. Endogenous identification of multiple housing price centers in metropolitan areas[J]. Journal of Housing Economics, 1998, 7(3):193-217.

[23]
国家统计局. 中国城市统计年鉴[M]. 北京: 中国统计出版社, 2016.

[24]
Rosen Sherwin. Hedonic prices and implicit markets:Product differentiation in pure competition[J]. Journal of Political Economy, 1974, 82(1):34-55.

[25]
Can A. The measurement of neighborhood dynamics in urban house price[J]. Economic Geography, 1990, 66(3):254-272.

[26]
谷一桢, 郭睿. 轨道交通对房地产价值的影响——以北京市八通线为例[J]. 经济地理, 2008, 28(3):411-414.

[27]
王福良, 冯长春, 甘霖. 轨道交通对沿线住宅价格影响的分市场研究——以深圳市龙岗线为例[J]. 地理科学进展, 2014, 33(6):765-772.

DOI

[28]
Ottensmann J R, Payton S, Man J. Urban location and housing prices within a hedonic model[J]. Journal of Regional Analysis and Policy, 2008, 38(1):19-35.

[29]
Anas A, Kim I. General equilibrium models of polycentric urban land use with endogenous congestion and job agglomeration[J]. Journal of Urban Economics, 1996, 40(2):232-256.

[30]
Dale-Johnson D. An alternative approach to housing market segmentation using hedonic price data[J]. Journal of Urban Economics, 1982, 11(3):311-332.

[31]
Mohring H. Land values and the measurement of highway benefits[J]. Journal of Political Economy, 1961, 69(3):236-249.

[32]
Aguilera A, Mignot D. Urban sprawl,polycentrism and commuting. A comparison of seven French urban areas[J]. Urban Public Economics Review, 2004(1):93-114.

文章导航

/