On Hedonic Price of Second-Hand Houses in Beijing Based on Multi-Scale Geographically Weighted Regression:Scale Law of Spatial Heterogeneity

  • SHEN Tiyan , 1 ,
  • YU Hanchen 2 ,
  • ZHOU Lin 3 ,
  • GU Hengyu , 1, 4, ,
  • HE Honghao 5
Expand
  • 1. School of Government,Peking University,Beijing 100871,China
  • 2. School of Geographical Sciences and Urban Planning,Arizona State University,Phenix 85287,Arizona,USA
  • 3. Institute of Industrial Economics,Chinese Academy of Social Sciences,Beijing 100044,China
  • 4. Center for Spatial Data Science,University of Chicago,Chicago 60637,Illinois,USA
  • 5. School of Software & Microelectronics,Peking University,Beijing 102600,China

Received date: 2019-05-15

  Revised date: 2020-02-03

  Online published: 2025-04-11

Abstract

A large number of empirical researches show that there is obvious spatial heterogeneity in the housing price influence mechanism. Although classic geographically weighted regression (GWR) can solve part of the spatial heterogeneity problem which cannot be handled by traditional linear regression models, it ignores the scale problem of spatial heterogeneity of different influencing factors and causes large estimation errors. Multi-scale geographically weighted regression (MGWR) improves classical GWR by allowing the bandwidths of each variable to be different, thereby obtaining more credible estimation results and giving the scale of influence of different variables. Based on MGWR, this paper studies the price characteristics of second-hand residential transactions in Beijing from 2011 to 2017. The results show that: 1) Previous researches based on classic GWR may not be robust. MGWR can separate different influence scales of the independent variables, and MGWR result is more reliable. 2)Beijing second hand house prices are very sensitive to location factors, and there is a high degree of spatial heterogeneity. The scale of location impact is the smallest of all variables and is close to the street scale. The number of bedrooms and the distance to the nearest subway are variables on a global scale, and the influence on space is relatively stable. The distance to the bus station, the distance to the elementary school, the structure of the building and the condition of the decoration have no significant effect on house prices. Other significant variables have certain spatial heterogeneity, and their spatial scales from small to large are transaction time, area, building age, floor, and orientation. 3) Location, orientation, number of bedrooms, and transaction time all positively affect house prices, while area, age, floors and distance to the subway station negatively affect house prices. In all the influencing factors, location is the most important factor affecting house prices, followed by the direction of transaction time. Area, transaction time, direction, and distance to the nearest subway have key impact. Floor and the number of bedrooms have a smaller impact on house prices, while the area and building age have the weakest impact.

Cite this article

SHEN Tiyan , YU Hanchen , ZHOU Lin , GU Hengyu , HE Honghao . On Hedonic Price of Second-Hand Houses in Beijing Based on Multi-Scale Geographically Weighted Regression:Scale Law of Spatial Heterogeneity[J]. Economic geography, 2020 , 40(3) : 75 -83 . DOI: 10.15957/j.cnki.jjdl.2020.03.009

大量实证研究表明住宅价格影响机制研究中往往存在明显的空间异质性现象。尽管经典地理加权回归可以在一定程度上解决传统线性回归模型所不能处理的空间异质性问题,然而其忽略了不同影响因素的空间异质性尺度差异,导致了较大的估计偏误。多尺度地理加权回归通过允许各个变量带宽不同改进了经典地理加权回归,进而得到了更为可信的估计结果,同时给出了不同变量的影响尺度。
住宅价格是目前社会最为关心的问题之一,尤其在北京、上海等特大城市,过高的房价正驱逐着具有创新能力的年轻人。从居民需求来看,第六次全国人口普查数据显示,北京市城市居民人居居住面积8 m2以下户数占比达到14.97%,远远高于全国户数比例9.72%,其中,城市中心更是达到了20%,住宅资源极其紧张。然而根据网易房产数据中心(gl.house.163.com)统计,目前北京市主城区商品房开发成本(含低价)只有1万元/m2左右,而销售均价达到6万元/m2左右,高出5倍以上。
高房价带来的影响涉及社会的方方面面,并将通过影响人才居留进而影响城市未来的竞争力。因此,特大城市住宅价格的影响机制亟待被进一步研究和剖析。

1 文献回顾

1.1 住宅价格研究中的空间非平稳性

传统的住宅价格研究往往将住宅视为一种同质性的标准商品,其区位特征、建筑属性和其他差异性特性多被忽略。住宅商品异质性的本质源于空间固定性,这一特性决定了其不能像食品、电器等同质商品一样被相互替换。Lancaster的异质性商品消费理论和Rosen的隐性市场研究,奠定了异质性商品实证研究模型——特征价格模型(Hedonic Price Model)的理论基础[1-2]。从研究层面上,将住宅作为异质性商品的探讨多关注城市内部,且以价格分异及其机理研究为主[3-6]。传统基于OLS回归的实证研究假设所有特征因素存在同质性。然而,一个地区的住宅市场并非同质统一,位于不同地理位置的住宅很可能具有不同的特征价格组合。例如,以Schnare为代表的市场细分理论认为一个地区的住宅市场可以分割为若干个子市场,每个子市场对应不同的特征价格函数,并通过实证研究证实,相对于统一市场,对每个细分子市场进行单独回归的结果拟合度更好[7]。Goodman、Fletche等则发现住宅年龄、房间数等特征因素在基于OLS回归模型的特征价格分析中存在异方差问题[8-11]。这些研究都表明,不仅住宅商品具有异质性,住宅特征与价格之间的关系也具有空间非平稳性。因此,变量间的结构或者关系会随地理位置的变化而改变。
从消费者理论出发,这种空间异质性是存在的,异质性商品给消费者带来的效用源自商品的属性特征。单位特征量给不同消费者带来的效用满足是不同的,取决于消费者对某一特征的偏好程度,这种偏好是会随商品其他特征属性的改变而改变的。以住宅为例,房价一定程度上反映了买房者对不同特征的偏好,由于不同消费者对房屋属性的需求和偏好程度不同,住宅的特征属性对房价的边际影响也不同。例如,城市中较老的房屋很少配有车库,所以一个车库的附加价值比其他房屋更高[12]

1.2 空间异质性的尺度拓展

国内外住宅价格空间异质性研究普遍验证了部分特征属性的空间异质性,且大量理论与实证研究发现,相比OLS回归,经典地理加权回归(GWR)更适合揭示住宅价格特征[13-23]。然而在既有研究中,学者对不同影响因素空间异质性的尺度差异研究甚少,而这恰恰是地理学研究的基本范畴。Goodchild认为:“尺度是地理信息科学最重要的话题”[24]。McMaster认为:“尺度是所有地理检索的本质”[25]。在日益全球化的世界体系中,当我们试图去解释某种社会经济现象时,“空间尺度效应”的理解至关重要。一方面,不同类型社会经济要素的发展过程往往对应不同的空间尺度。另一方面,某种社会经济现象的涌现往往是由多个不同尺度的空间过程共同决定的。尺度是描述和理解社会经济现象的重要参考,但学界在建立具有“跨尺度”描述能力和解释能力的数学模型方面仍缺乏强有力的理论与方法。这会导致无法揭示不同影响因素的空间尺度,也会因捕捉了过多的噪声而造成结果的不稳健。
在北京市二手住宅价格影响机制中,异质性尺度的影响同样至关重要。北京不同行政区功能定位和经济发展特点存在明显不同,人群收入、生活方式等存在较大差异。因此不同地区购房人群存在显著区别,也就造成了不同地区对不同二手住宅的偏好存在差异。这种偏好的空间异质性和空间尺度导致了二手住宅价格影响因素的空间异质性和空间尺度。因此不同影响因素存在不同的异质性和尺度,即在某个范围内作用大小相似,而超过这个范围后作用大小差异明显。对于北京来说,消费者对于区位非常敏感,区位一方面反映了交通的通达性,另一方面决定了公共服务和基础设施的优劣。所以区位对于房价的影响尺度非常小。相比而言,朝向、面积等因素对于房价的影响较为平稳,空间异质性不明显,因此其影响尺度较大。
目前能够处理尺度问题的研究方法中,虽然半参数地理加权(SGWR)回归在一定程度上能处理全局和局部的尺度问题[26-27],但其仅能将不同变量的影响尺度分成全局和局部两类,无法进一步细分。Fotheringham在2017年提出的多尺度地理加权回归(MGWR)方法则针对这一不足做出了非常充实的回应[28]。但当时缺乏该模型的统计推断方法。Yu等在2019年补充完善了MGWR的统计推断,从而使得该方法可以普遍地用于实证研究中[29]
相比传统的经典GWR,MGWR主要有以下三点重要改善:首先,允许每个变量各自不同的空间平滑水平解决了经典GWR模型的缺陷。其次,每个变量特定带宽可以用作每个空间过程作用的空间尺度的指标。第三,多带宽方法产生了更接近真实和有用的空间过程模型。本文基于MGWR和特征价格模型,结合北京市二手住宅交易数据,对北京市2011—2017年二手住宅价格的空间分异和空间尺度差异进行探讨。

2 数据来源与变量选择

2.1 数据来源

北京市住宅与城乡建设委员会将城市住宅分为城镇新建住宅和二手住宅两类。前者主要指在房地产市场第一次进行产权交易及网上签约的住宅,分为保障性住宅和新建商品住宅两类。后者则特指进入房屋市场进行交易,第二次及以上进行产权登记的住宅,包括二手商品住宅、允许上市交易的已售公房等。自2008年起,二手住宅已经成为北京市住宅交易的主角,且成交占比连年上升,在2011—2017年甚至达到95%以上。因此,二手住宅不仅为北京市住宅市场的研究提供了更加充足的样本,且更具代表性。此外,在空间布局方面,随着城市持续、大规模的扩张,新建住宅格局的重心不断向外漂移,相比之下,二手住宅的空间布局更为均质,这更加有利于进行空间数据分析。
本文选取2011—2017年的北京市六环内二手住宅为研究对象。剔除信息严重不完整、信息明显有误的数据之后,共有3 219 754个样本,主要来自于2 971个不同小区,即平均每个小区约有107套二手住宅交易记录。由于MGWR计算量大,为了降低样本数量,本文基于分层抽样在每个小区进行抽样得到2 971个样本,并借鉴Li等提出的Fast GWR算法[30],对所有样本进行计算。
研究数据来自链家地产网(bj.lianjia.com/xiaoqu/)。链家地产在北京市二手住宅市场的份额占50%以上,在中介机构中排名第一,其二手住宅成交记录的代表性较强。二手住宅样本坐标信息来自2017年北京市遥感影像图。百度地图、google地图等网络地图资源的坐标信息进行过内部加密转换,因此与实际坐标位置存在偏差。为避免由地理坐标不准确而导致的实证偏误,本研究应用北京市最新遥感影像地图获取二手住宅样本的坐标信息。

2.2 变量选择

特征价格模型的一般形式为: P = f Z 1 , Z 2 , , Z n,其中, Z i i = 1 - n表示商品的第i项特征属性值。特征价格理论从商品异质性出发,认为人们消费商品的效用并非来自商品本身,而是来自商品所具有的属性或特征,并从中获得效用和满足。每种特征对价格的影响称为这一特征的特征价格。特征价格模型往往通过回归方程进行特征价格的求解,因此模型函数具体形式的选择将直接影响分析的结果。目前文献中,最常用的包括线性、对数、半对数等函数形式,关于哪种函数形式最优一直存在争论。本文使用最常用的线性形式的特征价格模型。参考国内外相关理论及研究成果[13-23],并考虑到数据可得性、局部共线性等问题,本文以二手住宅单价为因变量,自变量选择见表1。其中,由于经典GWR和MGWR的常数项表示了在其他自变量确定的情况下,不同位置对于因变量的影响大小,因此常数项在一定程度上可以捕获未包含在模型中的教育水平、环境等由位置唯一确定的因素对于房地产价格的影响[26]
表1 变量描述

Tab.1 Descriptions of major explanatory

变量名称 英文简写 单位 变量描述
常数项 Intercept 万元 模型的截距项,反映了区位的影响
成交月 month 成交时间距2011年1月的月份数
面积 area m2 住宅面积
卧室数量 bed 住宅卧室数量
楼龄 age 房屋建成年龄,即2011年与建成年差值
楼层 floor 分值 房屋所在楼层(0为低楼层,1为中楼层,2为高楼层)
朝向 direction 虚拟变量 房屋是否朝向东、南(朝向包含东或者南为1,否则为0)
装修状况 decorate 虚拟变量 是否精装修(精装修为1,否则为0)
建筑结构 stucture 虚拟变量 房屋是否是板楼(板楼为1,否则为0)
最近地铁站距离 subway km 到最近地铁站的距离
最近公交站距离 bus km 到最近公交站的距离
最近小学距离 school km 到最近小学的距离

3 研究方法——多尺度地理加权回归(MGWR)

MGWR模型的计算公式如下:

y i = j = 1 k β b w j u i , v i x i j + ε i

式中:bwj代表了第j个变量回归系数使用的带宽。
MGWR的每个回归系数 β b w j都是基于局部回归得到的,且带宽具备特异性,而这也是与经典GWR的最大差异,在经典GWR中, β b w j的所有变量带宽相同。MGWR的核函数和带宽选择准则依然延续使用经典GWR的几种经典的核函数和带宽选择准则。本文使用最为常用的二次核函数和AICc准则。
经典GWR使用了加权最小二乘估计方法,而MGWR的估计则大为不同。MGWR可以看成是一个广义加性模型(GAM)[31-32]。如下:

y = j = 1 k f j + ε f j = β b w j x j

对于广义加性模型可以使用后退拟合算法(Back-Fitting Algorithm)来进行各个平滑项的拟合。后退拟合算法首先需要对所有的平滑项进行初始化设置,这意味着需要对于MGWR模型中的各个系数在先期进行初步估计。初始化一般有4种选择:①经典GWR估计。②半参数GWR估计。③最小二乘估计。④均设置为0。本文选择以经典GWR估计作为初始估计。在确定初始化设置之后,则可以通过计算真实值与初始化估计得到的预测值之间的差距,也就是初始化残差 ε ^

ε ^ = y - j = 1 k f ^ j

该残差 ε ^加上第一个加性项 f ^ 1与第一个自变量 X 1上进行经典GWR回归,找到最优的带宽 b w 1和一列新的参数估计 f ^ 1 ε ^来替换之前的估计。然后残差加上第二个加性项 f ^ 2与第二个变量 X 2回归并更新第二个变量的参数估计 f ^ 2 ε ^。以此类推,重复进行直到最后一个自变量(第k个自变量) X k。以上整体为一步,重复直到估计收敛到收敛准则为止。本文采用经典的残差平方和变化比例(RSS)作为收敛准则:

S O C R S S = R S S n e w - R S S o l d R S S n e w

式中: R S S o l d代表上一步残差平方和; R S S n e w代表这一步残差平方和。

4 北京市二手住宅价格影响因素的空间尺度和空间分异

4.1 二手住宅价格的空间格局分析

图1可知,北京市的二手住宅单价格局存在明显的圈层结构,具体表现为:中心高,外围低,西北高,东南低,高值二手住宅普遍位于西二环、北二环、中关村和国贸CBD地区。整体上房屋单价由三环路、四环路分割,三环路以内属于单价最高的区域,单价在6万元以上。三环到四环之间属于单价居中的区域,单价在4~6万元之间。超过四环后价格迅速降低,单价在1.7~4.0万元之间。进一步使用局部Moran's I (LISA)探索成交单价的空间自相关模式,如图2所示[33]。由成交单价的LISA图可以看出,二手住宅单价呈现明显的空间正自相关,在四环以内出现显著的“高—高”集聚区,以外则以的“低—低”集聚区为主。
图1 北京市二手住宅成交单价

Fig.1 Beijing second-hand houe price

图2 北京市二手住宅成交单价LISA图

Fig.2 LISA of Beijing second-hand houe price

4.2 模型对比

表2可知,MGWR的拟合优度R2高于经典GWR,且AICc值低于经典GWR,由此可以判定,MGWR的结果优于经典GWR。在有效的参数数量方面,MGWR更小,残差平方和也更小,说明其使用更少的参数得到了更接近真实值的回归结果。另一方面,从整体的回归系数来看,MGWR的各个系数在整体上均显著,如图3所示,而经典GWR除常数项以外其他系数整体上均不显著。二手住宅交易中这些变量均不显著是非常不合理的,而这也表明经典GWR由于忽略了各个变量作用尺度的多样化,造成了回归系数中存在大量噪声和偏误,进而导致回归系数的不稳健。因此,至少基于本案例的分析结果,发现MGWR模型优于经典GWR模型。
表2 经典地理加权回归与多尺度地理加权回归模型指标

Tab.2 Model index of GWR and MGWR

模型指标 MGWR 经典GWR
拟合优度R2 0.915 0.899
AICc 5 316.8 5 897.3
有效参数数量v1 598.2 613.7
残差平方和 628.1 751.2
图3 多尺度地理加权回归系数的空间格局

Fig.3 Spatial patterns of coefficients in the MGWR

4.3 尺度分析

表3可知,MGWR能够直接反映不同变量的差异化作用尺度,而经典GWR则只能反映出各个变量作用尺度的平均值。经典GWR的带宽为142,占总样本数量的4.8%。而通过计算MGWR,发现不同变量的作用尺度差异很大。在MGWR回归结果中,常数项、成交月、面积、卧室数量、楼龄、楼层、朝向、最近地铁站距离8个变量的回归系数整体显著。而装修状况、房屋结构、到小学距离、到公交站距离4个变量的回归系数不显著。常数项表示了在其他自变量确定的情况下,不同位置对于房价的影响。其中本文控制了交通的因素,故而常数项反映了学区、建成环境等其他区位因素对于房价的影响。其作用尺度为43,占总样本数量的1.4%,远低于其他变量的作用尺度。北京六环内面积约为2 267 km2,1.4%的面积为31.7 km2。平均意义下,该尺度接近于北京市街道尺度。而对于城市中心的样本点来说,该尺度接近于社区尺度。这一方面说明区位的价值在街道行政区大小的范围内基本相同,一旦超过该尺度,系数会出现剧烈变化。另一方面,该结果也说明二手住宅价格对于区位非常敏感。成交月的作用尺度同样较小,为67,接近街道尺度,这说明价格随时间的涨幅在空间上的差异较大。房屋面积的作用尺度很小,为116,说明面积存在的空间异质性较大。卧室数量的作用尺度为2 945,属于全局尺度,即几乎不存在空间异质性,北京各地区房价受到卧室数量的影响基本相同。楼龄的作用尺度为481,占总样本16.2%,存在较大的空间异质性。楼层的作用尺度为1 114,属于较大尺度,系数在空间上较为平稳。房屋朝向的作用尺度为1 890,同样属于较大尺度。到地铁站的距离的作用尺度为2 970,是全局尺度,即基本不存在空间异质性。
表3 经典地理加权回归与多尺度地理加权回归模型带宽

Tab.3 Bandwidth of GWR and MGWR

变量 MGWR带宽 经典GWR
常数项 43 142
成交月 67 142
面积 116 142
卧室数量 2 945 142
楼龄 481 142
楼层 1 114 142
朝向 1 890 142
装修状况 43 142
建筑结构 69 142
最近地铁站距离 2 970 142
最近公交站距离 2 970 142
最近小学距离 306 142

4.4 系数空间格局分析

MGWR各系数统计描述见表4。常数项所反映的区位对于房价的影响为正向影响,且出现明显的圈层结构,如图3a所示。高值主要集中在二环内、北二环到北三环之间、西三环和西北三环到西北四环之间。常数项取值在0.662~9.155之间,均值为4.44,标准差为1.4,这说明北京市六环内区位价格在0.662~9.155万元/m2之间,平均的区位价格在4.4万元左右,且不同区位对于二手住宅单价的影响差异很大。从系数绝对值上来看,其影响强度在所有变量中最大。
表4 多尺度地理加权回归系数统计描述

Tab.4 Statistical description of MGWR coefficient

变量 均值 标准差 最小值 中位数 最大值
Intercept 4.442 1.406 0.662 4.442 9.155
area -0.011 0.005 -0.024 -0.011 0.001
bed 0.437 0.008 0.416 0.440 0.448
direction 0.639 0.113 0.420 0.634 0.844
decorate 1.301 1.257 -2.443 1.128 6.118
month 0.050 0.024 -0.038 0.048 0.140
subway -0.138 0.002 -0.143 -0.138 -0.134
floor -0.278 0.123 -0.472 -0.309 0.072
age -0.024 0.009 -0.048 -0.025 -0.005
stucture 0.042 0.366 -0.749 -0.015 1.752
bus 0.056 0.003 0.050 0.055 0.067
school 57.154 22.831 -9.748 64.674 87.260
成交月具备显著的正向影响,与2011—2017年北京各地区房价上涨的事实相符合,如图3b所示。成交月的影响仍然具有一定的圈层结构,高值主要集中在二环内、东北二环和东北三环之间、北四环和北五环之间。成交月系数取值在0.025~0.140之间,均值为0.05,标准差为0.024。说明2011—2017年北京市六环内二手住宅价格的涨幅在每月0.025~0.140万元,平均涨幅为每月0.05万元,各地区涨幅差异较大。从系数绝对值上来看,其影响强度在所有变量中居中。
面积因素显著且负向影响房价,反映出由于面积大从而总价高,导致需求减少,进而单价降低,如图3c所示。东二环、东三环之间和东三环、东四环之间的CBD地区、东北五环五元桥附近的地区受到面积影响最小,但这些地区的二手房单价是全北京最高的,收入水平较低的人群不具备购买这些地区房产的能力,只有少部分收入水平较高的群体能够承担这些地区高额的房价,而相比普通人来说,由于高收入群体有足够的资金支付房款,对于面积大导致的高总价不敏感,因此受到房屋面积的影响较小。面积因素对于北京南部的影响居中,西二环、北二环、天通苑地区受到面积的影响最大。西二环、北二环附近集中了大量的学区,小户型的房产在该地区更受欢迎,导致该地区受到面积的影响最大。天通苑地区则是集聚了大量工薪阶层,其购买力远低于其他地区,更容易受到总价的影响,因此更倾向于小户型。面积系数取值在-0.024~-0.005之间,均值为-0.011,标准差为0.005。说明面积每增加1 m2,二手住宅单价降低50~240元,平均降低110元,该影响因素各地区差异较大。从系数绝对值上来看,其影响强度较弱。
卧室数反映出购房者对于房屋结构的偏好,总体上卧室数量正向影响房屋价格,如图3d所示。相同面积情况下,购房者更倾向于卧室数量更多的房屋,从而导致这一类房屋的单价更高。卧室数量的影响强度延由东到西递减。卧室数系数取值在0.418~0.448之间,均值为0.437,标准差为0.008。说明在面积相同的情况下卧室数量每增加一个二手住宅单价平均提高0.437万元。由于卧室数量是全局变量,整体上各地区卧室数量的影响差异不大。从系数绝对值上来看,其影响强度居中。
房屋朝向同样正向影响房屋单价,房屋朝向越好,单价越高,且该因素影响大小由东南向西北递减,如图3e所示。房屋朝向系数取值在0.42~0.84之间,均值为0.639,标准差为0.113。说明房屋朝西或朝北要比朝向东或南低420~840元,平均低639元。说明朝向是影响二手住宅价格中的重要因素。购房者对于朝向的偏好主要是考虑到房屋东南方向的采光,对北京来说东南地区要比西北地区的房屋采光要好,根据边际效用原理,西北地区比东南地区受到房屋朝向的影响更大。
楼龄对于房屋单价的影响反映出西北、东南地区较弱而东北、西南地区较强,如图3f所示。楼龄系数取值在-0.048~-0.012之间,均值为-0.024,标准差为0.009。说明楼龄每增加1年,二手住宅价格降低12~48元,平均降低24元,反映了楼龄对于房价的负向影响在各地差异不大,且其影响强度较弱。
楼层的影响主要集中在四环内的房屋,五环外地区基本不存在。楼层呈现圈层结构,中心城区受到楼层影响最大。楼层系数取值在-0.47~-0.25之间。均值为-0.278,标准差为0.123。说明普遍低楼层的价格要高于高楼层的价格。高楼层比中楼层(或者中楼层比低楼层)平均价格低278元。是影响城区房价的重要因素之一。导致该现象的一个可能的原因是对于有老人的家庭来说,考虑到老人的出行方便更倾向于购买低楼层。
到最近地铁站的距离负向影响房价,距离地铁站越远房价越低,且该变量为全局变量,在空间上的变化不大。到地铁站的距离系数取值在-0.1426~ -0.1342之间,均值为-0.138,标准差为0.002。说明到地铁站的距离每增加1 km,平均房价降低138元。

5 结论

本文首次将学界前沿的带有统计推断的MGWR和特征价格模型应用于实证研究中。结合北京市二手住宅交易数据,对于2011—2017年北京市二手住宅价格的空间分异和空间尺度差异进行研究,得到以下结论:首先,相比经典GWR,MGWR的结果更为可靠。以往基于经典GWR的研究可能存在一定的不稳健。这主要是由于多MGWR能够捕捉到不同变量的不同影响尺度从而避免了捕获太多的噪声和偏误。因此是否考虑影响因素的空间尺度将对模型的结果和分析产生了非常巨大的影响。其次,房价对区位非常敏感,且存在很强的空间异质性,区位的影响尺度是所有变量中最小的,接近于街道尺度。其他存在空间异质性的影响因按其空间尺度由小到大分别为成交时间、面积、楼龄、楼层、朝向卧室数量和到最近地铁站的距离为全局尺度的变量,空间异质性很弱。最后,区位、朝向、卧室数量、成交时间均正向影响房价,而面积、楼龄、楼层、到地铁站的距离负向影响房价。所有影响因素中区位是影响房价的最主要因素,其次是成交时间。面积、朝向和到最近地铁站的距离影响较大,所在楼层、卧室数量的影响较小,而楼龄的影响最弱。
研究证明,MGWR的模型结果相对于对以往的GWR及SGWR模型有较大幅度的提升,也较适用于针对房地产价格的影响因素问题展开研究。但本文仍有两点不足:①由于数据所限,没有纳入具体的学区变量,因此无法具体讨论这些因素的影响。②由于MGWR模型计算量巨大,无法对于所有样本进行回归,故本研究使用了二手房交易数据的抽样数据,选取的样本量较小。未来,希望能够通过计算方法的改进和计算机性能的提升对于全体样本进行回归。
[1]
Lancaster K J. A new approach to consumer theory[J]. Journal of Political Economy, 1966, 74(2):132-157.

[2]
Rosen S. Hedonic prices and implicit markets:product differen- tiation in pure competition[J]. Journal of Political Economy, 1974, 82(1):34-55.

[3]
Freeman A M. The hedonic price approach to measuring demand for neighborhood characteristics[C]// The Economics of Neighborhood. Academic Press,1979:191-217.

[4]
Harrison Jr D, Rubinfeld D L. Hedonic housing prices and the demand for clean air[J]. Journal of Environmental Economics and Management, 1978, 5(1):81-102.

[5]
Michaels R G, Smith V K. Market segmentation and valuing amenities with hedonic models:the case of hazardous waste sites[J]. Journal of Urban Economics, 1990, 28(2):223-242.

[6]
Straszheim M. Hedonic estimation of housing market prices:A further comment[J]. The Review of Economics and Statistics, 1974, 55(1):404-406.

[7]
Schnare A B, Struyk R J. Segmentation in urban housing mar- kets[J]. Journal of Urban Economics, 1976, 3(2):146-166.

[8]
Goodman A C. Hedonic prices,price indices and housing mar- kets[J]. Journal of Urban Economics, 1978, 5(4):471-484.

[9]
Goodman A C, Thibodeau T G. Age-related heteroskedasticity in hedonic house price equations[J]. Journal of Housing Research, 1995, 6(3):25-42.

[10]
Goodman A C, Thibodeau T G. Dwelling-age-related hetero- skedasticity in hedonic house price equations:an extension[J]. Journal of Housing Research, 1997, 8(2):299-317.

[11]
Fletcher M, Gallimore P, Mangan J. Heteroscedasticity in he- donic house price models[J]. Journal of Property Research, 2000, 17(2):93-108.

[12]
Brunsdon C, Fotheringham A S, Charlton M. Some notes on parametric significance tests for geographically weighted regression[J]. Journal of Regional Science, 1999, 39(3):497-524.

[13]
McCord M, Davis P T, Haran M, et al. Spatial variation as a determinant of house price:Incorporating a geographically weighted regression approach within the Belfast housing market[J]. Journal of Financial Management of Property and Construction, 2012, 17(1):49-72.

[14]
Helbich M, Brunauer W, Vaz E, et al. Spatial heterogeneity in hedonic house price models:the case of Austria[J]. Urban Studies, 2014, 51(2):390-411.

[15]
Lu B, Charlton M, Harris P, et al. Geographically weighted re- gression with a non-Euclidean distance metric:a case study using hedonic house price data[J]. International Journal of Geographical Information Science, 2014, 28(4):660-681.

[16]
Fotheringham A S, Crespo R, Yao J. Exploring,modelling and predicting spatiotemporal variations in house prices[J]. The Annals of Regional Science, 2015, 54(2):417-436.

[17]
Yao J, Stewart Fotheringham A. Local spatiotemporal model- ing of house prices:A mixed model approach[J]. The Professional Geographer, 2016, 68(2):189-201.

[18]
董冠鹏, 张文忠, 武文杰, 等. 北京城市住宅土地市场空间异质性模拟与预测[J]. 地理学报, 2011, 66(6):750-760.

[19]
冯长春, 李维瑄, 赵蕃蕃. 轨道交通对其沿线商品住宅价格的影响分析:以北京地铁5号线为例[J]. 地理学报, 2011, 66(8):1055-1 062.

[20]
宋伟轩, 毛宁, 陈培阳, 等. 基于住宅价格视角的居住分异耦合机制与时空特征研究:以南京为例[J]. 地理学报, 2017, 72(4):589-602.

[21]
古恒宇, 沈体雁, 周麟, 等. 基于 GWR 和 sDNA 模型的广州市路网形态对住宅价格影响的时空分析[J]. 经济地理, 2018, 38(3):82-91.

[22]
谷一桢, 郑思齐. 轨道交通对住宅价格和土地开发强度的影响:以北京市13号线为例[J]. 地理学报, 2010, 65(2):213-223.

[23]
王洋, 方创琳, 盛长元. 扬州市住宅价格的空间分异与模式演变[J]. 地理学报, 2013, 68(8):1082-1 096.

[24]
Goodchild M F. Models of scale and scales of modelling[C]// Tate N J,Atkinson P M (eds). Modelling Scale in Geographical Information Science. New York: John Wiley and Sons, 2001.

[25]
McMaster R B, Sheppard E. Introduction:scale and geograph inquiry[J]. Scale and Geographic Inquiry:Nature, Society,and Method,2004:1-22.

[26]
Fotheringham A S, Brunsdon C, Charlton M. Geographically weighted regression:the analysis of spatially varying relationships[M]. Chichester/Hoboken:Wiley, 2002.

[27]
古恒宇, 孟鑫, 沈体雁, 等. 中国城市流动人口居留意愿影响因素的空间分异特征[J]. 地理学报, 2020, 75(2):240-254.

[28]
Fotheringham AS, Yang W, Kang W. Multiscale geographical- ly weighted regression (MGWR)[J]. Annals of the American Association of Geographers, 2017, 107(6):1247-1 265.

[29]
Yu H, Fotheringham A S, Li Z, et al. Inference in multiscale geographically weighted regression[J]. Geographical Analysis, 2019, 52(1):87-106

[30]
Li Z, Fotheringham A S, Li W, et al. Fast Geographically Weighted Regression (FastGWR):a scalable algorithm to investigate spatial process heterogeneity in millions of observations[J]. International Journal of Geographical Information Science, 2019, 33(1):155-175.

[31]
Hastie T, Tibshirani R. Generalized additive models[J]. Statis- tical Science, 1986, 1(3):297-310.

[32]
Hastie T J. Generalized additive models[C]// John M. Cham- bers. Statistical models in S. Routledge,2017:249-307.

[33]
Anselin L. Local indicators of spatial association-LISA[J]. Geographical Analysis, 1995, 27(2):93-115.

Outlines

/