人口分析的空间回归模型
Guangqing Chi Jun Zhu
摘要:虽然在人口研究中,空间数据分析已获得越来越多的关注。它对于从业者而言,它仍然是一个棘手的课题,因为它的复杂性和各种悬而未决的问题。在这里,我们给出了一个空间人口分析的使用指南,这个指南的侧重点是对空间回归模型的使用。我们先概述人口动态的空间显性和隐性的理论。然后,我们再通过20世纪90年代在威斯康星州的未成年人民事部门的案例描述探索性空间数据分析和空间回归模型的基本概念。我们也将回顾空间回归模型,包括空间滞后模型,空间误差模型和空间自回归移动平均模型,并使用这些模型分析数据案例。最后,我们对今后的空间的人口理论和实践研究的机会和方向进行展望。
关键词:空间回归 空间数据分析 空间权重矩阵 空间自相关 空间异质性 人口分析
介绍
虽然在过去数几十年来空间统计已被应用于许多领域,但它最近才引起人口学家的关注。虽然人口统计学有丰富的分析方法,目前许多人口研究缺乏空间立体远景(Tiefelsdorf 2000)。大多数现有的社会学人口学模型对待一个地理单元,如对于小城市或一个县的人口普查,作为独立分离的实体,而不是作为一个通过其他地理单元包围的实体,它可能相互作用(例如,通过上下班通勤或者购物方式)。动态人口的空间效果已经在一些社会科学相关的学科具有理论依据,如地理和区域科学,包括空间扩散理论,增长极理论,中心地理论,和新的经济地理学理论。而另一方面,在农村人口统计学中的人口迁徙转移和住宅建筑特点经常基于空间维度进行定向研究。然而,无论是农村的人口学家还是其他社会学人口学家充分利用空间统计和计量经济学在实证研究的数据分析中的最新发展优势。特别是,在大多数人口和社会学研究中空间效果往往不正式纳入人口模型。重要的是要考虑空间效应对于人口的影响,因为从方法的角度看,如果存在相关的空间效应,但在一个模型,估计和统计推断都抛开空间效应可能是不可靠(例如,解释变量的影响可能被高估或低估)。
在空间统计学和空间计量经济学文献中,空间数据分析常分为三种类型,即点数据分析,栅格数据分析,和地质统计学,其每一个都有其自己的一组目标和方法(例如,Cressie 1993; Schabenberger和Gotway 2005)。简单的说,点数据分析涉及事件的地点的空间格局,往往是旨在确定或定量空间格局的形式,例如,规律性或聚集完全服从随机偏差。与此相反,栅格数据分析涉及有规律或不规则的空间网格,这是指出无论是在栅格点或聚集在网格单元格属性的空间格局。其目标通常有通过预先指定的邻域结构进行量化的空间格局,并检查有关的属性和潜在的解释性变量之间的关系同时占据的空间效应。此外,地质统计学数据指的是在空间上连续点位置进行采样的空间数据。地质统计具有类似于栅格数据分析的目标,以预测在未采样位置的属性的值的额外目标(安瑟伦2002;1993年Cressie;古德柴尔德1992)。区分的关键区别从点阵数据分析的统计学是统计学采用基于距离的函数,而不是附近的结构来表示的空间自相关。在此外,空间相互作用建模有时被视为的第四类空间数据分析,并旨在量化流的布置和建筑模型为起点和终点之间发生的相互作用(Bailey和1995年bull;加特莱尔)。
栅格数据分析是目前最常用的空间数据分析的方法人口统计学因各种原因。聚类数据是两种类型中大部分人口统计学研究中使用的数据之一,另一个是基于个人的数据。空间回归建立在标准回归之上,其中后者已在人口统计学研究一种流行的统计工具。此外,功能强大而且用户界面友好的计算机软件包,如ArcGIS和GeoDa已成为现成的从业者的选择。我们注意到,点数据分析,地质统计学,以及空间相互作用模型仍然在人口研究非常有用。例如,地理学家经常使用人口统计研究统计学(如,考恩和1998年延森; Jensen等1994;兰福德等1991;朗福德和昂温1994; Mennis 2003年),而点数据分析和空间相互作用模型都适合流行病学研究和社会网络的研究,不过,在这里我们将我们的分析中心放在点阵数据分析上。
这篇文章的目的是回顾空间回归模型和相关统计技术分析地理空间的人口统计数据。我们将举例说明在威斯康星州的未成年人民部门(MCD)水平从1990年到2000年人口变化的一个例子。在接下来的部分,我们先简要总结了地理学,区域科学,人类生态学,城市社会学,人口学和各学科的人口动态的空间显性和隐性的理论。然后,我们介绍一些基本概念和空间人口分析相关问题,包括空间自相关性和异质性,空间邻域结构,可塑性面积单元问题。我们也勾勒出空间回归分析的关键步骤,与描述标准线性回归,空间直线回归,模型评估,有条件自回归的回归,进一步扩展空间,从回归模型时空回归和空间逻辑回归的小节。最后,在讨论部分,我们对空间的人口理论和实践的未来研究的机会和方向进行展望。
人口空间理论
人口动态的空间自相关被建议在一些人口统计和社会学理论及人类生态学,城市社会学,农村人口中实证研究含蓄地审议,虽然空间效应没有被正式引入到他们的人口模型。人类生态学仍然在研究人口空间分布的社会学家中起到重要作用(Berry and Kasarda 1977; Frisbie and Kasarda 1988)。McKenzie(1924年)人类生态学定义为受到环境的影响人类的时空关系的研究。Hawley(1950)认为城市系统为人类生态学的主要议题之一中的空间分异,而Robinson(1950)认为,人类生态学是使用空间信息,而不是个体单元的研究。Logan和Molotch(1987)参阅空间关系作为人类生态城市认识系统的分析基础。
种族隔离的研究,已是城市社会学研究的最大的内容之一,建议在其原有的问题之上以人口分布空间效应的角度分析(2003年查尔斯;2005年福塞特)。有各种各样的理论方法解释种族隔离。空间同化作用方法主张种族隔离是由社会经济地位和(1996年克拉克; Galster1988)差异生活方式相关的差异引起的。这个地方分层的做法规定,隔离是歧视造成的(Alba和1993年洛根;梅西及丹顿1993年),而城市郊区化的解释认为,城市郊区化的过程导致分离(帕里西等,2007)。
空间分布和人口的差异性早已经过了很多学科研究人员的研究,如区域科学,人口地理学和环境规划。这些领域对空间维度的人口分析,可以通过人口学家和社会学家采用成熟的理论和方法,区域经济学家善于解释和建立的土地利用模型,这是几乎总是与人口变化相关的变化(1997年Boarnet,1998年,2002年切尔韦罗,2003;切尔韦罗和Hansen 2002)。例如,增长极理论应用普及和反冲洗解释相互地域经济增长和发展,这反过来又导致了人口变化的依赖(佩鲁1955年)的概念。该中心地理论在人口,企业和商品流动可通过相关的成本和城市规模(1966年克里斯泰勒)确定的城市空间层次结构的地方人口。最近,克鲁格曼(1991年)在新经济地理学理论的内生经济增长和城市研究网络随时间的形成过程增加了空间动态分析。
探索性空间数据分析
回归分析通常始于探索性数据分析,其中2个不容忽视的重要性探索性空间数据分析(ESDA)是空间回归模型额外至关重要的一步,注重数据的空间特征。ESDA往往涉及到可视化的数据展示空间模式确定空间聚类和空间离群值,以及诊断的统计模型,所有这些都有助于更好地指明回归模型空间方面可能的假设错误(1996安瑟伦,芭蕾等,2001)。下面我们讨论基本概念和ESDA的背景下相关问题。特别是,我们回顾空间自相关,空间异质性,基于空间结构的邻域空间权重矩阵,并讨论可修改的面积单元的问题。这些概念和问题的空间回归分析是必不可少的。
空间自相关
空间自相关(也称为空间依赖性,空间相互作用,或本地交互)可以被粗略地定义为一个测量附近空间的属性值之间相似性(或相异性)的手段,换句话说,具有正空间自相关,属性的高或低的值趋向于空间群集。而负空间自相关,位置趋向于由邻域具有完全不同的值所包围。空间自相关可以通过各种指数,最知名可能通过是Moranrsquo;s I统计指数(Moran的1948)来测量。Moran I统计指数测量线性的关联程度,在给定的位置的属性(y)与在其相邻位置(Wy的)的属性的加权平均值之间,并且可以在解释为(y)的回归的斜率( WY)(帕切科和泰瑞尔2002)。空间自相关可通过Moran散点图,其中(怀俄明州)在垂直轴上被指定为(gamma;)绘制在水平轴(安瑟伦1995)可视化显示。
像Moranrsquo;s I统计指数描述整个数据空间自相关,整个研究区域,往往被视为一个全局的分析工具。虽然在一个相对均匀的区域进行分析的数据集是有用的,它可能不会像信息计算一样跨过有多个空间状态区域数据(安瑟伦1996)Moranrsquo;s I值。例如,一个Moran散点图可能显示两种类型的空间自相关(例如,正和负空间自相关),这表明不同的空间状态的存在,因此本地区域不稳定的混合。在这种情况下,空间自相关的全局指数可以是实际的空间自相关(安瑟伦1996)的粗略量度。存在一个解决办法是制定一套空间关联的局部指标(LISA),如local Moranrsquo;s I(安瑟伦1995;崖和Ord 1973年,1981年),G和G *统计(Ord和1995年G系数)和K统计( G系数1984; Ord和1995年G系数)。LISA可以用于评估空间均匀性的假设,确定超过它没有其它可识别的空间自相关的距离,允许一个分解的全局度量变成由个别观测值的贡献,并确定大纲或不同的空间状态。
空间异质性
空间异质性(也称为空间结构的不稳定性,或数据的大规模全局趋势)是指在均值与方差的差异,和协方差结构,包括一个空间区域内空间自相关(1999 LESAGE)。与此相反,空间均匀性(也称为平稳性)要求均值与属性的方差是跨越空间恒定,并且该属性的任意两个位置是空间相关依赖于两个位置之间的滞后距离,而不是实际位置(Bailey和Gatrell1995)。
邻域结构与空间权重矩阵
以考虑在栅格数据分析空间自相关,有必要通过被认定为是它的邻域的栅格(安瑟伦1988)那些位置建立为每个位置的邻域状态。特别是,我们需要指定对应于所述附近邻域状态,使得所得到的方差 - 协方差矩阵可表示为一个小数目相对于样品大小(安瑟伦2002)估计的参数的函数的空间权重矩阵。在空间计量经济学流行的空间权重矩阵包括所谓的lsquo;rookrsquo;s 或者lsquo;queenrsquo;s邻接权重矩阵一阶或更高,而k邻域权重矩阵,一般距离权重矩阵,以及反距离权重不同的权重,后者三个是基于距离的(1992安瑟伦)矩阵。 更复杂的空间权重矩阵可以基于额外理论和假设,例如基于经济距离那些(情况等,1993)来创建。而空间权重矩阵是必要的点阵数据分析,选择邻域结构的一个原则是。通常,确定或定义一个空间权重矩阵(安瑟伦2002)之前要进行相关的空间权重矩阵比较。例如,我们可以创建和比较多个空间权重矩阵,并选择具有高水平的统计学意义(沃斯和志2006年),这个过程有理论依托以及实现空间自相关高系数的案例。
有在与空间权重的参考书中描述了相关的(安瑟伦2002)两个潜在问题。一个问题是,权重的状态被GIS数据的拓扑质量所影响。例如,由于多边形和顶点的不精确,GIS数据中错误的存在岛屿(即,没有任何邻域的位置)或其它位置状态。另一问题是,使用某些基于距离的空间权重矩阵的需要一个阈值,这可能是难以确定尤其是当有较强的空间异质性。一个小的阈值,可能会产生过多的岛屿,而一个大的阈值,可能会产生过大的集群。这是特别进行单元人口普查的情况下,因为人口普查单位根据人口尺寸在地县级单元下进行,这使得它们经常划定的不规律。使用基于距离的空间权重矩阵往往使城市地区存在太多邻域和农村存在太少邻域结构。一种解决这一问题的是k邻域矩阵(安瑟伦2002),其可以通我们下面的数据为例进行支持。应当指出的是,4元素的最近邻权重矩阵提供最高人口变动的空间自相关和5元素的最近邻权重矩阵提供了标准的残差的最高空间自相关
回归分析,一共存在四十种不同类型的空间权重矩阵。
可塑性面积单元问题
可塑性面积单元问题(MAUP)产生的统计结果分析是由刻度以及聚合形状的影响。前者被称为规模效应,分区效果(Fotheringham和Wong,1991; 兰福德和1994昂温;奥彭肖1984;奥彭肖和泰勒,1981)。更具体地,规模效应指的是,当相同的数据在不同尺度聚集,统计分析的结果是超过尺度分散的。在人口普查数据的分析,可能的聚集尺度是由州,县,乡,街区等。例如,一个属性的一个看似聚集的空间格局可能会出现在一个刻度(比如,县级),但不能在其他尺度(比如,区块级)。或者在一个刻度两个属性之间的关系可能不会在其他尺度容纳。该MAUP密切相关,在聚集水平的属性之间的关系生态谬误的概念在个人层面(Green和1996年Flowerdew;1950年罗宾逊;箭牌等1996)可能不成立。
区域划分效应另一方面,是指,当数据被按不同的方式同一比例内分组,统计分析给出不同的结果的事实。在一个小区域规模边界变化的调整(例如,MCD)经常导致区域划分效应(Tolnay等人1996;沃斯和驰2006),用于调整作为不同的方法可能会急剧改变它的数据分析结果。下面的例子是在MCD水平,其中包括非嵌套,相互排斥和详尽的政治领域的汇总。另一种方法是人口普查区域。在美国的许多州,人口普查有相似的的MCD尺寸,但人口普查局用于计算人口的宗旨划定的地理单元。显然,无论规模效应和分区效果是在空间数据分析中需要注意的重要问题,是栅格数据分析(Paelinck2000)。
数据示例
剩余内容已隐藏,支付完成后下载完整资料
英语原文共 26 页,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[151136],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。
您可能感兴趣的文章
- 带水印的GIS数字矢量地图质量监测外文翻译资料
- 基于多源地理数据的城市功能区识别——以中国郑州市为例外文翻译资料
- 北京医疗服务可及性的空间差异和影响机制:移徙者平等的视角外文翻译资料
- 利用巴基斯坦费萨拉巴德的光学多时相卫星数据进行陆地表面温度和土地利用土地覆盖变化的CA-马尔可夫链分析外文翻译资料
- 大都市地区植被净初级生产力(NPP)动态变化与城市化驱动力研究–以北京市为例外文翻译资料
- 公园缓解城市热岛效应的有效性–以亚的斯亚贝巴为例外文翻译资料
- 一种描述新罕布夏州肺癌发病空间格局的地理计算方法外文翻译资料
- 加拿大大温哥华地区极端炎热天气温度-死亡率关系的空间差异描述外文翻译资料
- 雅典地区气温和湿度对人体热舒适度的影响外文翻译资料
- 量化公共卫生实践和研究中的空间可及性:在现场酒精场所的应用,美国,2013年外文翻译资料