英语原文共 18 页,剩余内容已隐藏,支付完成后下载完整资料
GeoDa:空间数据分析简介
Luc Anselin1,Ibnu Syabri2,Youngihn Kho1
摘要
本文概述了GeoDaTM,这是一个免费软件程序,旨在为非地理信息系统(GIS)专家空间分析的用户进行图形介绍。它包括从简单映射到探索性数据分析,全局和局部空间自相关的可视化以及空间回归等功能。 GeoDa的一个关键特性是一个交互式环境,它使用动态链接的窗口技术将地图与统计图形结合起来。给出了软件设计的简要回顾,以及一些说明该程序在处理公共健康,经济发展,房地产分析和犯罪学应用程序中的独特特征的示例。
引言
Haining(1989)在1980年代后期对缺乏这种工具感到悲叹,并指出地理信息系统(GIS)采用和使用空间统计数据的一个主要障碍是空间数据分析专用软件的发展迅速发展)研究员。最初,注意力集中在概念性问题上,比如如何将空间统计方法和GIS环境(松散耦合,紧密耦合,嵌入式还是模块化等)相结合,以及哪种技术最有成效地包含在这样的框架中。对这些问题的熟悉回顾在其中包括Anselin和Getis(1992); Goodchild等人(1992); Fischer和Nijkamp(1993); Fotheringham和Rogerson(1993,1994); Fischer,Scholten和Unwin(1996);和Fischer和Getis(1997)。今天,情况完全不同,并且相当大量的空间数据分析软件已经很容易获得,包括适用于商业统计和GIS软件包的小众程序,定制脚本和扩展程序,
使用R,Java和Python等软件环境开创了开源工作。美国空间一体化社会科学中心(CSISS)维护的软件工具交换所日益增长的内容就是一个例证。
CSISS成立于1999年,是美国国家科学基金会资助的一个研究基础设施项目,旨在促进社会科学中的空间分析视角(Goodchild et al。2000)。人们很容易认识到,传播和促进空间数据分析的主要工具将是一种易于使用的,可视化的和交互式的软件包,面向非GIS用户,并且尽可能少地要求其他软件(例如作为GIS或统计软件包)。 GeoDa是这项工作的结果。它被设想为一个“空间数据分析的介绍”,后者被认为是由可视化,探索和地理数据中有趣模式的解释组成。
该软件的主要目标是通过一个经验性的空间数据分析练习为用户提供一条自然的路径,从简单的绘图和地理视觉化开始,继续探索,空间自相关分析,并结束空间回归。在很多方面,GeoDa是对原始SpaceStat软件包(Anselin 1992)的改造,现在已经变得相当过时,只有基本的用户界面,过时的体系结构以及大中型数据集的性能限制。该软件从零开始重新签署并重写,围绕动态链接图形的核心概念。这意味着数据的不同“视图”被表示为图表,地图或表格,其中所选的观测值总是突出显示。在这方面,GeoDa与许多其他现代空间数据分析软件工具类似,尽管它将用户友好性与广泛的整合方法结合在一起。一些说明性比较将有助于澄清其在当前空间分析软件领域的地位。
就所包含的空间统计技术的范围而言,GeoDa与在开源R环境中开发的功能集合最为相似。例如,如Bivand和Gebhardt(2000),Bivand(2002a,b)和Bivand和Portnov(2004)所述,描述性空间自相关测量,速率平滑和空间回归包含在spdep软件包中。与R相反,GeoDa完全由点击式界面驱动,不需要任何编程。它还具有更广泛的映射能力(在R中仍然有些实验),并且在动态图形中完全链接和刷新,由于其架构的限制,目前在R中是不可能的。另一方面,GeoDa尚未(尚未)由用户定制或扩展,这是R环境的优势之一。从这个意义上说,这两者被认为是高度互补的,理想的情况是在引入GeoDa技术后,更复杂的用户对R的“毕业”。
动态链接和刷牙作为数据可视化的中心组织技术的使用在探索性数据分析(EDA)中具有强大的传统,回到连接散布图刷牙的概念(Stuetzle 1987)和各种各样的
Cleveland和McGill(1988)概述了动态图形的方法。在地理分析中,Monmonier(1989)引入了“地理刷牙”的概念,并在Haslett,Unwin和同事的Spider / Regard工具箱中运作(Haslett,Wills和Unwin,1990; Unwin,1994)。用于探索性空间数据分析(ESDA)的几种现代工具包也包含动态链接,并且在较小程度上包括刷牙。其中一些依赖于与地图组件的GIS交互,例如将XGobi或XploRe与ArcView相结合的链接框架(Cook et al.1996,1997; Symanzik et al.2000); SAGE工具箱,它使用ArcInfo(Wise,Haining和Ma 2001);和GeoDa的前身ArcView(Anselin 2000)的DynESDA扩展。这些实现中的链接受GIS的体系结构的约束,该体系结构将链接过程限制为单个地图(在GeoDa中,链接地图的数量没有限制)。在这方面,GeoDa与ESDA的其他独立式现代实现(如制图数据可视化器,或cdv(Dykes 1997),GeoVISTA Studio(Takatsuka and Gahegan 2002)和STARS(Rey and Janikas 2006))类似。这些都包含动态链接的功能,在较小程度上包括刷牙。它们建立在开源编程环境中,如Tkl / Tk(cdv),Java(GeoVISTA Studio)或Python(STARS),因此可以轻松扩展和定制。相比之下,GeoDa仍然是一个封闭的盒子,但这些软件包为图表和地图提供了最广泛和灵活的动态链接和刷牙形式。
在本文的其余部分,我们首先概述设计并简要回顾GeoDa的整体功能。 接下来是一系列说明性示例,突出了测绘和地理视觉功能的特点,探索多元EDA,空间自相关分析和空间回归。 这篇文章最后提到了关于软件开发未来方向的一些评论。
设计和功能
GeoDa的设计由一个交互式环境组成,该环境将地图与统计图组合在一起,使用动态链接窗口技术。它适用于离散地理空间数据的分析,即以空间位置为点(点坐标)或多边形(多边形边界坐标)为特征的对象。当前版本遵循ESRI的形状文件作为存储空间信息的标准。它包含读取和写入这些文件的功能,以及将点坐标或边界文件坐标的ASCII文本输入文件转换为形状文件格式。它使用ESRI的MapObjects LT2技术进行空间数据访问,映射和查询。分析函数以模块化方式实现,作为C11类和相关方法的集合。
广义而言,功能可以分为六类:空间数据操作和实用工具:数据输入,输出和转换,数据转换:变量转换和新变量的创建,制图:choropleth地图,制图和地图动画,
Luc Anselin等人 |
空间数据分析 |
表1 GeoDa功能概述 |
|
类别 |
功能 |
空间数据 |
从形状文件(点,多边形)输入数据 |
从文本输入数据(指向点或多边形形状) |
|
数据输出到文本(数据或形状文件) |
|
从文本输入创建网格多边形形状文件 |
|
质心计算 |
|
泰森多边形 |
|
数据 |
变量转换(log,exp等) |
转型 |
查询,虚拟变量(政权变量) |
变量代数(加法,乘法等) |
|
空间滞后变量结构 |
|
费率计算和费率平滑 |
|
数据表连接 |
|
制图 |
泛型分位数choropleth图 |
标准差图 |
|
百分位图 |
|
异常图(box map) |
|
圆形的cartogram |
|
地图电影 |
|
有条件地图 |
|
平滑速率图(EB,空间平滑) |
|
超标率图(标准化死亡率,SMR) |
|
EDA |
直方图 |
箱形图 |
|
散点图 |
|
平行坐标图 |
|
三维散点图 |
|
条件图(直方图,箱形图,散点图) |
|
空间的 |
空间权重创建(车,女王,距离,K最近) |
自相关 |
更高阶的空间权重 |
空间权重特征(连通性直方图) |
|
Moran散点图与推论二元Moran散点图 |
|
推理 |
|
率的Moran散点图(EB标准化) |
|
当地Moran重要地图 |
|
当地莫兰群集图 |
|
双变量当地莫兰 |
|
当地Moran的税率(EB标准化) |
|
空间回归 |
带诊断功能的OLS(例如,LM测试,Motans I) |
最大似然空间滞后模型 |
|
最大似然空间误差模型 |
|
预测值图 |
|
残差图 |
|
GeoDa的功能可以通过菜单项或通过点击工具栏按钮直接调用,如图1所示。以下几节将重点介绍一些特定的应用程序,重点介绍软件的一些独特功能。
测绘和地理视觉化
大部分测绘和地理信息系统功能由一系列专门的等值线地图组成,重点强调数据中的异常值,即所谓的箱形地图(Anselin 1999)。此外,还包括相当大的能力来处理经济贝叶斯(EB)或空间平滑器形式的利率的内在方差不稳定性.6如“设计和功能”中所述,映射操作使用包含在ESRI的MapObjects扩展了链接和刷牙功能。 GeoDa还包括一个圆形的方块图,地图电影形式的7张地图动画和条件地图。后者是根据Becker,Cleveland和Shyu(1996)以及Carr等人所述的原则,通过对三个区间进行两个调节变量的调节而构建的九个微观地图。 (2002)[8]。与传统的等值线地图不同的是,制图,地图电影和条件地图不使用MapObjects类,而是从头开发的。
我们举例说明了速率平滑过程,异常图和链接操作。本分析的目标是确定死亡率升高的地点,并评估指定作为异常值对速率平滑效应的敏感性。利用阿巴拉契亚癌症网络(ACN)1993至1997年间156个县的前列腺癌死亡率数据,
图1.带有菜单项和工具栏按钮的开始屏幕
我们通过指定死亡人数作为分子和人口作为分母来构造一个箱形图。对原始费率(即对于不同年龄分布或其他相关因素没有任何调整)的结果图显示为上限值,如图2中的左图所示。三个县被确定为异常值,并以深红色显示.10这些区域与图左下方框图中选择的异常值相匹配。所有地图和图形的链接导致这些县也在地图上被交叉阴影。
图中的右上图表示平滑的费率图,其中利用经验贝叶斯过程对费率进行了转换,以消除处于风险中的变化人群的影响。结果,原始异常值不再,但另一个县被确定为具有升高的风险。此外,还发现了一个较低的异常值,在
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[22328],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。