利用遥感土地覆盖和高程数据估算沙特阿拉伯利雅得市市人口空间分布外文翻译资料

 2022-12-02 19:40:49

英语原文共 10 页,剩余内容已隐藏,支付完成后下载完整资料


利用遥感土地覆盖和高程数据估算沙特阿拉伯利雅得市市人口空间分布

摘要:

本文通过Landsat ETM 遥感高程数据的使用,调查了沙特阿拉伯利雅得市区级人口普查和居住单元,用于缩减人口规模。回归分析用于在居住单元密度和在街区水平建成区比例间建立关系,其系数用于将居住单元密度缩减到图斑规模。这个人口分布的估计是建立在单位平均人口的基础上,共有七个模型进行了拟合和比较。首先,传统的方法是利用ISODATA分类建立土地覆盖,以此作为一个协变量,并将它当作一个基准,评估六个更复杂的模型。传统的模型导致整体相对误差(ORE)在( 116%)的低准确度测量。结合上述表面高度数据的降尺度方法,对有可能提高精度的方法进行了探索。这些包括在估计建筑面积的时候,掩蔽了零和近零高度区;利用高度估计楼层数;用支持向量机取代ISODATA算法模型;通过调整居住空间容量来估计;将研究区域分层划分为不同的建筑类别;以及保存最佳模型的因变量。这些方法使得估算住宅单位密度的精度大幅度增加。然而,尽管这些高度数据占垂直维度(主要是通过楼层的数量),但是如果没有进一步的数据,是不可能对引起居住密度的变化的其他因素,如由于生活水平、富裕程度和其他空间变化的因素做出解释的。

1.简介

人类人口的增长不断对全球的资源和环境以及可持续发展的迫切需要施加压力(Li amp;Weng,2005)。及时准确地了解城市人口的规模和空间分布信息,对于了解和应对社会、经济和环境问题十分重要。从国家到街区普查,人口数据对于如城市与区域规划、资源管理、应急规划、公共事业和服务分配这类的目标都是必不可少的(Dob-son, Bright, Coleman, Durfee, amp; Worley, 2000; Sutton, Roberts, Elvidge, amp; Baugh, 2001)。不幸的是,在沙特阿拉伯,包括利雅得的人口数据,只有一个粗略的空间分辨率(分区水平,平均人口30000)。

传统上,人口特征和社会经济状况的数据是从普查、实地调查和行政登记中获得的(Rhind, 1991)。但是,这些数据来源没有每年都记录,并且在发展中国家,可能无法获得所有数据。定期更新、长时间的人口普查间隔、空间聚集和边界指定问题的挑战,鼓励研究人员开发估计人口的替代技术(Li amp; Weng, 2005; Liu amp; Herold, 2007)。

自20世纪50年代以来,利用遥感卫星传感器数据和航空摄影技术,国内外学者开发了许多人口估算的方法。根据Wu、Qiu、Wang(2005)的研究,有两类人口估计理论:面插值法和统计建模。前者将人口普查人群作为估计过程的输入量(Holt, Lo, amp; Hodler, 2004; Lang-ford amp; Unwin, 1994),而后者则使用社会经济协变量和人口统计变量与协变量之间的关系模型。Sutton(1997)研究的城市人口密度衰减函数理论模型是基于一个圆形城市从国防气象卫星计划(DMSP)夜间卫星遥感图像上确定的,被不规则地分成各个集群。他用的是一个集群的边缘,而不是一个城市中心的距离。Sutton(1997)称道,这些简单的理论模型,只需要输入很小的信息,就可以成为建立更精确的人口密度模型发展的起点。

本文集中在统计方法(回归分析)预测人口计数。具体而言,来自卫星数据的城市范围的信息聚合为参考人口的区域水平,并提供解释变量来估算人口。

Wellar (1969), Lo amp; Welch (1977) , Lo (2003) 的研究是使用异速生长的方法。Lo(2003)采用ISODATA算法通过Landsat TM影像对低密度城市土地利用进行分类。在这项研究中,人口统计和住宅单位的数量估计总的相对误差分别为0.23%和2.4%。

Langford (2006)提供了一个关于人口和莱斯特郡两种不同的土地覆盖方案之间的关系的详细调查。分析是在分区规模进行的,将人口在枚举区(EDS)插值。通过全球和区域回归模型,对这两个方案进行对比。他得出结论是,区域模型得出的结果更精确。他还探讨了三级分区密度映射,通过选择性采样、全球性和区域性的回归分析确定密度比。得出的结论是通过回归分析的密度校正比选择性抽样更为准确。三级分区密度映射提供了比区域模型更准确的结果,其参数化和局部拟合也更好。但是,它没有二进制分区密度精确。

三维信息(如高程数据)被提出作为帮助区分如建筑和非建筑在城市土地利用类(如别墅、公寓)用途的重要因素。正如Charaniya, Manduchi, Lodha(2004); Secord amp; Zakhor (2007), Antonarakis, Richards, Bra-sington (2008)的研究,利用光探测和测距(LiDAR)数据进行细化分类处理。从激光雷达数据或立体图像获取的遥感高程数据(Binard, Devriendt, Cornet, amp; Donnay, 2006)可能会增加人口估计的准确性。Lu, Im, Quackenbush,Halligan (2010) ,在丹佛的人口街区普查中使用QuickBird和LIDAR数据,并且采用基于面积和基于体积的方法估计人口。双方都产生较好的结果,但基于面积的方法稍微更准确一些。类似的研究,包括Dong, Ramesh, Nepali (2010) Ural, Hussain, Shan (2011),都证明了利用遥感高程数据的益处。

Lo (2008)通过利用四个来源于亚特兰大Landsat数据的土地覆盖情况,报告称区域和GWR模型比全球模式更准确。Dong 等人(2010)利用在丹顿的Landsat和LiDAR数据,在街区水平上提供小面积的人口估计。在连续和随机抽样中使用了三个解释变量:建筑物的数量、面积和体积。将十个OLS模和GWR模型进行比较,显示出随机样品比连续样本提供更准确的结果(Dong et al., 2010)。

Hsu(1973)是第一个使用Landsat多光谱扫描系统(MSS)数据(1 1公里网格)与多元回归模型相结合来估计人口分布的。Li ,Weng (2005)研究各种不同的协变量,如主成分、植被指数、分数图像、纹理表面和表面温度。Lo (1995) Harvey (2002) 报告说存在大多数的低密度区被高估和低估高密度区的现象。Lo (2003) Li , Weng (2005) 基于区域单位将研究区域划分为不同的密度,这是不足以解释真实密度是否被映射。例如,如果一个分区里包含着一个公寓楼,而这个分区还没有完全开发,平均密度就不能反映实际密度。

上述研究表明,关于建成区分布的遥感信息对于预测人口分布是有帮助的,而当使用回归型方法时,建筑高度数据可以对一般的土地利用/覆盖类的变量添加有价值的解释信息。然而,引入高度信息的最佳方式(如高度、体积、楼层数)尚未建立。此外,这些研究往往集中于西方世界,而这种高度信息的价值对于在沙漠环境中迅速城市化的城市而言,并没有被发掘。沙特阿拉伯的利雅得市是有趣的,因为在全国人口普查中,人口数据没有存在于一个精细的空间分辨率下。鉴于城市化的快速发展,迫切需要找到合适的方法进行测绘和监测人口分布。

本文基于输入的住宅建筑数据,重点介绍了在住宅区详细的人口映射。详细的人口分布图对于决定在哪里建公共设施如学校、清真寺、卫生中心和公园,确定公共交通路线和私人企业的位置都是十分重要的。

本文的目的是利用遥感数据对利雅得一个选定的叫Um Alhamam 的分区提供小面积的人口估计。首先,应用传统的人口估计模型。这一策略是对住宅单元的密度进行分析,然后用一个简单的经验因子将其转化到人口估计中。传统的模型开发是通过在各种形式中引入高程数据,并且比较其结果。次要的目的是研究不同的分类算法是如何影响结果的。

本论文的其余部分是组织的:在下一部分中提供了方法,包括图像分类,回归分析和精度评估。研究区和数据在第三部分中描述,而反馈结果和解释变量在第四部分解释。不同模型的分析是在倒数第二部分叙述。最后部分是讨论和结论的陈述。

2.方法

2.1 图像分类

在本研究中使用的两种分类算法:迭代自组织数据分析技术(ISODATA)和支持向量机(SVM)。ISODATA算法是一个著名的无监督的算法,不使用训练样本作为分类的依据。未知像素被分类为自然分组或集群。具体的讨论可能会在Jen-sen (2005) Campbell (2006)中看到。

支持向量机算法的详细解释已经超出了本文的范围,但在Vap-nik (1995) Haikin (1998)中有更好的可解释。支持向量机是一种基于统计学习理论的监督分类方法,它通过运用决策面(最优超平面)最大化类别间的差异来区分兴趣区类型。要理解支持向量机,需要了解四个概念(Noble, 2006):(I)超平面:SVM构建一个超平面,可用于分类和回归分析,(II)的最大间隔超平面的:最佳的分离是从满足最近采样点间的最大距离条件的超平面上获得的(被称为支持向量),(III)软边缘:采样点并不总是线性分离的,一种方法就是允许通过修改软间隔的误判,(IV)核函数:当采样数据是很难单独线性分开时,一个解决方案就是使用内核,并且允许数据在一个高维空间代表内核是线性可分的(Luts et al., 2010; Yu amp; Kim, 2012)。

2.2 回归模型

在本文中,回归模型是用来表示从遥感数据中获得的住宅单元密度与城市变量间的关系,是不应该出现没有建筑面积的居住单位或人口的(Langford, 2006; Yuan, Smith, amp; Limp, 1997)。用于估计住宅密度的通过原点回归(RTO)模型:

, i = 1...n (1)

其中D是居住单元密度,xi表示遥感的协变量,beta;i...n表示坡度,ɛi是剩余量,n为独立变量数,i表示第i个变量。

2.3 精度评价

衡量的预测值有多少来自真值是十分重要的。验证的一种形式是无论“缺失的”数据是否可以通过模型从剩余的数据中预测出来(内部验证),而其他采用新的数据作为训练数据,都具有相同的空间特征(外部验证)。在本文中,内部验证是基于总体相对误差(ORE)、平均绝对误差(MAE)和均方根误差(RMSE)统计,用来评估在较小的地理单元时的精度(即降尺度):

(2)其中是研究区的总体人口估计值,D表示总参考人数。这可以解释为偏见衡量。

(3)

(4)

其中,m表示区域的数目(图斑)。ORE, MAE 和 RMSE的值越小,表示精度越大。

3 研究区和数据

3.1 研究区

利雅得是沙特阿拉伯王国的首都和最大城市,包括6个部门、17个直辖市和140个分区(图1)。在2004年,总开发面积为950平方公里,人口为450万。利雅得是中东地区人口增长最快的城市之一,每年有8%的人口增长率(HCDA,2004a)。人口从1930年的20,000增长到2010年的500万,并且预计在2020年达到1000万(HCDA,2004b)。所以,适时人口估计是对于多个城市规划的应用是及时必要的。

所选择的研究区是一个位于利雅得西部名叫Um Alhamam的分区(图1),选择这个地区是由于其各种土地用途(如住宅,植被)、住宅类型(如别墅,宫殿)、数字表面模型的可用性和数字地形模型(DTM)数据。

3.2 数据

2004年在分区规模的人口普查数据是从中央统计和信息部(CDSI)获得的;居住单元的街区和图斑界线的属性数据是从利雅得发展高级委员会(HCDA)获得的;街区的

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[29148],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。