基于支持向量机的方法从DMSP-OLS和SPOT VGT数据提取城市地区外文翻译资料

 2022-12-07 16:26:05

英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料


基于支持向量机的方法从DMSP-OLS和SPOT VGT数据提取城市地区

Xin Cao , Jin Chen ,⁎, Hidefumi Imura , Osamu Higashi

北京师范大学地球表面过程与资源生态学国家重点实验室,北京100875

名古屋464-8601环境学研究科,名古屋大学,日本

摘要:因为城市化的加速和相关的环境问题的压力,城市区域映射在区域和全球尺度内已成为一项紧迫的任务。DMSP-OLS上稳定的城市灯光遥感影像提供准确、经济、简单的方法来映射全球城市地区分布。为了解决由于经验、手动调试或错误方法而选取的阈值的问题,我们提出了一种支持向量机(SVM)为基础的区域生长算法从DMSP-OLS和SPOT NDVI数据提取城市地区的方法。我们使用几种方法来选择支持向量机的城市和非城市像素训练集,在区域生长识别的基础上,我们选择一个迭代采用分类和训练程序来识别城市像素。这个新的方法是选取中国25个不同程度的城市进行验证,作为 Landsat ETM 影像进行分类的结果,然后与两种阈值方法进行比较。结果表明,基于支持向量机算法既能达到局部最优阈值法的精度,又可避免其繁琐试验和错误的过程,表明新方法能简单便捷地从DMSP-OLS和SPOT NDVI数据上提取城市范围。

关键词:城市范围 、支持向量机、阈值、 DMSP-OLS、SPOT NDVI

  1. 简介

城市地区覆盖着地球表面的小部分,却极大地影响着周围的环境,能源,资源通量。受经济发和人口增长的影响,加速进行的城市化正在改变土地利用和覆盖,并进一步影响生物多样性生物,地球化学循环,与当地和全球的气(Foley et al.2005;格林等人.2008)。出于城市的可持续管理和评价城市化对环境的影响,科学家和政府的越来越需要监测城市地区的空间范围。遥感技术,能长时间地对大面积的范围进行监测,有很高的潜力以满足这些需求。

我们可以在不同分辨率的遥感影像中标绘出城市。高或中等空间分辨率图(IKONOS、Quickbird、Landsat Thematic Mapper (TM)/Enhanced Thematic Mapper plus(ETM )、SPOT/HighResolution Visible (HRV))已广泛应用于各个城市城市土地利用分类。在区域甚至全球范围内,国防气象卫星计划(DMSP)的业务线扫描系统(OLS)夜间图像已被证明为映射的地区或城市人居环境是一种经济有效的数据源(例如Elvidge et al.,1997,1999, 2001; Imhoff et al., 1997a; Henderson et al., 2003; Milesi et al.,2003a;Sutton, 2003; Gallo et al., 2004; Lu et al., 2008),并且用于人口和社会经济的参数估计(如Welch,1980; Sutton et al., 1997, 2001; Lo, 2001, 2002)。从DMSP-OLS数据映射地区或城市人居环境,阈值技术是常用的,因为它的简单。然而,现有的研究表明,这种方法是有问题的,尤其在发展水平不一样的城市间对比。据报道,由于弥散效应的影响,单一阈值在大规模城市应用中,明显高估了城市范围。也忽视了一大批发展水平较低的城市(Henderson et al., 2003; Small et al., 2005). 随着对这一问题的认识,在城市发展水平的基础上,人们大力发展多个阈值(例如,Imhoff et al., 1997a;Owenetal.,1998; Sutton et al., 2001; Lawrence et al., 2002; Henderson et al., 2003)。然而,现有的阈值仍然是通过经验获取或者人为规定的,没有在其他领域进行有效验证。目前根据城市的发展水平而选取有效的阈值在研究上还没有得到人们的一致认可。此外,最佳阈值的选择是一个复杂的和耗时的过程,在很大程度上限制了其在实践中的应用。这些问题会导致无法在区域尺度DMSP-OLS数据上得到城市范围。因此,我们尝试使用一种基于支持向量机(SVM)的半自动分类方法,在DMSP-OLS数据中映射地区或城市人居环境。这个方法通过将城市提取转化为城市和非城市的区分,从而避免了有关阈值的问题。在这里,支持向量机分类器是因为它是一个非参数的分类而被使用,通过少量的训练样本它可以很好的为二值化分进行分累。为了验证新方法的灵活性和稳定,对发展水平不同的中国城市进行了个案研究。

2研究区和数据

中国城市被选为案例研究,因为中国自20世纪80年代以来经历了快速的城市化并且如今仍有较大的区域发展差异。25个城市(图1)分别来自在北京,上海,广州,郑州,兰州,和沈阳的具有不同发展水平的城市。在2000年,这25个城市的人口从不到70000(定西)到超过900万(上海),人均国内生产总值(GDP)从低于8000元(或1200美元)定西到超过150000人民币(或22000美元)深圳(中国统计局,2001)。

表1 在这项研究中所使用的数据的描述。

数据来源

产品描述

采集日期

空间分辨率

DMSP-OLS

年稳定的夜间光复合材料

2000年

1km

SPOT NDVI

MVC全球最大NDVI

2000年4-9月

1km

Landsat ETM

六张图片覆盖5个城市,乐队1个,5个和7个

1999-2000年

28.5m

一个简短的描述遥感数据显示在表1。用于这项研究的DMSP-OLS夜间灯光数据由美国国家海洋和大气管理局(NOAA)提供/国家地球物理数据中心(NGDC)提供。数据包括来自城市的灯光、持续照明的住宅区和短暂的事件如火灾过后的点区域(Elvidge et al.,1997,1999, 2001)。全年的数据通过平均稳定的光图像的DN值被记录为6位数字号码(DN),范围从0(背景)到63(饱和)。在本研究中我们利用DMSP-OLS数据与2000年期数据混合。我们还使用归一化植被指数(NDVI)数据减少弥散效应(Lu et al.,2008)。为了创建一个年最大NDVI图像,我们利用从2000年四月到九月(生长季节)进行采集和处理的最大值合成(MVC,Holben,1986)合成SPOTVGT-NDVI全球10天影像数据。将DMSP-OLS和 NDVI图像解译和重新采样的一个1公里的空间分辨率(图1)。最后,最后,我们用总的空间分辨率为28.5米的6 Landsat ETM 图像,分别获得1999-2000年覆盖25个城市的影像,验证通过OLS和NDVI数据提取城市的程度。城市地区由基于典型城市地区的训练数据的最大似然法产生。如果建筑物和道路的像素我们不管他们属于城市或郊区,我们利用Landsat ETM 数据将很难区分城市和郊区。因此,监督分类产生的城市地图包括城市和郊区。聚合过程采用分辨率为28.5m为分辨率为1公里的城市地图分类,其中一些较小的郊区被淘汰。针对Landsat ETM 和DMSP数据之间的空间分辨率差,ETM 结果不够准确,可作为验证参考图。

图1 研究区和数据:(一)2000 DMSP-OLS图像和选定的25个城市,(b)SPOTVGT-NDVI(MVC–四月九月2000)。

3方法

我们开发了一个基于SVM的区域增长算法,来对城市像素和非城市像素进行半自动化分类。SVM是一种基于统计学习理论的非参数方法(Vapnik, 2000)。基于SVM分类器超过传统的优势在于传统它解决了当训练样本只有少量可用时的学习问题。(Mantero et al., 2005)。支持向量机的基本思想是通过使用一个具有超大间隔的平面将输入的向量分为两大类,来源于求解下面的带约束的二次规划问题:

(1)

(2)

式中,Xi为训练样本向量,yiisin;{1,-1} 为对应的类编号,K(u,v)是核函数。Vapnik(2000)提取出了三种类型的支持向量机,在本次研究中,我们将径向基函数(RBF)作为核函数。

功能,和宽度sigma;(唯一的自由参数)在下方程被设置为1:

(3)

首先,我们输入DMSP-OLS,SPOT NDVI,然后选择两个训练集,城市和非城市类。潜在的城市斑块与OLS DN大于30的像素被选为城市训练样本集合。这是通过检查OLS值定义城市并且能确保包括所有潜在的城市补丁。非城市类训练集包括从SPOT中提取出来的水与植被覆盖的像素与NDVI值大于0.4和OLS值小于30的像素。事实上,这些阈值仅提供一个基准,确定城市和非城市像素的训练样本,他们有没有影响的最终结果,因此,最终的结果是不敏感的初始阈值。SVM训练后,基于支持向量机分类器进行OLS和NDVI数据未知像素分类。请注意,我们没有在同一时间内对所有未知像素进行分累,而是一步一步地使用支持向量机分类器在一个迭代的过程中,分类的像素附近的种子像素(城市类培训像素)。在循环过程的第一步,输入的城市像素被分配作为种子,然后在3个窗口范围内的每一个种子的像素的所有像素同时由基于支持向量机分类进行分类。分类完成后,这些被划分为城市的像素点被作为新的分类样本,并且输入到支持向量机分类器中来进行新的分类。同时,这些被分类为城市的像素也被用作种子像素在下一个循环。进行多次迭代之后,直到新的确定为城市的像素变为零数量。最后,在一个城市范围的地图制作完成后,一些NDVi值大于0.6的城市像素被重新贴上伪城市标签。

双阈值法(全局固定和局部优化)也被用来比较他们的性能,算法的更新。全局固定阈值法一DMSP-OLS DN值被用来提取城市地区(Imhoff et al., 1997a; Milesi et al., 2003b)。将每个在1到63范围内的DN值作为一个阈值,产生63元的城市图像后,通过与ETM 遥感影像分类结果对比确定最佳的整体连贯性得到了全局固定阈值。局部阈值优化方法为从DMSP-OLS数据导出的ETM 城市匹配最优DN阈值。这种方法通过DMSP-OLS数据提供了最好的城市范围。为匹配指数,两阈值分割方法基于误差矩阵的Kappa指数(Congalton,1991)。

4结论

图3 城市面积提取结果:(a)选定城市的DMSP的图像,(b)由Landsat ETM 遥感分类的城市范围,(c)全球固定阈值法、(d)阈值法和基于支持向量机的区域生长方法。(e)广州是由因邻近城市的高DMSP-OLS值城市边界

我们使用基于支持向量机的区域生长算法的全局固定和局部优化的阈值方法,提取了三个城市的城市化进度。图3显示选定的6个城市(北京,上海,广州,兰州,郑州,本溪)的城市地区,以及作为DMSP-OLS图像和ETM 数据的分类结果(30米)。两阈值方法(图3 c、d)由于DMSP-OLS数据的弥散效应,倾向于识别连续的城市范围。而基于SVM的方法(图3E)通过区域生长算法和拒绝植被和SVM分类器和NDVI像素标准水可连续提取城市区域。以ETM 可视化结果比较表明,兰州和郑州,分别在中等发展水平,可以采用三种方中的任何一个的提取,都能取得较好成果。上海,北京,和广州,有较高的发展水平,基于支持向量机的算法比全局固定阈值法效果好。对于定西,这有最低的发展水平,三种方法的结果进行了比较。在一般情况下,局部优化的阈值方法取得了最好的结果,其次是基于支持向量机算法和全局固定阈值法。

为了量化三种方法的性能,采用城市像素数和整体精度的2个精度评价指标,我们进行了精度评估(表2),OA和Kappa值是基于误差矩阵从DMSP-OLS计算结果和每个城市的ETM 结果中得出来的。比较平均的OA、Kappa、局部优化的阈值与ETM 方法具有相同的一致性(OA = 0.912,Kappa值为0.638);基于支持向量机算法也产生了良好的城市范围结果(OA = 0.905,Kappa值为0.622),而全局的固定阈值有最坏的结果(OA= 0.873,Kappa= 0.512)。考虑广泛的部分非城市背景像素的测试样本,可以在很大程度上提高了精度值,我们主要依赖于三种方法的性能值进行比较。平均而言,这三种方法往往高估的城市地区,但基于SVM的算法是最接近ETM 。对于个别城市,南部的很多城市包括广州,佛山,深圳,中山,江门,东莞都无法准确确定城市范围。这些城市在DMSP-OLS数据中都有较高的人均GDP和弥散效应。另一个城市,定西,也被错误的提取,由于其极低的经济发展和数量极少的人口。基于SVM的算法被发现有比全球固定阈值法对几乎所有城市较高的Kappa值,并能够提取的城市如上海、惠州、郑州、新乡、沈阳、富顺、本溪(kappan0.7)比局部最优阈值法更准确。在一般情况下,支持向量机的性能相比较,基于算法的局部最优阈值法。

表2 城市区域三种提取方法的精度评价

5.讨论和结论

我们开发了一个基于SVM的区域生长算法,同时通过DMSP-OLS和SPOT NDVI数据自动分类提取多个城市地区。为了处理城市特征像素,这种新方法用几个简单的标准来建立城市和非城市像素的初始训练集,用一个迭代的分类程序,能够连续训练的支持向量机分类。当验证通过ETM 数据,基于支持向量机算法取得了类似的结果

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[31970],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。