一、外文资料译文:
一种描述新罕布夏州肺癌发病空间格局的地理计算方法
关键词:疾病分布图;地理计算;核估计;肺癌;蒙特卡洛
在医疗卫生地理学和公共卫生调查中,聚类分析已成为了一种揭示疾病发病率空间差异的重探索性方法(Openshaw et al. 1988; Centers for Disease Control and Prevention [CDC] 1990; Besag and Newell 1991; Alexander and Boyle 1996; Gatrell et al. 1996; Bithell 2000)。根据Besag和Newell(1991)的观点,聚类分析有两种类型:聚类检测和集群检测。前者旨在回答某一地区(可以大到一个州,也可以小到核电站附近)内的疾病病例是否具有全球聚集性,而后者则试图找出疾病发生几率异常高的局部地区。这两种类型的聚类分析都会受到数据可用性的限制。很难获得疾病发病率和高危人群在空间和人口统计学上的详细数据。通常来说,研究人员不得不使用汇总到主观定义的管理或人口普查单位的数据。聚合数据的主要缺点包括可修改的面积单位问题和人口较少地区的数值不稳定(Wheeler 2007)。尽管已经开发了复杂的统计技术来处理聚合数据(例如Anselin 1995;Lawson 2001;Banerjee,Carlin and Gelfand 2004;Mu and Wang 2008),但研究人员认为,可以获得单个或较少聚合的数据应该成为研究的首选(例如Openshaw 1984;Ftheringham and Wong 1991;Jacquez and Waller 1999)。
最近,美国的数据可用性得到了显著改善。例如,美国已经建立了一个全国性的癌症登记网络,在医疗机构收集详细的癌症信息,这些医疗机构包括医生办公室、诊所和医院在内。收集的数据包含有关患者的详细位置信息,并在州(或地区)和国家一级的登记处报告和汇编(CDC 2005)。在过去十年中,关于纳入辅助信息以绘制人口普查单位内人口空间变异性地图的研究一直很活跃(Dobson et al. 2000; Bhaduri et al. 2002; Mennis 2003; Langford and Higgs 2006)。这项工作的一个重要成果是LandScanTM数据(Oak Ridge National Laboratory 2005)。对于美国来说,LandScan数据是根据土地覆盖、道路、坡度、夜间灯光和其他因素的信息,通过将人口普查数据分配到精细的规则网格单元中所创建的(Dobson et al. 2000; Bhaduri et al. 2002)。
本文提出了一种用于疾病地图中点群检测的地理计算方法。有研究将地理计算框定为一种使用密集计算的方法,该方法利用在空间和属性方面都较为详细的数据,减少对统计模型和假设的依赖(Couclelis 1998; Longley 1998; Openshaw 2000; Fotheringham 2000; Gahegan et al. 2002; Kwan 2004)。这正是疾病制图这一具体应用的目标所在。
虽然这篇文章的特点是从新罕布夏州的肺癌发病率数据中提取一个程序方法,但该方法的核心,即最大限度地利用详细的地理参考数据,量化和表示在利用这些数据过程中存在的不确定性,以及使用密集的计算来减少对统计假设的依赖,这可能会引起从生态学到犯罪学等空间分析领域的兴趣。
本文提供的方法建立在前任的方法基础上,并且关注的主要问题与那些方法相同。在过去的二十年里,已经开发了许多方法来检测疾病的聚集点。这些方法解决的两个主要问题包括:(1)如何衡量疾病病例的局部强度;(2)如何消除高危背景人口的空间变化的影响。这里的术语“高危背景人口”(在本文中有时被简化为背景人群)指的是那些有着感染健康问题风险的人(Cromley and McLafferty 2002, chapter 5)。测量局部病例强度的方法可分为两大类:基于预定义区域单位内的病例计数的方法和基于分析病例位置之间的距离的方法(Orsquo;Sullivan and Unwin 2003, chapter 4)。病例计数是大多数方法采用的策略,在这个过程中,预定义的空间单位可以是空间上相排斥的(Black, Sharp, and Urquhart 1996; Muirhead and Butland 1996)或重叠的(Openshaw et al. 1987; Openshaw et al. 1988; Turnbull et al. 1990; Besag and Newell 1991; Kulldorff and Nagarwalla 1995; Fotheringham and Zhan 1996; Rushton and Lolonis 1996)。不同的是,Cuzick and Edwards(1990,1996)的最近邻法是基于距离的,这里的距离指的是病例点和控制点之间的距离。
对于病例计数的方法来说,控制背景人口通常涉及三个因素:空间单元的大小、背景人口的大小和疾病病例数。通常的方法是控制三个因素中的一个,并测试其他因素(或其他两个因素之间的关系)。在地理分析的早期版本(Openshaw et al. 1987)中,Rushton and Lolonis(1996)的空间滤波法和Ftheringham and Zhan (1996)的随机核方法是控制空间单元大小并检验病例计数与背景总体(或代表背景总体的对照)之间关系的示例。Kulldorff and Nagarwalla(1995)的空间扫描方法基本上控制了空间大小,但其独特之处在于,空间的大小由计数和背景人口之间的关系确定,因此大小是局部特定的,不是主观的。从某种意义上说,所有这些方法都可以被认为是Bithell(1990)病例对照方法的特例,它对病例和背景人群都适用相同的带宽。Kelsal land Digger(1995a,1995b)证明了对病例和背景人群使用相同的带宽是合理的,但并没有得到非常广泛的支持 (Gatrell et al. 1996)。与此不同的是,Turnbull(1990)的方法不是控制空间单元的大小,而是控制背景人口并且测试病例数。Besag and Newell(1991)的方法是控制病例数并且测试背景人口。
在有风险的背景人群方面,除了人口数量外,人口结构对某些疾病的分析也是至关重要的。例如,不同年龄段的肺癌发病率差别很大。那些引起变化的但不是研究所关注的因素被称为混杂因素,这些因素的影响必须最小化,才能揭示更重要的变化。大多数先前关于疾病聚集性的研究都没有明确地解决患者的人口结构问题。他们通常选择队列相对而言较窄的疾病(例如儿童白血病、出生体重低和乳腺癌),这一现象产生的部分原因可能是因为缺乏空间详细的人口统计数据。
与许多以前的研究一样,本文提出的方法使用核密度估计和蒙特卡罗模拟来评估每个位置的相对风险,但它结合和集成了新的方法来解决详细数据使用中的三个主要问题。首先,它使用基于案例一方和背景人口的自适应核来最小化背景人口的影响。该内核测量了疾病病例位置周围的背景人口,而不是要为其分配密度值的地点周围的背景人口。第二,它使用有限制的蒙特卡罗过程来处理病人位置数据的不精确性,特别是邮箱地址引起的不精确性,这是登记处系统收集数据产生的一个常见问题。第三,将流行病学中的直接标准化和间接标准化相结合,解决了人口统计学上的混杂因素,简化了核密度估计中带宽的选择。
本文的其余部分组织如下。首先介绍了数据的准备过程,重点介绍了通过整合美国人口普查数据和LandScan数据创建背景人口数据层的过程。然后解释了聚类分析过程的细节,再介绍并讨论了新罕布夏州肺癌病例研究的结果。最后一部分是对当前研究的总结和对未来工作的建议。
一、数据
(一)肺癌发病病例的数据
肺癌数据来自新罕布夏州卫生与公众服务部(NHDHHS)疾病控制和健康统计局公共卫生服务司(NHDHHS)健康统计和数据管理科(Health Statisits And Data Management)和新罕布夏州癌症登记处(NHSCR)。2003年,数据集当中的患者地址数据被发送到地理数据技术公司(现为Tele Atlas的一部分),以便使用该公司当时最新的街道和邮政编码数据进行地理编码。由于用于高危人群的人口统计信息来自2000年人口普查(见下一小节),为了更好地保持肺癌数据和人口数据在时间上的兼容性,本研究只使用了1995至2003年间向登记系统报告的6472例病例。在6472个案例中,4719个(72.9%)与准确的街道号码位置匹配成功,1753个(27.1%)只能在邮政编码级别匹配。这些邮政编码级别的地址中,大多数只包含邮政信箱号码。所有的病例被分成18个年龄-性别类别(表1)。
表 1 新罕布夏州患肺癌的病例数和人口总数统计表(性别-年龄)
男性 |
女性 |
|||||||
年龄 |
病例数 |
人口 |
患病率 |
病例数 |
人口 |
患病率 |
||
30-39 |
28 |
97949 |
28.6 |
34 |
100411 |
33.9 |
||
40-49 |
200 |
104,608 |
191.2 |
179 |
105,034 |
170.4 |
||
50-54 |
232 |
42,892 |
540.9 |
214 |
42,977 |
497.9 |
||
55-59 |
308 |
31,380 |
981.5 |
270 |
31,284 |
863.1 |
||
60-64 |
433 |
23,020 |
1881.0 |
368 |
23,975 |
1534.9 |
||
65-69lt; 剩余内容已隐藏,支付完成后下载完整资料
英语原文共 14 页,剩余内容已隐藏,支付完成后下载完整资料 资料编号:[596238],资料为PDF文档或Word文档,PDF文档可免费转换为Word |
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。
您可能感兴趣的文章
- 带水印的GIS数字矢量地图质量监测外文翻译资料
- 基于多源地理数据的城市功能区识别——以中国郑州市为例外文翻译资料
- 北京医疗服务可及性的空间差异和影响机制:移徙者平等的视角外文翻译资料
- 利用巴基斯坦费萨拉巴德的光学多时相卫星数据进行陆地表面温度和土地利用土地覆盖变化的CA-马尔可夫链分析外文翻译资料
- 大都市地区植被净初级生产力(NPP)动态变化与城市化驱动力研究–以北京市为例外文翻译资料
- 公园缓解城市热岛效应的有效性–以亚的斯亚贝巴为例外文翻译资料
- 一种描述新罕布夏州肺癌发病空间格局的地理计算方法外文翻译资料
- 加拿大大温哥华地区极端炎热天气温度-死亡率关系的空间差异描述外文翻译资料
- 雅典地区气温和湿度对人体热舒适度的影响外文翻译资料
- 量化公共卫生实践和研究中的空间可及性:在现场酒精场所的应用,美国,2013年外文翻译资料