描述和量化地中海的搜索和救援行动的数据融合方法外文翻译资料

 2022-07-31 21:32:59

英语原文共 10 页,剩余内容已隐藏,支付完成后下载完整资料


描述和量化地中海的搜索和救援行动的数据融合方法

Katherine Hoffmann Pham 斯特恩商学院 纽约大学 美国纽约 khof@nyu.edu

Jeremy Boy “全球脉动” 联合国 美国纽约 jeremy@unglobalpulse.org

Miguel Luengo-Oroz “全球脉动“ 联合国 美国纽约 miguel@unglobalpulse.org

摘要—地中海是影响欧洲最大的人道主义危机地区之一。自2014年以来,成千上万的移民和难民在尝试偷渡进入非洲大陆的过程中而丧生或失踪。然而,关于他们如何偷渡的有用的结构化信息相对很少。这些信息可以用来更好的对海上目标进行救援行动或者预测走私方式,从而有可能挽救生命。在本文中,我们提供了一个可以用的数据源概况用来对地中海地区偷渡的研究。我们描述了如何将这些数据组织,合并且分析,用来提供这片区域情况的定量分析。我们定义了一种量化救援框架用来融合围绕个别救援行动的不同数据资源,并且我们研究了机器的学习潜力,它基于船只轨迹信息进行自动救援行动。我们总结与这些数据资源使用有关的技术研究问题、潜在政策和操作意义。

索引词-社会公益,计算社会科学,迁移,轨迹数据,机器学习,人工智能

1.引言和背景

世界正在经历着前所未有的海上移民浪潮。在2015年欧洲难民危机最严重的时候,联合国难民署(UNHCR)估计有超过100万人通过海上抵达欧洲[1]。其中包括逃避政治迫害和冲突的难民,以及希望找到更好的生活并支持家属的经济型移民[2]。在2016年期间,到达的人从地中海东部(希腊至土耳其路线)转移到地中海中部 (利比亚至意大利路线)。在意大利拒绝接纳移民和难民,以及利比亚海岸警卫队采取更加强硬的措施之后,他们现在正向地中海西部(摩洛哥-西班牙路线)移动[3]-[6]。在本文中,我们重点关注地中海中部路线,因为这是自危机开始以来最致命的路线。国际移民组织(IOM)估计自2014年以来有超过14,000多人在试图越过这条路线中死去[7]。

地中海中部的搜寻与救援(SAR)使命最初是由意大利当局领导作为2013年10月至2014年10月进行的“我们的海”行动的一部分。这个行动在2014年12月被欧盟联合特里顿行动代替,欧盟联合特里顿行动后来在2015年6月由反走私行动索菲亚进行了补充。自2015年中期以来,许多非政府组织(NGOs)加入工作,在利比亚海岸开展由私人资助的救援任务,并在海上巡逻,以寻找遇险船只。总的来说,他们已经执行了数百次搜救任务来帮助数万的人,他们每天要进行多次行动。

利比亚海岸是厄立特里亚,尼日利亚和孟加拉国等国家的移民和难民的中转站。有些人带着到达欧洲的目的而放弃原本国籍,而另一些人在因暴力,动荡或人口贩运而流离失所之前在利比亚居住了数年之久[2]。

走私者从沿海的收容中心将移民安排在船舶上,然后将他们送往国际海域。橡皮筏是通常选择的船类,因为如果丢失或损坏,替换它们是不贵的,并且这种船一次可以载运多达200人。改建的木制渔船也被使用,据了解一次可以载运超过800人。因为这些船拥挤不堪并且装备差,这些船几乎没有机会依靠船舶本身到达意大利或马耳他。他们通常会持续航行直到燃料用完、开始泄漏或被救援为止。有一些更幸运船配备了一部卫星电话,可用于向罗马海事救援协调中心(MRCC)请求帮助。其他的则完全依靠被过往船只和搜救飞机发现。有些运气较差的船几天后才被发现,有些甚至在海上消失了。

尽管有大量的人流量和广泛的SAR工作,但除了对到达岸上的移民进行处理外,很少对海上活动模式进行系统分析。信息分散在各种参与者之间,包括:意大利当局,例如海军和海岸警卫队等;非政府组织经营救助艇,例如无国界医生组织的无国界医生组织(MSF)和移民海上援助站(MOAS);以及国际移民组织和难民署等国际移民和难民组织。更好地了解运动方式可能有助于预测到达;确定需要增加搜索和救援巡逻的识别区域;激励国际政府采取行动应对当前危机;并了解这个不断变化的情况。

在这里,我们描述了我们为收集和结合地中海中部救援数据所做的工作。我们汇编“现成的”和“定制的”数据源(如[8]中所述)用来提供对情况的全面了解。现成的数据指的是大规模、大数据源,这些数据资源适用于除最初收集目的以外的目的。定制数据是指明确收集用来研究感兴趣的现象的数据。

本文基于我们先前在[9]中发表的工作,并且组织如下。在第二节中,我们描述了两个现成的大数据源-船舶运动的自动识别系统(AIS)数据和海上遇险呼叫的广播警告数据-那一个据我们所知,至今没有用于大规模定量分析救援工作。我们还将描述有关社交媒体中发现的非政府组织活动的信息。在第三节中,我们描述了定制的官方和非官方数据源,包括国际海事组和难民署的统计数据,以及记者收集的信息。在第四节中,我们介绍了量化救援,这是一个融合这些不同数据源的框架,用来提供有关救援行动的整体观点;在第五节中,我们探讨了机器学习如何支持救援行动的自动检测。最后,在第六节和第七节中,我们总结了对这项工作的政策和操作意义以及明显的技术问题。

2. 现成的大数据源

船舶运动的直接数据来源是自动识别系统(AIS),船舶使用该系统来跟踪和报告其位置以避免碰撞。借助AIS,可以监视例如利比亚沿海救助船的行为,或识别商船是否参与SAR行动。 然后,可以将广播警告用于其他。这些数据包含有关船舶在海上请求援助的信息。此外,随着越来越多的非政府组织对此做出回应,Twitter提供了关于危机的详细叙事,照片和视频信息。

A.自动识别系统数据

关于海上运动的最详细信息源来自船舶AIS数据。所有500吨以上的货船,300吨以上的所有国际旅行船以及所有客船都必须配备AIS收发器,该收发器必须能够发送(1)静态信息,例如自我报告的船名,大小,注册国家,最多三个船舶识别器(9位数字的海事移动服务识别码(MMSI),7位数字的国际海事组织(IMO)号码和长度可变的字母数字呼号。);(2)动态信息,例如纬度,经度,地面航向,速度和船舶的自我报告目的地[10],[11]。

图 1低频AIS轨迹数据的一个例子,说明了2015年4月18日事件发生时的运输流量,其中一艘商船(雅各布国王)与一艘移民船相撞,导致800人死亡[19]。

配备合适的陆地或卫星接收器的任何人都可以收集AIS传输。作为一个结果,各种组织汇总,共享和转售数据。领先的供应商包括:MarineTraffic,ExactEarth,OrbComm,FleetMon,VesselFinder和VesselTracker [12]- [17]。有关完整的评论,请参见[18]。通过使用MarineTraffc,ExactEarth和OrbComm的数据,我们发现AIS信息可以沿四个关键轴来区分。

首先,AIS读数的时间频率不同。不同的供应商以大约2分钟到1小时的频率提供船位读数。数据源中也可能存在差异,这似乎与船速和活动类型相关。

其次,AIS读数在地理空间覆盖率方面有所不同。陆基接收器通常会在15至20海里范围内检测海上信号,尽管它们的范围可以扩展到60海里[20]。为了进一步覆盖,需要卫星接收机。覆盖范围可能因AIS提供商而异,通常被认为是一项高级功能。

第三,AIS供应商以不同的方式对其数据进行采样以进行购买。公司在历史(相对于实时)数据的可用性以及如何从其数据库中选择数据方面存在差异。例如,可以在船级获得数据。用于纬度/经度边界框;或整个世界尽管许多供应商都使用经过计算的特征来标记轨迹(例如,他们可以推断出何时船正在访问港口),或者我们发现根据更高级的查询(例如,在两个以下范围内选择所有AIS读数,所有通过给定港口的船舶的每周时间表)。

第四,AIS提供程序在其数据的结构化程度和机器可读性方面有所不同。 有些数据经过高度预处理的标准格式后提供(例如,具有纬度,经度,速度,地面航向等的船级读数)。 其他则提供原始数据,这需要大量投资来构造和解码。特别是,AIS数据是根据27种不同的类型进行识别的,这些类型通常对应于数据特征,例如来源(例如,地面或卫星),报告对象(例如船舶或基站)以及数据是静态的还是动态的(为了我们的目的,相关的动态数据似乎是1–3(A类位置报告),18–19(B类位置报告)和27(远程/卫星位置报告)类型。 类别是指收发器的类型; A类对应于大型商船,而B类通常对应于小型商船或休闲船[21]。)。数据以“封装信息实体”传输,这些实体是根据美国国家海洋电子协会建立的标准编码的字符串:NMEA 0183。这些编码的字符串显着减小了传输的大小(及其所需的存储空间),但由于它们是人类不可读的,因此需要借助LibAIS [22]之类的库分别进行解码。

除了该解码过程(必要时)之外,典型的预处理还包括删除陆地上的读数,并纠正错误的用于多艘船的标识符(给人的印象是同一艘船一次位于两个位置),以及用于同一艘船。更复杂的预处理还可以包括:连接点以创建轨迹,插补数据以覆盖点之间的间隙,以及将重复数据压缩为更经济的表示形式。例如,锚泊船舶的“轨迹”可能会给人留下船舶围绕某个点行驶的假象,通常可以用代表锚泊开始和结束的两个读数来代替。

最后,AIS读数有时可能不准确或丢失。例如,欺骗性船只可能会关闭其AIS收发器,或者可能会故意“欺骗”其位置。此外,诸如船名和目的地之类的自我报告信息的质量可以变化。例如,某些船只列出了诸如“ SAR区”之类的目的地。这些数据质量问题可能会给AIS数据的使用带来重大风险;根据Robards等人的评论,(2016年)发现一些研究人员在其数据集中删除了28%至74%的记录[23]-[25]。

AIS数据已被广泛用于实际应用中,包括监视捕捞活动和跟踪海上贸易流量[26]-[29]。但是,我们知道只有一个出版物使用AIS数据来跟踪迁移,用有限的取样数据 [30]。我们最初收集了AIS数据,希望像[30]中那样确定移民船的航迹,但是发现这些船无法大规模检测。实际上,大多数移民木筏和船只都不会发出AIS信号,这是因为它们没有配备收发器,或者由于故意关闭或操纵了这些收发器(如上所述)。因此,我们将重点从搜索和救援活动的角度转向研究移民。我们为许多非政府组织的救援船以及几艘海军和海岸警卫队的船舶确定了海上机动服务识别码。

图 2 汇总的AIS数据显示,救援船在利比亚海岸外活动的高度集中。

B.广播警告

广播警告是简短的,基于文本的无线电警报,用于更新船只附近的活动,危险和紧急情况。 警告中包含有关军事演习,海上漂流物体和遇险船只等事件的半结构化信息。警告文字通常引用大海或海洋的名称;最近的国家;日期,时间和地点;以及救援协调中心的联系信息(如果适用)。图4中显示了一个示例警告。这些警告是由全球导航警告服务(WWNWS)产生的,其原始文本可以从美国国家地理空间情报局[31]检索。

图 3 2014-2018年,在利比亚沿海广播警告。

图 4 广播警告示例

使用广播警告的主要困难是过滤有用的记录。广播警告在五个不同的地区发布,HYDROLANT警告涵盖了地中海和大西洋的大部分地区[32]。我们发现,按较小的地理区域进一步过滤这些数据很有帮助[33],并将结果限制为有用的关键字。(特别是52-56区覆盖了地中海。我们也将搜索范围限于警告,其中提及救援组织,例如MRCC或利比亚海岸警卫队,东地中海,以及“人员”,“人员”和/或“协助”一词。最后,我们消除了包含“电缆修理”,“危险操作”,“起落架漂流”等短语的警告。)

另一个挑战涉及从文本中获取完整特征。广播警告的措词足够系统,可以应用标准的文本处理方法。正则表达式匹配可用于构建有用的特征。例如,我们针对是否需要帮助,船上人数,船的状态(例如“请求援助”,“翻盖”,“取水”)和成对的纬度/经度坐标(尽管它们通常是近似的或自主报告的)。

我们的分析表明,在地中海中部迁徙高峰期,广播警告包含有关遇难移民船的广泛信息。在2014年至2018年期间,我们平均每月发现20条相关警告。尽管如此,我们能够生成1,094个带有地理标记的警告的数据集,其中614个包含有关参与人数的相关信息。这些警告表明,随着时间的推移,救援物资的空间分布正在发生演变,2016年和2017年,靠近海岸的呼救声越来越高(见图3)。

C.Twitter

最后,Twitter包含了令人惊讶的有关中地中海移民危机的实时信息。在危机的早期,当易于访问和标准化的数据集受到限制时,这是有关救援的最全面信息来源之一。例如,意大利海岸警卫队的推文通常包含有关参与救援的移民人数,疗养名称以及与其他救援行动的协调的详细信息。

然而,根据产生该推文的组织的说法,由于推文结构的变化,很难从Twitter编译结构化救援数据。需要翻译外语推文;并且缺乏地理参考信息。尽管如此,Twitter对于监视整个情况还是有用的。

3. “自定义”报告和官方统计

A.官方资料

1)Guardia Costiera:自2016年以来,意大利海岸警卫队每月发布有关救援行动的汇总报告,与Twitter提要相比,这是更准确的信息来源。这些PDF报告可从其研究页面的“特区移民活动”部分中获得[34],其中包括由MRCC协调的营救次数和获救人数的数据。至关重要的是,

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[241432],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。