基于传感器数据的实时隐私保护人群估计外文翻译资料

 2022-07-26 15:45:57

2016 IEEE International Conference on Mobile Services

Real-Time Privacy Preserving Crowd Estimation Based on Sensor Data

Abstract—As one of the popular topics to ensure public safety, crowd estimation has attracted lots of attentions from both industry and academia. Most of traditional crowd estimation approaches rely on sophisticated computer vision algorithms toestimate crowd based on camera data, therefore suffering from

privacy issues and high deployment and data processing cost. In this paper we present a sensor fusion based approach to real-time crowd estimation based on privacy-conscious and inexpensive sensors. The approach has been implemented and verified first by a small scale deployment at our lab, and then tested based on a 3-month trial at a shopping mall in Singapore. A deep analysis has been carried out based on the data sets collected from the trial, showing promising results: 1) the data from CO 2 , sound pressure and infrared sensors are influential in estimating crowd levels for indoor environments; 2) Random Forest and C4.5 are identified as the more suitable supervised learning models; 3) an accuracy of 95% can be achieved by our crowd estimation system in a real scenario. In contrast to the state of the art, our approach is privacy preserving and can provide comparable estimation accuracy with lower deployment and processing cost and better applicability for large scale setups. It can be used either as an alternative solution when user privacy must be enforced or as a complementary solution to camera-based crowd estimation when privacy is less concerned because of pubic safety.

I. I NTRODUCTION

Today Internet-of-Things (IoT) [1] and Ubiquitous computing instrument our environments via various connected sensors and actuators, providing an unprecedented wealth of information and enhancing the intelligence of environments around us. Thanks to the deployed sensors and actuators, we are now able to sense physical environments and react on critical situations in realtime using the right data analyticstechniques. This provides us unique opportunities to improve the public safety of our living world.

As one of the popular topics for ensuring public safety, crowd estimation has attracted lots of attentions from both industry and academia. Estimating the crowd for a given physical place can provide facility operators or city authorities useful information on how crowd the place is and how it has been used. This allows them to optimize their facility usage for saving cost, or to avoid any crowd emergency for ensuring safety. As an important technique, crowd estimation can be used by various applications in a wide range of areas like conference rooms, office building, shopping malls, museums, train stations, and airports.

For decades camera based solutions have been the dominated approach to crowd estimation. They usually rely on sophisticated computer vision algorithms to analyze camera data, therefore estimating the number of people in the monitored space. Although the camera based approach has been widely used by many places in different counties, it has some drawbacks and limitations. First, its effectiveness highly depends on the quality of captured images and it has problems to be applied into low-light environments. Second, it requires lots of computation for video analysis and is hardly to be real time. Third, the cost for installation and video processing is very high and also blind areas can not be avoided, especially for a large scale deployment. Moreover, privacy issue is always a big concern for camera based solutions and can not be solved. Therefore, new solutions for crowd estimation are still highly desirable.

In this paper we present a privacy preserving crowd estimation approach that can estimate crowd for indoor environments in real-time based on sensor data collected from various environmental sensors. In contrast to the previous solutions, we have taken the privacy issue and the cost issue very seriously.In our approach no camera is needed and we use only inexpensive sensors which are not able to identify any individuals by their own.Based on sensor data fusion techniques, our approach can map the current crowd situation into a crowd level, which is predefined according to the potential size of crowds in the monitored environment.

As compared with the state of the art, our approach has the following advantages. First, no intensive video processing is needed and emerging crowds can be detected by our approach in realtime, which provides fast response time for dealing with crowd emergency. Second, thanks to the carefully selected sensors and machine learning algorithms, our approach is able to achieve good accuracy that is higher than previous sensor based approaches while is still comparable with existing camera based approaches. Third, our approach can preserve user privacy and is suitable for some indoor environments where privacy must be enforced or is highly demanded. Lastly, our approach has lower deployment cost and can be used to monitor large scale areas with better coverage and low cost. Regarding the relationship with camera-based crowd estimation solutions, our approach can be used as an alternative solution when user privacy must be enforced or can be used as a complementary solution to provide realtime crowd estimation when privacy could be compromised for safety in public places.

The rest of this paper is structured as follows. Section II discusses the state of the art about crowd estimation and explains how our work is different from them. Section III introduces our sensor fusion approach to crowd estimation and presents the design of our crowd detection system, which has been deployed and tested both in a lab environment and in a real shopping mall. The experiments and measurement results from these two deployments are shared in Section IV. Finally, Section V concludes the

全文共24245字,剩余内容已隐藏,支付完成后下载完整资料


2016年IEEE国际会议——移动服务

基于传感器数据的实时隐私保护人群估计

摘要——作为一个关于确保公共安全的话题,人群估计已经吸引了很多来自产业界和学术界的关注。大多数传统的人群估计方法基于摄像头数据,依靠先进的计算机视觉算法来估计人群,因此存在隐私问题,部署和数据处理成本高。在本文中,我们提出一个基于传感器融合方法来进行人群估计,注重保护隐私,并使用更廉价的传感器。实施和验证的方法为:首先在我们的实验室进行小规模部署,然后其测试是基于一场在新加坡的购物中心进行的三个月的实验。对实验所收集的数据集进行深入研究,显示出可喜的结果:1)对于室内环境,来自二氧化碳、声压和红外传感器的数据在人群水平监测上影响力较大;2)随机森林和C4.5被认为是更合适的监督学习模型;3)在真实的场景中,我们的人群估计系统可以达到95%的精度。与当前发展现状相较,我们的方法能够保护隐私,用较低的部署和处理费用就能提供类似的估计精度,并且对于大规模设置有更好的适用性。这种方法既可以在用户隐私必须被保护时作为一种解决方案,也能在因公共安全而不那么重视隐私时作为一种基于摄像头的人群估计解决方案。

一、介绍:

现在物联网(物联网)[1]和无处不在的计算机仪器通过各种传感器和执行器连接起来,为我们提供了前所未有的丰富的信息,使我们的生活环境变得更加智能。由于部署的传感器和执行器,我们现在能够感知物理环境,在危急的情况下利用正确的数据能够进行实时的应对。这给我们提供了绝佳的机会来改善我们生活环境的公共安全。

作为一个关于确保公共安全的话题,人群估计已经吸引了很多来自产业界和学术界的关注。对于一个给定的物理位置进行人群估计可以提供设施运营商或市政当局关于该地区人群密度和如何被使用的相关信息。这有助于优化设施,节约成本,也能保障安全,避免人群发生紧急情况。作为一种重要的技术,人群估计可以在各个领域中被各种应用使用,如会议室、办公楼、购物中心、博物馆、火车站和机场。

几十年来,基于摄像机的解决方案是主要的人群估计方法。这些方法通常依靠先进的计算机视觉算法来分析视频数据,因此估计的人数在监控的空间内。虽然基于摄像机的方法被广泛的应用于许多地方,它也有一些缺点和局限性。首先,其有效性高度依赖于所捕捉的图像质量,同时应用于光线暗的环境时存在问题。第二,它需要大量的实时视频来分析计算。第三,安装和视频处理的成本很高,同时无法避免存在监控盲区,尤其是在大规模部署的情况下。此外,隐私问题对于基于摄像机的解决方案始终是一个大问题,并且无法解决。因此,现在急切需要新的人群估计解决方案。

在本文中,我们提出一个保护隐私的人群估计方法,它可以在室内环境中,基于各种各样的环境传感器收集的数据来实时估计人群情况。相比之前的解决方案,我们更注重隐私问题和成本问题。在我们的方法不需要摄像机,而是用较低价格的不能自动识别个人的传感器。基于传感器数据融合技术,我们的方法能够描绘当前人群状况水平,根据监视环境的潜在范围所预定义的。

与当前该领域其他方法相较,我们的方法有如下几点优势:首先,不需要密集的视频处理,同时我们的方法可以实时的检测到新出现的人群,这为人群紧急情况提供了处理时间。第二,由于精心挑选传感器和机器学习算法,我们的方法较以前的基于传感器的方法能够达到更好的精度,能够媲美现有的基于摄像机的方法。第三,我们的方法可以保护用户隐私,并对于一些对于隐私要求较高的室内环境。最后,我们的方法能够降低部署成本,并且在大区域监测时能够达到更大的覆盖范围用更低的成本。此方案与基于摄像机的人群估计解决方案的关系为,在保护用户隐私时可以作为一种可选方案,或者在公共场合,出于对安全的考虑而需要人群隐私信息时,它也可以作为一项补充方案。

本文的其余部分结构如下。 第二部分讨论了人群估计的最新情况,并解释了我们的工作与他们的不同之处。 第三节介绍了我们进行人群估计的传感器融合方法,并介绍了我们的人群检测系统的设计,该系统已经在实验室环境和真实的购物中心部署和测试。 这两个部署的实验和测量结果在第四部分中说明。 最后,第五部分对未来工作的前景作了总结。

二、发展状况

在现有技术中有不同类型的人群估计方法,关于哪种类型的数据源被用作输入数据(例如,视频,音频,无线信号等),监视哪种类型的环境(室内或室外)以及人群的特征(小规模或大规模, 人群数量,人群规模,人群流量)。 本节将现有的人群估算方法基于其使用的数据源归纳为四类,然后指出了我们的方法的目标和我们的工作与以前的工作相比所填补的差距。

1)基于相机的方法:典型的于应用计算机视觉算法的基于摄像机的方法,如利用视频帧画面上的形状和外观模型检测并计算人数。 虽然这些技术往往适用于单独的人,难以应用于密集的人群,难以适用于低光环境,这是众所周知的问题[2]。 为了解决这些问题,已经在调查[3]和[4]中看到,在这些情况下,为了找到人之间最明显的的界限,已经作出了巨大的的努力。 即使如此,基于相机的人群估计仍然对隐私有很大的关注。 如[5],[6],[7]中所指出的,根据国家规定和相机安装位置的性质,相机的使用可能非常严格。 有许多情况下不允许使用相机,例如。 限制访问区域或办公环境。

2)基于无线信号的方法:近来无线信号已被用于估计室内和室外人群的数量。 通过测量和分类人群行为对接收到的信号强度的影响,可以粗略估计被监测区域的参与人数。 最近,已经进行了两项研究[8] [9],根据一对固定的发射机/接收机天线之间的WiFi接收信号强度指示(RSSI)测量来计算一个地区的总人数。 虽然这些方法是无设备的,并且还保护用户隐私,但它们只能被验证为对于小规模有效,最多能监测10个参与者。 他们估计人群的有效性仍然是未知数。

3)基于传感器的方法:由于手机可以提供许多传感器,并且市场上可以使用许多专门的传感器设备,价格便宜,因此传感器数据为估计人群提供了另一个机会。 例如,Xu等人[10]根据部分参与者的智能手机捕获的音频段,估计某个地方的人数。 西村等 [11]提出了一种新的系统,用于通过分析加速度计和麦克风的数据来估计公共空间行人流量的人群密度和平滑度。

在本文中,我们更多地关注基于部署在监控位置的专用传感器设备估计人群的方法。通过这种方法,人群估计不依赖于如果有或多少人携带他们的移动设备,并且用户隐私也不太关心。我们正在尝试使用低成本和非侵入式传感器来通过测量人群行为对来自多个传感器的监控环境的影响来估计人群。最相关的工作是Viani等人提出的工作。 [12]。在本文中,作者通过三步法:检测,过滤和分类室内环境,并在博物馆内验证了其原型系统。虽然他们的初步结果已经显示出这样的解决方案的潜力,但其算法实现的占用其所估计的总体精度只有25%,这对于实际使用来说是不令人满意的。然而,通过严格挑选的传感器和机器学习算法,我们的方法能够实现超过90%的精度,这已经在具有不同尺度的两个不同的实际部署中得到验证。

三, 传感器融合用于人群估计 在本节中,我们首先介绍我们对人群估计的基本方法,然后描述我们的系统概况,该系统旨在于应用该方法。

A、传感器融合方法

我们的人群估计解决方案的目标是提供关于目标区域的人群密度的实时估计。 在我们的方法中,我们通过对精确定位的传感器进行采样来估计人群密度,然后将收集的传感器数据与目标区域中存在的人群的水平相关联。 人群水平代表密度范围,可以根据目标区域的潜在人群大小进行预定义。 级别的数量取决于预期的粒度。 对于许多用例,3或4级可能是足够的。我们的方法是基于在室内环境受人类活动影响的假设之上,其影响可以通过不同方面的各种传感器测量来推断人群的密度。 因此,在我们的方法中,我们使用声压或二氧化碳等环境传感器。 该方法的核心部分是使用廉价和隐私保护的红外接近传感器[13],并且不需要相机。

安装在天花板上并面朝下,当障碍物在天花板的1.5米范围内时,这些传感器被激活,有效地检测人员。 然而,他们的目标不是计算绝对人数,而是衡量在给定的时间窗口中平均的激活次数。 这是基于以下假设:人们在过境区域行走时遵循良好的道路,在我们实验室的广泛实验,以及从新加坡的现场试播收集的录像得到验证。 图1说明了这一点:在走廊里,人们将沿着它的中心走,除非这个空间被较大的人群所占据,迫使人们走近墙壁。 同样,在有两个入场点的大厅里,人们往往会遵循最短的路径。

通过将传感器放置在溢出区域(如果该地区已经有很多人在这个区域中,只能走路的,而不是常规区域),我们就获得有关传感器激活频率的信息,这些信息不仅传达 在特定溢流区的人数,也反映了邻近的常规地区。 使用监督学习,我们可以模拟收集的传感器数据与实际人群水平之间的相关性。

B.系统设计

我们设计的系统由四个主要部分组成:数据采集,从部署的物理传感器连续读取最新值;数据收集,包括接收,聚合和存储从采集组件接收的数据;模型学习,基于收集的数据和手动标记的地面实例来训练模型;人群估计,基于学习模型提供估计。另一部件被设计成处理可视化的情况,并向操作者(例如,在网站上)呈现人群估计结果。在典型的部署中,所有前端机器可能是低成本的机器,如raspberry Pi,因为仅计算密集型任务才发生在模型学习短语中。只有数据采集组件必须部署在现场的某些机器上,除非传感器本身可以直接将数据报告给数据采集组件。如果计算能力足够,模型学习组件可以与人群估计组件一起部署在同一台机器上。数据采集部件基于叶片发动机产品[14],可以轻松集成各种传感器。

我们的系统对标记的数据集进行监督学习。 特征直接从传感器报告的系统状态中提取出来。 基于阈值配置数据采集,使得数据采集组件只有在读取的值超过变化阈值时才会触发传感器事件。 在收到事件后,数据收集器将通过接收到的事件计算特征以及其余传感器的最后一个已知状态来创建样本。 由于传感器在人员通过的情况下发送事件,所以我们可以假定,当前值与上次报告的情况没有发生任何事件时没有分歧。

标示培训样本所需的地面事况是手动给出的,方法是让人直接在现场观察人群,或者使用临时摄像机安装,然后由人员对其进行检查。

四, 实验

上一节介绍了我们的人群估计方法。 基于这种方法,我们已经实现了设计的系统。 该系统首先在小型实验室部署中进行测试,以了解收集的传感器数据的性质,并检查我们的人群估计方法对室内环境的潜力。 测试在我们实验室的走廊进行了4个多月,显示出有希望的结果。 该系统能够通过调谐传感器安装和机器学习算法,以95%的精度检测三个人群。 在这些结果的鼓舞下,我们进一步将该系统部署在新加坡的购物中心进行试用。 关于本文的空间限制以及在购物中心部署是一个大型现场场景设置的事实,在本节中,我们将重点介绍这一大型部署,并提供试用的详细结果。

A.场景和部署描述

该系统部署在新加坡的购物中心。该地区有重要的白天活动,但夜晚更加活跃,人群聚集在酒吧和俱乐部。由于安全规定和复杂的楼层布局,对集聚点的理解在开发和应急规划中起着重要的作用。该位置还有一个预先存在的闭路电视安装,方便我们以比正常速度更快地建立地面状况模型。由于安装的试用性质,传感器只安装在其中一层。图2提供传感器位置的概述。精确的平面图和传感器位置尚未公开。共部署了23个传感器。前面的16个是红外接近传感器(3522 0 - 来自Phidg??et [13]的Sharp Distance Sensor],设置在精心选择的地方,覆盖溢流区域和常规区域,如第III-A节所述。此外还包括以下额外的传感器:

三个运动传感器(1111 - Phidget [13]的运动传感器):用于检测运动,以较大(直径约5m)的覆盖区域对运动源的精度进行

声压传感器(1133 0 - 来自Phidget [13]的声音传感器):集中安装,这是一个带有低通滤波器的麦克风,用于测量整个音量,无需实际录制任何音频

二氧化碳传感器(Yocto-CO 2来自Yoctopuce [15]):集中安装,但要远离空调和空气管道,以期望室内空气中的二氧化碳水平随着更多人的呼吸而爬升

温度和湿度传感器(1125 0 - Phidget [13]的湿度/温度传感器):集中安装,预期身体热量和呼吸将产生可检测的变化

传感器型号和品牌的选择由叶片发动机解决方案[14]提供。 采购,模型学习和估计的部署完全按照第III-B部分所述进行。

数据收集和数据集

通过收集器系统收集数据,每当它们的值偏离预设的变化阈值时,它从传感器接收事件。 在距离和运动传感器的情况下,它们的输出是二进制的,所以任何改变将被报告。 其余的传感器配置在合理的阈值:声压5dB,CO 2 30ppm,湿度传感器温度为1°C / 1.8°F,湿度传感器为5%RH。

基于触发事件,通过假设传感器测量的值是最后观测值,产生整个特征集。 因为传感器发生变化,所以这个假设在预设的变化阈值内成立。 这种基于事件的机制有较高的频宽效益,因为只有变化的信息才被传输,但是由此产生的数据集可能会有较大的偏差。 例如,在一个安静的时期,传感器不会经常发生,数据集将包含少量与该标签相关的样品。 另一方面,在拥挤的情况下,传感器将变化更多(例如噪声水平不会持续大声),因此我们将发现人群标签样本的过度表示。

为了重新平衡数据集,我们通过每5s生成一个样本来重新创建它。 这相当于每天17280个样品。 我们还假设每5秒可以被认为是独立于之前的5秒,以便将监督分类应用于数据集。 数据集中的特征是通过针对每个传感器,基于前10个(即运行窗口),平均值,标准差,方差,最小值和最大值来计算。 此外,我们计算温度,湿度,噪声和CO 2的斜率。 总共来说,数据集包含121个特征,每个样本来自23个传感器。 每个这些特征中的信息量在很大程度上取决于传感器类型。 例如,声压(音频)的差异似乎传达了比其平均数更多的人群信息,而在其他较慢变化的传感器(例如CO 2)中,传达信息的平均值就是传播。

全文共6933字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[144614],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。