英语原文共 9 页,剩余内容已隐藏,支付完成后下载完整资料
毕业论文(设计)
英文翻译
原文标题A comparison of public datasets for acceleration-based fall detection
译文标题 基于加速度的跌倒检测的公共数据集的比较
基于加速度的跌倒检测的公共数据集的比较
Raul Igual, Carlos Medrano, Inmaculada Plaza
萨拉戈萨大学特鲁埃尔学院,西班牙,特鲁埃尔
摘要:摔倒是导致老年人死亡的主要因素之一,也是其主要不良健康后果的关键因素,在这方面,有几个作者进行了基于加速度的跌倒检测使用外部加速度计或智能手机的研究。他们所公布的检测率是不同的,有些会接近一个完美的检测器。这种差异可以解释为:在一个公平的研究中,很难比较使用它自己的数据集在不同条件下的不同的跌倒检测的每次研究。在这方面,最近已经取得了一些数据集。本文提出了一种比较,以我们最好的知识,第一次公开的摔倒检测数据集,以确定它们是否对他们所声称的研究有影响。研究表明,使用2个不同的检测算法,摔倒检测技术的性能受到或大或小影响,可以通过特定的数据集来验证他们。我们还发现,根据所使用的数据集的摔倒检测器的泛化能力的差异很大。事实上,一个算法在数据集被测试而不同于一个用于训练的数据集的时候,性能会急剧下降。其他的数据集特征比如训练样本的数目在性能方面也会受影响,然而算法似乎在采样频率或加速度范围方面并不是太灵敏。
关键词:摔倒检测,加速度计,公共数据集,对比,数据分析
1引言
跌倒事件是老年人主要的公共健康问题。摔倒和随后的长期卧床会导致严重的不良健康后果。疾病控制和预防中心统计:跌倒老年人每年在美国的直接医疗费用,超过300亿美元,每17个老年人中就有一个人在急救中心因为摔倒而接收治疗。这种情况下,需要有一个强大的跌倒探测器检测到摔倒时触发警报。
有几种摔倒检测的技术已经被研究过。Igual等人把现有的摔倒检测划分成2类:上下感知系统和基于加速度的可穿戴式设备。一种加速度研究的特征是给出高的检测等级。举个例子,Kangas等人给出灵敏度和特征分别是94.6%和100%,Bourke等人的测算是94.6%和100%,98.6%和99.6%尤沃诺·苏达尔等人的结果,阿巴特等人给出的是100%和100%。其他的跌倒检测研究给出类似的结论 。应该注意的是,所有这些研究提供的检出率是非常高的。然而,在这一领域的许多学者已经注意到对比不同的加速度研究是非常困难的。这是由于这样的事实,每个研究使用自己的数据集组去模拟摔倒和ADL。因此,是否说结果是由特定的数据集使用的影响还不清楚,这是不可能进行一个公平的比较,因为在每个研究中所给出的检测结果的尺度是不一样的。
对此,一些作者已经确定具有公共数据集的需要。在这几个方向,自从近几年来几种数据集可以被公众获得已经取得了一些成果:在2011出版DLR,在2013年可以获得mobifall 和2014年公布tfall (对fudickar等人的研究,引用了另一个公共数据集,但似乎它目前无法下载)。虽然这三个数据集可以自由访问,但没有研究集中在比较它们。因此,一些重要的问题仍然没有答案:人们可以对这些公开的数据集直接使用吗?他们之间有什么区别吗?是不是摔倒检测算法的性能受具体选择数据集的影响?
表1 公众摔倒检测数据集的特征
DLR |
MobiFall |
tFall |
||
实验 |
被测人数 |
16 |
11 |
10 |
设备 |
Xsens MTx |
Samsung Galaxy S3 |
Samsung Galaxy Mini |
|
穿戴部位 |
腰带 |
裤兜 |
裤兜 |
|
摔倒类别 |
Not specified |
Forward-lying, front-knees-lying, |
Forward, forward straight, backward, |
|
sideward-lying and back-sitting-lying |
lateral left and right, sitting on empty |
|||
air, syncope and forward fall with |
||||
obstacle |
||||
日常生活类别 |
坐、站、慢走 |
站、慢走、慢跑、跳 |
真实生活行为 |
|
跑、跳、躺 |
上楼、下楼 坐在椅子上 |
|||
坐进车里或从车里出来 |
||||
样本 |
No. ADL |
1077 |
831 |
7816 |
No. falls |
53 |
132 |
503 |
|
采样频率 |
100 Hz |
100 Hz |
50 Hz |
|
加速度范围 |
7 g |
2 g |
2 g |
|
图1 研究的总体方案
在这方面,本文的总体目标是以公平的方式比较现有的公共数据集(图1)。为了这个目的,就要完成下面的具体目标:
- 要测试是否给定算法的性能取决于选定的数据集;
- 比较公共数据集的泛化能力。泛化能力是指在不同条件下训练系统在不同条件下工作的能力;
- 要确定是否有一些数据集的参数影响了摔倒检测算法的性能。
2 材料和方法
2.1 数据集集合
通过广泛的文献搜索,我们确定了三个公共数据集呈现摔倒和日常活动加速度样本:DLR、mobifall 和tfall。这三个数据集不同的研究机构采集到的,都在一个特定的方式下进行的实验。因为我们最好的学识,这些数据集是科学界向公众提供的最好的。
2.1.1 DLR数据集
该数据集是由通信和德国航空航天中心导航所公开的(DLR)。数据集是从16名年龄在23岁到50岁之间的男性和女性上采集到并由一位观察者亲自写出的。总的来说,它包含了约4.5小时的摔倒和活动标记(表1)。参与者进行不同数量的日常活动和摔倒。为了捕捉运动数据,每个被测人员的腰带上会放一个Xsens公司MTX惯性测量单元。数据采样频率为100Hz,测量单元的加速度范围为至少7g。
2.1.2 mobifall数据集
该数据集是由克里特教育技术学院的生物医学信息与健康实验室采集的。mobifall数据集包含来自11个志愿者的数据:六的男性和五的女性(年龄范围:22–36)。九名参与者进行摔倒和日常生活活动,两名只进行摔倒测试。这两个人,每个参与者进行了四种类型的摔倒,每组重复三次。其他九个人进行九种类型的日常行为模拟(表1)。具体来说,三星Galaxy S3装置的lsm330dlc惯性模块(3D加速度计和陀螺仪)被用来捕捉运动数据。该装置自由的布置在随机方向的裤兜里。加速度计的范围为2g,数据采样频率为100Hz。
2.1.3 tfall数据集
该数据集是由eduqtech(教育、质量和技术)热拉哥萨大学研究组完成的。十人参与的数据收集过程(七名男性和三名女性,其年龄从20岁至42岁不等。仿真组模仿八种不同类型的摔倒(如表1)。每组的每次摔倒重复三次。日常生活的收集过程进行在现实生活中的情况下。ADL在受试者的真实世界环境记录当他们进行他们的日常生活。每个研究对象的监测时间至少持续一个星期。只有在给定的阈值(1.5g)内的ADL才会被记录。在实验的最后,每组约800条记录平均约(6秒)是被采集的。数据的采集是使用三星银河迷你手机,50Hz的采样频率,范围是2g。在摔倒的研究过程中,被测者在他们的裤兜里放了一个手机。
2.2 用于比较数据集的摔倒检测算法
很显然,比较可以依赖于算法。因此,我们选择了2种算法分别代表不同的方法来检测。
第一个是著名的支持向量机(支持向量机)分类。通过内核的方法,它将输入到另一个空间中的最优超平面是分离的两部分,摔倒和日常活动。训练后,一个新的输入的分类仅依赖于一小部分的训练输入称为支持向量。因此,支持向量机建立一个稀疏模型。我们选择基于径向基函数(RBF)流行的内核。输入时间窗口的加速度的形状,在中间的峰值,并在一个给定的频率采样。然后,给出两个加速度样本a(t)和b(t),距离d(A,B)之间得到:
(1)
两次输入的内核RBF:
(2)
经过周期采样,d2近似为:
(3)
另一方面,我们也可以采纳一个新颖的检测器,根据最近邻(NN)规则。在这种情况下,系统模式只有正常活动,日常生活活动能力。跌倒是被偏离正常时可以被检测到。NN是一种纯数据驱动的方法。给定一组样本an,训练集,给一个新的加速度a,到最近的邻居距离: (4)
如果DNN高于阈值theta;,新的输入被认为摔倒,因为它和样本设定的行为有明显不同。通过theta;的变化,被测者的表现特征(ROC)曲线是可以获得的。在这条曲线中,我们选择的点处于平均的敏感性和特异性的最大化位置,那些已经被选为最图案(见2.5节)。我们对支持向量机进行了同样的操作,但这一次用不同的超平面的距离来绘制ROC。
支持向量机的训练在图书馆ScikitLearn上表现的。对于NN,我们在Python上实现了自己的代码。
2.3预处理数据集
该数据集进行预处理,用同一格式的数据给跌倒检测算法:6s的时间窗,标记为ADL或摔倒,在加速度峰值的中央。峰值总是高于1.5g。这种适合的算法格式在2.2节中解释过了,实际上,只有1s宽中央部分被使用。
数据集的加速度级数已经被统计过了。然后,我们提取了中间具有最大的加速度幅值的6s的时间窗。对于DLR,包括有几个活动的长时
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[28935],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。