英语原文共 13 页,剩余内容已隐藏,支付完成后下载完整资料
GLOVE隐藏移动交通指纹
摘 要
在发布包含关于个人的细粒度信息的数据集时,保护用户隐私至关重要。 在蜂窝运营商收集的移动通信数据集的情况下,这个问题尤其重要,因为它们具有高的用户轨迹唯一性,并且通过时空泛化来抵制匿名化。 在这个工作中,我们首先通过利用用户手机指纹匿名性的原始度量来揭示移动通信数据集的不良特征背后的原因。 基于这些发现,我们建议GLOVE,一种算法,通过专门的泛化来赋予轨迹的k个匿名性。我们通过两个全国移动流量数据集来评估该算法,并证明在保护数据大致准确性的情况下实现K匿名。
CCS 概念
安全隐私→伪匿名,匿名性和可追溯性;
数据匿名化和排查;
网络→网络隐私和匿名;
关键词 移动数据流量;k匿名
这项工作得到法国国家重新搜索机构的授权ANR-13-INFR-0005 ABCD的支持并通过欧盟FP7 ERA-NET计划授予CHIST-ERA-2012 MACACO。 这是由我们提供的移动通信数据SONATEL和Orange在D4D挑战赛中。这项工作是Marco Gramaglia在CNR-IEIIT时进行的。
允许个人制作全部或部分此作品的数字或复印件或者课堂使用而不需要费用,只要没有制作副本或分配利润或商业利益,并且副本第一页有声明和完整的应用。属于ACM以外的本作品的版权应当被尊重。允许提供信用证。 要复制或重新发布,在服务器上发布或重新分发
列表,需要事先具体的许可和费用。从permissions@acm.org请求权限,
ABSTRACT
Preservation of user privacy is paramount in the publication of datasets that contain fine-grained information about individuals. The problem is especially critical in the case of mobile traffic datasets collected by cellular operators, as they feature high subscriber trajectory uniqueness and they are resistant to anonymization through spatiotemporal generalization. In this work, we first unveil the reasons behind such undesirable features of mobile traffic datasets, by leveraging an original measure of the anonymizability of usersrsquo; mobile fingerprints. Building on such findings, we propose GLOVE, an algorithm that grants k-anonymity of trajectories through specialized generalization. We evaluate our methodology on two nationwide mobile traffic datasets, and show that it achieves k-anonymity while preserving a substantial level of accuracy in the data.
CCS Concepts
Security and privacy → Pseudonymity, anonymity and untraceability;
Data anonymization and sanitization;
Networks → Network privacy and anonymity;
Keywords
Mobile traffic data; k-anonymity.
This work was supported by the French National Research Agency under grant ANR-13-INFR-0005 ABCD and by the EU FP7 ERA-NET program under grant CHIST-ERA-2012 MACACO. It was performed using mobile communication data made available by SONATEL and Orange within the D4D Challenge.This work was carried out while Marco Gramaglia was at CNR-IEIIT.
Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. Copyrights for components of this work owned by others than ACM must be honored. Abstracting with credit is permitted. To copy otherwise, or republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee. Request permissions from permissions@acm.org.
1、介绍 5
1.1 高独特性 5
1.2 低匿名性 6
2、问题和定位 7
2.1 定义 7
2.2目的 8
2.3 攻击模式 8
2.4隐私模型 9
3、移动流量数据 11
4、测量无差异性 12
4.1样本压缩度 12
4.2移动指纹的k-gap 15
5、无差异性分析 16
5.1 良好的匿名效果 16
5.2 缺点 :无法泛化 17
5.3 为什么 :长尾时间多样性 18
5.4 小贴士 19
6、GLOVE 20
6.1 算法简述 20
6.2指纹合并 20
6.3复杂性分析 22
7、性能评估 23
7,1结合GLOVE与抑制 24
7.2比较分析 25
7.3一般性分析 26
8、相关工作 28
9、总结 29
10、参考文献 30
1、介绍
公开披露包含微观数据的数据集,即通过调查收集的个人信息,交易记录,定位和服务日志,是一个日益频繁的做法。的确,这些数据集产生有关大量人口的细粒度数据被证明是研究学科的核心研究重点。在公开访问中保持用户隐私可微数据是一项关键任务,低级的匿名化术(例如,用户标识符的散列)通常不能提供充分的保护。这已经反复被重新识别攻击证明,例如医疗记录【1】或网络服务数据库【2】其中公开了用户的健康状况或政治观点。我们的工作重点是由蜂窝网络探测器收集的移动流量提取移动微数据。这些数据描述了数千到数百万用户超过数周至数月的流动。它们已经成为社会学,人口学,流行病学,和计算机科学的重要组成,最近的调查可参考文献【3】【4】:如其他类型的微数据一样,移动通信数据集容易对个人隐私的攻击。具体来说,它们特点高度独特性以及低匿名性
1.1 高独特性
移动用户有很多独特的模式,往往使它们即使在非常大的人口中也独一无二。实验表明2500万强数据集中50%的移动用户可以通过他们极少的运动模式知识被唯一地检测到,。即通过他们最常访问的三个位置[来唯一地检测。同样,一个人可以在150万其他的人中找到移动客户的概率几乎相等通过只知道他的移动交通数据中的五个随机时空点[6]。我们认为,唯一性并不意味着重新识别,因为对特定用户的唯一知识轨迹不能透露他的身份:因此,在这里工作我们不会重新识别我们分析的移动流量数据集中存在的任何用户。 但是,该链接可能通过跨数据库链接成为可能:
在最近的一次尝试中,Flickr和Twitter的地理参考登记利用用户进行脱离匿名攻击在移动流量数据集上[7]。 几百个可以被确定为90%的置信水平,作者认为完全重新识别有限的附加信息将具有有可能因此,唯一性是可以用于去匿名的漏洞。 标准对策依赖于非技术方案,即不公开约束了对数据集进行的活动范围的协议,并且在没有有关当局的事先核实的情况下防止数据分析结果的公布。 这就是我们研究中使用的移动交通数据的情况所采用的解决方案。
这种做法极大地限制了移动通信数据集的可用性,以及相关研究的可重复性。 减轻用户轨迹的唯一性成为一个非常理想的方案,这可能需要更多的隐私保护数据集,并有利于其公开流通。 在这里,移动通信数据集的第二个问题就出现了。
1.2 低匿名性
减少微数据数据集唯一性的传统解决方案是泛化:数据精度降低到没有个体唯一可区分的程度。 然而,以前的研究表明,通过减少其移动的时空粒度,使人群中的用户模糊,在移动流量数据集的情况下几乎不是一个解决方案。 只有在非常粗略的泛化下才能实现可靠的匿名化,例如通过以城市级精度公开用户的位置【5】。 此外,在移动通信的唯一性和时空泛化之间存在幂律关系:额外的隐私在数据解析方面的成本越来越高【6】。
总之,不仅移动通信数据集产生了非常独特的轨迹,而且后者也难以匿名化。 确保这些数据集中的个人隐私容易实现安全性。 我们的工作解决了这个精确的问题,贡献了两倍。
首先,我们对上述移动交通数据集不便之处的原因进行了深入调查。 为此,我们定义了订户在与蜂窝网络交互时留下的移动指纹的匿名级别的原始度量。 当适用于两个全国移动流量数据集时,我们的测量提供了对这种类型的移动微数据的高度唯一性和不可忽略性差的原因的新颖见解,这在【5】 【6】中不是个体化的。
第二,我们提出了一种基于上述见解的移动交通数据集的新型匿名算法。 该算法适合命名为GLOVE,通过所谓的专门化生成隐藏移动指纹。 GLOVE在我们的参考数据集中实现了所有用户的不可区分,同时保留了数据的实质准确性。 与之前尝试匿名移动流量的尝试相比,可以大大改善,在不影响数据效用的情况下,之前的方法无法达到类似的隐私级别。
<t
全文共26401字,剩余内容已隐藏,支付完成后下载完整资料</t
资料编号:[142629],资料为PDF文档或Word文档,PDF文档可免费转换为Word
id |
手机指纹 |
|||||||
a |
C1,8 |
C2,14 |
C3,17 |
|||||
b |
C4,8 |
C5,15 |
C6,15 |
... |
C12,15 |
C13,15 |
C14,16 |
C15,17 |
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。