基于现有时空数据模型的停止与移动语义轨迹聚类外文翻译资料

 2022-08-09 20:16:55

英语原文共 9 页,剩余内容已隐藏,支付完成后下载完整资料


基于现有时空数据模型的停止与移动语义轨迹聚类

摘要:由于时空数据集的显着增长,因此使用轨迹挖掘,特别是轨迹聚类来管理,理解和分析运动对象的现有时空数据。时空数据模型具有处理历史查询,发现相似模式或具有特定特征/特性的模式,发现轨迹内有趣的位置以及发现常见轨迹和子轨迹的能力。在论文中,我们将停止和移动语义轨迹聚类方法组合到现有的时空数据模型中。我们将使用这种聚类方法,因为它是将单个轨迹内的个体聚类,不仅根据轨迹的几何特性(例如速度和方向),而且通过查看停靠点来显示轨迹的语义。这有助于理解轨迹的语义和运动对象的行为。最后本文使用两个真实的轨迹数据集证明了该方法的有效性。

关键词:移动物体;轨迹挖掘;轨迹聚类;轨迹语义;停止与移动聚类

1 引言

在移动电话和车辆中,定位设备和应用程序的使用催生了许多地理空间应用程序。因此,移动对象数据库(MOD)将极大地影响地理空间信息系统(GIS),因为它们使用户能够对轨迹和连续运动进行建模。为了进行时空分析,需要管理和分析大量的移动物体以及它们的轨迹和有关其移动的其他信息。这些数据库通常称为时空数据库,用于处理随时间连续变化的移动对象的几何形状。

地理参照和时空数据集快速增长的现象是由于现在无处不在的日常事务,这些事务提供时空数据,例如转换网络的流量管理。随着时空数据中大量轨迹的可用性,知识发现通常是最关键的步骤,因为这些轨迹具有自己的语义和详细信息。轨迹中的每个点也有自己的特点。较新的应用集中于轨迹挖掘,即从这些时空数据集中发现的知识,这些数据可识别出有价值的信息,例如相似的模式或具有特定属性的模式。

由于轨迹是样本点的集合,每个位置都有自己的语义属性,因此很难从用户的角度分析和理解这些轨迹。因此,有一些与轨迹数据分析和轨迹挖掘有关的工作。通常,轨迹挖掘,尤其是轨迹聚类在许多方面很有用:在处理历史查询,发现相似模式或具有特定特征/特性的模式,发现轨迹内有特点的位置以及发现常见轨迹和子轨迹。

在轨迹挖掘中,需要解决一些重要的问题:

(1)可以从轨迹数据集中推断出哪些模式?

(2)能够提取这些模式的最合适的轨迹挖掘形式是什么?

轨迹聚类是最重要的轨迹挖掘算法之一,它可以根据相似性度量,有特点的位置和单个轨迹内的位置,运动对象行为或轨迹语义,发现相似轨迹的组。根据所使用的聚类方法和在所述聚类方法中使用的数据类型,将确定从轨迹数据集推断出的信息和模式的类型。

最近,聚类算法被用作活跃的研究领域,特别是在轨迹数据模型中。某些群集方法问题涉及特定环境和特定域中的相似性[1]。其中一些作品使用户能够调整相似性阈值,而其他一些作品则涉及发现子轨迹[2]

轨迹聚类的另一种新类型与在单个轨迹内停止和移动以发现轨迹中有特点位置的聚类有关。CB-SMot方法[3]是一种利用移动物体的速度进行轨迹聚类的方法,而移动物体的速度又明显取决于轨迹的停止和移动。轨迹聚类的另一项类型是DB-SMoT [4],它是一种轨迹聚类方法,它考虑了运动对象的方向。[5]中的工作将两种方法(CB-SMoT和DB-SMoT)与知识库结合在一起,以了解轨迹的语义和停止点内移动物体的行为。在以下时空模型中概述了这种聚类方法。

    1. 时空数据模型

本节介绍了[6]中提出的时空数据模型,通过该模型我们可以增强停止和移动语义轨迹挖掘方法。

开发此时空模型的目标是扩展一个时空数据模型,以用于约束运输网络,其中模型中的所有静态和运动对象均基于开放地理空间联盟(OGC)标准。受运输网络限制的移动对象有很多应用,尤其是在地理空间信息系统(GIS)中。此时空数据模型的构造网络符合地理数据文件(GDF)标准。此外,在这项工作中,他们扩展了查询语言,以便管理,检索,查询,操纵和分析该时空数据。在此模型中,他们关注的是几何形状,形状和范围,它们在移动期间不会改变。此外,它们专注于基于OGC的ORDBMS中移动对象的历史记录。基于OGC构建此模型的好处是能够分析时空数据。

此模型中的网络被构造为轨迹和轨迹间交汇点的一部分。该部分是网络中的主要基本元素,其中存储了网络图结构。轨迹可以是单向的或双向的,这使得在某些情况下有必要指示轨迹的两侧位置。最后,它的交汇点是两条或更多条轨迹的交点。

网络上的数据类型可以表示静态(GPOINT和GLINE)或移动对象(MGPOINT)。GPOINT与网络中的位置(例如加油站)有关,而GLINE与网络中的区域(例如网络中具有特定速度限制的区域)有关。此外,GPOINT和GLINE上还有一些基本操作,用于创建和更新网络结构图。其他操作用于使用户能够获取有关网络的一些信息,如图1所示。这些操作分为两组。

1)一组关于轨迹的访问信息操作:

●LENGTH操作:用于获取特定轨迹的长度。

●CURVE操作:用于获取特定轨迹的LRS几何形状。

● DUAL操作:用于获取轨迹类型。

  1. 一组检查网络和数据类型之间的拓扑关系的操作:

●ON_ROUTE:GPOINT可以属于轨迹的位置。

●INTERSECTS:GLINE值可以与轨迹相交。

●CONTAINS:一个GLINE值可以包含一条轨迹。

●IS_CONTAINED:轨迹中可以包含GLINE值。

数据类型MGPOINT与网络中的移动对象有关。如图2所示,在移动对象上还有一组操作。它们使用户能够获取有关网络和移动对象的信息:

● IN_SPACE和IN_NETWORK操作:它们用于在网络值和空间值之间进行转换。

● INST和VAL操作:它们用于基于Intime值获取两个组件。

● DEFTIME操作:用于获取用对象定义的所有时间间隔。

●TRAJECTORY操作:用于构建移动对象的网络路径。

●AT_INSTANT操作:用于获取特定时间中移动对象的位置。

●AT_PERIODS:它用于返回移动对象在特定时间段内行进的网络区域。

●AT运算:当第二个参数中包含函数的值时,用于将函数限制为特定的时间。

●DIRECTION操作:用于获取特定时间的运动方向。

●INSIDE操作:用于检查移动对象在特定时间是否存在于网络的特定区域中。

●SIZE运算:用于计算特定轨迹的长度。

●DURATION操作:用于计算移动物体运动期间的花费时间。

●CURRENT and NOW:它们用于获取与网络上特定移动物体有关的最后位置和最后存储的时间。

由于篇幅所限,网络模型,数据类型和操作的详细信息在[6]中进行了详细说明。

对静态和移动对象的这些操作将使用户能够构建复杂的算法,包括但不限于最短路径算法以及停止和移动语义轨迹聚类算法。

该时空数据模型的拟议工作包括附加的轨迹挖掘技术。我们添加了停止和移动语义轨迹聚类以增强模型,从而允许根据轨迹的几何特性对其进行分析。某些示例可以是速度和方向,并且根据包括一组规则的知识库来理解运动的轨迹和运动对象的行为。将这种方法添加到时空数据模型后,它将具有在网络中查找有趣的位置的能力,并具有分析一组运动对象的行为的能力,以及发现相似或特定模式的能力。该方法的主要缺点是,一站式可能满足知识库中的多个规则,从而导致模棱两可,否则称为“噪声”。

总的来说,我们的贡献如下:

●我们增加了一种聚类技术来跟踪时空数据模型的未来工作,以增强其分析时空数据的能力。

●不仅通过使用轨迹的几何特性,而且使用代表轨迹的语义信息的知识库,在此时空模型上对轨迹进行聚类。

●我们根据对轨迹语义和运动对象行为的分析,在构建知识库的过程中使用了该模型。

本文的结构如下。第2节介绍了我们研究的相关工作。在第3节中讨论了将停止和移动语义轨迹聚类方法组合到时空数据模型的细节。第4节介绍了实验结果,最后,在第5节中总结了结论和潜在的未来应用。

2 相关工作

本节从建模,查询,数据生成器等方面介绍了有关移动对象的一些相关工作,以及该领域中的其他相关研究。

2.1 建模与查询

在移动物体数据库领域有两个重要的研究领域:位置管理和时空数据库[7]。位置管理与预测查询以及与移动对象的当前位置有关的查询有关。该领域最重要的著作是关于运动对象的时空(MOST)模型[8]和未来时态逻辑(FTL)语言[9]。时空数据库与运动对象的轨迹和历史查询有关,如[10] [11]中所述,其中运动对象的完整演化表示为数据库的属性。这项工作中将使用的时空数据模型与第二个研究领域有关,该领域与基于OGC的ORDBMS中运动对象的历史有关。

欧洲标准地理数据文件(GDF)[12]是描述道路网络和道路数据的空间网络模型的最重要和主要标准之一。在此标准中,道路网络由一组道路组成,其中道路由道路元素组成,每条道路的两端都有一个端点。交汇点可以位于两条或更多条道路中心线的交叉点。根据该标准,道路网络模型由三层结构构成:

级别0:这是拓扑级别,其中网络中的所有内容都表示为节点和边。

级别1:在特征级别中,已描述了与网络相关的所有简单特征(如道路元素和路口和它们的属性,单向,道路宽度和车道数量)。

级别2:在复杂功能级别,它将“简单功能”聚合在一起以构建更高级别的功能。

有一些与此相关的重要著作。这些工作之一是(DEDALE)[13],这是一个空间数据库系统,它依赖于基于约束的模型来表示和操纵几何和时空数据。在这项工作中,对象的移动受到嵌入式网络的限制。另一项工作[14]是关于对道路内的运动对象进行建模和查询的。在这项工作中,通常使用图模型来对由关系和边组成的网络进行建模。

此外,关于特殊网络中的数据建模问题,有一些研究[15] [16] [17]。Jensen和他的同事的工作是关于真实的道路网络及其复杂性的,其中使用简单的有向图不足以对那些复杂的网络进行建模。

文献[10]中提出的网络中移动物体的数据模型及其查询语言具有一些有趣而重要的特征。首先,根据网络描述运动对象的位置,这意味着此数据模型使用线性参考系统(LRS)表示位置,而不是使用带有(x,y)的嵌入空间点。使用LRS有两个优点,即网络中任何点的几何形状仅存储一次。此外,通过在运动描述中检查路线id的id的存在来完成查找运动物体与网络任何部分之间的连接要容易得多。其次,用户具有使用DBMS的标准工具扩展某些网络信息和控制网络的能力,例如控制一部分网络中的速度限制和路由类型。此外,用户可以定义一些操作,例如最短路径。而且,它们具有描述网络上的静态或移动对象(例如加油站和车辆)的能力。将在本文中使用的[6]中的时空数据模型利用了该论文[10]的优点,并根据不同DBMS模型之间的共同点和标准进行了一些更改,而在[10]是用第二数据库管理系统实现的。

HERMES系统是在[18] [19]中提出的。为了支持Oracle数据管理,在[20]中提出了时空对象盒(STOC)作为Oracle扩展。

2.2 数据产生器

通常,数据生成器用于生成运输网络内的移动物体的数据集。在[21] [22] [23]中提出了一些已知的运动物体数据生成器,例如GSTD,OPORTO和SUMO,而在[24]中提出了最流行和最重要的数据生成器。它提供有关限制在特定运输网络内的移动物体的数据。这项工作有一些优点。首先,它是一个开源数据生成器,具有网络内移动对象的GUI。其次,网络边缘的负载控制着车辆的速度和路线。

在[25]中提出的工作使用第二数据库管理系统来生成数据模型,而不是开发一个新的数据库模型。这项工作的问题在于,它与在2D平面内自由移动且不受运输网络约束的移动对象有关。现在,他们正在使用SECOND数据模型来支持运输网络内的运输。

2.3其他研究领域

本节介绍了有关MOD的一些研究领域。

  1. 运动物体轨迹不确定度

有许多因素会影响并产生运动对象轨迹的不确定性,例如定位应用程序和设备的位置不精确。在这方面有一些研究,例如[26] [27] [28]中提出的关于运动对象的不确定性建模,管理和查询的工作。

  1. 空间轨迹索引

为了检索轨迹数据,这种移动对象包含大量有效轨迹的在MOD中行进历史依赖于适当的索引方法,例如轨迹索引的使用。在这个研究领域,有一些关于开发和实现索引结构的研究工作,例如[29] [30] [31] [32]中提出的工作。

  1. 轨迹挖掘与移动物体本体(MOO)

MODs中的轨迹挖掘是一个有趣的研究领域。轨迹具有某些几何特性,因此具有自己的语义。从用户的角度来看,很难从轨迹中分析和发现信息。因此,需要开发数据模型和工具以便从轨迹数据中发现有意义的和相似的模式。在这方面已经开发了一些应用程序,例如[33]中的工作。在[34]中提出的工作是一种轨迹数据挖掘的查询语言。此外,[35] [36] [37]中还提出了其他一些关于发现相似轨迹和轨迹采样点挖掘的工作。此外,关于轨迹相似性的研究也很多,例如[38] [39] [40]。

lt;

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[238664],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。