基于抽象服务的应用对象工作流管理系统外文翻译资料

 2022-07-26 16:08:30

英语原文共 9 页,剩余内容已隐藏,支付完成后下载完整资料


基于抽象服务的应用对象工作流管理系统

摘要

由于网格上执行的众多大型科学应用程序被表达为复杂的科学工作流程,工作流管理已经成为过去几年网格环境中最重要的服务之一。然而,大多数管理系统并没有完全隐藏底层编排语言的复杂性。同时,当每个科学家都涉及不同的要求将网格环境提交给异构执行环境时,网格环境是动态的。因此,为了解决复杂性,异质性和动态性问题,本文开发了基于抽象服务的应用对象工作流管理系统。抽象服务是具有类似功能的组Web服务的抽象组合服务。我们提出了服务中心,其中包含大量抽象服务,以形成虚拟统一视图,以屏蔽各种Web服务之间的多样性。我们还开发了一个视觉工作流设计器,它允许科学家通过将抽象服务的图形表示拖放到(或从画布)中来编排抽象工作流程。特别是,提出了需求描述文档(RDD)来描述XML语法中个别计算任务的特殊需求。我们实施了一个工作流程应用程序管理系统(WFAMS),它将抽象工作流程以明确的顺序转换为具体的工作流程,并对工作流进行管理,控制和分解,然后结合科学家的关系数据,并将工作流程提交到网格平台中的作业池。最后,考虑了工作流管理系统关键问题的解决方案,包括抽象工作流的定义,支持故障处理的机制,工作流模板以及隔离控制流和数据流的机制。

发布于:网格与合作计算,2009年。第八届国际会议

会议日期:2009年8月27日至29日

加入IEEE Xplore的日期:2009年10月06日

ISBN信息:

INSPEC登录号:10906294

DOI:10.1109 / GCC.2009.32

出版社:IEEE

会议地点:中国甘肃兰州市

第一章 引言

目前,作为网络计算技术之一的网格计算[1]在过去几年中引起了广泛关注。网格计算可以为异构资源构建虚拟组织(VO)[2],提供统一的应用接口和集成地理资源。随着网格技术的出现,许多在网格上执行的大规模科学应用表现为复杂的科学工作流程[3]。科学工作流也被称为网格工作流,可以定义为网格应用程序服务的聚合,它们以明确的顺序执行在分布式异构资源上,以满足科学家的具体要求。

1.1 动机和问题陈述

工作流管理系统(WfMS)[4]通常用于在Grid资源上定义,管理和执行工作流应用程序。然而,网格环境(包括网络,资源和应用)的规模复杂性,异构性和动态性日益增加,使得这些工作流管理系统变得虚弱无法。所以有一些新的挑战要解决:

网格环境是动态网格环境涉及异构环境中的多种不同类型的执行系统的交互,例如硬件,机器负载和网络的链路状态。

更重要的是,大多数项目提供的服务组合工作流程都绑定到特定的具体服务或具体环境[10]。

Web服务Web服务技术的多样性是试图定义构建松散耦合的分布式应用程序的构建块。目前,这些Web服务部署在不同的Grid环境中,例如Globus [5],GLite [6],Unicore [7],CGSP [8],GOS [9],甚至是个别主机中的其他Web服务容器。然而,具有类似功能的这些Web服务可能呈现不同的地址格式,不同的服务类型,甚至不同的调用方法等。

科学任务松散耦合通常,科学研究包含了许多巨大的计算任务,可以分解为单个计算单元的小部分。大多数任务是并行的,序列或条件的逻辑结构。也就是说,这些任务是松散耦合的,或任务的输出是另一个任务的输入。当科学应用的复杂性增加时,科学研究成效不高,难以控制[12]。

工作流程语言的复杂性为了利用工作流技术来实现科学任务,科学家需要提交工作流程语言,该语言应该符合一些工作流描述语言的语法到工作流引擎。目前,存在许多不同的工作流程语言,包括:MoML(建模标记语言)[13],BPEL(业务流程执行语言)[14],Scufl(简单概念统一流语言)[15]和工作流描述语言通常非常复杂。所以科学家需要学习如何编程这些语言。

科学过程的重复性为了改进研究成果的共享,减少重复投入,将根据现有实验进行许多实验。现在有几个项目已经开发出科学的工作流环境。这些环境使工作流程语言变得抽象,并提供一些工具来支持科学家来编排工作流程。然而,当工作流程规模很大时,几乎所有的视觉表现都会使科学家们陷入困境。此外,这些环境通常不能提供良好的机制来支持频繁使用的重用工作流。

网格环境的不同要求科学家来自不同的研究领域,他们可能需要不同的个人工作提交模式和对Gird环境中个人计算工作的不同需求。

1.2 研究课题

根据工作流管理联盟发布的上述问题和工作流管理参考模型架构(图1)[17]。

图1工作流管理参考模型

在本文中,我们探讨了这些问题,并描述了几种简化工作流系统负担的方法。因此,我们基于分散的异构环境,合作方式和对科学家工作模式的特殊要求,设计并实施了应用对象工作流管理系统(AWFMS):

在这个系统中,我们在第3节定义抽象服务和第5.1节中的抽象工作流。

我们提出了服务中心,其中包括一系列抽象服务,重点研究这些具有相似功能的分布式Web服务之间的多样性保护。

我们还开发可视化工作流程设计器,通过将抽象服务元素拖放到(或从)画布上,科学家可以使用图形化表示形成抽象工作流。

我们还提出了工作流模板来加强科学过程的重现性,提出了隔离控制流和数据流的机制。

我们还提出RDD,它是以XML语法描述将计算作业提交给执行环境的要求。

我们还实施了工作流应用程序管理系统(WFAMS)。它将一个抽象工作流定义为具体的工作流程。

在我们的系统中,我们还提供身份认证失败的机制,确保在并发性的情况下可靠执行。

本文的组织结构如下:第2节总结相关研究工作和若干相关项目。在第3节我们介绍抽象服务。在第4节中,我们主要关注AWFMS。在第5节中,我们扩大了系统中关键问题的解决。在第6节中,我们得出结论并指出未来的工作。

第二章 相关工作

工作流管理系统的发展已经付出了很多努力。

Taverna [18]是电子科学项目myGrid的一个组成部分,它是一个支持生物信息学虚拟实验研究的开源工作流程工具。在Taverna,生物学家描述了这一过程,并以结构化,可重复,可验证的方式实施了实验。 Taverna的主要特点是基于数据流的工作流程。此外,它提供了一个工作流程语言Scufl(简单概念统一流程语言)和一个设计工作流的图形界面。

由卡迪夫大学开发的Triana [19]提供了一个开源的图形问题解决环境,支持信号,文本和图像处理,以及重力波的检测和其他科学问题。 Triana环境设计用于一系列即插即用组件,可以轻松集成到其他系统中,并包含大量预先分析工具和定制工具。科学家可以从工具箱中拖放组件,然后将它们放在工作区中以组合复合应用程序。这些组件之间的连接通过线路呈现。

Askalon [20]是由奥地利自然基金会(奥地利科学基金,FWF)资助的Aurora项目的一部分,该基金会是集群计算和网格计算的编程环境。在这个项目中,它提供了一种新的工作流程语言AGWL(抽象网格工作流程语言),这使得科学家们只关注Grid应用程序,而Grid Grid的基础并不熟悉。

与上述这些项目相比,在我们的工作中,我们专注于如何使科学家组成工作流程和控制工作流程执行更易于访问,而不是标准工作流程语言。我们的目标是通过将工作流程语言的复杂性隐藏起来,使工作流程语言的复杂性通过解耦Web服务编排来构建工作流程,从而使科学家更加灵活地与网格环境进行交互,从而为工作流设计师提供了强大的功能。

第三章 抽样服务

在网格环境中,具有类似功能的各种服务可能由不同的组织提供[10]。此外,这些服务可以在许多地方进行复制和部署。因此,无论服务地址格式,服务类型,调用方法或参数介绍的多样性,我们都努力支持各种Web服务。

抽象服务是具有类似功能的组Web服务的抽象组合服务,用于屏蔽服务地址,类型和其他位置信息的多样性。它提供一对多的方式来映射抽象服务和具体的Web服务之间的关系。抽象服务提供了几个元素lt;servicegt;,lt;descriptiongt;,lt;operationgt;和lt;parametergt;。 service元素表示一个抽象服务,包括定义服务名称和服务功能类型。我们不会在此详细介绍所有元素。后面的示例是抽象服务“mopac”,相应的可执行文件“mopac”有两个参数,输入和输出。

图2显示了抽象服务与具体服务之间的映射。它表明抽象服务存在于三个异构主机(202.201.14.250,202.201.14.240,202.201.1.125)中,具有不同的调用方法名称和不同的参数名称。

图2抽象服务与具体服务之间的映射

抽象服务支持参数化在此工作流管理系统中起着重要的作用。它使科学家能够通过改变参数值而轻松地对不同的参数进行实验,而不用担心细节服务描述。需要支持多个参数类型,如inputfile,outputfile,string,exec,int,boolean,float。

对于抽象服务,我们充分考虑了网格环境的动态,并将高性能Web服务应用于工作流管理的调度,使AWFMS系统更加灵活和兼容[21]。

第四章 应用对象的工作流管理系统

4.1 系统架构

在最高级别,Grid工作流管理系统的功能可以表征为构建时间功能和运行时功能。构建时功能涉及定义和建模工作流任务及其依赖关系,而运行时功能涉及管理工作流执行和与Grid资源的交互以处理工作流应用程序[4] [22]。

AWFMS通过图形环境设计,管理和控制工作流程,构成五个主要的织物部件。图3描述了整个系统架构,从下到上有Grid平台,Workflow应用程序管理系统,Workflow Designer和补充部分,包括Service Center和RDD。

图3 AWFMS的架构

4.2 服务中心

有必要提供网格平台中所有资源服务的信息,具有相当多样性,动态行为和巨大分布的特点。 在这个系统中,我们提出了一个服务中心,它是一个虚拟的XML文档,并且汇总了一系列抽象服务。 图4显示了基于性能和服务类别的服务信息。

它为科学家提供统一的服务信息视图。 服务类别将受到Grid环境的约束,并被Grid开发人员考虑。 科学家们可以通过刷新动作来获取执行环境中的服务状态。

图4服务中心的树查看器

4.3 工作流设计器

利用两个eclipse插件的优势:图形编辑框架(GEF)[23]和Eclipse建模框架(EMF)[24]。 设计师提供与视觉表示的有意义的交互,并通过许多可用性功能指导科学家。 它提供了一个GUI,便于科学家通过将抽象服务元素拖放到(或从)画布上来构成抽象工作流程。 它将编程环境与图形环境相结合,使科学家轻松组合工作流程; 图5显示了工作流设计器的概述。

图5工作流设计器概述

设计师由三部分组成:导航视图,服务视图和流程图。

导航器视图允许科学家在Eclipse中创建与工作流项目相同的操作。服务视图显示服务中心中汇总的各种抽象服务。科学家们可以通过刷新动作来获得网格环境中的服务状态。这些抽象服务在视图中显示可以被拖放,以构成抽象的工作流程。在第3节中已经详细讨论过。过程图是用于设计抽象工作流程的主要可视化编程环境。它是Designer中可视化的部分,其中工作流实际上组成,它是工作流设计器中最重要的功能之一。画布显示工作流程图。科学家可以简单地将服务视图中的抽象服务拖放到画布上,以便编排抽象工作流程。同时,我们提供另一个名为Source Editor的视图,以满足计算机专家的要求。它还可以实现这些GUI视图之间的实时映射。在工作流设计GUI视图设计工作流程之后,它会自动生成一个源代码,映射到图形工作流,反之亦然。

4.4 要求说明文件

网格环境涉及异构环境中多种不同类型的执行系统的交互。同时,对于每个科学家,它可以根据他/她在工作流程中的要求呈现个人工作管理模式。所以在本文中,我们提供了描述提交计算作业到执行环境的特殊要求的功能。为了统一不同领域的每个科学家的形式,我们还提供了一个XML格式的文档来解决科学家对计算工作的需求。图6显示了帮助科学家在我们的系统中生成RDD的用户界面。

图6用于生成RDD的用户界面

在RDD中,符合领域特定科学家功能要求和性能要求的要求。它包括静态优化和动态优化。如RDD所述,有三个方面:ResourceDescription,ServiceDescription和ControlDescription。ResourceDescription片段描述了计算任务(如CPU,内存,磁盘等)的资源(特别是执行环境)的需求信息。ServiceDescription片段表示计算任务的高级抽象服务的需求信息,包括响应时间,调用成功率等。ControIDescription片段解决执行环境中计算任务的控制信息,包括开始时间和故障处理程序。RDD的定义将在我们将来的工作中的规范文件中进行更详细的讨论。

4.5 工作流应用管理系统

一旦科学家定义了工作流程,就需要安排这些工作流程,以便在将其交付到电网平台时实现优化。作为网格平台和工作流程设计人员的接口,WFAMS包含六个部分(如图7所示),包括工作流控制,工作流数据,工作流翻译,需求存储库,模型组合,XML解析器,工作流提交和故障处理程序交互模型,这些模型将不在这里介绍。

图7 WFAMS的骨架。

WFAMS将定义明确的订单抽象工作流转换为具体的工作流程,其中必需的资源将被绑定。它管理,控制工作流程,并从数据流中指定最

全文共9756字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[144566],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。