用于控制远程操作移动机器人的可变自治框架的实验分析外文翻译资料

 2022-11-06 11:29:30

英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料


用于控制远程操作移动机器人的可变自治框架的实验分析

Manolis Chiou1, Rustam Stolkin2, Goda Bieksaite1, Nick Hawes1, Kimron L. Shapiro3, Timothy S. Harrison4

摘要:本文提出了一种对移动机器人导航的可变自主控制方法的原理性实验分析。 研究人类行动(HI)可变自主系统,其中人类操作者能够在远程操作(操纵杆控制)和自主控制(机器人导航)之间切换自主程度(LOA)自主地朝向由人类选择的路点)。 我们的假设是,HI系统将比单独的远程操作或自主性能够实现优越的导航性能,特别是在人和机器人的性能有时会变差的情况下。 我们通过仔细控制和可重复的实验使用大量的人类测试对象来评估我们的假设。

I.引言

尽管近年来自主机器人技术取得了重大进展,但是在高度后果和危险环境中部署的现实世界机器人仍然主要使用遥控操作,使用30年来没有大幅变化的接口。这类应用的例子包括爆炸物处置(EOD),搜索和救援(SAR)和核退役(例如部署在福岛或英国和美国遗留核站点的机器人)。 继续依赖直接远程操作的原因是自主方法仍然不够健壮,不足以在高度非结构化和不确定的环境中完全自足。

另一方面,SAR操作中的几个人机交互(HRI)现场研究[1] - [3]确定了在这种机器人中使用更多自主性的必要性。 通常,远程机器人将与其人类操作者分离。 厚的混凝土墙(核情景)或瓦砾(SAR情景),在脐带系统可能引起纠缠和其他严重问题的情况下严重限制通信带宽。 另外,控制远程机器人以相对于周围物体执行精确移动对于仅具有有限的情景意识(SA)(例如,使用机器人安装的照相机的受限制的视图和差的深度感知)的人类操作者来说是极其困难的。

似乎未来的机器人应用将需要某种形式的可变自主控制。 可变自主系统是其中可以通过在不同自主级别(LOA)之间切换来在人类操作者和机器人之间交换控制,使得代理可以彼此协助。 这样的系统提供了帮助可能正在努力应对诸如高工作负载,间歇通信或操作者多任务的问题的人的潜力。 例如,人类操作者可能需要集中精力于辅助任务,同时暂时地将控制权交给可以自主管理机器人导航的AI。

使用不同的LOA以提高系统性能是一个具有挑战性和开放性的问题,提出了一些困难的问题。 例如:在哪些条件下应使用哪个LOA? 什么是在不同的LOA之间切换的最佳方式? 以及如何以可重复的方式研究切换LOA提供的权衡? 这些问题需要通过在严格的多学科框架下进行实验,利用心理学和人为因素,以及工程和计算机科学领域的方法探索。 我们以前的工作[4]强调了现有文献中没有这样的框架。 此外,由于大量的混杂因素和结果中的大差异,它证明了进行这样的实验的固有的复杂性。

本文从我们以前的工作开发,通过设计和执行一个原则性的实验研究,以经验性地评估人机器人团队在使用可变自主控制器时的性能。 更具体地,其通过以下方式改进实验框架:a)最小化混杂因素, 通过广泛的参与者培训和主题内设计; b)为人类操作者引入有意义的次要任务; 和c)引入可变自主控制器。 我们提出正式分析,统计评估的实验证据,支持一个假设,一个可变自治系统在各种情况下的确可以胜过远程操作或自主系统。

在我们的实验中,我们比较了三种不同系统的性能:1)移动机器人的纯操纵杆遥控操作; 2)半自主控制模式(其在下文中称为“自主”LOA),其中人类操作者指定机器人自主导航的导航目标; 3)人类倡议(HI)可变自主系统,其中操作人员可以使用按钮按压在远程操作和自主模式之间动态切换。 在实验期间,人类测试人员负责在迷宫式测试场地周围导航差速驱动车辆,SA仅由监视器显示的控制界面提供。 在实验期间的各个点,通过人为地将受控量的噪声引入传感器读数来降低机器人的性能,并且通过迫使它们执行认知复杂的次要任务来降低人类操作者的性能。

本文中报道的实验集中在一个人类操作员根据自己的判断在飞行中切换LOA的能力和权限。 我们将这种形式的可变自主定义为人类倡议(HI),与其中AI和操作者都有权力发起LOA变化的混合主动(MI)系统相反。 然而,在本文结束时,我们另外提出了如何在这些实验中收集的数据,结果和见解可用于在未来工作中用于通知混合倡议(MI)系统的设计。

II。 相关工作

大多数机器人文献集中在描述新技术的工程和/或计算细节,而相对少的研究解决了严格评估人类可以如何使用这样的机器人来执行实际任务的问题。 此外,自主机器人学文献历来倾向于与调查远程操作问题的文献有些分开和不同,相对较少的工作专注于可变自主系统。

改进远程操作系统的常用方法是增强用户界面[5]。 精心设计的界面通常可以帮助操作者更好地执行。 然而,它不能减轻他们的持续控制的负担,也不利用机器人的互补能力来管理自己的一些任务

重点研究移动机器人的动态LOA切换的研究相当有限。 此外,MI系统的研究以解决这种动态转换甚至更有限,正如Jiang和Arkin [6]和Chiou等人 [4]。 大部分文献,例如, [7],[8],侧重于比较单独的LOA的相对性能,并且没有报告能够在LO之间切换的价值。 相比之下,我们的工作专门解决使用MI或HI范例动态地改变LOA的问题(即在任务执行期间)。

Baker和Yanco [9]提出了一种机器人系统,其中机器人通过表明LOA的潜在变化来帮助操作者的判断。 然而,该系统没有通过实验验证。 Marble et al。 [10]进行了SARinspired实验,其中指示参与者切换LOA,以改善导航和搜索任务的性能。 然而,[10]旨在是一个可用性研究,探讨参与者与每个不同的LOA互动的方式。 相比之下,我们自己的工作侧重于评估和演示当LOA水平可以动态切换时的整体任务性能。正如我们自己的工作,[10]也将次要任务纳入他们的实验。 然而,与我们的工作相反,使用这些辅助任务本质上是机会主义的,因为参与者仅被指示可选地执行它们。 因此,[10]中的次要任务不会降低主要任务(操纵机器人)的人性能。 此外,与我们的工作不同,[10]没有将任何方法纳入他们的实验,以降低机器人的自主性能在受控的方式

大部分公布的实验工作没有仔细控制可能的混杂因素。 这些因素可以从部分不受控制的测试环境(如[10])到[8],[11],[12]中没有针对人类测试对象的标准化培训。 控制人类测试对象的训练和经验是特别重要的,因为这些因素已知会影响整个机器人的操作性能[13],[14]。 其他混杂因素包括机器人在测试的不同条件下具有不同的速度限制[11]或人类操作员的不同导航策略[4]。 与我们的工作相反,Nielsen et al。 [15]报告没有重大的主要任务结果由于大的测量差异,但他们提出了一种方法,系统地分类人类操作员的不同导航策略。

上面讨论的所有论文都有自己的重要贡献,我们不打算以任何方式贬值这些工作。 然而,在相关文献中,我们注意到一个缺陷:a)严格的统计分析; b)假设和假设的清晰度; c)对所实验方案的精确和详细描述; d)形式化,连贯和可重复的实验范式。 相比之下,在心理学和人为因素等学科中,上述标准构成了标准做法。

相关工作的一个很好的例子,它提供了严格的协议,统计分析和详细描述,是Carlson等人的工作。 [16]。 它们验证自适应共享控制系统,同时使用辅助任务降低任务性能。 然而,他们的工作集中在使用脑 - 计算机接口用于机器人控制。 因为该领域相对年轻,并且问题非常困难,[16]使用相对简化的机器人导航任务,即操作者仅使用键盘控制机器人的左右移动。

最后,在由单个操作员控制的多个机器人的领域中的可变自主研究提供了类似的实验研究。 然而,这些研究(例如[17],[18])集中在比我们的工作更高的抽象层次。 规划或任务分配。 其他实验,例如[19],[20],侧重于人为因素的问题,例如在控制多个机器人时获得SA,或者操作员如何与尽可能多的机器人进行交互。

与上述工作相反,就我们所知,我们的文章是第一个利用从心理学和人为因素研究的严格的方法进行移动机器人的可变自主性的原则性研究; 第一个移动机器人实验将人类和机器人的可量化和可重复的降解因素结合起来; 以及第一个正式和系统地评估在动态模式切换系统中结合人和自主控制的能力的好处的工作。

III。 设备和机器人软件

我们的机器人和环境是模拟开放机器人模拟引擎(MORSE)[21],这是一个高保真模拟器。 所使用的机器人是装备有激光测距传感器和RGB相机的Pioneer-3DX移动机器人。 机器人由操作员控制单元(OCU)控制,操作员控制单元(OCU)由膝上型计算机,操纵杆,鼠标和显示控制界面(参见图1)的屏幕组成,

在我们以前的工作[4]中,我们建立了一个大的迷宫式测试场(参见图2(b)和图3(b)),并使用真实的Pioneer-3DX机器人配备相机,激光扫描仪和WiFi通信到远程操作员控制单元。虽然在真实机器人上演示新方法很重要,但我们观察到这可能引入困难的混杂因素,这可能减损实验的可重复性和收集数据的有效性。例如,在一天的不同时间或不同天气的测试意味着实验室内的日光级别改变,影响每个测试对象观察到的视频图像。不同数量的电池充电可能导致机器人的最高速度在不同的测试对象之间略微变化。这些和其他因素导致我们使用高保真模拟机器人和测试场设计本文报告的实验。如在图1中可以看出的。 2。如图3所示,并且比较真实的和模拟的视频馈送(图1和图4),模拟环境为操作人员创建了非常类似的情况和刺激,如驾驶真实机器人时所经历的,但具有高得多的可重复性

我们的系统提供两个LOA。 远程操作:操作人员用操纵杆驱动机器人,同时通过来自机器人的板载RGB相机的视频馈送获得SA。 另外,激光产生的2D地图显示在OCU上。 自主:操作者点击2D地图上的期望位置,然后机器人自主地计划并执行到该位置的轨迹,自动避开障碍物。 该系统是人类倡议(HI)系统,因为操作者可以通过按压操纵杆按钮在任何时间在这些LOA之间切换。 所使用的软件是在机器人操作系统(ROS)中开发的,并在[4]中更详细地描述。

IV。 实验设计和程序

该实验研究机器人在何种程度上表现不佳的情况,可以通过在AI和人类操作者之间切换控制来克服或改善。 这种情况可能包括空闲时间,这是在实现目标方面没有任何进展的时间[4]。 例如,当处于远程操作模式时,其操作者忽略机器人,或者由于自主模式中的导航故障而卡住机器人。 类似的情况在真实世界的机器人部署中是很常见的[22]。 例如,考虑机器人操作员必须中断其对机器人的控制以向SAR团队领导或EOD团队指挥官提供信息的情况。 我们的假设是,在这种情况下,对另一个代理的交易控制将提高系统的总体任务性能。

A.实验设置 - 操作员控制单元和机器人测试

在本文所描述的工作中,我们使用与用于真实机器人的先前实验中使用的相同的OCU(参见图4(b))[4]。 设计尺寸为11times;13:5米的模拟迷宫(参见图2(a)和图3(a))。 它接近一个黄色编码国家标准和技术研究所[23]。 如在图1中可以看出的。 如图3(b)和图4(a)所示,通过OCU呈现给操作人员的数据几乎与在我们现有工作中在真实竞技场中操作真实机器人的人类测试对象所经历的数据相同。

B.主要和次要任务,和实验测试模式

每个人类测试对象被赋予从图3(a)中的点A(竞技场的开始)到点B(竞技场的结束)并返回到点A的主导任务。路径被限制,并且一个 即没有替代路径存在。

引入了两种不同类型的性能降级因素,每个代理一个:人工生成的传感器噪声用于降低自主导航的性能; 并且使用认知密集的次要任务来降低人类测试对象的性能。 在每个实验试验中,这些性能退化情况中的每一个发生两次,一次在从点A到点B的途中,并且第二次在从点B回到点A的途中发生。两种不同类型的退化分别发生 其他,如图3(a)所示。

更具体地,通过向激光扫描器范围测量添加高斯噪声,从而降低机器人的定位和障碍物避免能力,降低了自主导航。 对于每个实验试验,当机器人进入竞技场的预定义区域时,该附加噪声被实例化,并且当机器人离开该区域时被停用

为了降低人类操作者的性能,通过智能旋转3D对象的次要任务增加他们的认知工作负荷。 每当机器人进入竞技场中的预定义区域时,向测试对象呈现一系列10张卡片,每张卡片示出两个3D对象的图像(参见图5)。 在一半的卡,对象是相同的,但旋转150度。 在另一半中,物体是具有相反手性的镜像物体。 要求测试对象口头陈述两个对象是否相同(即是或否)。 这组3D对象以前在[24]中用于心理旋转任务。

对于每个人类测试受试者,测试三种不同的对照模式。 在远程操作模式下,操作员仅限于使用直接操纵杆控制来操纵机器人,并且在任何时候都不允许使用机器人的自主导航功能。 在自主模式中,操作者仅被允许通过在2D地图上点击期望的目的地来引导机器人。 唯一的例外是在关键事件的情况下,例如机器人卡在一个角落。 在这种情况下,实验者将指示操作者简单地恢复到操纵杆控制以释放机器人,使得实验可以继续。 在人类倡议(HI)模式中,操作者可以随时根据他们的判断,以最大化性能随意切换LOA(使用操纵板上的按钮)

C.参与者和程序

总共24个测试受试者参与组群实验设计(即,每个测试受试者进行所有三个试验),来自23个参与者的可用数据。先前的经验调查表显示,大多数参与者有驾驶,玩视频游戏或操作移动机器人的经验。每个测试受试者在实验之前经历了广泛的训练。这确保所有参与者达到共同的最低技能水平(否则可能导致在以后的数据分析中的混杂因素)。不允

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[139637],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。