英语原文共 27 页,剩余内容已隐藏,支付完成后下载完整资料
未知数据关联映射
13.1最新衍生
这是关于EM的正确导出,不幸的是在本书的其余部分使用了一个略有不同的符号。它用来提醒塞巴斯蒂安:它必须被纳入文本,并且它的一部分最终必须消失在附录里。因此读者们,不要看这些了。如果你这样做,我们使用表示t时刻的姿势,用表示引导到时刻t的姿势。z是一个测量值,u是一个控制量。并且间隔(t-1,t]之间的控制量被标注为,而不是。祝大家好运!
我接下来要说的是:
(13.1)
对两边同时取对数我们得到:
(13.2)
这里和是常量,在二进制域中引入指标变量和,当且仅当机器人在时刻t的姿势为时成立;当且仅当机器人在时刻t姿势为,时刻t-1姿势为时成立。所有这些变量的集合称为I,它们是潜在变量,这就给了我们以下的表达形式:
(13.3)
现在计算这些指标变量I的期望值:
(13.4)
其中指示符变量的期望以当前映射为条件,换一种说法,我们得到(我不确定写成这个形式好不好):
(13.5)
因此,在E步骤中,我们必须对所有的t,和计算期望值
(13.6)
在M步骤中,我们寻求在这些期望下最大化表达式(13.5),而这些期望将会给我们第(i 1)个映射。幸运的是,表达式(13.5)中不是所有的条目都取决于映射m:
(13.7)
回顾一下,我们会注意到我们甚至不用计算指示变量,相对于映射m,该项是常量,所以我们可以早点忽略它们。
假设统一先于机器人姿势,对于E步骤,我们得到:
(13.8)
这是一种向前——向后定位。
对于M步骤,我们有:
(13.9)
对于每个位置lt;x,ygt;方便地进行解耦,注意:这是近似值,因为那些单元格不是独立的。另一种方法是运行模拟退火算法,但是解耦在文献中比较常见。
(13.10)
我们观察到:
(13.11)
因此:
(13.12)
很棒,不是吗?我唯一不喜欢的便是M步骤了,如果我们能解决这个问题,我们可能实际上证明了收敛。
好了,现在让我们阅读动机这部分吧,不要再把注意力放在衍生那一章节了。
13.2动机
在前一章节中,我们讨论了一种映射算法,这种算法用来计算建立在姿势和映射之上的完整的关节后路。从概率的角度看,后验估计显然是一条黄金准则,因为它携带关于映射不确定性、姿势不确定性的信息,甚至还带有姿势估计和映射估计的交叉依赖性。
然而,为了获得后验估计算法,前面章节中所描述的方法不得不诉诸于一些限制性假设,这些假设中最重要的是缺少数据关联问题。换句话说,对于这些算法,它们可以在不同的时间节点在相同的环境特征景点之间建立对应关系是神关键的,否则后者将不是多模式的。为此,使用卡尔曼滤波器的映射算法经常熊传感器数据中提取少量的便于消歧的地标(特征)。因为这样做,它们被迫丢弃大部分数据。例如,在上一章提到的水下测绘结果中,大部分关于水下海床的测量值被丢弃,只有少量的特征检测值被用于绘制地图。通过考虑所有的数据,一个地图可以被构建得更好。这些观察促使我们希望开发能够处理模糊传感器数据和数据关联问题的映射算法,这种算法是本章以及以下章节的主题。
本章介绍了一种专门解决数据关联问题的映射算法。特别地,它们可以处理模糊的地标并且估计它们之间的对应关系。基本算法的变体也可以处理原始传感器数据,通过将数据序列编译成小的局部映射,并将它们以统计的合理的方式合并成一个全局的、一致的映射。从消极方面来看,这里开发的算法与卡尔曼滤波器方法相对有两个缺点。首先,它们仅仅只是寻求最可能的映射,而不是计算完全后验的映射和姿态。因此,该算法的结果没有明确地表示地图或机器人姿势的不确定性。第二,这里讨论的算法是批处理算法,它们需要在整个数据集中多次传递。相反,卡尔曼滤波器是递增的。一旦测量值已经被处理,便无需再被记住。
尽管如此,从实际的观点来看,这里讨论的算法是很重要的。数据关联问题通常被认为是并行映射和本地化中最具挑战性的问题,并且这些算法是目前已知的唯一能够在统计学上以可靠的方式解决这个问题的方法。这些算法还在本质上难以映射的环境中生成了一些已经构建的最大的映射。
本章包含一些比前几章材料稍微更先进的统计材料。特别地,它使用(没有证据)邓普斯特的最大期望算法,这是公认的用于具有缺失数据的最大似然的统计技术。为了在进入数学形式主义之前首先传达基本思想,本章从对本章讨论的所有算法的基本思想的非正式描述开始。特别地,
- 第13.3节使用两个简单的认为例子介绍基本思想。
- 第13.4节描述了用于并行映射和本地化的最大期望算法,并在数学上导出。
- 第13.5节讨论如何实现最大期望算法。特别地,它讨论了基于地标的映射算法的实现,这种算法使用概率密度函数的分段常数近似,并指出减少计算复杂度的策略。
- 第13.6节介绍了该算法的分层版本,其依赖于局部映射作为最大期望的基本实体。如在那里讨论的,该分程版本将最大期望应用于占用网格风格度量图成为可能。
Figure 13.1 环境(细线);机器人路径(灰色);测量路径(粗线)。在某一最大感知范围内,机器人可以感知它是否在不可感知的角落之中。点表示机器人到角落的位置。
13.3与最大期望(EM)映射:基本思想
让我们开始讨论与EM映射的基本思想与概念,正如我们将看到的,一般的想法是相当直观的,和本书中的其它内容一样,是与概率的概念密切相关的。
EM映射的目标是找到给定数据的最可能的地图,在数学上,为了任意数据集和地图,我们现在对计算感兴趣 (13.13) 感兴趣。不幸的是,搜索地图的空间是不可能的,因为它太大。因此,EM在所有地图空间中充当爬山的角色。更确切的说,它开始于非常差的地图,然后开发更好的地图,等等,直到它最终到达可能性空间中的局部最大值。特别地,这是EM的基本技巧,EM迭代两个不同的估计步骤:
- 定位步骤,由于下面给出的原因也称E步骤,其中机器人将其自身定位在其当前最佳图中。
- 映射步骤,也称为M步骤,其中一个新的、改进的图基于定位结果计算得到。
Figure 13.2 初始阿尔法值,仅使用里程法计算机器人姿势的后分布
显然,这个问题分解的有点在于:各个步骤比第7章中的并发要容易的多,我们已经看到了如何将机器人定位在已知地图中(E步骤)。在第9章中,我们讨论了从已知姿势(M步骤)构建地图的技术。EM方法交替定位和映射,使用与前面描述的相似的技术。
为了说明EM,考虑图13.1所示的矩形环境。让我们暂时假定机器人具有检测角的传感器,每当它在角落或靠近角落时,它可以感知它的相对位置,但是不能分开角落。请注意,此环境是高度对称的。映射问题清楚地提出了在相同角落的不同检测之间建立对应关系的数据关联问题。图13.1还显示了机器人的路径(灰色)。沿着路径的点表示了机器人何时检测到一个角落。显然,我们的机器人往往漂移到右侧,相当于其历程测量。
EM算法从没有任何映射的本地化步骤开始,图13.2显示了不同时间点的情况。图13.2显示了不同时间点的情况,最初,姿态被定义为lt;x=0,y=0,theta;=0gt;,这在图13.2的第一个(最左边)图中显示出来。在第一个运动片段到相邻的角落后,机器人的信念如第二个图所示。这种信念完全基于里程计,因为没有地图、没有以任何方式约束信念的机会。接下来的三个图表示出机器人在接下来的三个运动段之后的信念,说明机器人的不确定性在随着时间增加。
姿态估计现在被用于产生第一个高度不确定的图,如图13.3所示。这里,灰度级对应于地图中x-y位置是角的可能性:黑色意味着机器人确定这里有一个角落,白色则表示机器人确定这里没有角落,其间的值指示0(白色)和1(黑色)之间拐角度的概率。图13.3中的图具有几个显著的性质:首先,它是高度不确定的,正如可能是角落的大区域所指示的那样。左下角的灰色圆圈对应于第一个感知值,其中机器人知道其姿势(根据定义它是lt;0,0,0gt;),并且仅在其圆形感知场中看到单个拐角。其他灰色区域对应于机器人感知到相同传感器读取值的时间点,但是不太确定其位置。因此,所得到的地图不太尖锐。
Figure 13.3 初始映射
机器人现在重新运行本地化,但这次试用初始映射。这个映射,虽然很不准确,但还是能造成本地化的改进。基于初始映射的新的本地化运行如图13.4所示。与第一次定位结果(图13.2)的比较显示不确定性边际已经缩小,说明了映射对定位的积极影响。
到目前为止,仅仅只谈到了前向定位,使用导致时间t的数据来确定机器人在时间t的姿态。严格地说,甚至时间t之后收集的数据都携带着关于机器人在时刻t姿态的信息。因此,需要某种后向的定位,即使用未来的数据来修正过去的信念。图13.5显示了后向定位的结果,该图应从右边向左边看去。由于机器人的最终姿态是未知的,我们便从均匀分布开始,如图13.5中最右侧的图所示。一旦提前移动,机器人的分布便由左边的图表给出。这与全球定位相同,只是时间顺序相反罢了。该图包含圆形集合的事实表明:在跟随命令的单次测量之后,机器人可能在一个已知的和拐角位置的固定距离处。从右到左,图13.5中的图表显示了直到初始时间步长的后向定位的结果。
严格来说,我们的方法需要在所有迭代中继续向后,即使是第一个,但在没有地图的情况下,结果分布依旧是均匀的,这解释了我们为什么没有在第一轮本地化中解决这个问题。
Figure 13.4这些alpha;值基于里程计(如前所述)和初始的、高度不确定的映射
Figure 13.5 后向定位:从右到左计算beta;值,及时有效地对机器人进行向后定位
Figure 13.6 前向定位和后向定位的综合结果
Figure 13.7 第二个映射
Figure 13.8 前向定位和后向定位的综合结果
Figure 13.9 最终映射
各个时间点,机器人位置的真实后方如图13.6所示。每个图都是前向定位和后向定位结果的(归一化)产物(分别见图13.4和图13.5)。
读者应该注意到:虽然远不能确定,姿态估计是对不使用地图时初始姿态估计的改进。新的、改进的姿态估计现在用于生成新的、改进的映射,如图13.7所示。
与第一个映射(图13.3)的比较表明,现在机器人更确定其环境中的角落在哪里。
Figure 13.10 测试环境和数据:(a)环境拥有四个不可区分的地标位置,标记为A-D,机器人的路径是A-B-C-D-C-B;(b)第一个数据集,由机器人的里程计测量得到;(c)第二个数据集,包含比第一个更多的步骤。
Figure 13.11 数据集1,EM三次迭代后的本地化
Figure 13.12数据集2,EM三次迭代后的本地化
重复定位和映射的过程,经过十次迭代,这个过程几乎包含了我们的像玩具那样的例子。生成的姿态估计图显示在图13.8的底行;顶行和中间行分别表示向前定位和向后定位的结果。在这一点上,即使对于中间位置,不确定性也几乎完全消失,在最后一个时间点上,机器人现在确定当前角与第一个角是相同的,如右下角的图所示。值得注意的是向后定位的结果,它们在x-y-theta;空间中时螺旋形的(因此x-y空间中的投影是圆)。
对应的映射,如图13.9所示,显示了四个角的位置,它们稍微被旋转了一些,但是与真实的布置是一致的。最后的映射还包含一个虚假的第五个角,这是在机器人感知范围的边界处“过度拟合”的结果。
第二个例子如图13.10到图13.12所示,此示例说明了该算法如何有效地使用数据来及时对信念向后修正。在这个例子中,由于缺乏数据,我们的算法首先未能正确地对机器人进行定位。随着更多数据的出现,错误的信念被识别并更正,从而有利于得到正确的信念。
图13.10a显示了这样一种环境:即拥有四个“重要”位置(标记为从A到D)的多走廊环境。为了进行说明,我们假设这些地方都是不可区分的。机器人的路径是A-B-C-D-C-B,即机器人向上移动、向右转、然后转向并移动一半返回到它开始的地方。当然,里程表是错误的。图13.10b和c描绘了通过机器人里程计得到的路径。在图13.10b中,描述了机器人重新访问位置C之后的情况。一步之后,机器人回到位置B,如图13.10c所示。
该示例的有趣特征是:在返回到位置C(图13.10b),机器人的姿势非常接近位置B。由于我们的机器人
全文共21257字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[142945],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。