英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料
动作捕捉和检索
基于信息熵的运动提取以实现动作捕捉动画
摘要
在本文中,我们提出了通过在运动捕捉数据中搜索的临界关键运动动作提取运动模式的新的分割解决方案。在临界关键姿势中建立的等级是为了标识动态数据的方向变化的意义关键。该方法是基于熵的指标,特别是互信息的措施。使用帧之间的位移的直方图进行评估和相互信息度量用来计算帧间关系。最显著关键姿势识别所述运动数据的最大方向变化。这将针对所有候选关键姿势具有最低互信息水平。较少显著的关键动作是在较高的互信息列出。结果表明,该方法在方向变化方面比基于单独的速度的大小的方法有更高的灵敏度。这个方法的目的是提供一个关键动作的等级的运动片段的总结,它在运动中浏览和运动检索数据库系统非常有用。
关键词:动作捕捉;动画;;熵;互信息;移动数据库
介绍
动作捕捉系统的出现对迅速产生的3D角色动画和栅极分析临床研究有显著的影响。当前的运动捕捉设备捕捉高频率的人体动作,并且运动可以重新定向到计算机字符来模拟逼真的动作。动作捕捉的应用从大众和控制合成特征在大型电影制作短电视广告,3D电脑游戏,在体育和临床研究的数量和范围正在不断增长,模拟和保存特定动作的风格可以通过独特的个体,如武术,舞蹈,杂技和功夫等例变化产生。然而,运动生成往往涉及很长的运动捕捉周期,并谨慎的编辑,以适应和满足一个特征的特定行为。所捕获的运动通常被归档和注释以供将来使用。运动数据库可能是制作工作室最重要的资产。记录运动是频繁地从数据库中调出,并且新运动是从给定的片段构成。本文的工作的动机是处理大动作数据库需要运动存储和检索操作。我们试图回答的基本问题是:
- 我们怎样才能有效地存储所有拍摄的运动到一个运动数据库?
- 什么是最有意义的方式去总结运动剪辑而不是通过文字注释?
- 相比单纯使用文字注释,我们怎样用一个更直观的方式取回运动节段?
- 哪些特征可以作为一种有效的索引策略从运动剪辑中提取?
我们试图通过提议首先确定在运动模式显著变化的新方法,为了提取排名中有意义的运动节段建立基于熵来解决这些问题。我们定义一个关键姿势来表示三维运动这样的一个时间样本,在关键姿势之前发生的运动是与关键姿势之后发生的运动显著不同的。一个关键的姿势给出一个视觉运动总结,并定义了两个连续的动作变化之间的变化过程中标识唯一的姿势。一个关键的姿势包含了比文字注解更多信息。关键姿势的使用类似于在传统的动画“关键帧”,然而,一个关键姿势与关键帧不同之处在于它是一个当运动必须从一个连续经过时间的表示模式到另一个的“极端”姿势,因此,它具有相当的方向上的变化。因此,一个关键的姿势可以用作喜欢的姿势动作跳舞运动功能,功夫运动和简单的行走或跑步周期等的代表。
通过我们从一个给定的运动序列采用互信息的方法来确定关键姿势来首先解决的关键姿势提取问题。该提取的结果是,在一个大的运动节段被检测到临界关键姿势的等级列表。关键姿势确定运动的实质性方向变化模式,我们用熵的措施,特别是互信息测度,去量化信息从一帧传递到另一个。两帧之间的定向运动较大差异导致弱的帧间依赖,因此,相互信息一个较低的水平。我们的算法排名根据其相应的关键姿势互信息的水平。这些水平与在运动的方向改变的意义相关。关键姿势的等级之后可以进一步在使用于运动检索系统的索引。我们组织的论文如下:我们首先提出一些背景和相关工作。我们给熵公制和我们在未来的工作细节部分。我们将提出结果,并比较以前的工作,以及给出其它可能的应用。最后一节总结全文,并建议未来的发展方向。
相关工作
最近,Li等根据分层运动索引树提出一个的运动检索系统。样品和在子库中的运动之间的相似性是通过弹性匹配计算。为了提高相似度计算的效率,将采用自适应基于聚类的键位姿提取算法。
关键姿势而不是使用整个运动序列用于计算。我们的工作通过搜索和识别的“极端”构成,而不是像Li在质心寻找最相似的姿势。
最近的一些研究工作也表明运动数据库的概念。这些技术主要是运动再合成技术,从现有的运动剪辑自动生成的新动作。一些算法通过用户规定的约束重新合成新的运动基于非注解移动数据库。这些算法遵循路径合成一个新的运动,去一个特定的位置,或在指定的时间执行一定活动。提及的运动数据库,被限制为一组运动样本并靶向特定运动再合成的需求。我们讨论议案数据库和检索环境实际运动编辑会话的更广泛的概念。
要连接的议案文集高效地协同,Gleicher等提出了一种揿扣在一起的运动系统,用于处理一组运动语料库的一组短的剪辑,变成是串连的连续流。该系统建立一个图结构来规划人物动作的高效设施,Kovar建了同时包含原议案的议案图,自动生成的过渡以方便合成行走在地面上。所有工作都包含从一系列运动库里检索类似的姿势特征。一个高效的移动检索系统会通过合成更复杂的运动有利保持较大的一组运动库。
最近,一些运动合成技术是基于手动注释运动数据库。新的运动是根据动画师指定的条款如“走”,“跑”或“跳跃”的基本词汇合成。因此,运动剪辑是在合成前手动注解。新的运动重新组装融合了注解运动剪辑。阿勒坎等人也进行了研究自动标注采用支持向量机(SVM)分类。然而,人在分类的干预是必要的,以便引导该系统学习某些动作。这样的分类可导致建立成功的基于文本运动检索数据库。
其他工作涉及“关键帧”或“关键姿势”的想法。Pullen和Bregler基于该动画的关键帧提出运动“纹理”想法。关键帧和曲线由动画制作者所概述和运动捕捉数据被映射到基于一个匹配过程的曲线。Bevilacqua建议从基于幅度运动捕获数据速度来提取关键姿势。我们通过探索信息内容存在于运动模式之间的转换提供更好的解决方案。
然后,我们在结果一节比较其结果。Kim等提出提取运动的节奏基于所述第二过零点每个运动信号的衍生物(加速度)。过零运动信号的加速可以暗示的意思是一个关键的姿势。但是,他们的工作解决了一个非常不同的问题。他们的重点是找到运动跳动。跳动之外的潜在是未考虑到关键姿势。这会造成更多的泛型类型的运动序列问题。对于这一点,对关键姿势进行分级,并试图找到在动作模式的变化的显着性的量度是很重要的。我们的工作是基于使用互信息度量,以便找到与运动所有潜在的关键姿势更加注重确定显著的关键姿势。
我们面对的问题是类似的在视频索引和检索关键帧提取系统。某些颜色基于直方图的算法用于检测视频剪切和反馈发展。我们的方法是类似于最新的视频剪切和反馈的由Z.Cernekova的基于互信息熵指标和联合熵的检测算法。
熵基于公制贝伊波雷提取
互信息
窗体顶端
离散随机变量X的熵测量X的信息内容或不确定。是有概率为X的结果。其中,熵的定义是:
|
(1) |
两个分散随机变量X和Y的联合熵为:
|
(2) |
当是联合概率密度函数,互信息测量在给定的Y后对X的不确定性减少。
|
(3) |
互信息也可通过X与Y的联合熵进行计算:
|
(4) |
相互间的信息给我们一个衡量X和Y之间的关系。它测量在X和Y的重叠信息。这是重叠区域的H(X)和X(Y)。另一方面,联合熵计算X和Y携带的统一信息。这是H(X)和X(Y)统一区域。
位移直方图和位移互信息
我们考虑的数据是通过运动捕捉系统捕捉标记的XYZ坐标。这种格式是目前由如VICON动作捕捉系统产生的。使(xif,yif,zif)在框架内成为XYZ坐标系中i的标记。我们假设数据不包含丢失的样本。由于闭塞的标记数据丢失,必须完全重建之前的计算,它可以参考文献[27]中进行实现。
我们可以定义向量dif为位移向量标记该帧和下一帧之间的变化,它可以写作:
|
(5) |
当dxi,f,dyi,f,dzi,f与XYZ轴相交的位移。di,f形成连续向量标识i在帧f和下一帧中。
下一步是根据数量n和分散程度计算位移直方图,只考虑X坐标方向我们选取dxi,f全局最大值和最小值作为离散化的范围,使位移直方图Af为n个的不连续分散结果dxi,f在帧f中有对应可能性Bf,Bf当等于Af/总数量时,近似的,帧f和帧f 1之间的离散联合概率可以被表达为n*n的矩阵,其中。元素(r,s)在中代表一个标记有离散化水平r在帧f和离散化水平s在f 1中的概率,使I为位移的互信息量对于X轴上的帧f和f 1。我们使互信息量I被用于公式三并赋值给向量和矩阵,得到下式:
|
(6) |
我们对Y和Z坐标进行相应计算,以得到和,因此,帧f和帧f 1间的总互信息量为:
|
(7) |
关键姿势检测
一个关键姿势涉及到向量的一个改变(或者在帧之间向量的一个位移改变)对于动作来说。一个低的互信息量表示着一个高的帧之间不相同向量的可能性,并且也表示着一个高的关键动作发生的可能性。图1表示一个动作样本在120HZ,有着n=256分散水平的互信息量。低表示着向量的显著相关性改,高水平表示着动作的相似,我们提出定位互信息来强调局部的改变,我们绘制如下:
图1 动作样本在120HZ,有着n=256分散水平的互信息量
|
(7) |
当=和的平均数,形成一直是帧f中心的窗口,当时,我们限制窗口左边的边界为1,并且右边的边界为帧的最大值,当超过最大数时,图2表示以w=60(总窗口大小为1秒)来绘制图1。垂直的线表明在低最小值对关键姿势的提取。这里有很多方法来得到的低最小值,曲线可以用阈值被水平方向的修剪。几个局部的槽将被分离并且各槽的最小值可以选。另一种方式是用一个递增的顺序排序。我们相应的提高阈值直到特定数量或达到密度。只有最低的点的各槽将输出做为关键动作。我们也可能考虑到平滑的信号,但这可能会导致检测的不准确和显著的互信息的变化。图2中显示的例子是用阈值为0.9来进行提取的。
图2 图1中局部动作的互信息,阈值为0.9
结果
关键姿势提取
图3示出一个舞蹈运动的结果。在120Hz的运动进行采样,本地化互信息计算为1秒窗口的大小和256离散化水平。关键姿势是提高阙值提取。运动以向左倾斜和向右倾斜后右腿的飞跃,左腿开始。在图3中每个快照的数字表示所提取的关键姿势的顺序。在开始的时候,这两个最关键的显著姿势(运动最大的变化)与低提取(0.75)。两个关键姿势(3和4),然后出现时上升到0.90。少显著关键姿势(5,6,和7)与较高的0.95提取。它们是关键动作之间的连接动作,关键动作的重要性随着阙值的上升而下降。该过程停止在一个在达到特定数目或关键动作的密度,或在达到预定的最大阈值(1.0是一个合理的数字作为我们感兴趣的是下面的姿势平均)。关键姿势这样的快照作简要沿着时间的运动事件的总结。
图3 用增加阈值对跳舞动作进行关键动作提取
比较震级速度的方法
我们尝试通过Kovar提出的方法用一个幅度速度来比较的方法。大小速度法计算的幅度在每个帧到下一个标记的速度帧。所有的幅度都总结以形成一维信号。
区域的局部极小将被提取为重点姿势。为了使用比较这种方法,我们试图通过同样的1本地化信号第二个窗口。我们的结果表明,我们双方的信息的方法是比大小,速度法方向的变化更为敏感。图4显示了我们的本地化互信息曲线的情节和另一舞蹈动作的幅度,速度曲线。在相同的阈值0.90,22个关键姿势是由我们的方法拾取(它们被垂直表示图中的行)只有15个关键姿势由震级速度的方法。该图表示几乎所有的幅度,速度回升的关键姿势还通过我们的方法
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[151250],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。