英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料
定格动画基于图像的运动模糊
Gabriel J. Brostow Irfan Essa
GVU Center / College of Computing
Georgia Institute of Technology
http://www.cc.gatech.edu/cpl/projects/blur/
摘要
停止运动动画是一种成熟的技术,静态场景的静止图像被拍摄,然后以电影速度播放,以显示运动。当需要快速运动时,这种方法的一个主要限制出现了;大多数运动似乎有锋利的边缘,并且没有可见的运动模糊。运动模糊的出现是一种强烈的感知暗示,它自动地出现在动作片中,并以动画序列综合生成。本文提出了一种自动模拟运动模糊的方法。我们的完全是后处理,并使用图像序列,既停止运动或原始视频,作为输入。首先,我们跟踪图像平面内对象的帧到帧运动。然后,当场景在一段时间内发生变化时,我们对其外观进行整合。这段时间对应于实景电影中的快门速度,并使我们能够交互控制诱导模糊的程度。我们演示了我们的方法的简单实现,因为它适用于不同动作的片段和不同复杂度的场景。我们对这些输入序列进行的真实感渲染近似于在有限时间内曝光的胶片上捕捉移动物体的效果。
图1:Minikingkong停止运动序列是通过手动旋转螺旋桨拍摄的。前两个图像是原始帧,下一个图像显示从该输入自动渲染的模糊螺旋桨。
CR Categories: I.3.3 [Computer Graphics]: Picture/Image Generation—display al- gorithms; I.3.7 [Computer Graphics]: Three-Dimensional Graphics and Realism— Animation; I.4.9 [Image Processing and Computer Vision]: Scene Analysis—Time- varying Images
Keywords: Animation, computer vision, image-based rendering, motion blur, stop motion animation, temporal antialiasing, video post-processing.
1、介绍
定格动画是一个广泛尊重和传统的过程生成电影。《小鸡快跑》、《超级无敌掌门狗》、《格罗米特》、《圣诞夜惊魂》是继《金刚》等早期作品之后的最新特色作品。在常规制作中,停止运动也被广泛用于产生动态(和受控)效果[17]。停止运动动画的制作过程很费劲,要求每一个场景在移动和修改后都要进行拍摄[12]。天才的动画师以不同的速度和轨迹展示人物和物体非常精细的运动。这些动画师无法使用的工具可以帮助在静态帧之间生成运动模糊,以显示快速运动。我们使用一种可以作为后期处理的技术来解决这个问题,不需要动画师做额外的工作。
运动模糊的存在在知觉上是非常重要的。像许多照片图像的人工制品一样,人们通常只注意到它的感官;它的存在给人一种现实主义的感觉[9,13]。此外,由于运动模糊,动画图像序列在时间上更容易受到笔划效果和混叠的影响。在计算机图形学中,运动模糊是一个研究得很好的课题,具有商业化的软件和硬件解决方案,有助于合成真实的运动。
由于缺少运动模糊,定格动画师的工作是改变他们的角色在帧之间的轻微姿势,来防止观众视觉被分散。此外,还采用了一些涉及变形物体和重复胶片曝光的技巧。甚至,在工业光和魔法领域开发了一种称为“Go Motion”的机械技术,并首次用于1981年的电影《魔幻屠龙》[17]。这项技术使用计算机控制的电枢来有效地增强停止运动的动画动物的运动。
1.1相关工作
暴露在实况动作中的胶片暗含运动模糊,这保证了快速对象的注册方式与慢速对象的注册方式不同。目前,只有在计算机动画方面的研究,才解决了创建真实感运动模糊图像的问题。时间采样三维运动的抗锯齿现在是大多数渲染管道的标准部分。
《运动模糊》的开创性作品最早于1983年由Korein和Badler[11]以及Potmesil和Chakravarty[14]介绍。Korean和Badler介绍了两种方法,都是模仿传统漫画家的作品。第一个实现参数化了二维基本体(如磁盘)随时间的运动。第二种方法是对运动图像进行过采样,然后对产生的强度函数进行滤波,生成叠加多个动作渲染的图像。生成的图像看起来像是多次曝光的胶片。
波特梅西和查克拉瓦蒂提出了一种不同的模糊环连续运动方法。一个通用的相机模型(及时)对运动物体的像平面采样点进行累积,形成一条路径。然后将每个样本的颜色值与该路径卷积,以生成具有照片真实性的有限时间曝光。
随着Cook等人的分布式光线跟踪工作,在时间域中抗锯齿最重要的后续发展〔6〕。这项工作成功地结合了图像空间和一个修改过的超采样算法,从随机采样点检索像素值的时间。
这些算法不能直接应用于停止运动动画的光栅图像,因为缺少场景的变换信息。与路径的卷积和该路径在时间上的超采样都要求在“快门”打开时完全指定运动。停止运动的光栅图像是有效的快照,就运动而言,是用无限快的快门拍摄的。虽然只有动画师知道物体的真实路径,但通过对场景的视觉观察,我们可以获得预期运动路径的近似值。Cucka[7]在开发一个为手绘动画添加运动模糊的系统时,可以估计局部运动。与当前可用的商业模糊生成和视频重定时软件包一样,只有小帧到帧的运动被成功跟踪,并且预分割必须手工完成或作为动画过程的一部分。
我们的方法完全基于图像。在获取图像后,动画师可以根据自己的喜好调整生成的模糊的范围。我们利用成熟的计算机视觉技术在整个序列中分割和跟踪大型运动。我们提出的技术依赖于背景减法和模板匹配的组合,以及预先探索的光流和视觉运动计算能力。虽然现有的运动编码技术正在变得相当精细(例如,MPEG-4[10]),但这些方法不足以满足我们的需要。
1.2 观点
我们有兴趣改变图像序列中对应停止运动活动的区域来显示运动模糊。我们的目标是让用户控制模糊的数量,并尽可能自动地调整流程的其余部分。一个主要任务是检测和提取受连续帧中移动影响的区域。
为了帮助确定两个连续帧中像素之间的对应关系,我们首先将每个图像中相邻的像素分组为斑点,并假定这些斑点是独立移动的(第2节)。这些斑点的仿射变换被跟踪并记录为像素特定的运动矢量。这些矢量随后可能会被单独地改进,以模拟其他类型的运动。一旦运动向量充分解释了先前图像中的像素如何移动到当前图像中的新位置,每个像素就会变得模糊(第3节)。像素颜色值将根据行驶距离重新分布,因此具有零矢量的像素不变,而具有长运动矢量的像素将根据该路径进行卷积(或涂抹)。最后,我们演示了我们的实验实现所产生的各种结果(第4节)。图2显示了我们的管线图。
图2:使用Film Chicken Run中的帧,从顶部图像的插入开始,每个级别代表我们技术的一个阶段:分割、刚性斑点跟踪、流校正和污点样本的累积。结合起来,他们产生了岩石在三轮车上向后滚动的模糊图像。
2.寻找像素转换
理想情况下,我们需要与基于网格的动画渲染器相同的3D转换数据。由计算机视觉研究人员研究的运动和场景重建技术中的一些结构能够从某些类型的图像序列中提取此类姿势信息[8]。他们通常寻求最佳的场景几何,假设一个单一的运动,像凸轮时代的运动,导致了场景的所有变化。包含特定角色的影片很麻烦,因为多个动作有助于改变。因此,我们的方法是一种相当野蛮的力,但一般用途的二维运动估计方法。所得到的系统只是可能的运动估计量的一个变体,可以满足我们的方法的需要。下面的描述解释了如何处理在后续帧之间长距离移动的对象。
ReelSmart Motion Blur Our Method
(Blur Amount = 0.25) (exposure = 0.29sec)
图3:同样的序列是使用商业运动模糊包和我们的技术处理的。左边的特写显示,帧间运动太大,因为Hi-erarchical流向量影响了活动轮之间可见的背景部分。我们在右边的结果更有力地表明运动是从左到右发生的。
2.1场景分割
对跟踪的像素进行分割和分组的任务是通过为大多数停止运动动画捕获的高质量的胶片进行模拟。此外,用移动摄像机拍摄的场景往往是例外,因此背景减法是分割动作的自然选择。
如果没有干净的背景板,通常可以在时间域中生成中值滤波。我们观察整个序列的像素位置,对强度值进行排序(尽可能多的帧)。通过选择中间值,背景可以一次重建一个像素。这种高度可并行处理的结果是选择最常见的颜色由一个给定的像素,或至少是最接近这样做的颜色。给定一个相当好的背景图像(Ib),给定帧(If)中不同的像素被隔离。仅包含移动像素的图像(Im)根据以下标准获得:
一个适用于我们处理的所有序列的良好阈值是强度范围的7.8%。请注意,我们在比较时使用了不同颜色图像的灰度版本。
相对于这个门槛。Im中像素的每个连续区域被分组为一个斑点(b),目的是在随后的帧中再次定位它。当然,表示独立对象的点可以随着时间的推移合并和分离,这取决于它们的近邻。虽然这对我们来说不是问题,但可以通过使用颜色相似性和轮廓完成作为辅助手段将场景分割成可管理的斑点来解决。这些未来的扩展也将有助于处理摄像机拍摄的镜头。
2.2斑点跟踪
因此,对象以及表示它们的点可以在第一帧和第一帧 1之间巧妙地移动。为了确定模糊最终发生的路径,我们必须首先找到一个对应关系,将每个斑点映射到它在成功帧中的外观。这种运动估计是一个长期存在的视觉研究问题。大面积单色与不均匀场景光照复合违反光流约束方程。为了使这个问题更容易处理,已经开发出了分层技术,其中一些技术包括刚性约束。卑尔根等。[1]开发了一个层次结构框架,该框架结合了几种基于参数的光流方法。这有助于限制故障点的运动,尽管更重要的工作[16]显示了我们必须处理的大运动的更多希望。Tweed和Calway执行基于块的平移估计,然后进行部分相关传递,将分割块细化为有意义的形状。虽然还没有处理大于块大小一半的旋转和转换,但显式处理OC-结论信息。
为了处理包含大量平移和旋转的镜头,我们的双通方法从非本地搜索开始,然后使用依赖于邻近度的技术进行验证。对于这个目的,我们通过评估im(i)中的每个点 b与Im(i 1)中的点之间的相似性来执行相当详尽的搜索,这里分别称为集合b(i)和b(i 1)。完全详尽的搜索将需要以小角度增量旋转斑点b的各种缩放版本,并测试它与b(i 1)的相关性,以每个可能的(x,y)位置为中心。最终,我们会期望找到旋转、平移和缩放参数,这些参数可以最好地将B(i)中的所有点转换为点在 b(i 1)。
在这里,我们对我们的镜头做了两个假设,它们不会影响我们的目标,对我们的结果影响最小,并且允许更有效的参数搜索。这些假设是:(a)比例不会显著影响对象在连续帧中的外观;(b)旋转程度可以通过评估所有斑点的绝对方向来确定。每个斑点的方向(theta;)是通过其第一和第二标准化中心矩u(x,y)来确定的,该中心矩u(x,y)基本上测量了x和y轴的不对称性。
其中,每个斑点的不同力矩u(m,n)计算为:
其中bw , bh 是斑点的宽度和高度,ba 是以像素度量的面积。
依次取每个b(i),我们生成与b(i 1)中元素一样多的旋转版本,再加上一个表示没有旋转的可能性的额外版本。每个版本的b(i)都是与im(i 1)匹配的模板。这样,每一个b(i)的表达都有一个平移偏移,最大化了归一化互相关(ncc)。在每个坐标处计算斑点像素值b(x,y)和图像i(x,y)之间的标准化相关性,如下所示:
达到最高相关分数(通常高于0.9)的b(i)版本记录为帧i和i 1之间斑点运动的最佳估计值。有趣的是,随着对象进入和离开场景,最佳的平移和旋转参数通常会将一个斑点推到图像边界之外。
2.3流量修正
当前的斑点跟踪结果表示对场景中对象执行的旋转和平移的最佳估计。通过对每个斑点的连续像素坐标应用相应的二维变换,获得表示每个像素从其原始位置移动的矢量图vi。如果(i 1)的当前估计称为ir(i 1),通过将vi向量应用于if(i)来重新生成。理想情况下,如果(i 1)所有的运动都纯粹是由于平移和旋转,那么Ir(i 1)看起来就像是(i 1)。在实践中,其他变换和灯光变化与透视投影的效果相结合,表明我们必须局部地改进运动估计。由于有大量用于计算视觉运动的算法可供选择,我们尝试了几种不同的算法,现在使用的是Black和Anandan提出的方法的稍微修改版本[2]。该方法计算了HIER-archical光流,找出了使红外(i 1)最佳弯曲为if(i 1)的运动矢量。其他局部运动估计算法的优点是显著的,但每种算法都有一个断点,当帧到帧变形或灯光变化过大时,可以达到该断点。
估计光流可以创建一个相对运动矢量图。该图与Vi中的初始运动矢量相结合。使用校正后的Vi重新生成的红外(I 1)图像与预期外观相比,其可见差异更小(见图2)。
3.渲染模糊
动画制作人员想要的帧到帧的转换现在已经被近似了。我们继续插入像素模糊的路径。
一个vi图告诉我们在哪里移动在时间tlt;
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[18546],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。