插画风格的相似外文翻译资料

 2022-12-12 17:17:11

英语原文共 9 页,剩余内容已隐藏,支付完成后下载完整资料


插画风格的相似

图1:最左边的成分是由从一个数据集的200K的剪贴画搜索的关键字选择产生:狗,树,太阳,云,和花。不幸的是,剪辑艺术的风格是不一致的。我们的风格相似的功能,可以用来重新排序的搜索结果的风格。三个场景是由固定一个元素生成,然后寻找风格相似的剪辑艺术与上述关键词。在每一种情况下,额外的剪辑艺术选择从前十二返回的结果(数千)。

摘要:

本文提出了一种在风格上测量相似性的方法,在两个矢量艺术风格,独立的内容。相似性是由四种特征之间的差异来衡量:颜色,阴影,纹理,和中风。特征权重是众包实验学。这种感性的相似性在相同风格的基础搜索。用我们的风格为基础的搜索功能,我们展示了一个应用程序,允许用户创建风格连贯性剪辑艺术混搭。

铬类:i.3.6 [图形]:方法与技术[ M ]:我的计算机图形学的杂项;

关键词:风格,插图,学习,人群采购

1引言

矢量艺术是二维计算机图形学中最常见的形式之一。剪贴画库包含了几百个你的作品,设计的矢量艺术作品被复制成文档和插图。这些集合通常由OB项目类别标记;常见物品的搜索(如“狗”)产生大量的结果。然而,还有另一个方面的VEC Tor艺术目前很难寻找:风格。剪辑艺术来源于许多艺术家和许多来源,在一个广阔的VI视觉风格,包括素描、版画、漫画、和渐变;有的很卡通,异想天开,而另一些更专业的。因为剪贴画来自不同的来源,非常不一致的标签,这些数据集缺乏任何可靠的注释的艺术家或风格。

在叙述风格的模拟一直是非真实感绘制一个焦点[古奇和古奇2001 ],来理解风格的关注很少,没有好的工具存在的剪贴数据搜索或文体分析。事实上,这是基本上很难定义的一个简单的函数,描述了这些不同的风格。但是,随着近年来急剧增长,在泉的视觉内容可以在线和日益流行的数量混音和混搭艺术[ 2008 ] Lessig,文体搜索可能是许多设计中的应用价值。

本文提出了一种风格相似的剪辑艺术的功能。也就是说,我们的功能,我们的功能计算一个真正的价值衡量自己的风格相似,独立的内容(图1)。我们展示风格为基础的搜索,剪辑艺术搜索结果排序的相似性查询的艺术品。我们描述一个剪贴混搭应用样式的搜索帮助用户COM茎多件风格连贯的剪贴画成成分组成。例如,如果用户已经把房子和树在一个粗略的笔式到画布上,然后寻找一只狗,我们的应用程序重新排序的搜索结果,同样粗略的笔式狗最先显示。

我们计算我们的风格距离函数结合使用众包和机器学习。我们聚集了风格多样性的剪贴画集合。然后,一个大的选择的剪贴画的三胞胎,我们收集了Mechanical Turk(MTurk)的形式“收视率是剪贴画更类似风格的剪贴画B或C?“我们从这些评价中学习到了一种风格相似的模型。该模型是基于一组的特点,我们观察到的矢量艺术的风格描述。在总体上,我们计算169个功能的四个类别:颜色,阴影,纹理,和中风。相似的功能,是一个加权的特征向量的L2距离;权重是通过最大化的概率学MTurk评级。学习与稀疏之前产生一个最终的权重,有78个非零权重。我们的距离函数的性能进行了数值模拟独立的测试数据。我们还进行用户研究工程师,工人创造的混搭和式的搜索。我们发现,评价者判断混搭与风格的基础上创建的搜索更连贯,一般可取。

2相关工作

虽然有相当的努力,在计算机图形学的风格渲染,有较少的作品在艺术风格的分析。维拉特斯与杜兰德[ 2005 ]提供二维插图绘画风格要素概述。一个AP法风格的算法分析是学习的属性模型;即,一个模型,学会从头开始创建新实例的风格,如产生新的字体[ Tenen -鲍姆和弗里曼2000 ],并学习3D孵化方式从实例[该等人。2012 ]。第二类方法传递风格的例子,如传输[ hertzmann等人的绘画风格。2001 ],[裴某等人的摄影风格。2006,或曲线形式的二维形状[李等。2013 ]。我们的工作主要集中在一个不同的问题,即文体相似性的感性的措施,而不是合成。我们的知识,有没有以前的工作的感性相似性的矢量艺术。此外,上述方法不直接适用。生成模型从理论上可以被用来计算风格相似;然而,从实例创建一个生成剪贴画风格的模型,将前traordinarily困难。

图2:对于每一个功能类别,我们展示了两个片段的剪辑,其风格是非常不同的。彩色的例子对比了一个彩色插图从单色的。遮光的例子显示一个渐变阴影图与恒定的颜色区域。纹理的例子说明艺术模式的图像在一个木刻插图更多的随机模式。最后,中风的例子对一个粗略的说明用不同宽度的线下等宽平滑的轮廓。

虽然图像搜索和检索是视觉和图像分析[ Datta等人的标准问题。2008,基于风格的识别是罕见的。Murray等人。[ 2012 ]根据一些摄影风格分类照片。有在其他领域更多的例子;风格相似度函数来推荐音乐[ aucou - turier和包2002 ]和[ 2007 ]电影贝尔和科伦基于实例的偏好。夏米尔等。[ 2010 ]描述风格识别定义为画。doersch等人。[ 2012 ]承认不同城市的街道景观的风格。我们的方法,而不是专注于矢量艺术的风格。

最相关的工作,我们是从一种艺术集[ hurtut等人检索相似风格的素描方法。2011 ]。他们亲姿势特征计算行程轮廓,首先前提取图像描述线图的风格。他们的方法只适用于黑白线图,而我们的方法也可以测量颜色,阴影和纹理的差异。此外,我们的技术方法是不同的,我们收集的数据对人类感知的风格,并符合我们的风格相似的功能,这一数据。

最后,我们的混搭应用在重新分工,支持视觉一致的内容,可以组合成复合材料的照片数据库搜索的动机是相似的。照片剪贴画[ Lalonde等人。2007]发现照片和角度与目标场景一致的光的物体,而sketch2photo [陈等人。2009]产生照片复合材料从草图同时确保照片元素在视觉上一致的帐篷。

3剪辑艺术风格特点

建筑风格相似功能的第一步是定义识别和区分剪贴画风格的数字特征。铝虽然很难确切说明的特点,定义样式,还有一系列的立体感,可用于不同entiate一风格从另一个。这些线索包括基本的视觉属性如颜色、阴影和纹理,以及实际的标志如线,中风,和地区[杜2002、杜兰德;维拉特斯2005 ]。请注意,我们不需要决定这些特征如何区分风格,或它们的相对权重,我们的目标是

建立一个完备的功能,可以通过学习算法来适应我们的相似度函数使用的数据。

我们的特点是计算位图而不是矢量描述方法(例如,SVG)的原因有两个剪辑艺术。首先,计算位图为我们提供了灵活性,包括剪贴画是否矢量版本可用。其次,我们观察到一个令人吃惊的变化性内容相似向量描述。例如,一个简单的黑色行程可以被定义为线,路径,或多边形图元,甚至更糟,是增加一个较小的前景区域的一个黑色背景区域的结果。将这些陈述转换成一致的向量格式是一个研究挑战本身。

我们确定了四个主要方面,我们认为最好的特点风格的剪辑艺术:颜色,阴影,纹理和笔触。这些形式的169维特征向量为任何单个片段的剪辑艺术。图2显示了一些有代表性的例子,其风格是非常不同的,沿每个确定的方面。我们现在在一个高层次的列表中描述的功能,形成我们的特征向量;详细信息在附录中给出。

颜色。这些特点区分不同的颜色使用的风格;我们观察到的一些风格,包括黑白,单色,彩色,静音,明亮/饱和的颜色。值得注意的是,这些统计数字反映了而不是个人单独使用的颜色的颜色的使用方式。颜色特征是颜色的分布实施,包括均值和标准偏差的饱和度、亮度和色调,色彩丰富的几种措施,并主导颜色数。最后,灰色和黑色像素的百分比是有用的区分黑色和白色的颜色。

阴影。这些特点区分类型的阴影。一些款式很卡通的样子,用锋利的,简单的颜色变换等;也有更现实的材料与光滑梯度。我们描述了阴影与颜色和灰度梯度直方图。前捕获的整体外观和材料的ALS的彩色图像,后者捕捉阴影和中风之间转换,如果任何。

质地。这些特征捕捉图像的重复模式的存在。纹理定义了一个小规模的描绘对象的外观,并给出了一个直观的图像中的对象如何会感觉时,感动。纹理特征在计算机视觉中有悠久的历史;我们用局部二进制模式(LBP)[ Ojala等人。2002;诸等。2010 ]和[ 1973 ] Haralick特征。

中风。中风的类型是剪辑的艺术风格[ hurtut等人的一个重要因素。2011 ]。剪贴画通常在质地、厚度和重量上有所不同。这些特点都准备捕获的LBP特征,如笔画线厚度和均匀性。我们增加了额外的笔画特征使用笔画宽度变换(SWT)[ epshtein等人。2010 ],这是极好的最后发展到认识自然图像中的文字。SWT是一个局部算子近似的笔画宽度在每个像素。

图3:我们的MTurk相似采集界面截图。左:一个例子给用户在开始的测试,以确保他们理解的问题。右:一个实际的比较是三。

4收集相似信息

我们使用剪贴画两源来训练我们的模型:从艺术爆炸剪辑艺术、商业的收集了200000张剪贴画,并收集了3600剪辑艺术作品包括微软Office。前者收集采用众包收集风格相似的数据。相比之下,后者,更小的集合已经被组织成一组的文体相似。

我们手动从艺术爆炸的数据集,涵盖了广泛的风格和主题的1000幅图像。我们用机械的土耳其人(MTurk)的评分信息收集方式。每个测试(机械特克术语打击)五十题。我们收集到的数据相对比较[麦克菲和lanckriet 2011形式;舒尔茨和Joachims 2003 ]因为他们为评委提供比数值距离更容易。每个问题显示三张剪贴画,B,和C,和MTurk是问:“是者更类似于B或C?“(图-尤尔3。)为微软的数据,我们自动生成相对比较约束,通过随机抽样的三个样品,每个相对比较来自相同的方式组。

每一次攻击之前都有一个简短的培训课程,其中包括几个试验相对比较明显的答案,用户只能访问真正的考验,一旦他们正确地回答了所有的问题。共有313名用户参加,51.4%名女性。56.5%宣布了一些艺术经验,另外7.3%位自称有专业设计经验。每一个命中的持续时间约为十分钟,我们支付了0.30美元。五个控制问题被包括在每一个命中;2错误的控制问题被拒绝,拒绝率为21.5%。

5学习相似

本节介绍了我们学习风格相似性的基础上定义的特征向量的方法,在3节和4节的训练数据。我们的学习方法是使用前一种技术的结合,为我们的应用程序工作。让X和gamma;成为2片艺术的特征向量。我们的目标是学习欧氏距离度

D(x,y)=∥Xminus;Y∥W =(Xminus;Y)TW(xminus;y)(1)

由一个对角矩阵W这个问题得到很好的研究,被称为度量学习[ kulis 2013;舒尔茨和Joachims 2003 ]。我们的问题的事实,众包的相对的比较并不总是可靠的更加复杂;有工人在进行可靠性建模韦林德等人[分类的几种方法。2010 ]和搜索排名[陈等人。2013 ]。我们把这个可靠性问题最小化。首先,我们使用了一些控制和训练问题,拒绝不好的工作人员。其次,我们使用的每个评级[塔穆兹等人的概率逻辑公式。2011,期望更多的噪音相对比较不太清楚的答案。

具体而言,我们使用的度量学习方法的多诺万等人。[ 2014 ],谁适应塔穆兹等人的逻辑公式。[ 2011 ]对学习特征的情景:给定的剪辑艺术,B,和C,我们定义为Q = 1如果评委认为,A和B是相似的,和Q = 0如果评分状态A和C是相似的。我们参数化模型的权重矩阵的对角:W = diag(W)。我们模型的概率,用户率= 1给定的元组作为:

PA (q=1) = sigma;(d(xA,xC)minus;d(xA,xB)) (2) BC

sigma;(x) = 1/(1 exp(minus;x)) (3)

除了这个模型,我们的目标是规范sparsify

权重向量。因此我们认为拉普拉斯先验权重:

p(w) prop; exp(minus;lambda;||w||1) (4) 在lambda;是正则的重量。给定一组太古评级D = {(AI、BI、CI、七)},我们学习的权重w的最大后验估计,这需要最小化目标函数的工作

6相似函数评价

我们现在探讨的正则化项的影响,每个学习过程的性能,和训练数据的质量。训练集包括25540元组聚集通过亚马逊的Mechanical Turk和25000元组产生标记的数据从微软。

6.1特征选择

L1正则化的使用鼓励稀疏的权重。通过交叉验证,正则化的权重设置为lambda;= 1.3。阈值的步骤后,我们达成一个最终的权重向量与78个非零权重;91零重量的功能可以忽略不计。在补充材料中的权重。一些功能被视为无关(例如,对亮度和颜色的熵),而其他人可以覆盖一个较小的有限元的结构(例如,用几桶LBP不是所有)。最高的加权特征具有独特的色彩数;RGB颜色的数目是第二高。对LBP,Haralick,颜色渐变的几个垃圾箱,和笔划宽度特征也高度加权。权重表明这些高维特征可以在低维的组合简化为我们的应用

7 应用程序

我们应用我们的风格相似性度量在三个方面:集群化和VI -剪贴画风格的空间,进行搜索,并支持创建剪贴画组成的Mashup应用。

7.1剪辑艺术风格可视化

我们使用我们的风格距离函数的基础上,在我们的数据集可视化的不同风格的剪辑艺术。特别是,我们使用流行的T-SNE [ van der maaten和Hinton 2008 ];这项技术将高维特征向量到二维空间,类似的方式彼此靠近。创建图6中的可视化,我们整个数据集减少100例通过K-means的WX值,选择只有狗,然后执行T-SNE。我们可以观察到一个明显的分离方式;丰富多彩的增加从上到下,从左到右,画复杂的变化而变化。

7.2搜索

图10显示了典型的搜索查询结果使用我们的方法,我们显示了额外的500个例子,补充材料。左栏中的每个图像显示一个查询图像。下一列相显示的方法判断数据集是最相似的结果。在每一种情

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[30767],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。