英语原文共 15 页,剩余内容已隐藏,支付完成后下载完整资料
对于高密度二维码中心偏测量的模块识别
Iuliia Tkachenko,William Puech , Olivier Strauss , Jean-Marc Gaudin ,Christophe Destruel , Christian Guichard
摘要:如今随着存储的信息量增加,条形码尺寸减小,高密度二维码非常受欢迎的。但是,由于大多数智能手机和平板扫描仪的读写问题,高密度版本的二维码未被广泛使用。因为变化频繁,黑,白色模块尺寸较小,所以在二维码的二值化、倾斜校正过程中存在的读取问题。二值化方法设置全局或局部阈值,并且将每个像素点单独二值化,因此对于打印扫描的失真和亮度比较敏感。在本文中,我们关注高密度二维码的识别,提出使用的中心偏差模块,来提高模块识别的结果。这种方法已被用于分类以及对于标准二维码的识别。实验结果已经证实,在这两个情况下,识别率均得到提高。
关键词: 高密度二维码 模块识别 模块中心偏差 加权均方误差
- 介绍
今天使用条形码来存储信息很受欢迎。我们可以在广告,飞机上和演唱会门票,名片,甚至在博物馆和产品的包装上看见二维码。但是随着存储的信息量增加,条形码尺寸减小,这意味着代码存储容量大小是当前的重要问题。例如,高容量的二维条形码,大量数据的压缩技术在参考文献[1]中涉及。在[2]中,作者设计一个高效的多级二维条形码。目前,最受欢迎的条形码是快速响应——QR码。QR码有很多优点,例如面积小,容量高,密度大并且它有纠错能力以及创建和阅读过程简单。二维码依据存储容量有40个版本。低容量QR码(版本1-10),如图1a。这类二维码到处都可以看见,因为他们阅读过程简单,但我们只能存储一个网页地址或一个简短的广告信息。高版本二维码(版本35-40)在日常生活中,因为读取问题不是很受欢迎。随着模块大小的减少,这些代码的识别率下降。然而,在近的几年,在文档安全以及生物识别领域,大容量的二维条形码变得越来越重要。例如,在[3]提出使用数字签名和QR码文件认证。在[4]中,为了个人身份识别,面部生物识别技术存储在大容量的条形码。
高密度QR码,也可用于多媒体自动跟踪和管理应用程序,例如打印文件的跟踪(纳税申报表、发票)。在这个应用场景中,行政信息存储在高密度二维码,插入该文档。这个文档被办公室的打印机打印使用。最后,为了进行自动跟踪和交易,使用办公室的扫描仪扫描该文档。此方案我们还的研究中。
图1 二维码演进:(a)二维码V10 57*57模块 (b) 二维码V40 177*177模块,
高密度条码识别其中一个主要问题由于是打印扫描(Pamp;S)的影响,改变了条形码像素值。打印扫描过程,主要由于违背物理过程和随机变化的性质,被认为是一个物理非克隆方法。在打印扫描过程中最重要的变换是伽马调整,数字半色调,网点增大,点到点,扫描仪gamma;补偿、数字化、几何转移和随机噪声(这通常是由一个加法或乘法高斯过程)。这些参数产生的特定图像,人类视觉系统有的可见有的不可见。有很多的实验,研究了打印扫描通道的影响。在[8]中,作者研究喷墨打印机带来的影响,特别是半色调和逆半色调处理。作者在[7]研究激光打印机的几何失真和半色调过程。其他重要参数,如指定每英寸点数(dpi),打印机和扫描仪分辨率[9]。打印机的分辨率决定每个像素点的数量。扫描仪分辨率决定扫描的文档像素的数量。
尽管在高版本的二维码中的错误错码的出现,大多数现有的iOS和Android应用程序,以及平板扫描仪都无法识别QR版本或存储的信息。打印扫描过程改变了二维码的特点,如几何(大小、方向)和光度。低密度的二维码,这些特征可以很容易纠正,但高密度QR码不符合这样的情况。
在本文中,我们引入一个基于中心偏的新测量。中心偏差测量的使用可以提高高密度QR码黑,白模块的识别。针对这个新算法,已经用版本40二维码测试超过10000个样本。
本文内容安排如下,在第二节介绍二维码特性,以及介绍编码和解码算法;第三节中概述中心偏差测量;第四节介绍了识别方法;在第五节与现有的方法给出了实验结果和比较;最后我们在第六节做出总结。
2,二维码的描述
QR码是由日本电装公司浪潮。QR码的目标应用程序是日本的汽车工业。因此,这段代码创建遵循两个特点:(1)小区域大容量,(2)高速扫描和阅读过程。此外,二维码编码模型有四个标准:数字、字母数字,字节/二进制和汉字。由于这些特性,二维码在其他应用领域已变得非常流行。二维码被国际标准化组织(ISO)认证,规范定义在[10]。
默认情况下,二维码是一个黑白图像(或者两种对比色的图像),其中每个信息相关联的一些模块(黑色或白色)。然而,今天,我们也可以找到五彩缤纷的QR码,这可以成为一个审美选择[11]或增加存储容量的解决方案。存储所有信息与Reed-Solomon纠错编码代码[13]。
QR码的结构包含一些特定的区域:位置区域,调整区域,定位区域,格式信息模式和版本模式。每一个二维码有三种位置模式,正确的二维码取向1:1:3:1:1暗光比率。对齐模式从版本2以后的二维码均提供。这些模式也有特定的形式与1:1:1:1:1暗光比率,和用于代码变形调整。定位模式为了设置的二维码模块的坐标。模式包含信息的格式,信息纠错水平和符号模式用于创建符号。信息模式采用BCH码的编码格式[13],并且在二维码中进行复制。最后,二维码版本和纠错位存储在版本模式,版本的模式也复制在二维码中。二维码的结构以及模式位置,如图2。
如前所述,有40个版本的二维码取决于存储容量。最小的二维码版本是版本1,是21*21模块大小和最大容许的152数据位数量,校正水平最低。二维码最高版本是40,有177*177模块的大小。最低校正水平版本40允许存储7089数据位。
每个二维码版本可以使用四个误差校正水平存储信息:(1)低,恢复7%;(2)中,恢复15%; (3)四分点,恢复25%的码字;(4)高,恢复30%。从逻辑上讲,最高存储容量对应于最低的误差校正水平。
二维码生成算法:包括以下步骤。首先,输入带有校正水平的ReedSolomon数据编码。形成比特流,划分8位的码字。码字形成块,这里面的块中增加了纠错码。然后,覆盖模式用于屏蔽码字。码字从右下角放置到顶部的左上角,以“Z”型行进。由于存在对齐模式和交叉纠错块,复杂的码字用于最高的二维码版本。在最后一步中,各种功能(位置、对齐方式、时间、格式和版本模式)放置到二维码。QR代码生成几个应用可以很容易在互联网上找到。
二维码识别算法:包括三个步骤:(1)预处理;(2)二值化;(3)解码算法。我们应该注意,在预处理后进行二值化,并在图3中给出了主要步骤。灰度图像与旋转二维码信息的输入。首先,位置定位,然后,应用一套重采样过程来确定的二维码大小和正确的方向。之后,识别黑白模块,完成之前应用标准的解码算法,输出提取的信息。
预处理:在这一步我们执行图像几何校正。首先,我们定位的位置。标准的过程是基于搜索区域1:1:3:1:1暗光比率。边缘检测器用于方形轮廓位置模式本地化。由于常规结构的二维码的霍夫变换检测和定位可以使用。霍夫变换是用来检测二维码的四个角落地区。在[17]中,作者结合霍夫变换和自适应阈值和纹理分析来定位二维码正确颜色。作者在[18]也用霍夫变换和二维码边缘梯度分布的性质的来定位高分辨率图像QR码。
定位后,二维码用最近或双线性插值方法重新取样,确定坐标位置模式。作者建议使用双线性插值方法,因为结果图像的质量清晰。在[20]中,基于几何的角搜索算法和边界建模,提出了用抛物线方程3D失真的校正。这样就创建一个确定大小与方向的二维码。
二值化:在这个步骤中,我们从灰度图像得到黑白图像。不同的二值化方法已经提出了文档二值化[21]。其中有些方法已经适应了二维码二值化就像大津算法,Niblack方法或Sauvola文档二值化方法一样。我们可以将现有二值化方法分三大组:全局阈值方法,混合(全球和本地)阈值方法和局部阈值方法。
标准的二维码是基于全局阈值二值化算法。全球图像阈值在图像中计算中间值之间的最大和最小反射率[10]。这种方法非常简单,但非均匀照明条件下,它是低效的[22]。另一个流行的全局阈值方法是大津算法[23]。这个算法的阈值选择通过最小化类内方差。二值化方法不能有效的执行可变光照条件和低分辨率的图像来扫描QR符号。
图2 二维码的结构
图3 二维码识别算法的主要步骤
以下两种方法是混合二值化方法,因为我们通过使用局部阈值计算全局阈值。在[24]中,作者提出了计算全局阈值实验。选择QR码图像的中心附近九个60*60像素块。这些块被认为是用来定义黑白亮度之间阈值水平的采样点。每个部分的局部阈值计算平均亮度值。然后,全球阈值被定义为最小值在所有计算局部阈值。
作者在[22]提出一种自适应多级阈值方法,局部与全局阈值结合。他们提出的过滤灰度图像直方图和分析直方图峰值特性。过滤后的直方图按照双峰分布,全球阈值等于最低的槽对应的值或中间值。直方图峰值,他们采用了迭代阈值方法,计算阈值作为一个之前全局阈值和平均值之间的黑暗或光明的中心地区。使用的局部阈值算法用于多峰分布直方图。
在可变光照条件的情况下,使用局部阈值方法更好。[25]的实验结果表明,使用Niblack后处理似乎是最合适的。纠正的窗口大小,消除块效应和减少执行时间是局部阈值方法主要的问题。作者在[26]使用一个修改版的Niblack算法,对于一个给定的点,阈值设置为点邻域的平均灰度。
基于改进的背景灰度二值化算法在[27]有介绍,计算每个子块的灰度值,然后使用插值算法构建灰度图像,最后用大津算法来二值化。这种改进的二值化算法能有效纠正的非均匀光照条件下的QR码。
有效Sauvola的文档自适应二值化方法[28]被修改来解决二维码图像二值化问题。作者在[29、30]使用Sauvola的阈值用于二维码的过程中的局部阈值。然后,之前的二值化结果通过略微改变阈值公式而改善。
提出了所有二值化方法使用直方图定义全局或局部的阈值。全局阈值二值化方法对于光照变化和频繁的像素灰度值的变化情况并不是很有效,如高密度QR码。
在文档还有two-pass算法的二值化方法,这些都是命名为局部自适应阈值方法[21]。在[32]中,作者设置低和高阈值,然后通过使用克里格指示使像素位于这些阈值之间。作者[33]在第一阶段使用全局阈值,在第二阶段完成当地的细化过程。
其他类型的文档二值化方法是基于机器学习算法。作者在[34]使用相机支持向量机方法产生二值化的文档图像。尽管如此,这种方法需要检测过程,这会产生人类训练集的标签。
在这篇文章中,我们建议采用新两路二维码二值化方法。它使用了二值化改进的第二阶段。同时该方法是基于一种无监督的机器学习方法,第一阶段获得结果,第二阶段二值化。
解码算法:在二维码识别算法的最后一步,标准的QR码译码器[10]应用于重新采样以及二值化二维码图像。
- 提出中心偏差测量(WMSE)
在本文中,我们专注于二值化改进。加权均方误差(WMSE)衡量,考虑到了一个事实,提出了模块边界相互影响以及由于打印扫描失真改变像素值。这意味着增加中央像素的重要性和为每个模块减少边界像素的意义。我们建议使用WMSE测量模块分类,增加了二维码识别率。此外,WMSE测量可用于改善ISO和大津法二值化方法。
[35]对相邻像素的灰度值影响扫描灰度像素值提出了实验。建议的措施是信息放在基于模块的中心像素,而不是模块边界像素。事实上,中央像素更好地代表模块。此外,一个模块的边界可以影响另一个模块的边界,所以边界像素值并不代表正确的模块。如图4 (a)黑色模块周围白色模块,(b)打印扫描过程后,黑色模块周围白色模块的变化。(c)白色模块周围黑色模块,(d)打印扫描过程后,白色模块周围黑色模块的变化。因此我们建议通过WMSE措施增加每个模块的中心像素,减少像素边界。
考虑模块M是个的正方形块(K 1)^2像素(k是一个正整数)。模块的结构见图5。左上角像素位置p(-k/2,-k/2,),右下角像素位置p(k/2,k/2)和中央像素p(0,0)。一个原始模块之间的WMSE M(黑色模块Mb或白色模块Mw)。打印扫描模块Mrsquo;(像素点p(i,j) )
其中,
和f(i,j)函数赋予中央像素更多的权重,N是权重。
图4 (a)黑色模块周围白色模块,(b)打印扫描过程后,黑色模块周围白色模块的变化, (c)白色模块周围黑色模块,(d)打印扫描过程后,白色模块周围黑色模块的变化,
图5 (k 1)^2像素组成的模块结构。
在本文f(i,j)我们建议使用:
K是权重,给定模块的中心值,K是实数并且满足Kgt;1状况。因此,对于N有
事实上,权重参数K,当K满足Kgt;1条件,作为四连接像素的权重(上,下,左,右)中央像素p(0,0)并不等于0。如果我们不满足这种情况,只需考虑中心像素二值化。这是不能接受的,因为小的错误,整个二维码二值化将有错误。在图6中,我们画出依赖的权函数f参数K四连接像素,例如像素点p(0,1)。每个四连接像素我们认为大约权重K=10时约等于1,当增加K值,中央像素的减少的重要性。
- 用WMSE测量的识别方法
本节旨在使用WMSE测量目前提出的识别方法。在4.1节中,提出了一种新的分类方法。这
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[28940],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。