英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料
基于局部阈值技术的印章提取和颜色分析
Chengyun Wang Zhenhua Guo Youbin Chen
清华大学深圳研究生院 清华大学深圳研究生院 清华大学深圳研究生院
中国深圳 中国深圳 中国深圳
wang.chengyun11@alum.sz. zhenhua.guo@sz.tsinghua.edu.cn chenyb@sz.tinghua.edu.cn
tsinghua.edu.cn
摘要:在本文中,我们提出了一种提取银行支票图像中印章的方法。因为印章经常是有颜色的,所以我们可以利用颜色信息来提取它们。首先,我们利用局部阈值技术来实现,将印章印记与背景区域区分开来。这一步不仅降低了提取问题的复杂性,也获得清晰的边缘。其次,我们利用R和G通道过滤机器打印的字符和噪声。最后,将我们方法的结果与其他传统方法进行了比较。 实验证明了我们的方法能够提取大多数情况下的中国印章。
关键词:印章提取,局部阈值处理,色彩空间,RGB。
1.引言
印章在东方国家有着悠久的历史(中国,日本,韩国等)。在中国,每天有各种印章图像需要进行验证或识别。以前,印章主要是手工处理。然而,这种疲惫的工作对人们来说非常耗时且容易出错。自20世纪80年代起,已经有人开始进行研究自动印章系统。这些系统总是包含很多模块和功能。在印章验证系统中,第一步是检测文档图像中的印章区域并提取印章。然后,使他们可以被光学字符识别(OCR)识别。在验证系统中,将印章与模板印章进行比较。通过比较,我们可以区分假印章。对于大多数印章系统,关键步骤是提取印章。它是基本程序,在很大程度上影响系统的准确性和有效性。各种背景(白色,蓝色,粉红色和黄色)在提取中成为一个很重要的挑战。在中国,银行支票图像中红色印章很常见。因此,我们的论文仅着重于提取红色印章。
迄今为止的各种印章提取方法中已经提出了利用颜色信息。在[2]中,在RGB(红色,绿色和蓝色)颜色空间通过正交投影到合适的轴来提取。三个峰值(印章,背景和签名)是在三维直方图中找到。通过投射,背景和签名合并为一个集群。然后可以通过全局阈值提取印章。在[3]提出的方法中,将印章图像从RGB色彩空间转换到HSV(色调,饱和度和强度)颜色空间,并通过饱和度直方图提取印章。在[4]中,RGB颜色空间在颜色归一化后被分成8个子空间,属于红色空间的像素被标记为印章。在[5]中,作者将图像转换为YCbCr(ITU-R BT.709标准)色彩空间,设置阈值以分离背景。然后使用k均值聚类算法区分不同的颜色。这种方法可以检测到任意形状和颜色的印章。在[6]中,作者将HSV色彩空间分成几个部分。一个模板图像是手工选择的,它用于将其他图像分为不同的部分(前景或背景)。然后使用自适应索沃拉的方法来获得准确边缘。在[7]中,首先使用灰色的全局阈值空间去除背景,然后R和G组合在一起以删除左侧打印的字符。
图1:(a)密度图像在饱和度或亮度方面不明显,传统方法的准确性不是很令人满意。(b)[3]中S分量法的提取结果。(c)[4]中的颜色归一化方法的提取结果。(d)[7]中R-G法的提取结果
传统方法在印章图像清晰时效果很好。然而,现实生活中的印章样本是各种各样的而且是低质量的。提到的一些方法需要修复参数且它们缺乏适应性。此外,应用于这些低质量的印章样本时,传统方法的准确性不太令人满意(如图1所示)。在此论文中,我们提出了一个两步框架来提取印章图片。首先,我们使用常见的局部阈值提取文档图像以消除印章图像的背景。其次,提出了一种新的印章图像提取通用公式。实验结果表明它比传统方法更具有适应性。
本文的结构如下:第二节介绍了在不同的背景区域区分印章区域的方法。第三节展示了如何消除印刷字符和噪音。第四节报告我们的实验结果。第五节得出结论。
2.前景分割
一般来说,印章图像基本上包含三个不同的组件(印章,背景和印刷字符)。 这些部分在银行支票中通常表现不同的颜色(印章为红色,印刷字符为灰色或黑色,背景为白色,黄色或其他颜色)。 印章提取是擦除背景和印刷字符。在本节中,我们将重点介绍如何消除背景。
我们将彩色图像转换为灰度图像。然后,背景删除任务类似于文档二值化。由于银行支票上的印章亮度变化很大,我们使用局部阈值消除背景。Niblack的方法[8]和索沃拉的方法[9]是两个受欢迎的传统方法。所以在本文中我们采用索沃拉的方式来消除背景,因为它产生更少的噪音。该方法的每个像素的值由(1)计算。
其中k和R是常数,m(i,j)是平均值窗口图像,s(i,j)是标准偏差,T(i,j)是像素(i,j)的阈值。
在(1)中,k被设置为常数值,这是不合理。当k非常小时,它总是会产生噪声如图2(b)所示。当它非常大,有些印章要素会丢失,如图2(e)所示。然而,对于不同的图像,适合的值变化很大(如图2所示,对于(a),最佳k为0.04而对于(f)最好的k是0.10)。 因此,该参数需要是自适应的。
但是,我们注意到当k在某个范围内时,它都适合二值化。因此,我们需要评估近似值而不是准确值。通过观察,我们发现适当的k会带来一些噪声。因此,一些小关联元素可用于选择适当的参数。在(2)式中,我们将P(k)定义为印章图像中的噪声密度。当k很小时,它会非常大。当我们增加k,它会慢慢减少。在我们的研究中,我们设置阈值。 当P(k)小于时,该值k被认为是一个合适的值。因此,我们可以得到一个适当的k值。
其中N是面积小于3像素的关联元素,S是印章图片面积,是(1)式中的参数。的值由实验设定。
图2:(a)和(f)的最佳k分别为0.04和0.10,如(c)和(j)所示。(a,f)灰度图像。(b,g)Sauvola方法,k = 0.01。(c,h)Sauvola的方法,k = 0.04。 (d,i)Sauvola的方法,k = 0.07。(e,j)Sauvola的方法,k = 0.10。
3.字符删除
A.传统方法的内在关系
对于我们在第二部分中得到的图像,接下来我们要做的是将红色印章与打印字符分开。打印字符的颜色始终是黑色或灰色。它与印章不同,所以我们可以使用颜色信息将它们分开。
图3(a)显示了具有白色背景的印章,属于背景的所有像素都是白色。这些前景像素的分布可以在图3(b)中看到。黑点代表印刷字符,而红点代表印章。这些点是线性分布(对于黑色像素,其R,G和B几乎相同;对于红色像素,G和B分量非常相似)。这意味着对于所有前景像素,G和B分量大致呈线性相关(我们可以通过实验得出这个结论)。 通过这个事实,我们可以将颜色特征从三个维度(R,G和B)减少到二维(R和G)。 此外,对于属于前景的像素,我们假设R不小于G(R分量小于G的那些像素可以被忽略,因为它们不是印章像素),并且B和G在式(5)中是等价的。
图3:(a)没有背景的印章。(b)(a),x和y轴的前景像素的分布分别是G和B分量。(c)R-G 256的直方图。(d)(a),x和y轴的前景像素的分布分别是R和G分量。(e)印刷字符删除的结果。
有许多颜色空间(RGB,HIS,HSV,YCbCr等)可以来进行彩色图像的分割。不同的色彩空间有不同的特征。RGB色彩空间非常适合显示图像。HSI色彩空间与人类视觉上的色差一致,此外,它显示每个颜色通道的低相关性。通过YCbCr色彩空间,我们可以轻松地分离红色或蓝色。HSV和HIS是相似的,它们的组成部分是相似的。使用以下公式可以轻松地从RGB转换为HIS或YCbCr。
传统方法在各种颜色空间中提取印章。在[3]中,使用S分量(印章比黑色打印区和白色背景区有更高的S)。在[10]中,Cr分量用于检测文档中的红色印章(红色印章比其他像素具有更高的Cr值)。在[7]中,R-G分量用于将红点与其他噪声分开。似乎不同的方法能在不同的颜色空间中提取印章。但是,这些方法在某种程度上是等同的。虽然这些方法通过不同的分割平面提取印章,但它们的效果非常类似。此外,HSV或YCbCr中的分割平面等同于RGB中的平面。我们将通过以下公式证明这一事实。
从式(5),(6),(7),我们可以发现所有这些组件都是相似的。传统方法之间的区别在于它们的系数alpha;是不同的。此外,公式(8)可以扩展到更一般的,即
其中w是形成不同投影方向的系数。在传统方法中,它被设置为固定值1.0。我们将在下一节讨论这些参数。
我们使用[6]中提供的方法(即R-G元素,alpha;在公式中为1,w在公式(9)中为1.0)来除去黑色字符。R-G 256元素的直方图(我们使用R-G 256而不是R-G来确保x轴从0开始)如图3(c)所示。其中有一个明显的山谷,可用作此阈值来消除字符。图3(e)显示了该步骤的最终结果。此外,我们可以在图3(d)中理解这个过程。图3(a)中的所有印章像素由红点表示。蓝线表示R-G方向的切割平面。它将空间分成两部分,线下方的这些点是我们需要的印章像素。
B.讨论参数w
[5]提出的这种方法在大多数情况下都能很好地工作。但是,它忽略了红印章的分布。对于一些不经过冲压的印章,部分冲程的饱和度非常低。对于这些像素,R和G非常接近。在这些情况下,R-G的直方图中没有明显的阈值。因此,我们无法取得令人满意的结果。图4(a)显示了具有白色背景的图像,其直方图如图4(b)所示,我们找不到合适的阈值。但是,我们可以获得另一个提取方向。在图4(d)中,红点代表图4(a)的印章像素,蓝线表示R-G投影方向,而绿线表示R-0.8 * G投影方向。我们可以看到,蓝线无法将它们分开。与蓝色相比,黑色是更合适的分割平面。图4(c)显示了R-0.8 * G直方图,并且存在明显的阈值。图4(e)显示了该方案的结果。
图4:(a)没有背景的印章。(b)R-G 256的直方图。(c)R-0.8 * G 256的直方图。 (d)(a),x和y轴的前景像素的分布分别是R和G分量。(e)删除打印字符的结果。
这意味着将w设置为传统方法中的固定值是不合适的。当参数1.0失败时,我们需要将w调整到适当的值并转向另一个切割平面 这个新的投影方向与R-G略有不同,但它可以工作。
为了获得合适的w,我们收集了446个印章图像。所有这些图像都来自真实的合同。 其中一些可以通过R-G投影方向提取,而其他一些则在w为1.0时失败。我们选择这些失败图像的一部分,对于每个图像,我们手动将它们分成两部分(印刷字符和红色印章)。 然后我们使用线性判别分析(LDA)来获得投影方向。w的值可以通过如下获得
其中代表两部分(印刷字符和红色印章)的R和G分量的矢量,是平均值,是像素数量,是类内散射矩阵,是集合在一起的类内散射矩阵。在本文中,LDA适当的w为0.8。
本文提出的方法可归纳为两个步骤。首先,w设置为1.0。如果我们找不到明显的阈值,我们将其改为0.8。虽然这种变化非常小,但效果很明显,可以带来更好的结果。
之后,我们需要做一些后期处理。由于局部阈值处理,存在许多小结构或小洞。字符删除步骤也会带来一些噪声。我们使用高斯平滑滤波器来降低噪声。结合[11]中的连通分量分析,我们可以填充部分小孔并获得更好的结果。
4.实验结果
A.不同方法的FM测量
在实验中,我们从真实的银行支票中收集了142张图片,这些图像具有不同的质量。有些背景很脏,前景也很模糊,这些因素给提取带来了很多困难。为了证明我们方法的有效性,我们使用不同的方法来提取这些图像。这些方法分别由[3],[4]和[7]提供。它们处理不同颜色空间(RGB和HSV)的印章。图5显示了不同结果的示例,可以发现我们的结果更稳定和准确。
图5:(a)原始图像。(b)地面真相图像。(c)S分量的结果[3]中的方法,其中FM为0.90。(d)[4]中的颜色归一化方法的结果,其中FM为0.92。(e)[7]中R-G方法的结果,其中FM为0.95。(f)拟议方法的结果,其中FM为0.96。
我们还使用Adobe Photoshop为所有这些图像制作实况模板。通过将不同方法的结果与模板进行比较,我们可以得出令人信服的结论。为了评估,我们采用FM作为衡量标准,即
其中TP,FP,FN分别表示真阳性,假阳性和假阴性值。
<s
剩余内容已隐藏,支付完成后下载完整资料</s
资料编号:[19825],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。