英语原文共 6 页，剩余内容已隐藏，支付完成后下载完整资料

基于局部阈值技术的印章提取和颜色分析

Chengyun Wang Zhenhua Guo Youbin Chen

清华大学深圳研究生院清华大学深圳研究生院清华大学深圳研究生院

中国深圳中国深圳中国深圳

wang.chengyun11@alum.sz. zhenhua.guo@sz.tsinghua.edu.cn chenyb@sz.tinghua.edu.cn

tsinghua.edu.cn

摘要：在本文中，我们提出了一种提取银行支票图像中印章的方法。因为印章经常是有颜色的，所以我们可以利用颜色信息来提取它们。首先，我们利用局部阈值技术来实现，将印章印记与背景区域区分开来。这一步不仅降低了提取问题的复杂性，也获得清晰的边缘。其次，我们利用R和G通道过滤机器打印的字符和噪声。最后，将我们方法的结果与其他传统方法进行了比较。实验证明了我们的方法能够提取大多数情况下的中国印章。

关键词：印章提取，局部阈值处理，色彩空间，RGB。

1.引言

印章在东方国家有着悠久的历史（中国，日本，韩国等）。在中国，每天有各种印章图像需要进行验证或识别。以前，印章主要是手工处理。然而，这种疲惫的工作对人们来说非常耗时且容易出错。自20世纪80年代起，已经有人开始进行研究自动印章系统。这些系统总是包含很多模块和功能。在印章验证系统中，第一步是检测文档图像中的印章区域并提取印章。然后，使他们可以被光学字符识别（OCR）识别。在验证系统中，将印章与模板印章进行比较。通过比较，我们可以区分假印章。对于大多数印章系统，关键步骤是提取印章。它是基本程序，在很大程度上影响系统的准确性和有效性。各种背景（白色，蓝色，粉红色和黄色）在提取中成为一个很重要的挑战。在中国，银行支票图像中红色印章很常见。因此，我们的论文仅着重于提取红色印章。

迄今为止的各种印章提取方法中已经提出了利用颜色信息。在[2]中，在RGB（红色，绿色和蓝色）颜色空间通过正交投影到合适的轴来提取。三个峰值（印章，背景和签名）是在三维直方图中找到。通过投射，背景和签名合并为一个集群。然后可以通过全局阈值提取印章。在[3]提出的方法中，将印章图像从RGB色彩空间转换到HSV（色调，饱和度和强度）颜色空间，并通过饱和度直方图提取印章。在[4]中，RGB颜色空间在颜色归一化后被分成8个子空间，属于红色空间的像素被标记为印章。在[5]中，作者将图像转换为YCbCr（ITU-R BT.709标准）色彩空间，设置阈值以分离背景。然后使用k均值聚类算法区分不同的颜色。这种方法可以检测到任意形状和颜色的印章。在[6]中，作者将HSV色彩空间分成几个部分。一个模板图像是手工选择的，它用于将其他图像分为不同的部分（前景或背景）。然后使用自适应索沃拉的方法来获得准确边缘。在[7]中，首先使用灰色的全局阈值空间去除背景，然后R和G组合在一起以删除左侧打印的字符。

图1：（a）密度图像在饱和度或亮度方面不明显，传统方法的准确性不是很令人满意。（b）[3]中S分量法的提取结果。（c）[4]中的颜色归一化方法的提取结果。（d）[7]中R-G法的提取结果

传统方法在印章图像清晰时效果很好。然而，现实生活中的印章样本是各种各样的而且是低质量的。提到的一些方法需要修复参数且它们缺乏适应性。此外，应用于这些低质量的印章样本时，传统方法的准确性不太令人满意（如图1所示）。在此论文中，我们提出了一个两步框架来提取印章图片。首先，我们使用常见的局部阈值提取文档图像以消除印章图像的背景。其次，提出了一种新的印章图像提取通用公式。实验结果表明它比传统方法更具有适应性。

本文的结构如下：第二节介绍了在不同的背景区域区分印章区域的方法。第三节展示了如何消除印刷字符和噪音。第四节报告我们的实验结果。第五节得出结论。

2.前景分割

一般来说，印章图像基本上包含三个不同的组件（印章，背景和印刷字符）。这些部分在银行支票中通常表现不同的颜色（印章为红色，印刷字符为灰色或黑色，背景为白色，黄色或其他颜色）。印章提取是擦除背景和印刷字符。在本节中，我们将重点介绍如何消除背景。

我们将彩色图像转换为灰度图像。然后，背景删除任务类似于文档二值化。由于银行支票上的印章亮度变化很大，我们使用局部阈值消除背景。Niblack的方法[8]和索沃拉的方法[9]是两个受欢迎的传统方法。所以在本文中我们采用索沃拉的方式来消除背景，因为它产生更少的噪音。该方法的每个像素的值由（1）计算。

其中k和R是常数，m(i,j)是平均值窗口图像，s(i,j)是标准偏差，T(i,j)是像素（i,j）的阈值。

在（1）中，k被设置为常数值，这是不合理。当k非常小时，它总是会产生噪声如图2（b）所示。当它非常大，有些印章要素会丢失，如图2（e）所示。然而，对于不同的图像，适合的值变化很大（如图2所示，对于（a），最佳k为0.04而对于（f）最好的k是0.10）。因此，该参数需要是自适应的。

但是，我们注意到当k在某个范围内时，它都适合二值化。因此，我们需要评估近似值而不是准确值。通过观察，我们发现适当的k会带来一些噪声。因此，一些小关联元素可用于选择适当的参数。在（2）式中，我们将P(k)定义为印章图像中的噪声密度。当k很小时，它会非常大。当我们增加k，它会慢慢减少。在我们的研究中，我们设置阈值。当P(k)小于时，该值k被认为是一个合适的值。因此，我们可以得到一个适当的k值。

其中N是面积小于3像素的关联元素，S是印章图片面积，是（1）式中的参数。的值由实验设定。

图2:（a）和（f）的最佳k分别为0.04和0.10，如（c）和（j）所示。（a，f）灰度图像。（b，g）Sauvola方法，k = 0.01。（c，h）Sauvola的方法，k = 0.04。（d，i）Sauvola的方法，k = 0.07。（e，j）Sauvola的方法，k = 0.10。

3.字符删除

A.传统方法的内在关系

对于我们在第二部分中得到的图像，接下来我们要做的是将红色印章与打印字符分开。打印字符的颜色始终是黑色或灰色。它与印章不同，所以我们可以使用颜色信息将它们分开。

图3（a）显示了具有白色背景的印章，属于背景的所有像素都是白色。这些前景像素的分布可以在图3（b）中看到。黑点代表印刷字符，而红点代表印章。这些点是线性分布（对于黑色像素，其R，G和B几乎相同；对于红色像素，G和B分量非常相似）。这意味着对于所有前景像素，G和B分量大致呈线性相关（我们可以通过实验得出这个结论）。通过这个事实，我们可以将颜色特征从三个维度（R，G和B）减少到二维（R和G）。此外，对于属于前景的像素，我们假设R不小于G（R分量小于G的那些像素可以被忽略，因为它们不是印章像素），并且B和G在式（5）中是等价的。

图3:（a）没有背景的印章。（b）（a），x和y轴的前景像素的分布分别是G和B分量。（c）R-G 256的直方图。（d）（a），x和y轴的前景像素的分布分别是R和G分量。（e）印刷字符删除的结果。

有许多颜色空间（RGB，HIS，HSV，YCbCr等）可以来进行彩色图像的分割。不同的色彩空间有不同的特征。RGB色彩空间非常适合显示图像。HSI色彩空间与人类视觉上的色差一致，此外，它显示每个颜色通道的低相关性。通过YCbCr色彩空间，我们可以轻松地分离红色或蓝色。HSV和HIS是相似的，它们的组成部分是相似的。使用以下公式可以轻松地从RGB转换为HIS或YCbCr。

传统方法在各种颜色空间中提取印章。在[3]中，使用S分量（印章比黑色打印区和白色背景区有更高的S）。在[10]中，Cr分量用于检测文档中的红色印章（红色印章比其他像素具有更高的Cr值）。在[7]中，R-G分量用于将红点与其他噪声分开。似乎不同的方法能在不同的颜色空间中提取印章。但是，这些方法在某种程度上是等同的。虽然这些方法通过不同的分割平面提取印章，但它们的效果非常类似。此外，HSV或YCbCr中的分割平面等同于RGB中的平面。我们将通过以下公式证明这一事实。

从式（5），（6），（7），我们可以发现所有这些组件都是相似的。传统方法之间的区别在于它们的系数alpha;是不同的。此外，公式（8）可以扩展到更一般的，即

其中w是形成不同投影方向的系数。在传统方法中，它被设置为固定值1.0。我们将在下一节讨论这些参数。

我们使用[6]中提供的方法（即R-G元素，alpha;在公式中为1，w在公式（9）中为1.0）来除去黑色字符。R-G 256元素的直方图（我们使用R-G 256而不是R-G来确保x轴从0开始）如图3（c）所示。其中有一个明显的山谷，可用作此阈值来消除字符。图3（e）显示了该步骤的最终结果。此外，我们可以在图3（d）中理解这个过程。图3（a）中的所有印章像素由红点表示。蓝线表示R-G方向的切割平面。它将空间分成两部分，线下方的这些点是我们需要的印章像素。

B．讨论参数w

[5]提出的这种方法在大多数情况下都能很好地工作。但是，它忽略了红印章的分布。对于一些不经过冲压的印章，部分冲程的饱和度非常低。对于这些像素，R和G非常接近。在这些情况下，R-G的直方图中没有明显的阈值。因此，我们无法取得令人满意的结果。图4（a）显示了具有白色背景的图像，其直方图如图4（b）所示，我们找不到合适的阈值。但是，我们可以获得另一个提取方向。在图4（d）中，红点代表图4（a）的印章像素，蓝线表示R-G投影方向，而绿线表示R-0.8 * G投影方向。我们可以看到，蓝线无法将它们分开。与蓝色相比，黑色是更合适的分割平面。图4（c）显示了R-0.8 * G直方图，并且存在明显的阈值。图4（e）显示了该方案的结果。

图4:（a）没有背景的印章。（b）R-G 256的直方图。（c）R-0.8 * G 256的直方图。（d）（a），x和y轴的前景像素的分布分别是R和G分量。（e）删除打印字符的结果。

这意味着将w设置为传统方法中的固定值是不合适的。当参数1.0失败时，我们需要将w调整到适当的值并转向另一个切割平面这个新的投影方向与R-G略有不同，但它可以工作。

为了获得合适的w，我们收集了446个印章图像。所有这些图像都来自真实的合同。其中一些可以通过R-G投影方向提取，而其他一些则在w为1.0时失败。我们选择这些失败图像的一部分，对于每个图像，我们手动将它们分成两部分（印刷字符和红色印章）。然后我们使用线性判别分析（LDA）来获得投影方向。w的值可以通过如下获得

其中代表两部分（印刷字符和红色印章）的R和G分量的矢量，是平均值，是像素数量，是类内散射矩阵，是集合在一起的类内散射矩阵。在本文中，LDA适当的w为0.8。

本文提出的方法可归纳为两个步骤。首先，w设置为1.0。如果我们找不到明显的阈值，我们将其改为0.8。虽然这种变化非常小，但效果很明显，可以带来更好的结果。

之后，我们需要做一些后期处理。由于局部阈值处理，存在许多小结构或小洞。字符删除步骤也会带来一些噪声。我们使用高斯平滑滤波器来降低噪声。结合[11]中的连通分量分析，我们可以填充部分小孔并获得更好的结果。

4.实验结果

A.不同方法的FM测量

在实验中，我们从真实的银行支票中收集了142张图片，这些图像具有不同的质量。有些背景很脏，前景也很模糊，这些因素给提取带来了很多困难。为了证明我们方法的有效性，我们使用不同的方法来提取这些图像。这些方法分别由[3]，[4]和[7]提供。它们处理不同颜色空间（RGB和HSV）的印章。图5显示了不同结果的示例，可以发现我们的结果更稳定和准确。

图5:（a）原始图像。（b）地面真相图像。（c）S分量的结果[3]中的方法，其中FM为0.90。（d）[4]中的颜色归一化方法的结果，其中FM为0.92。（e）[7]中R-G方法的结果，其中FM为0.95。（f）拟议方法的结果，其中FM为0.96。

我们还使用Adobe Photoshop为所有这些图像制作实况模板。通过将不同方法的结果与模板进行比较，我们可以得出令人信服的结论。为了评估，我们采用FM作为衡量标准，即

其中TP，FP，FN分别表示真阳性，假阳性和假阴性值。

剩余内容已隐藏，支付完成后下载完整资料</s

资料编号：[19825]，资料为PDF文档或Word文档，PDF文档可免费转换为Word

原文和译文剩余内容已隐藏，您需要先支付 30元 才能查看原文和译文全部内容！立即支付

以上是毕业论文外文翻译，课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。

注册

找回密码

基于局部阈值技术的印章提取和颜色分析外文翻译资料

基于局部阈值技术的印章提取和颜色分析

您可能感兴趣的文章

登录

基于局部阈值技术的印章提取和颜色分析

您可能感兴趣的文章