The book and its support
Each chapter of the book presents a particular package of information concerning feature
extraction in image processing and computer vision. Each package is developed from its
origins and later referenced to more recent material. Naturally, there is often theoretical
development prior to implementation (in Mathcad or Matlab). We have provided working
implementations of most of the major techniques we describe, and applied them to process
a selection of imagery. Though the focus of our work has been more in analysing medical
imagery or in biometrics (the science of recognising people by behavioural or physiological
characteristic, like face recognition), the techniques are general and can migrate to other
application domains.
You will find a host of further supporting information at the bookrsquo;s website http://
www.ecs.soton.ac.uk/~msn/book/.First, you will find the worksheets (the Matlab
and Mathcad implementations that support the text) so that you can study the techniques
described herein. There are also lecturing versions that have been arranged for display via
a data projector, with enlarged text and more interactive demonstration. The website will
be kept as up to date as possible, for it also contains links to other material such as websites
devoted to techniques and to applications, as well as to available software and on-line
literature. Finally, any errata will be reported there. It is our regret and our responsibility
that these will exist, but our inducement for their reporting concerns a pint of beer. If you
find an error that we donrsquo;t know about (not typos like spelling, grammar and layout) then
use the mailto on the website and we shall send you a pint of good English beer, free!
There is a certain amount of mathematics in this book. The target audience is for third
or fourth year students in BSc/BEng/MEng courses in electrical or electronic engineering,
or in mathematics or physics, and this is the level of mathematical analysis here. Computer
vision can be thought of as a branch of applied mathematics, though this does not really
apply to some areas within its remit, but certainly applies to the material herein. The
mathematics essentially concerns mainly calculus and geometry though some of it is rather
more detailed than the constraints of a conventional lecture course might allow. Certainly,
not all the material here is covered in detail in undergraduate courses at Southampton.
The book starts with an overview of computer vision hardware, software and established
material, with reference to the most sophisticated vision system yet lsquo;developedrsquo;: the human
vision system. Though the precise details of the nature of processing that allows us to see
have yet to be determined, there is a considerable range of hardware and software that
allow us to give a computer system the capability to acquire, process and reason with
imagery, the function of lsquo;sightrsquo;. The first chapter also provides a comprehensive bibliography
of material you can find on the subject, not only including textbooks, but also available
software and other material. As this will no doubt be subject to change, it might well be
worth consulting the website for more up-to-date information. The preference for journal
references are those which are likely to be found in local university libraries, IEEE
Transactions in particular. These are often subscribed to as they are relatively low cost, and
are often of very high quality.
The next chapter concerns the basics of signal processing theory for use in computer
vision. It introduces the Fourier transform that allows you to look at a signal in a new way,
in terms of its frequency content. It also allows us to work out the minimum size of a
picture to conserve information, to analyse the content in terms of frequency and even
helps to speed up some of the later vision algorithms. Unfortunately, it does involve a few
x Preface
equations, but it is a new way of looking at data and at signals, and proves to be a rewarding
topic of study in its own right.
We then start to look at basic image processing techniques, where image points are
mapped into a new value first by considering a single point in an original image, and then
by considering groups of points. Not only do we see common operations to make a picturersquo;s
appearance better, especially for human vision, but also we see how to reduce the effects
of different types of commonly encountered image noise. This is where the techniques are
implemented as algorithms in Mathcad and Matlab to show precisely how the equations
work.
The following chapter concerns low-level features which are the techniques that describe
the content of an image, at the level of a whole image rather than in distinct regions of it.
One of the most important processes we shall meet is called edge detection. Essentially,
this reduces an image to a form of a caricaturistrsquo;s sketch, though without a caricaturistrsquo;s
exaggerations. The major techniques are presented in detail, together with descriptions of
their implementation. Other image properties we can derive include measures of curvature
and measures of movement. These also are covered in this chapter.
These edges, the curvature or the motion need to be grouped in some way so that we can
find shapes in an image. Our first approach to shape extraction concerns analysing the
match of low-level information to a known template of a target
剩余内容已隐藏,支付完成后下载完整资料
图像频域处理
这本书的每一章都提供了关于图像提取处理和计算机显示方面的特定信息方案。每个方案基于最新的研究以及原创观点。当然,理论依据的提出往往是优先于实现手段的(无论是在Mathcad或是在Matlab中)。我们提供了主要技术上的实现手段,并且将其用于图像选取。尽管我们的工作重心在于医学上的图像分析以及生物识别技术(通过行为以及生理特征进行人物识别的学科,比如面部识别技术),但这些技术本身是具有普适性的,可以迁移到其他应用领域当中。
你可以在这本书的网站http://www.ecs.soton.ac.uk/~msn/book/中找到更多的相关信息。首先,你会找到一份工作列表(Matlab和Mathcad的实现方式),你可以再次了解它的技术描述。也有适配数字投影仪显示的文字讲演版本,带有放大的字体以及更多的可互动的示范范例。网站将尽可能的跟进最新的研究成果,网站也包涵许多去往其他素材,比如那些致力于技术和应用的网站,可用的软件以及在线文本编辑的链接。最后,所有的勘误都将被展示出来。这些谬误的存在是我们的失误,改正它们是我们的责任所在。但作为勘误的回报,我们能提供给你的是一品脱啤酒。如果你发现了我们所不知道的错误(除了如拼写,语法和排版的打印错误),我们将邮寄给你一品脱优质的英国品酒,免费!书中的数据有一个确切的总量。这本书的目标读者是BSc/BEng/MEng电子和电子工程或者数学,物理方面课程第三及第四年的学生,这是数学分析的门槛。计算机的显示可以被认为是一系列应用数据,尽管它们并不会真的被用于它传输的一些区域,但它的在此确会被用于这些素材。这些数学拱墅主要关于微积分和几何尽管其中的一些比传统课程允许的内容更加详尽。诚然,并不是所有这些材料都在Southampton低年级的课程中普及。这本书以计算机图像硬件,软件及生产材质的总览开头,并且参照最精妙复杂却没有完全开发的,人类的视觉系统。尽管让我们得以拥有视觉的准确图像处理细节还有待确定,但关于软硬件却有一个客观的界限得以让我们给予电脑获取,处理图像的能力,我们称之为“视觉”。第一章同时也提供了与这个课题相关的生物学依据,不仅包括文本,还有软件及其他素材。这无疑会协助网站获得最新的信息。杂志的引用偏好是那些可以在地方大学图书馆里面找得到的材料,比如电气与电子工程师协会学报。此类文摘经常被引用,因为话费较少但是却有较高的学术价值。
下一章关注计算机图像的信号处理方面的基础知识。它介绍了一种可以让你以不同方式看待信号的方式,称作傅立叶变换。我们也可以通过它解得一个图片的最小尺寸来保存信息,并分析频率方面的内容,甚至提高一些最近的图像算法的效率。不幸的是,它经常包含一些含x的方程式,但这的确是一种处理数据和信号的新工具,并且在研究方面有其独到的价值。
我们首先涉及到的是基础的图像处理技术,像素点被重新审视,首先我们观察分立的单个像点,接下来把它们看作是一组像点。我们不仅将见到使图像呈现出更好效果的一般操作,尤其对于人类的视觉而言,我们还会看到怎样减少图像常见的噪声。图像处理技术的实现依赖于Mathcad 和 Matlab中算法的实现。
接下来的章节中主要围绕图像信息的描述方式上,站在整个图像的角度上,而不是在某一个有着清晰界限的区域内。其中一个最重要的处理过程叫做图像边缘检测。将图像转化成类似漫画家的素描,却不像漫画家的画那么夸张。主要技术介绍得都比较详细,并且包括其实现步骤的介绍。我们还可以了解到图像曲率的计算以及图像位移等等,这些内容在这一章中也有涉及。
我们需要得到图像边缘的弯曲信息,这样我们才能够得知图像的轮廓。而第一步就是对目标形状的已知模板进行分析。因为这个计算会十分繁琐,之后我们会改善计算的效率,并呈现最优的效果。这个技术被称为霍夫变换,这个方法在计算机图像领域的学者中十分流行,他们一般致力于寻求图像处理技术的基础,以求提升处理速度,并增加其精确性和稳定性。总而言之,通过霍夫变换,我们可以估测影响图像形状的参数,无论是直线,椭圆甚至是一些我们不知道的形状。
一些形状提取的应用不仅要求我们获取决定图形表现的参数,更要求我们将模板进行变形或放大缩小。因此,其接下来一章的内容是关于图像形状分析的。这是关于这一方面周全介绍的命题,尤其介绍了snakes(动态提取)。这些举措旨在通过分析当地的资料来匹配图形的形状。更进一步,我们可以通过图形的对称性来描述它,并且运用统计学导向最终的边缘提取结果。
关于这一点,我们还尚未考虑可用于描述图形形状的技术。我们将会发现,两种主要技术无非是关乎描述图像边缘周长的,或是描述整片区域的。描述周长的技术,典型的是傅立叶分析,甚至要用到傅立叶变换。而区域描述的技术,在傅立叶分析方面来看则有很大的不同。
最后一章讨论纹理分析,比一些图案分类要详细一些。纹理描述的是那些没有已知可分析部分的图案,也是计算机显示以及图像处理的目标。其在此的作用更多是作为一个工具,就如同傅立叶变换和区域描述在其他通用文献中被引用一样。这里也有介绍怎么辨别已知数据之外图形的方式,但当然,这是一扇通往更大研究命题的窗户。
附录中包括了有关文献,诸如协调几何,最小二乘法,旨在为读者做一个简短介绍。其他文献将在文中陆续列出,尤其是那些在线资源。附录中还以打印的形式给出了Mathcad 和 Matlab的工作区的样式。
就此,文章已经涵盖了图像提取,图像处理和计算机显示的主要内容。淡出了我们提及的这些,课题中会涉及到更多:比如,有一个的3D计算机显示和2D的信号处理方面的资料,当然我们这里只是暗指。但是为了涵盖这些可能会引导到那些没人能买得起甚至搬得动的书籍的资料,我们承认我们用了快照。但这些只是为了这样一个迷人的,并且值得的课题
2.3 傅里叶变换
傅里叶变换是将信号映射到分量频率的一种方法。频率的单位是赫兹(HZ),同来度量时间上的重复频率,时间单位是秒(s);时间是频率的倒是,反之亦然。
假设有一个音乐中心:声音来自一个CD播放器(或录音带等等),经过扩音器处理之后在扬声器上播放。扩音器可以改变低音或者高音(或响度,它是低音高音的组合)。低音包括低频分量,高音包括高音分量。傅里叶变换就是将CD播放器上随时间变化的信号映射为频率分量的方法。信号变换后,可以得知原声音由那些频率组成。
为什么要这么做呢?我们并没有改变信号,只是改变了信号的表达。把信号以频率的形式,而不是以时变电压的形式来表示。如果改变这些频率(因为可以清楚看见),将会改变原声音。假设声音上有嘶嘶声,由于嘶嘶声势高频分量,故傅里叶变换中他显示为高频分量。接下来理解如何通过傅里叶变换去除嘶嘶声。如果曾经使用过图形均衡器,那么这样的事情大概已经做过了。图形均衡器是通过解释信号的频域表达来改变信号的一种方法;我们可以通过改变图形均衡器控件的位置有选择性的调整频率的组成。对信号P的傅里叶变换Fp可以利用复数积分表示为:
(2.1)
其中Fp(omega;)表示傅立叶变换;omega;是角频率,omega;=2分,其单位是rad/s(其中频率f是时间t的倒数,f=1/t);j表示复数变量,电子工程师更喜欢用j而不用i,因为它们不会把j与电流富豪混淆;p(t)表示连续信号(随时间连续变化);计算的是p(t)的频率分量。
将式(2.1)应用与感兴趣信号可以计算傅里叶变换,通过对简单信号的分析来理解傅里叶变换是如何计算的。假设有一个振幅(大小)为A的脉冲,其开始时间为t=-T/2,其他值为零,该脉冲为:
(2.2)
为了得到傅里叶变换,替换式(2.1)中的p(t)。只在特定时间内p(t)=A,因此选择积分极限是从脉冲的起点到结束点(其他地方为零)并且设置p(t)=A,作为此时间间隔内的值。脉冲的傅里叶变换计算结果是:
(2.3)
对上式求解,可得Fp(omega;)的表达式:
(2.4)
利用关系式进行简化,则脉冲的傅里叶变换为:
(2.5)
这是sinc函数的一种形式,sinc(x)=sin(x)/x。原脉冲及其变换如图2.3所示。式(2.5)标明,脉冲是由许多低频率分量和少数较高频率分量(他给出脉冲信号边缘)组成的。傅里叶变换图被称为信号的频谱,与光谱类似。
图2.3 脉冲及其傅里叶变换
傅里叶变换究竟是什么呢?傅里叶变换标明时域信号是由什么频率组成的。特定频率上的变换幅度是源信号中该频率的总量。如果傅里叶变换所以确定的所有正弦信号叠加在一起,便可以得到变换前的原信号。这个过程的说明如图2.4所示,该图中显示的是图2.3所示的信号及其变换。需要注意的是,由于傅里叶变换是一个复数,有实部和虚部,图中绘制的只是实部。图(2.4)所示,omega;=1的低频率占原信号的大部分分量;omega;=2的较高频率所占分量较少,如图2.4所示。这是因为omega;=2频率的变换系数比omega;=1频率变换系数要小。omega;=3的频率所占分量非常少,而omega;=4的频率所占分量稍多。这是因为还有许多频率没有分量,其变换为零。对上述信号求积分,可以得到与原脉冲非常相似的信号。这里我们只考虑omega;=-6到omega;=6范围内的频率。如果积分频率范围越大,那么它多包涵的高频分量越多,从而可以得到更加忠实于原脉冲的重构信号。
傅里叶变换的结果是一个复数,因此,傅里叶变换利用幅度来表示。该变换可以表示为:
(2.6)
其中Re(omega;)和Im(omega;)分别表示傅里叶变换的实部和虚部。因此,傅里叶变换的幅度为:
(2.7)
其相位为:
(2.8)
其中实部和虚部的分量的符号可以用来确定相位处在哪一个象限。幅度描述的是每个频率分量的总量,而相位描述的是频率分量产生的时序。脉冲的傅里叶变换幅度和相位如图2.5所示,图中幅度返回的是正变换,相位是0弧度或2弧度。
图2.4 根据变换重构信号
图2.5 脉冲的傅里叶变换幅度和相位
为了从频域信号恢复时域信号,需要进行逆傅里叶变换。它是根据傅里叶变换的频率分量重构脉冲的过程。逆傅里叶变换根据下式由Fp(omega;)计算p(t):
(2.9)
式(2.1),(2.9)一起形成傅里叶变换对,它可以把信号从时域变换到频域,并进行逆变换。通过这样的处理,我们可以在频域上或在时域上对信号进行操作,因为有方法在频域和时域之间进行变换。其中一个重要的处理过程成为卷积。卷积运算用*标记一个信号与另一个信号的卷积可以通过积分计算为:
(2.10)
这是系统理论的基础,其中系统的输出是激励和系统响应的卷积结果。通过反转系统响应的时间轴,得到,从而得到记忆函数。接下来,卷积过程对于激励与记忆函数相乘后的积求和:系统的当前输出是对激励的累加响应。通过计算(2.10)中的傅里叶变换,用标记,则两个信号卷积的傅里叶变换为:
(2.11)
这时,由于,可得
(2.12)
由此可见,两个频域信号的卷积是惩罚运算;卷积积分可以通过对两个信号变化的乘积进行逆傅里叶变换来实现。实质上,频域表达只是用不同的方式表达信号,同时提供不同的方法来处理信号。后面章节中,我们将利用卷积的对偶性大幅度提高视觉算法的计算速度。
其中表示相关性。相关性计算的是两个信号和之间的匹配度。当=是,信号与它本身相关,这个处理方式称为自相关。我们将利用相关性找出图像中的一些信息。
在进一步处理图像钱,还需定义一个函数,它可以看作是一个在特定时间间隔内出现的函数:
(2.14)
信号的时域表达与频域表达之间的关系被称为变换对:脉冲变化是频域上的sinc函数。由于变换具有对称性,所有sinc函数的傅里叶变换是一个脉冲。
其他傅里叶变换对如图2.6所示。首先,图2.6(a)和(b)显示余弦函数的傅里叶变换是频域上的两个点;在这预料之中,因为余弦函数只有一个频率,如其00变换结果所示。图2.6(c)和(d)显示高斯函数的傅里叶变换是另一个傅里叶变换;这说明高斯函数的线性特性,图2.6(e)显示一个单值点,该点的傅里叶变换是频率的无穷集;另一种解释是函数包括所有频率的等值量。根据式(2.5)也可以得到解释,就是说,若脉冲的持续时间越短,那么sinc函数越宽;当脉冲变得无限窄时,其频谱将会无限平坦。
最后,图2.6(g)和(h)显示:一组像个函数的傅里叶变换是另一组等间隔函数,但是这两组函数间隔大小不同。频域上的间隔是时域上的间隔的倒数。顺便解释一下,图2.6(c)中的高斯函数实际上是对一组密集的高斯函数求和构成的。由于函数的频谱是无限扩张的,就像高斯函数在时域上被拉伸一样,所以我们可以获得一组频域上的脉冲,但是其间隔是时域间隔上的倒数。这个变换对采样理论的基础。
图2.6 傅里叶变换对
2.4采样标准
采样标准规定蒸汽选择采样频率的条件。采样所关注的是选取一个连续信号的瞬间值;物理学上,这些值是A/D转换器对摄像机信号进行采样的输出。这些样本就是采样瞬间的信号值。
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[498341],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。