第一篇:三级项目报告图像匹配算法的实现及分析
三级项目设计(论文)
图像匹配算法的实现及分析
摘要
图像匹配是计算机视觉和图像处理领域中非常重要的工作,当我们需要在一副图像中寻找是否存在一个物体或一个小场景,并确定其位置,这时候我们就应当将具有灰度相关的图像进行匹配,实现图像匹配算法,通过计算它们之间的相关系数,确定协方差,进而进行图像匹配,确定其存在与否,并定位。
关键词:灰度相关;图像匹配;相关系数;协方差
前言
随着科技的进步,图像匹配技术已经成为信息处理领域极为重要和基本的技术。在军事上,它普遍应用于导弹的地图/地形匹配制导,飞机的导航等;在民用上,它普遍应用于运载工具自动导航仪,仪表导航,环境导航,环境保护,材料检测,机器人,交通等。
图像匹配是指通过一定的匹配算法在两幅或多幅图像之间识别同名点,如二维图像匹配中通过比较目标区和搜索区中相同大小的窗口的相关系数,取搜索区中相关系数最大所对应的窗口中心点作为同名点。其实质是在基元相似性的条件下,运用匹配准则的最佳搜索问题。常见方法有:像素灰度相关匹配,图像特征匹配等等。图像匹配是数字图像处理重要的研究课题之一。
正文
一.图像匹配方法原理与实现步骤
本项目要求,要用一个较小的图像,即模板与目标图像进行比较,以确定在目标图像中是否存在与该模板相同或相似的区域,若该区域存在,还可确定其位置。下面介绍几种常见的匹配方法 1.基于图像特征的配准方法
需要对图像进行预处理,然后提取图像中保持不变的特征,如边缘点、闭区域的中心、线特征、2.基于模型的匹配方法
在计算机视觉领域中的应用非常广泛,它可以分为刚体形状匹配和变形模板匹配[4]两大类。Kass提出的Snake主动轮廓模型是比较典型的自由式变形模板模型。3.基于变换域的匹配的方法
有基于傅立叶变换、基于Gabor变换和基于小波变换的匹配,这些匹配方法对噪声不敏感,检测结果不受照度变化影响,可以较好的处理图像之间的旋转和尺度变化。
综合看来:选择变换域的匹配方法可以较好的进行图像匹配。
根据相关定理,若f(x,y)和g(x,y)为二维时域函数,那么,定义以下相关运算: f(x,y)g(x,y)f()g(x,y)dd
式中,符号表示相关运算。
*F'f(x,y)g(x,y)F(u,v)G(u,v)
式中,F'表示傅里叶变换,F(u,v)是f(x,y)的傅里叶变换;G(u,v)是g(x,y)的傅里叶变换;G*(u,v)是G(u,v)的共轭。
也就是说,由于相关定理表示两个物体的相关程度,相关程度越高,说明两个物体越相似。那么我们根据定理,利用傅里叶变换,对两个图像做相关,然后观察出现的峰值,若峰值越高,表明两个物体越相似,并确定最高峰值的位置,则可以确定模板图在目标图中的位置。根据所给的条件,具体实现步骤如下:
1、制作模板图和目标图。根据所给的模板,利用画图工具重新制作一个模板图和目标图,要求目标图中间与左上角位置有与模板同样的图形,其他位置在画出另外三个图形。(如下图1、2、3)
2、将模板图与目标图数字化。即将模板图与目标图分别读入Matlab中,并存入相关矩阵,为了减少计算量,可将两幅图的数据矩阵转换为二值图像数据矩阵。
3、做傅里叶变换。根据相关定理,时域的相关,等于频域的乘积。所以要将模板图与目标图分别做傅里叶变换,变换的频域中去。(如下图4、5)
4、相关。模板图与目标图经傅里叶变换后,两图所得矩阵数乘,其中目标图的矩阵要先取共轭,然后经过反傅里叶变换到频域中去,并利用fftshift函数将低频部分移到中间去,并将图形旋转180度,得到正确的坐标轴,然后观察出现的五个峰值。(如下图6)
5、定位。求出相应矩阵中的最大值,根据最大值设置一阈值,找出高于此阈值的坐标,即为模板图在目标图中的位置。(如下图7)二.实现过程举例
根据上面所述实现步骤,具体实现过程如下 第一步所对应图形:
模板图 目标图
第三步所对应图形:
图4 模板图的傅里叶变换频谱
图5 目标图的傅里叶变换频谱
第四步所对应的图形:
图6 模板图与目标图相关后的图形
第五步所对应的图形:
图7 模板图在目标图中的位置(最高峰值出现的位置)
三.程序实现 具体实现程序如下:
function y=imagePosition()%图像匹配
%在一目标图像中,检测特定模板图像,并确定其位置
templet=imread('mig25_2.tif');%将模板图中的数据读入templet矩阵中 level=graythresh(templet);%设置黑白转换阀值 bw=im2bw(templet,level);%转换为二值图像数据
F=fft2(bw);%对模板图做快速傅里叶变换
figure,mesh(fftshift(abs(F)));%绘制模板图经过傅里叶变换后的三维图 title('模板图的傅里叶变换频谱');%图像题目
target=imread('mig25_3.tif');%将目标图中的数据读入target矩阵中 level=graythresh(target);BW=im2bw(target,level);F2=fft2(BW);%对目标图做快速傅里叶变换 %打开新的图形窗口,并绘制目标图经过傅里叶变换后的三维图 figure,mesh(fftshift(abs(F2)));title('目标图的傅里叶变换频谱');%在频域内用F点乘F2的共轭,相当于在时域内模板图与目标图做相关运算 %然后在做反傅里叶变换到时域,用fftshift函数将傅里叶变换的零频率部分移到数组中间
R=fftshift(abs(ifft2(F.*conj(F2))));R=rot90(R,2);%将R矩阵逆时针旋转180度,得到正确的坐标图 figure,mesh(R)%打开新的图形窗口,并绘制相关后的三维图,观察五个峰值 title('两个图相关后的频谱');thresh=max(R(:));%求矩阵R中的最大值
%求矩阵中最大值的所在的数组下标,即图像中最大峰值的位置 [row col]=find(R>thresh-1);figure,imshow(BW);%显示原始目标图
hold on %在当前坐标图形里添加绘制图形
%以找到的峰值的坐标为圆心,在原图上画圆做标记,即在目标图上标记模板图 for i=1:1:length(row)angle=0:0.1:2*pi;%采用极坐标法,其中半径设为10 plot(10*cos(angle)+col(i),10*sin(angle)+row(i),'LineWidth',3);End 四.结果分析
根据结果显示在目标图像中,与模板图像相同的图形被圈上了蓝圆圈,在相似图像的位置上有傅里叶函数变换频谱的峰值,进以证明图像在此相似度高,图像匹配。同时定位了相似图像的位置。通过对图像的像素的灰度值计算,可以充分利用图像的所有信息来高精度地区分不同对象,但因此处理的信息量很大,计算复杂度很高。同时不能分辨目标图片旋转,拉伸或压缩后的图像匹配问题。五.扩展解决方案
现如今为解决计算复杂度很高的问题可以通过SSDA算法,它的匹配精度与理论值相同,相位相关法匹配时间介于SSDA算法和ABS算法二者中间,也存在一个像素的误差; 为解决不能分辨目标图片旋转,拉伸或压缩后的图像匹配问题可以使用基于图像特征的匹配算法,应用图像边缘特征和频域相关相结合的图像处理技术进行图像匹配,能够达到较高精确地定位,具有自动匹配的优点。在带有旋转误差的图像匹配中,具有较好的稳定性,极大的减少了人为因素带来的误差,缩短了匹配时间,匹配效果良好。
这些方法都是进一步不错的解决图像匹配问题的方法,在这里不做过多的描述。
结论
1.基于傅立叶变换的匹配,这些匹配方法对噪声不敏感,检测结果不受照度变化影响,可以较好的处理图像之间的旋转和尺度变化。所以采用此变换方式来进行研究。
2.此匹配方法的优点:对噪声不敏感,检测结果不受光照变化影响。有成熟的快速算法并且易于硬件实现。缺点:该方法仅符合存在平移量的剧像间的配准,然而在实际中,图像间不仅存在平移量的不同,而且还有旋转角度、缩放尺度等的不同。
3.经过此次三级项目的制作与学习,不仅使我们对图像匹配算法有了更深的了解和认识,还加强了我们组内成员之间的沟通协作能力,让我们最感兴趣的是大家在一起共同探究,集思广益,各抒己见,这种形式让大家的观点来得更直接、更朴素、更真实。在交流中得到启发,得到快乐。
参考文献:
1.西安电子科技大学硕士学位论文“图像匹配算法研究” 2.哈尔滨工程大学计算机科学与技术学院 “特定图像的检测与定位”
第二篇:二分图匹配算法总结
二分图匹配算法总结(by phoenixinter, Aug 2006)
最近下决心要把二分图匹配部分的算法都搞搞清楚,努力了几天之后基本上搞定了,下面做一个这个专题的总结。一、二分图最大匹配
二分图最大匹配的经典匈牙利算法是由Edmonds在1965年提出的,算法的核心就是根据一个初始匹配不停的找增广路,直到没有增广路为止。
匈牙利算法的本质实际上和基于增广路特性的最大流算法还是相似的,只需要注意两点:
(一)每个X节点都最多做一次增广路的起点;
(二)如果一个Y节点已经匹配了,那么增广路到这儿的时候唯一的路径是走到Y节点的匹配点(可以回忆最大流算法中的后向边,这个时候后向边是可以增流的)。
找增广路的时候既可以采用dfs也可以采用bfs,两者都可以保证O(nm)的复杂度,因为每找一条增广路的复杂度是O(m),而最多增广n次,dfs在实际实现中更加简短。
二、Hopcroft-Karp算法
SRbGa很早就介绍过这个算法,它可以做到O(sqrt(n)*e)的时间复杂度,并且在实际使用中效果不错而且算法本身并不复杂。
Hopcroft-Karp算法是Hopcroft和Karp在1972年提出的,该算法的主要思想是在每次增广的时候不是找一条增广路而是同时找几条点不相交的最短增广路,形成极大增广路集,随后可以沿着这几条增广路同时进行增广。
可以证明在寻找增广路集的每一个阶段所寻找到的最短增广路都具有相等的长度,并且随着算法的进行最短增广路的长度是越来越长的,更进一步的分析可以证明最多只需要增广ceil(sqrt(n))次就可以得到最大匹配(证明在这里略去)。
因此现在的主要难度就是在O(e)的时间复杂度内找到极大最短增广路集,思路并不复杂,首先从所有X的未盖点进行BFS,BFS之后对每个X节点和Y节点维护距离标号,如果Y节点是未盖点那么就找到了一条最短增广路,BFS完之后就找到了最短增广路集,随后可以直接用DFS对所有允许弧(dist[y]=dist[x]+1,可以参见高流推进HLPP的实现)进行类似于匈牙利中寻找增广路的操作,这样就可以做到O(m)的复杂度。
实现起来也并不复杂,对于两边各50000个点,200000条边的二分图最大匹配可以在1s内出解,效果很好:)三、二分图最优匹配
二分图最优匹配的经典算法是由Kuhn和Munkres独立提出的KM算法,值得一提的是最初的KM算法是在1955年和1957年提出的,因此当时的KM算法是以矩阵为基础的,随着匈牙利算法被Edmonds提出之后,现有的KM算法利用匈牙利树可以得到更漂亮的实现。
KM算法中的基本概念是可行顶标(feasible vertex labeling),它是节点的实函数并且对于任意弧(x,y)满足l(x)+l(y)≥w(x,y),此外一个概念是相等子图,它是G的一个生成子图,但是只包含满足l(xi)+l(yj)=w(xi,yj)的所有弧(xi,yj)。
有定理:如果相等子图有完美匹配,那么该匹配是最大权匹配,证明非常直观也非常简单,反设其他匹配是最优匹配,它的权必然比相等子图的完美匹配的权要小。
KM算法主要就是控制了怎样修改可行顶标的策略使得最终可以达到一个完美匹配,首先任意设置可行顶标(如每个X节点的可行顶标设为它出发的所有弧的最大权,Y节点的可行顶标设为0),然后在相等子图中寻找增广路,找到增广路就沿着增广路增广。
而如果没有找到增广路呢,那么就考虑所有现在在匈牙利树中的X节点(记为S集合),所有现在在匈牙利树中的Y节点(记为T集合),考察所有一段在S集合,一段在not T集合中的弧,取 delta = min {l(xi)+l(yj)-w(xi,yj),xi ∈ S, yj ∈ not T} 明显的,当我们把所有S集合中的l(xi)减少delta之后,一定会有至少一条属于(S,not T)的边进入相等子图,进而可以继续扩展匈牙利树,为了保证原来属于(S,T)的边不退出相等子图,把所有在T集合中的点的可行顶标增加delta。
随后匈牙利树继续扩展,如果新加入匈牙利树的Y节点是未盖点,那么找到增广路,否则把该节点的对应的X匹配点加入匈牙利树继续尝试增广。
复杂度分析:由于在不扩大匹配的情况下每次匈牙利树做如上调整之后至少增加一个元素,因此最多执行n次就可以找到一条增广路,最多需要找n条增广路,故最多执行n^2次修改顶标的操作,而每次修改顶标需要扫描所有弧,这样修改顶标的复杂度就是O(n^2)的,总的复杂度是O(n^4)的。
事实上我现在看到的几个版本的实现都是这样实现的,但是实际效果还不错,因为这个界通常很难达到。
对于not T的每个元素yj,定义松弛变量slack(yj)= min{l(xi)+l(yj)-w(xi,yj),xi ∈ S},很明显的每次的delta=min{slack(yj),yj∈ not T},每次增广之后用O(n^2)的时间计算所有点的初始slack,由于生长匈牙利树的时候每条弧的顶标增量相同,因此修改每个slack需要常数时间(注意在修改顶标后和把已盖Y节点对应的X节点加入匈牙利树的时候是需要修改slack的)。这样修改所有slack值时间是O(n)的,每次增广后最多修改n次顶标,那么修改顶标的总时间降为O(n^2),n次增广的总时间复杂度降为O(n^3)。事实上我这样实现之后对于大部分的数据可以比O(n^4)的算法快一倍左右。四、二分图的相关性质
本部分内容主要来自于SRbGa的黑书,因为比较简单,仅作提示性叙述。
(1)二分图的最大匹配数等于最小覆盖数,即求最少的点使得每条边都至少和其中的一个点相关联,很显然直接取最大匹配的一段节点即可。
(2)二分图的独立数等于顶点数减去最大匹配数,很显然的把最大匹配两端的点都从顶点集中去掉这个时候剩余的点是独立集,这是|V|-2*|M|,同时必然可以从每条匹配边的两端取一个点加入独立集并且保持其独立集性质。
(3)DAG的最小路径覆盖,将每个点拆点后作最大匹配,结果为n-m,求具体路径的时候顺着匹配边走就可以,匹配边i→j',j→k',k→l'....构成一条有向路径。
五、稳定婚姻问题
稳定婚姻问题是一个很有意思的匹配问题,有n位男士和n位女士,每一个人都对每个异性有一个喜好度的排序,代表对他的喜爱程度,现在希望给每个男士找一个女士作配偶,使得每人恰好有一个异性配偶。如果男士u和女士v不是配偶但喜欢对方的程度都大于喜欢各自当前配偶的程度,则称他们为一个不稳定对。稳定婚姻问题就是希望找出一个不包含不稳定对的方案。
算法非常简单,称为求婚-拒绝算法,每位男士按照自己喜欢程度从高到低依次给每位女士主动求婚直到有一个女士接受他,对于每个女士,如果当前向她求婚的配偶比她现有的配偶好则抛弃当前配偶,否则不予理睬,循环往复直到所有人都有配偶。有趣的是,看起来是女士更有选择权,但是实际上最后的结果是男士最优的(man-optimal)。
首先说明最后匹配的稳定性,随着算法的执行,每位女士的配偶越来越好,而每位男士的配偶越来越差。因此假设男士u和女士v形成不稳定对,u一定曾经向v求过婚,但被拒绝。这说明v当时的配偶比u更好,因此算法结束后的配偶一定仍比u好,和不稳定对的定义矛盾,类似的,方式我们考虑最后一个被抛弃的男士和抛弃这位男士的女士,不难得出这个算法一定终止的结论。
如果存在一个稳定匹配使得男士i和女士j配对,则称(i,j)是稳定对。对于每个男士i,设所有稳定对(i,j)中i 最喜欢的女士为best(i),则可以证明这里给出的算法对让每位男士i与best(i)配对。对于所有男士来说,不会有比这更好的结果了,而对于女士则恰恰相反,对于她们来说不会有比这更糟的结果了,因此这个算法是男士最优的。
算法一定得到稳定匹配,并且复杂度显然是O(n^2),因为每个男士最多考虑每个女士一次,考虑的时间复杂度是O(1),当然了,需要作一定的预处理得到这个复杂度。
第三篇:基于形状特征的图像检索算法仿真实现研究
本科毕业设计(论文)
工 作 手 册
(理工类专业适用)
学 院
专业班级
姓 名
学 号
指导教师
二○一 年 月 日
基于形状特征的图像检索算法仿真实现研究
摘要:近年来,随着数字多媒体和移动计算机以及互联网信息技术的快速进步发展,数字图像的应用数量正以惊人的增长速度不断增长。面对日益丰富的数字图像媒体信息这个海洋,人们仍然需要有效地从中不断获取所有人期望能够得到的更多媒体信息。因此,在一个大规模的数字图像检索数据库中如何进行快速、准确的图像检索已经成为当前人们图像研究的一个热点。
为了能够实现快速而准确地进行信息检索数字图像,利数字图像的主要视觉信息特征,如图像颜色、纹理、形状等元素,基于形状的数字图像信息检索处理技术应运而生。本文主要深入研究基于图像形状基本特征的边缘图像侦测检索,边缘图像检测检索是基于图像形状基本特征的一种有效检索图像方法,边缘检测是检索图像最基本的形状特性。在图像景物边缘特征检测中,微分这个算子算法可以准确提取和输出景物图像的一些细节分析信息,景物图像边缘特征是图像细节分析信息中最主要具有不可描述性的景物边缘特征的部分,也是进行图像边缘分析过程中的一个不可或缺的部分。本文详细地阐述分析了一种局部边缘厚度检测算子方法,即canny方法算子,用c++编程语言实现各方法算子的局部边缘检测,并根据算子边缘厚度检测的准确有效性和边缘定位的准确可靠性,得出这种canny方法算子已经具备了所有最优化的边缘厚度检测所应必需的各种特性。并通过基于图像轮廓的图形描述表示方法,傅里叶轮廓描述符对一个图像的轮廓形状及其特征特点进行轮廓描述并将其存入图像数据库中。对行业也相应的具有检索查询功能。
关键词:形状特征检索;边缘图像检测;傅里叶描述符
一、前言
随着现代信息化工业社会的到来,几乎任何一个学科研究领域的技术发展都和现代计算机技术密切联系有关,人们所需要处理的图象信息已不仅仅只是一些数字、符号等的信息,而是越来越多地与人接触并得到大量的数字图象内容信息.其中例如:航空卫星信息遥感监测图象、医学遥感图象、地理水文信息监测图象等.而且在实际技术应用中随着时间的不断推移,图象信息数量也在不断扩大,利用各种人力来对这些图象信息进行内容浏览和信息检索,不仅仅需要大量的精力和时间,浪费大量的的人力,而且几乎已是不可能完成的一件事。这样需要利用计算机对这些数字图象内容进行有效内容组织和信息检索便已经成为现代人们科学研究的重要课题.因而传统的数字图象内容表达和信息检索处理方法往往是需要使用图象文件名、标题、关键词数字等.目前,这种检索方法已不能完全满足现代人们的技术要求.因此,人们越来越迫切地认识需要对这些图象的各种可视性和特征图象进行信息提取,并且根据这些可视特征对各种图象内容进行信息检索.基于图象内容的数字图象信息检索处理技术,也正是在这样的一种情况下发展产生的.基于图象内容的数据图象信息检索数据技术就是通过数据分析一个图象的主要内容(例例如:颜色、纹理、形状等),从大量活动视频图象库中查找含有特定物体的图象,它充分克服了现代传统检索方法的不足,融合了数字图象处理、图象识别和网络图象检索数据库等多个领域的最新技术成果,从而完全可以为你提供更有效的图象检索技术手段.它们既充分体现了特征图象的基本信息处理特点,又充分结合了现代传统图象数据库检索技术.其基本检索过程一般是:首先对一个图象特征进行图像预处理,然后根据特征图象的基本内容从特征图象中直接选取所有有需要的特征图象形状特征,存于图象数据库中;然后当对一个图象特征进行勾画检索时,对于一个图象已知的特征图象首先抽取其具有相应的图象特征,然后在整个图象数据库中进行检索与其相似的特征图象,也或者可以根据相对于某一个的查询对象要求直接给出一些图象特征点和值,然后根据所需要给定的图象特征点和值在整个图象数据库中进行检索所要的特征图象.结果例如:对于基本相同形状带有特征的图象检索,你或许可以直接给出一些有关被勾画检索某个对象的基本形状特征描述,可以认为是一些带有特征点的值,也或者可以认为是勾画出的检索对象的形状略图;对于基本相同颜色的图象检过,可以直接给出不同颜色的物体比例或者关系,等等.最后,给出图象检索后的结果.目前,从事这一技术课题相关研究的年轻人越来越多,国外许多著名科研机构和专家学者都在积极进行许多有关这一技术课题的相关研究,例如:公司的数据检索系统.国内的许多专家学者和相关科研机构也在积极进行此技术问题的相关研究.本文首先对基于对象内容实体图象的的检索数据进行了简要的理论概括,然后对基于实体对象动态形状的实体图象内容检索数据理论基础进行了深入的理论研究,包括:基于对象形状的实体图象内容检索计算方法,对象实体形状的综合描述,图象形状配匹检索算法,最后本文给出了一个基于对象形状的实体图象内容检索数据原型管理系统,并在一台微机上加以实现,该原型系统主要功能包括内容图象检索数据库的管理建立,数据库的日常维护,图象的信息查询等几个功能.二、研究介绍
2.1、课题背景及研究意义
随着现代多媒体网络技术、计算机网络技术、通信网络技术及互联网络的迅速进步发展,人们正在快速地发展进入一个现代信息化的新社会。现代信息技术已不可能能够运用各种技术手段大量的进行采集和分析产生各种类型的海量多媒体信息数据,人们对各种多媒体信息的采集需求也越来越大量和频繁。虽然人类信息的数量快速增长直接促进了人类社会的快速发展,但是由于信息快速膨胀也给现代人类社会带来了过多的的信息量以至于远远超过了这类人的整体接受信息能力。因此,除了怎样获取、处理和传输存储各种多媒体信息十分重要,怎样在各类海量的各种多媒体信息中快速有效地准确访问这些人们经常感兴趣的各种多媒体信息也对其显示体现出了同样的巨大重要性。
图像抽象信息采集是传统多媒体信息中最常见的一种,也因其具有传统多媒体信息采集数据量大、抽象应用程度低的基本特点。如何从各种海量的有用图像处理信息中有效地收集获取有用图像信息,即使是图像处理信息数据资源的使用管理和信息检索也就显得日益重要。随着当前人们对文字图像文本信息的巨大检索需求的不断增长,产生了基于图像文本的文字图像信息检索引擎技术,比如著名的中文搜索结果引擎google和百度中对文字图像的文本检索。这种基于人类文本的人工检索标注技术所广泛利用的人工文本标注检索方法虽然存在一些局限性,经常进行检索时会出来大量的一些用户不感兴趣的文本图像,但在没有找到更好文本解决办法的实际情况下,用户通常只能选择继续检索使用。因此如何对一个图像的特征内容自动、客观、全面地对其进行特征提取。真实有效的准确表示数字图像信息内容,帮助用户快速有效地检索访问自己感兴趣的信息图像内容,有着极大的科学研究领域需求和迫切的应用需要,而基于图像形状特征的数字图像信息检索分析技术恰好真正能有效的帮助解决这个现实问题。另外在实际的应用中,图像信息数据库及其信息检索的技术研究对医学多媒体图像数字图书馆、医学临床图像应用管理、卫星图像遥感网络图像和应用计算机图像辅助设计和开发制造、地理位置信息采集系统、犯罪识别系统、商标标识版权的使用管理,生物的形态辨识以及分类等诸多方面可以提供有力的技术支持。
2.2、国内外发展状况
近年来,CBIR已经逐渐发展早熟成为一个非常活跃的医药临床医学研究应用领域,各类我国顶尖临床科研机构与临床研究公司已陆续成功开发推出了一些基于CBIR临床应用管理系统的临床研究应用产品,有的已经成功广泛应用扩大到医药临床医学、商标、专利技术以及检索等诸多研究领域。
IBM的系统QBIC是它是第一个具有商业性的基于CBIR的子系统。它们还提供了基于图像颜色、纹理、形状和其他手绘图像草图的多种图像类型索引使用方法。columbia大学的图库Visual SEEK图库提供了基于自然色彩和立体纹理的多种索引分析方法。PhotoBook 是美国麻省理工学院和多媒体科学实验室自主开发的一套用于检索、浏览人脸图像的交互式检索工具,它其中包含三个图像子系统分别用于提取人脸形状、纹理和各种人脸面部特征,用户甚至可以分别定制做基于上述一种人脸特征的图像检索。MARS(multimedia analysis and retrieval system)这个系统由美国UIUC 大学负责开发,其不同之处主要在于用户学到了很多专业领域的基础知识:例如计算机图像视觉、数据库资源管理和云系统和网络信息资源检索。新加坡国立大学公司开发的一个基于复杂内容的模糊图像信息检索系统,其显著性的技术创新特色主要包括:多种特征提取的新方法、多种基于复杂内容图像检索的新方法、使用自定义组织式的神经网络对复杂内容特征进行度量、建立基于各种内容图像索引的新应用方法以及对各种多媒体信息格式进行模糊图像检索的新应用技术。
清华大学的数字ImgRetr检索结合了多种组织检索方法,就这样能为您提供基于形状主色、纹理、直方结构图、颜色元素分布、框架等多种组织方式的形状检索。
2.3课题研究的主要内容
本文主要依托基于物体形状的网络图像信息检索分析技术,重点深入研究基于物体形状动态特征的网络图像信息检索。形状纹理特征不同于物体颜色、纹理等的特征,形状纹理特征的正确表达必须以对物体图像中每个物体或图像区域的正确划分来作为理论基础。在二维矩形图像中的空间中,形状通常被我们认为为它是由于一条完全封闭的并由轮廓映射曲线所形成包围的特征区域。通常这种情况下.二维形状中的特征区域有两类可以表示它的方法,一类可以是一个区域形状特征,利用的可以是整个二维形状特征区域;另一种分类可以是一条轮廓曲线特征,利用的则可以是二维图像的整个外边和内界。本文主要重点研究的领域就是外界与边界的边缘索引测量方法边缘测量检测,边缘测量检测的常用方法主要有很多,如:roberts矩形交叉曲线微分代数算子、sobelt微分代数算子、priwitt交叉微分代数算子和Laplacian微分代数算子以及canny微分算子。而其中属Canny算子最好。
本文主要深入研究的字符是傅里叶描述符。其主要理论思想观点是用关于物体内部边界的傅立叶变换公式作为其物体形状学的描述。
2.4、相关内容介绍
2.4.1形状分析
2.4.1.1、形状特征
常用的长轴形状运动特征参数有长轴周长、形状特征参数、偏心率、长轴运动方向与弯曲运动能量等矩阵的描述、综合光密度以及三维轮廓的应力矩也同样可以用于表示和用来描述三维图像。
2.4.1.2特征选择
通常一般来说,形状的形态表示特征图型表示法具有两种常用图形表示法的表现方法,一种表示方式主要是用来表示具有轮廓性的形状形态特征,另一种表示方法主要是用来表示具有区域性的形状形态特征的。前者一般来说只用于看到整个部件物体的内部外观和形状边界,而后者则直接把它关系着其应用到整个部件物体外观形状上的各个区域。
2.4.2、一种基于形状的图像检索算法
2.4.2.1、算法分析
基于这种形状的图像检索更多地只是用于了解当前的用户能够粗略地扫描画出一个图形轮廓之后进行图形检索的实际情况。这种图形轮廓绘图可以认为是通过用户凭借自己脑子在空中的第一印象徒手自动画图绘出来的,也甚至可以认为是通过操作系统软件提供的基本图形绘图处理工具“拼凑”的。这两种检索情况都不具有一个基本特点,即它所提供的检索形状只是对所欲检索图象形状的粗略抽象描述,它从它的大小、方向或者其整体形状结构上都很有可能与真正根据要求调查的检索图形形状有较大小的出入。因此,基于面的形状进行检索的主要难点仍然在于需要寻找一种能够准确检索与面的大小、方向及整个扭曲面的伸缩程度无关的检索方法。
不变矩和产品轮廓的应力不变矩的方法产品具有良好的轴向平移、旋转、尺度上的缩小和放不变性及高度抗干扰性。用一个图像的形状不变矩和图像轮廓的应力矩阵来作为矩对图像的两种形状相似特征进行索引,使用适当的形状相似性之间距离进行定义,计算并得出两幅画中图像的形状相似性之间距离,当这个距离的值足够小时,就可以认为两幅画的图像形状是相似的。傅里叶这种算法不仅对图像噪音控制具有很好的鲁棒性,而且对几何变换速度具有不变性,更加十分适合工图像形状分析检索的实际需要。因此,提出了应力不变矩和矩形轮廓的应力不变矩的算法和傅里叶公式描述中的符号相结合的计算方法。
三、图像检索技术的发展过程
目前图像检索的技术最早开始于上个世纪70年代,当时主要研究的是基于文本的检索,即使采用关键词和描述性的文本来对其进行检索,要求使用者对文本中各种特征的描述都必须具备一定的精度准确性和规范性。但是随着各种大规模的数字化图像仓库的诞生,基于文本检索的技术暴露了自身的优势。在我国逐步发展到90年代,基于图像内容的信息化图像检索技术应运而生,其设计思路主要是充分利用信息化图像自身的各种视觉特点,例如:将图像中的颜色、纹理结构、形状、空间之间的关系等信息作为内容来进行匹配、查找。它通过充分地利用了己经拥有的算法,使得所有的特征提取和匹配都完全能够由机器自动地完成,检索的过程也没必要太多的人为干涉和解释,这就克服了传统的手工标签注释方式的低效率和二义性。
四、基于形状特征的图像检索
因为许多的图像检索系统把注意力集中到了基于色彩或者是纹理学的方式上。但对于某些图像形状来说,纹理和颜色的信息不够丰富,如一些商标图像等,这时基于纹理的检索方法便无法完全满足所有的检索要求,而必须从整个图像形状入手。形状特征信息是图像的中心特征之一,图像中的形态和信息不会随着图像中物体颜色的改变而发生任何变化,它是一种稳定的特征。用各种形状的特征来区别物体很加直观,它们是现代社会中人们识别不同形态图像的主要技术特征之一。因此,通过利用各种形状特征来检索图像,可以大大提高检索的精度和效果。基于目标的形状特征的图像检索主要目的是通过检测得到目标轮廓线或分割得到目标轮廓,并针对其所在位置进行形状特征的提取或直接针对图像搜集寻找合适的向量特征。形态描述要求我们在尽量区别各个目标之间的基础上,对于目标平移、转动及尺度的变化并不敏感。目前,虽然我们已经研究提出了许多关于形状的分析技术,但是想要将它们有效运用到图像检索中仍存在的问题还有一些困难和疑惑亟待解决,如算法的工作效率和复杂程度,形状特征的提取与描述等。
五、基于形状特征的图像检索具体实行
5.1对象形状的描述
图象经过边缘的提取、分割后可以获得诸个被分割的区域.对诸个被分割的区域所提取的形状特征,是基于内容的图象检索系统的重要组成部分,所提取的形状特征对于图象的旋转、图像的平移和对图象缩放都是不敏感的.本文主要研究涉及以下几种形状的特征:
(1)基于傅立叶系数的形态和特点.圆角度,细长程,散射性.(2)基于几何形状的特征.区域的面积,区域的周长,体态比.(3)矩描述.共有七个矩常量.(4)以相似多边形为基础的结构和特点.(5)形状直方图.5.2、系统设计与实现
系统主要可以分为三个组成部分:(1)图象数据库建立模块.该建立模块首先对用户输入的各种图象信息进行了预处理,其中包括各种图象信号和噪声的清除,图象尖锐化,边缘检测(对象物的分离),边缘细化,链码追溯,对于边界信息进行了多边形逼近,然后将其提取到对象的各种形状信息,最后把用户需要提取的信息特征值直接存入到图象数据库中;(2)图像数据库维护系统模块.本次维护系统主要负责对图像数据库信息进行维护,主要内容包括图像浏览记录的修改及历史纪念信息的删除;在对图像记录进行修改时,对那些由于计算机自动提取得到的特征值我们都是不可以进行修改的,而且我们只能通过修改这些由人为确定定义的字段,如:一个有关于图象的文字说明部分.(3)图像检索查询模块.该功能首先根据需要对被检索的图像进行提取的形状和特征,然后再根据需要选择按哪些特征值对象来进行检索,设置好图像的检索所达到要求的类型和相似程度,最后与将图像信息与数据库中的其他图像进行匹配,输出查询结果.图象的匹配查询是整个图像信息数据库的主要功能和组成部分,匹配算法的好坏及其优劣直接影响到匹配查询的速度和信息库查询的质量,其根本思路就是通过判断一个经典的已知图象与一个图像数据库中的一个图象之间的距离,如其距离有点足够小,就说明我们可以确定两个已知图象之间是相似的,其结果一般应该是多个已知图象,这些所有的图象都与经典查询的图像在一个给我们认为有点相似.我们其实可以通过运用各种相似性程量测度查询函数过程方法工具来进行分析和控制计算一个查询特征图象与一个特征图像数据库中每一个特征图象的相似度和程度,相似性程度测量中的查询函数过程主要来说是研究建立在对数据特征分析和模式识别相关技术研究基础上的,涉及所遇到的主要技术问题之一就是对于一个数据输入模式如何进行特征描述和模式判别,查询的基本过程就是根据一个新的给定数据模式对一个数据输入中的模式特征进行数据匹配.这个相似度一般来说是通过0~1之间的某个个不同参数特征来进行表现计算出来的,总的相似度也由各种不同特征所测量的相似度通过函数加权运算求和得.传统数据库的准确匹配和查询技术是很简单地了解的,但对于图象型的数据库来说,查询的质量和查询的快慢还是相互矛盾的,要求查询率和准确性好,就需要尽可能多地增加一些描述图象的特征矢量的维数,随之而来就需要尽可能多地增加计算量,所以,要在不降低特征矢量的维数条件下,才能够大幅度地提高查询率,就必须通过调整和完善查询的策略.主要采用以下两种操作方法:
(1).聚类的基本原理:分类即把一个标准图象按类划分开来成以下几类,每一类都被用户定义成作为一个分类标准图,则在用户查询一个标准图象时,首先根据要求计算出与各种分类标准图之间的物理距离,确定它们之间是否隶属于何一类,然后再与该一类的标准图象之间进行具有相似性的分类匹配.(2)过滤的原理:即通过降低维数,在进行图象匹配之前,首先将一些形状和特征相差甚远的图像从一个被称为图象匹配团队中全部清除掉,然后再将查询到的图象和匹配团队中剩下的其他图象进行对比.5.3、算法步骤
(1)通过计算被检索图像的形状和特征,并从数据库中提取图像形状和特征进行索引;
(2)对特征向量进行归一化;
(3)使用欧式距离法来计算归一化后的图像数据库中各个图像与显示者的图像之间的相似性和距离;
(4)按序输出检索结果。
5.4.边缘检测
其中边缘化的特点通常是直接影响物体图像最为主要的一个基本特点。边缘则主要是在泛指周围各个像素的颜色灰度并没具有较大阶跃性质的变化或者在屋顶上的颜色没有发生较大改变的那一个周围像素。Poggio在文中这样解释说:“或许对应着图像中物体的边界或许并没有对应着图像中物体的边界,但是边缘具有十分令人满意的性质它能大大地减少所要处理的信息但是又保留了图像中物体的形状信息”。
边缘图像检查理论是一种实现图像识别的重要理论知识基础和技术前提,直接意义地说它决定了图像识别检查结果的客观准确性。由于人体边缘图像检测尚不成熟,直接地严重影响了对图像识别的实际研究应用,一直以来都认为是图像识别相关技术应用领域的重要研究发展热点。经过多年的研究探索和应用实践,边缘式质量检测系统技术已经逐渐发展渗透至各个应用领域。在应用生物医学上,边缘提取检测主要作为适用于人体肾脏血小球的边缘提取,在应用生物医学工业和工程科学以及其他工程材料领域的边缘检测,如聚酯纤维或者其他塑料制品。而且在加工喷涂、焊接和机械装配时也被充分地吸收利用。在中国传统的民族文化工艺美术上,用于对传统纺织品和手工艺品的定制设计,服饰的定制设计和手工制作,发型的定制设计,文物收藏材料以及照片的编辑复制和收集整理,运动员的身体动作状态分析和体能评级等等。总之,边缘厚度检测已被广泛应用于各个领域。这仍然是我们必须不容忽视的一个研究发展热点。
5.5、Canny边缘检测
5.5.1 Canny指标
基于微分算子的边缘提取方法存在的一个比较麻烦的问题是如何让我们选择适当的阈值,可以通过这种方法使边缘从每一个细节中被提取出来。阈值的选择方式不同,所需要提取得到的边界信息也不相同。在两个不同的阈值下,采用相同的微分算子均可以从图像边缘提取得出一个点,但两者之间有比较大的差异。这样,在边缘提取中也就存在了对提取良好与否的评估。
针对这一重要问题,根据边缘检测的工作有效性和其定位的安全可靠性, Canny 通过研究最优的边缘检测仪器所必须要求的特点,给出了衡量边缘检测系统性能好坏的三个主要指标:
(1)良好的边缘信噪声对比,即将不是边缘点错误判定为其他边缘点的错误概率相对较高,将其他边缘点错误判定为其他边缘点的错误概率相对较低;
(2)良好的定位特性,即检测出来的边缘点应该要尽量安装在实际边缘的点为中心;
(3)对于单个边缘只能产生唯一的响应,即单个边缘能够同时产生许多个响应,其概率相对较低,并且在虚假的响应中对边界的反馈效果相应得到最佳抑制.用这样一个词来说,就是我们希望能够有效地提高人们对于景物边缘的灵敏度和噪音的同时,这种能够有效地抑制其他人们产生噪音的方式才是良好的边缘提取技术。值得我们十分庆幸的一点其实是,且个二阶线性映射算子仍然能够在有效抵抗图形噪声和对图形边缘的线性检测之间获得最佳结果折中,这个二阶线性映射算子本身其实就是高斯函数的一个二阶取值引用导出函数。高斯函数和用于原图的卷积已经初步达到了一种可以抵抗局部噪声的主要效果,而用于求导的函数,则被普遍认为已经是我们检测一个景物局部边缘的一种重要手段。
设二维高斯函数为
其中,σ为高斯函数的平滑度和分布式的参数,可以被广泛地基于用来衡量控制网络对象或者网络图像平滑的重要程度。
其中,σ是高斯函数的分布参数,可用以控制对图像的平滑程度。
最优阶跃边缘检测算子是以卷积▽G*为基础的,边缘强度为
而边缘方向为
由高斯函数的定义我们得以可知,该高斯函数都可以是无限地从头拖尾的,在实践中,一般的各种情况下都方法是将原来的有限模板尺寸截断为n,至于就达到了有限的模板尺寸。这个新的实验结果证明,当时,能够直接取得较好的边缘化学检查实验结果。
5.5.2 Canny算子的实现
下面是Canny算子的具体实现。
利用高斯函数的双向可分性,将映射▽g的两个一维滤波卷积上的模板可以分解成两个一维的滤波行列式式滤波器:
1
2
3
4
5
6
K为常数将式12分别与图像
则反应出一个在图像上点处的边缘强度,是一个在图像点处的法向力矢量(下一个交于其边缘线方向)。
根据关于canny的卷积定义,中心边缘点梯度作为一个卷积算子和它的图像(x,y)的卷积梯度是在中心边缘点和梯度相同直线方向的同一区域内两个算子梯度中的最高值。这样,就可以能够通过在各个梯度点的最大梯度值和方位上进行判断并得出每个该梯度点的最大强度方位是否为其应用领域最大强度值,从而快速确定各个梯度点的边缘点。例如,当一个矩形像素图象满足以下三个基本条件时,则被我们视作该点是一个像素图像的边界点。
(1)当像素该中一点的平均边缘运动强度方向超过了沿着像素该中一点的边缘梯度方向运动的同方向两个像素相邻点的像素中一点的平均边缘运动强度时;
(2)与该点梯度方向上相邻两点的方向差小于45度;
(3)观测领域核心中的最大边缘变化强度最大边缘阈度数值以所在该观测点位置为领域中心。
此外,如果(1)和(2)同时被边缘的顶点像素满足,那么候选选择梯度最小值相同方向上的两个非相邻顶点像素就从候选选择边缘的顶点中被直接取消,条件(3)阈值相当于由候选边缘区域选择梯度最大的阈值所在点组成的一个阈值,即图像与候选边缘的顶点之间的平均距离可以进行阈值匹配,这一消除过程就等于消除了许多虚假的边缘点。
图像边缘检测的基本步骤:
(1)对于滤波,边缘的检测主要是基于引导值进行计算,但是容易受到噪声影响。然而,该滤波器在减少噪声时还会造成边缘强度的损耗。
(2)进行了增强,加强算法把邻域的点的度有明显改变的地方突出表现。一般是靠计算梯度的幅值来实现。
(3)进行检测,但是在有些影像中梯度幅值较大的点并非边缘端。最简单的对边缘性检测就是梯度幅值阈值的判断。
(4)定位,精确确定边缘的位置。
综上所述,Canny算子的具体算法步骤如下:
(1)使用高斯滤波器对图像中的信号进行滤波,去除图像中的干扰和噪声;
(2)分析利用高斯算子的一阶方向偏移滤波函数采用微分的方法对物体图像中各点方向进行滤波,得到每一点的方向梯度和角强度和物体运动时的方向;
(3)针对梯度方向运动进行“非极大抑制”时对其梯度的反向运动及其方向如图可以正确定义为其如下如图所示
x
标识分别为1,2,3,4的四个区域将其属于四个局部分区之一,各个局部分区用不同的线将相邻四个像素分别排列来对其局部进行高度比较,以此来决定其每个局部的极大像素值。例如,如果我们在相邻中心像素图像获得x的梯度方向上认为属于第4区,则把获得x的极大梯度方向值与其左上和右下两个方向相邻中心像素的极大梯度的数值大小进行向量比较,看获得x的极大梯度的数值大小是否可视为极大梯度值。如果不是,就把每个矩形像素y到x的颜色灰度系数设置为0。这一抑制过程被人们称之为“非极大抑制”。
(4)对一个梯度进行两次阈值,即取一个阈值,两者之间的关系公式为。我们将梯度值小于的每个像素灰度设置为0。然后将梯度值小于的每个像素灰度平均值设定为0。去除了大部分的噪声,但同时也导致损失了有用的边缘和界面结构信息。
5.6基于轮廓的描述方法
基于局部轮廓图对形状进行描述的设计方法又大致可以细分为局部连续型(注意即局部全局式)和局部离散型(即局部结构式)两种。连续型全局轮廓图图描述的方法并没有对称为全局图的轮廓图进行任何分段式的处理,往往目的是从整个称为全局图的轮廓图中抽取并给出一个特征向量。这种属于离散式的分析方法通常首先把它的轮廓特点分解成许多不同片段,然后用传统计算机轮廓提取法找出其片段相应的轮廓特点。简单的物体形状类型描述表示符主要类型包括链码、傅立叶描述符、曲率尺度空间形状描述表示符和小波描述表示符四种基于物体轮廓的形状描述表示方式。
5.7傅立叶形状描述符
傅立叶形状轮廓描述符即它是一种被广泛应用的二维模型形状轮廓描述符,其最基本的设计思想就是用一个直接位于模型物体内部轮廓上没有边界的傅立叶变换函数来对其内部形状轮廓进行精确描述,假设一个二维模型物体的内部轮廓形状是由一系列每个坐标值函数为的物体像素所组合构造的并组成,其中,n函数为在物体轮廓上每个坐标像素的实际参考映射次数。从这些边界点的整体坐标中我们常常可以由此推导出来得出四类不同形状的坐标表达,分别为正弦曲率坐标函数、质心坐标距离、复弦长坐标矢量函数及其余弦长坐标函数。轮廓弧曲线上一个特征点的移动曲率被精确定义是因为该点在轮廓线上切向的移动角度与曲率相当于轮廓弧长之间的角度变动率。曲率密度函数我们通常可以简单地将其表示形式如下:
其中是轮廓线的切向角度,定义为:
质心点的距离函数可以直接定义成其为从一个物体的边界点到另一个给定物体的边界中心之间距离,如下所示:
复坐标函数是用复数表示的像素坐标:
这种复杂的坐标向量函数的傅立叶变换形式可以用来产生一系列关于复数的坐标系数。这些频率系数从微观频率上直接反映表示了各个类型物体的宏观形状,其中较低和高频度的物体分量值就代表了各个类型物体微观形状的具体性和宏观细节属性,高频度的物体分量值则代表了各个类型物体宏观形状的具体微观细节属性特点。形状图的描述符参数可以通过这些图形转换器的参数计算得出。为了使其能够更好保持与参数旋转的速度无关性,我们简单地仅仅保留了每个参数的旋转尺寸位置信息,而且同时省略了参数相位位置信息。缩放参数无关性通常由于在保证把缩放参数值的大小同时减少添加到c和dc中的分量(或第一个不为零的缩放参数)之后缩放才能得到确认。请特别注意图形转换中的无关性就是基于物体轮廓上的形状属性来转换表示固有的转换属性。对于具有曲率向量函数和质心之间距离的曲率函数,我们只不过需要分别考虑正交角频率的两个坐标时间轴,因为这时两个函数的傅立叶变换都必须是对称的,即有。基于点的曲率三角函数的一种形状线性描述符号也可以使其表示形式为:
其中整数代表傅立叶变换每个参数的第一至i个整数分量。类似的,由质心粒子间距所做的推测计算得到的粒子形态可以描述
符为:
对于一个复杂的坐标密度函数,正值的频率密度分量和负值的频率密度分量被同时广泛使用。由于函数dc的地理参数定义是否与某些形态条件所在处或地点的地理位置密切相关而因此得以常被忽略。因此,第一个不是零的微波频率参数分量被广泛应用于后来用于标准化其它的微波变换频率参数。复函数坐标系是函数所有的推导形式得到的坐标形态为其描述符式为其定义方程为:
为了能够保证在整个特征数据库中所有位于物体的各种特征形状和其他特征均可以具有相同的特征直径和特征长度,在第一开始进行实施傅立叶变换前后你需要把所有位于物体边界点的个别特征数目可以统一添加到m。因此算法可以被直接替换为傅立叶变换法的方式使用来大大幅度改善这个算法的执行效率。
5.8图像的相似性度量
在基于特征信息的图像内容检索图像信息检索中,特征的信息相似性和特征度量也被广泛认为已经是一个亟待解决的重大检索技术研究课题之一。只有在根据分析结果得到特点图像的两个特点后后再进行对该两个特点的图像相似性距离进行准确度量,才能有效的根据图像相似性和图像距离情况做出准确判断,实现对该特点图像的准确检索。为了更好地准确达到不同特征数据检索的提取目标,需要针对特征提取后得出的不同特征数据进行相似度的分析计算。相似性系数是以一个特殊数值的表示方式被用来显示表达两个不同物体之间的事物相似性相关程度的一种数学度量式的结果。将一个人类图像的各种特征检索观察点可看作等同是图像位于一个坐标标准空间的一个特征点,两个图像特征观察点的相似度和特征距离即相似度通常用它们之间的特征距离系数来精确表示,不同特征种类的图像特征检索数据所指的需要同时采用的相似度及其度量计算函数都可能是不一样的,相似性和度度量函公式的正确选择的恰当与否往往会对特征检索结果精确度与否产生很大的直接影响,合适点的距离才是度量计算函数的正确选择,将来也会帮助使得人类图像的各个特征向量比较更加容易契合了解的人类对于各种视觉图像感知技术方面图像内容的特征仿真,有助于基于人类视觉图像感知技术方面的人类图像特征检索分析技术的仿真性能和实际应用。
假设我们在一个图像的数据库中,用两个特征向量分别来描述和表示任意一个图像的特征,其中 x 和 y ,分别为是任意两个图像的特征向量,它们之间的接近程度我们可以通过采用距离的度量或者是统计学的方法等等来对这两个图像的相似性做出判断。常见的距离测度度量主要有欧几里德、Manhattan等。下面就我重点介绍一下欧几里德的距离。
欧几里德的线性距离函数是一种在实际上已经使用十分广泛的线性距离函数变量。它的变量计算简单,并且同时也和国际参考动力系统理论中的径向旋转不确定变量计算有密切相互联系。它的英文含义:
例如当我们发生了数据的丢失或者是当所有的特征矢量都不具备相同的权重时,那么就无法利用欧几里德距离计算方法来对其进行类似性的测度。为了避免这类情况,在实践和研究的过程中,我们可以针对欧几里德的距离进行归一化。归一化欧几里德距离的定义公式如下图所示:
6、实验结果分析
图像库中包括简单几何形状,其中星形、心形、圆形、新月形图像10幅。从分析我们不仅可以清楚地明显看出,算法对于检索图像的视觉扭转和图像形变都真的是十分具有非常强的不变性,并对于检索图像的基本主观形态和视觉特性也是非常具有鲁棒性,在就算没有一定的图像形变和扭转干扰等等条件的特殊情况下,仍然完全可以直接得出良好的视觉图像判断检索实验结果;且由于算法检索图像结果所需要排列的持续时间和排列顺序与检索个体的视觉主观性和视觉特征判断检索方式大致相同,检索结果准确率也比较高。
六、以形状为特点的图像检索系统设计
6.1检索基本思想
本文文件检索的基本工作方法主要内容是:在根据设计需要建立矩形图像库时,对不同输入的两个矩形图像子存入进行综合分析,分别选择采用经过改进后的不同可变矩和二维极坐标傅里叶描述子对两个图像的不同形状和状态特征向量进行综合描述;在将两个图像子的存入转换到二维矩形图像库同时,也将其中两个相应的不同可变矩和二维极坐标傅里叶描述子的形状特征向量分别存入二维矩形图像库的特征库.检索时,根据所有用户需要提供的图像查询数据示例检索图像,采用通过线性函数加权方法求和的一种计算结果方式,计算其与二维矩形图像库中各不同类型矩形图像的各种综合相似度,把计算结果对子集中的一个大于一定相似度的图像结果集进行返回发送给所有用户.6.2 Canny算子的程序设计
本文是用C++编程来实现图像的处理,整体流程图如图所示
未打开
N
Y
Canny算子程序流程图如图所示:
6.2.1图像特征数据库设计
基于图像形状和特征的检索系统中的一个图像特征数据库是用来存放和分析图像仓库中不同图像之间的形状和特点。在这里,将计算得到的一组图像的形状和特征(曲率、质心距离、复坐标和弦长)从 Access中存放到一个相应的特征列表中,组成了一个特征数据库。
对于图像的检索,本文特别设计了对图像入库、显示、删除和添加描述四个功能。首先,利用灰度共生矩阵提取的方法得到一个图像的形状特征,并将这些特征数据存储在 access 数据库中;然后,利用基于文本或者简单的缩略图浏览等多种方式从 access 数据库中寻找到一个示例的图像,同时,针对该一个示例图像进行基于其形状和特征的内容检索和匹配,并根据需要给出检索结果的图像。
6.3实验结果
以下是原图与处理后的图片,其中图3-4为原始图片,图3-5为Canny 算子处理后的图片。
从上述处理过的数据和图像中我们可以清楚地看出, canny 算子所处理的数据和图像不但达到了准确地提取边缘信息的主要目的,提高了抵御干扰的能力外,还使得边缘更为连续清晰。
七、基于图像形状学特点的检索方法在系统中的实现
7.1系统框架
一般的图像检索子系统主要有两个大部分共同组成:图像产生子系统和数据库检索子系统,如图4-1所示。图像产生的子系统主要是对于图像输入前进行的预处理、图像中内容的特性提取以及把这些特性和部件描述的信息纳入到数据库中。图像检索子系统主要是完成对图像的检索,其中包含了浏览和查询、图像特点的相似性匹配以及图形使用者接口等几个部分。
在本文的两个实验物理子系统中,图像特征制作与截图生成实验子系统将本文中所需要描述的流体物理学图像特征及其应用对象的局部轮廓特征进行了综合分析并并入库。在这个图像轮廓检索工具子系统中,支持一个用户通过浏览库中现有的一个图像库,手动地绘制一个图像库的轮廓及然后选择一个示例的视图。
7.2编程环境
本次测试实验操作系统的主要程序开发工具平台主要是Window XP,选择使用Visual C++6.0和Access两款软件作为主要的程序开发工具,选择Visual C++6.0和Access是因为它们都能够具有面向对象应用程序设计的基本整体化和性能设计特点以及所需要开发的所有应用程序都能够具有高度的效率地正常运行。同时又是一种微软技术性高度相互集成的企业软件开发实用工具,它为企业用户自己提供了一套功能强大的企业微软软件基础类库。且因我们已经使用了Visual C++6.0来用于开发一个基于视频内容的数字视频流和图像信息检索系统。由于芯片系统内部采用了面向对象的图像设计工作方式,这样也就使得芯片系统的许多图像功能以及处理图像模块都完全可以直接整合应用起来到其它的芯片图像处理系统中,而且需要添加新的图像算法也就不必再因为需要额外复杂地进行修改许多的图像源代码,非常好地有助于整个芯片系统在图像功能上的逐步完善和不断扩展。
7.3程序结果
首先打开一个图像库选择一个图像,然后对该图像进行特征提取。系统通过图像检索相似度的匹配,找到六个与其相似的图像,输出结果。找到六个与其相似的图像,输出结果。
八、总结
本文第一章对基于内容的图像检索方式进行了概述,进而又着重介绍了基于形态的图像检索方式。并且广泛地应用了对图像进行边缘检查的技术,对整个图像进行了检索。它主要是运用 canny 算子的方法。首先,是对边缘的检测主要以导数来计算,但是受到了噪声影响。然而,该滤波器在减少了噪声的作用下,也造成了边缘强度的损耗。其次,增强算法把对邻域的点的度有明显改变的地方以及点凸显性地展现了。一般可以靠计算机梯度的幅值来实现。再次,但是在有些图象中,梯度幅值比较大的地方并非边缘的节点。最简单的对边缘性检测就是梯度幅值阈值的判断。最后,精确地选择了边缘处的位置。
我也希望在今后的将来有更多的人去探导、研究一个边缘检测算子,为使我们能够看到更好的影片效果而努力,为了促进全人类的生活和发展而努力。图像是自古以来人类识别和交流信息的一个主要资料来源,因此,图像处理的应用领域已经涵盖到了人类日常生活、工作等诸多领域。随着现代科学技术的发展和进步,图像的应用领域也在不断拓宽。所以对于边缘性的检测也是需要继续进步。我看到将来,边缘检测技术已经广泛地应用于人们日常生活的各个领域,在当今世界人类的日常生活中,文化艺术、军事技术、生物医疗技术、工业生产和信息工程技术、航天与空间技术等等重要的领域都占有着不可或缺的一部分。同全人类的生活走向风流。
参考文献
[1] 章毓晋.图像处理和分析[M].北京:清华大学出版社,1999
[2] 章国宝.叶桦.陈维南.基于正交小波变换的多尺度边缘提取[J].中国图像图形报,1998(3)
[3] 陈武凡..彩色图像边缘检测新算法−广义模糊算子法[J].中国科学A辑,1995(2)
[4] 唐立军.段立娟.高文.基于内容的图像检索系统[J].计算机应用研究,2001,18(7):41-45
[5] 冯所前.文档内容图像检索[D].北京大学信息科学技术学院智能科学系硕士学位论文,2005
[6] 谢毓湘.吴玲达.栾悉道.基于内容的图像检索技术研究[J].计算机工程与应用,2002(1):35-38
[7] 宋涛.刘刚.一种基于内容的文档图像检索方法.《郑州大学报》,2010年1月
[8] 郭小娟.基于内容的图像检索技术的研究[D].西安:西北大学,2007
[9] 徐建华.图像处理与分析[M ].北京:科学出版社,1992
[10] 贾元元.基于形状的图像数据库检索技术研究[学位论文] 2004
[11] Ang Y H.Image Retrieval Based on Multidimensional Feature Properties 1995
[12] 赖志国.余啸海.Matlab 图像处理与应用[M].北京:国防工业出版社,2004
[13] 唐路路.张启灿.一种自适应阈值的Canny边缘检测算法/光电工程:第38卷第5期,2011.5
第四篇:简单验证码的匹配实现
简单验证码的模板匹配实现
摘要:验证码是伴随自动提交程序的出现而出现的,其初衷是预防恶意程序的大量登录,随着互联网IT技术的不断发展,验证码已成为网站和网民交互的一个特征。国内外都有对验证码的设计和识别的研究,该文以一类常见验证码为例进行了实际的识别实现。
关键词:验证码;模板;实现
中图分类号:TP393文献标识码:A 文章编号:1009-3044(2011)26-6375-02
验证码是论坛等网站用以阻止自动提交程序恶意行为的人机区分技术,其设计和使用直接涉及到互联网的正常浏览体验。在信息化社会这个背景下,随互联网IT技术的不断发展,验证码的发展是非常迅速的。现在各种论坛、博客、投票等程序都带有验证码功能。
目前,网络流行的验证码有很多种,从人工和机器识别两个角度分析,主要有以下4类:1)人工难以识别、机器容易识别;2)人工容易识别、机器容易识别;3)人工难以识别、机器难以识别;4)人工容易识别、机器难以识别;
验证码识别技术的研究,其目的就是设计并应用IV类验证码。但是国内实际使用的验证码中,尚无特别符合标准IV的实例[1]。
国内对验证码识别的研究较少,文献2将神经网络算法引入验证码识别技术中;文献3提出了简单的基于字符形状的验证码识别技术;文献4探讨了一种基于外部轮廓的数字验证码识别方法;文献5提出了一种加权模板的构造方案。本文以常见的直立、有杂色的验证码为例进行实际的识别实现,这种验证码图片内的字母及数字分布均匀,图片背景一般为纯色,目前在大量论坛及网页游戏、个人网上银行中应用。研究方法
通常验证码的识别需要涉及图像处理和人工智能、模式识别、机器视觉的基本知识。图像处理一般指针对数字图像的某种数学处理,如投影、钝化、锐化、细化、边缘检测、二值化、压缩等等。二值化:一般图片都是彩色的,按照逼真程度可能很多级别。为了降低计算复杂度,方便后续的处理,在不损失关键信息的情况下,能将图片处理成黑白两种颜色;细化:找出图像的骨架,图像线条可能是很宽的,通过细化将宽度将为1,某些地方可能大于1。不同的细化算法,可能有不同的差异,比如是否更靠近线条中间,比如是否保持联通行等;边缘检测:主要是理解边缘的概念。边缘实际上是图像中图像像素属性变化剧烈的地方。可能通过一个固定的门限值来判断,也可能是自适应的。门限可能是图像全局的,也可能是局部的。简单验证码的识别对象如图1所示。
其识别过程包括图像采集、预处理、识别几个方面,具体对应以下4个步骤:1)取出字模;2)二值化;3)计算特征;4)对照样本。技术实现
以VB6.0为开发平台,用WebBrowser控件载入带有简单类型验证码的网页、imagebox控件保存验证码图片。使用doAuen()函数复制验证码图片并保存到本地,调用doClear()、doComp()方法生成验证码,调用doPost()方法提交。
图像采集过程使用for each语句遍历WebBrowser1.Document.All,将tagName转换为大写字母与“IMG”匹配,以其id与验证码图片匹配。Vb提供了createControlRange()方法用于非文本元素选择区域,该方法返回一个controlRange集合,有add()方法用于添加元素,execCommand()方法用来对当前页面或选定区域或指定区域执行命令[6]:
Set ctrl = WebBrowser1.Document.body.createControlRange()
ctrl.Add(Dov)
ctrl.execCommand(“Copy”)
Dov元素为验证码图片元素。execCommand 方法需要一个字符串参数指示所要进行的操作,此参数可以是任意能执行的参数关键字,Copy参数将选定区域复制到剪贴板。
SavePicture 语句可以从对象或与其相关的Picture、Image控件属性中将图形保存到文件中,完成图像的采集,其语法有两个参数,第一个参数为产生图形文件的 PictureBox 控件或Image 控件;第二个参数是文件路径:
SavePicture Clipboard.GetData, App.Path & “tmp.bmp”
Clipboard 类提供可以方便地与系统剪贴板相互传输数据的静态方法,GetData从剪贴板检索指定格式的数据。
动态装载图片的VB方法是LoadPicture(),参数为图片文件名的全称及路径。对图所示验证码图片进行分析,宽度为80像素,高度为20像素,字符位置基本均匀,所以简单地将图片切割为4部分分别进行预处理。
图片的预处理过程为3次遍历:依像素对图片进行第一次遍历,忽视白色背景,将字符色与干扰色存入数组id,同时将颜色值出现次数存入数组nums,两者一一对应,用一个游标参数flag指示数组长度。VB的Picture.Point(i, j)方法,可以按照像素坐标获取位图的颜色值。对于任一像素,如果颜色值不为16777215(白色),则从nums(0)到nums(flag)遍历数组id进行匹配,如果颜色值不存在则将此颜色项同时添加到数组id和nums并进行相应的游标操作;如果颜色值已经存在,将其nums数组储存的数值加1。
第二次对nums数组进行遍历找出最大值,与其下标相同的id数组项的值即要识别的实际字符颜色;
第三次遍历对像素采样并进行二值化,将目标色置1,其它颜色统一置0,生成二值化数组。
遍历预处理数组生成二值化字符串,计算特征串,最简单的方法是去掉串头尾的字符0。将特征串存入本地文件,每个特征串一行,并将特征串对应的字符附加到串末尾。
Vb的open语句可以操作顺序、随机以及二进制文件。打开顺序文件的语法是open pathname for [Input|Output|Append] as [#]filenumber [len=buffersize],参数表示文件名,可以包含驱动器和目录;参数Input表示从打开的文件中读取数据,以这种方式打开文件时,文件必须存在,否则会产生错误;参数As[#]filenumber 子句为打开的文件指定文件号,对文件进行读写操作时,要用文件号表示该文件,文件号是介于1~511之间的整数,可以是数字、变量,也可以省略不用。顺序文件的按行读取语句为Line Input #,该语句从打开的顺序文件中读取一行数据。
Open App.Path & “list.txt” For Input As #1
Do While Not EOF(1)
Line Input #1, t
If InStr(s, Mid(t, 1, Len(t)-1))> 0 Then
singleC = Right(t, 1)
End If
Loop
Close #1
遍历特征库,如果特征串在二值化串中的子串位置大于0,即匹配成功。取出此特征串末尾的字符,即单个字符的识别结果。小结
互联网作为基础型平台,在提供大量信息及应用的同时,验证码给信息化及社会信息化带来的影响是深远的,它影响着用户的体验,影响着应用抵抗恶意攻击的生存能力,乃至影响着整个软件业生产方式的变化。在此背景下,研究验证码的自动识别、探索相关验证码技术,其重要性是不言而喻的。基于字符特征串匹配的验证码识别方法基本能做到100%识别率,而且特征库小、识别速度快。其缺点是验证码适用对象单一,没有涉及到专业的图形图像处理算法。
参考文献:
[1] 文晓阳,高能,夏鲁宁,荆继武.高效的验证码识别技术与验证码分类思想[J].计算机工程,2009.[2] 左保河,石晓爱,谢芳勇,等.基于神经网络的网络验证码识别研究[J].计算机工程与科学,2009.[3] 朱绍文,陈光喜.一种简单的基于字符形状的验证码识别技术[J].桂林电子科技大学学报,2010.[4] 潘大夫,汪渤.一种基于外部轮廓的数字验证码识别方法[J].微计算机信息,2007.[5] 王虎,冯林,孙宇哲.数字验证码识别算法的研究和设计[J].计算机工程与应用,2007.[6] MSDN.controlRange Collection [EB/OL].http://msdn.microsoft.com/en-us/library/ms537447(v=vs.85).aspx,2011.
第五篇:总结 图像配准算法范文
图像配准定义为:对从不同传感器、不同时相、不同角度所获得的两幅或多幅图像进行最佳匹配的处理过程[2]。图像配准需要分析各分量图像上的几何畸变,然后采用一种几何变换将图像归化到统一的坐标系统中。在配准过程中,通常取其中的一幅图像作为配准的标准,称之为参考图像;另一幅图像作为配准图像。
图像的获取参考图像输入图像 图像的预处理 特征提取 特征匹配 空间变换模型类型的确定 模型参数的估计 图像的插值与变换 配准结果 配准系统的评价 图像配准
图1-1 图像配准的基本流程
图像配准算法分类按全局与局部划分按配准的四要素划分从自动化角度划分全局配准点点匹配搜索空间特征空间搜索策略相似性度量互相关函数绝对差和相位相关Hausdorff距离…手工配准刚性变换仿射变换投影变换多项式变换局部变换灰度特征区域特征线特征点特征…穷尽搜索逐级求精树图匹配动态规划…半自动配准自动配准
图1-2 图像配准方法分类-根据配准使用的特征,图像配准的方法大致可分为三类:
(1)基于图像灰度的配准算法。首先从参考图像中提取目标区作为配准的模板,然后用该模板在待配准图像中滑动,通过相似性度量(如相关系数法、差的平方和法、差的绝对值法、协方差法)来寻找最佳匹配点。
(2)基于图像特征的配准算法。该算法是以图像中某些显著特征(点、线、区域)为配准基元,算法过程分为两步:特征提取和特征匹配。首先从两幅图像中提取灰度变化明显的点、线、区域等特征形成特征集。然后在两幅图像对应的特征集中利用特征匹配算法尽可能地将存在对应关系的特征对选择出来。对于非特征像素点利用插值等方法作处理推算出对应匹配关系,从而实现两幅图像之间逐像素的配准。
(3)基于对图像的理解和解释的配准算法。这种配准算法不仅能自动识别相应像点,而且还可以由计算机自动识别各种目标的性质和相互关系,具有极高的可靠性和精度。这种基于理解和解释的图像配准涉及到诸如计算机视觉、模式识别、人工智能等许多领域。不仅依赖于这些领域中理论上的突破,而且有待于高速度并行处理计算机的研制。
从自动化角度来看,可以将配准过程分为自动、半自动和手动配准。
存在问题:如何提高图像的配准速度将是大范围遥感图像自动配准问题的要点;选取何种自动配准方案以保证图像的配准精度将是大范围遥感图像自动配准问题的另一要点。)
f2(x,yg[f1(h(x, y其中,h表示二维空间坐标变换。g表示灰度或辐射变换,描述因传感器类型的不同以及成像时气候等环境的影响所带来的图像灰度的变换。配准问题的实质就是要找到最优的空域变换h和灰度变换g,使得上述的等式成立,从而找到配准变换的参数
特征空间的选择通常要考虑以下几个因素:相似性;空间分布;唯一性。在自动图像配准中对特征的理解可以分为两类。(1)基于灰度的方法:基于灰度的方法将重点放在特征匹配上,在其过程中并没有真正提取特征。一般所说的模板匹配法就是这种方法的代表。这种方法实际上将图像的灰度分布直接作为特征而构成匹配的基础。(2)基于特征的方法:基于特征的方法需要在图像中提取显著的特征:区域(森林、湖泊、农田等)、线(区域的边界、道路等)和点(区域的角点、线的交点、曲线上的高曲率点等)。特征应该可以分布在图像任何地方并且可以被提取出来。
一般图像配准的过程主要涉及到图像的特征空间、相似性测度和搜索策略这三个方面。我们称这三个方面为图像配准的三要素,它们决定了图像配准的精度和速度。
按照配准过程中采用的特征类型,图像配准可分成两类:基于灰度的配准和基于特征的配准的方法。
基于图像灰度的配准方法是直接利用图像的灰度值来确定配准的空间变换,其中充分利用图像中所包含的信息,从而也称为基于图像整体内容的配准方法。这类方法的核心思想是认为参考图像和待配准图像上的对应点及其周围区域具有相同或者相似的灰度,并以灰度相似为基础采用相似度函数,然后寻找一组最优的几何变换参数使得相似度函数最大,从而实现图像的配准。在两幅图像灰度信息相似的情况下,常用的匹配方法有:互相关法(Cross-correlation),序贯相似检测算法(Sequential Similarity Detection Algorithms, SSDA)以及最大互信息法。
虽然基于灰度的图像配准方法实现简单,但存在着如下缺点:(1)对图像的灰度变化比较敏感,尤其是非线性的光照变化,将大大降低算法的性能;(2)计算的复杂度高;(3)对目标的旋转,形变以及遮挡比较敏感。因此这种方法通常并不单独用在遥感图像配准中。
基于特征的图像配准方法可以克服利用图像灰度信息进行图像配准的缺点,主要体现在以下三个方面:(1)图像的特征点比图像的象素点要少很多,因此大大减少了配准过程的计算量;(2)特征点的匹配度量值对位置的变化比较敏感,可以大大提高配准的精确程度;(3)特征点的提取过程可以减少噪声的影响,对灰度变化,图像形变以及遮挡等都有较好的适应能力。因此,其在图像配准领域得到了广泛应用。基于特征的图像配准方法有两个重要环节:特征提取和特征匹配。
待配准图像 图像预处理特征提取 特征集合 选择匹配基元 参考图像 搜索策略 选择匹配基元 特征提取特征集合配准结果重采样 模型参数求解 匹配结果 图2-13 基于特征的图像配准方法的基本步骤 基于特征点的配准方法的缺点:目前大多数的遥感图像配准系统都采用基于特征点的配准方法,以交互或自动的方式选择必要的控制点,但这些系统不能很好地适用于自动处理大量的数据,原因是特征点或控制点的选取是一项耗时、耗力的工作,在要求实时处理的应用中,这种方法是不现实的。同时自动配准要考虑是精度问题,因为在卫星遥感图像中自动地确定有效的、精确的控制点有时是困难的,太少的点、不准确的点或者分布不均匀的点被选取都可能导致配准的误差,而且这种情况是经常发生的。
基于特征的要求图像比较清晰,能选出特征点,线,区域即:基于特征点的局部自动配准的一个前提是,能够从图像中准确提取点特征。图像模糊,这必然使得点特征的提取比较困难,更加容易漏选特征点和产生伪特征点,从而导致配准精度不高。
1.基于小波变换的遥感图像自动配准算法
其基本思想是:在对大尺度遥感图像进行配准时,为了降低运算量,提高速度,利用小波变换的多分辨率特性,首先在低分辨率图像上获得一组配准参数,然后以此为初始值,再向高分辨率方向上逐层映射;算法在实现上,遵循一种由粗到精的搜索策略,即首先利用相似性度量获得图像间的一个粗略的变换参数估计,逐层迭代搜索,最终获得精确的配准参数。
基于图像灰度的全局配准,全局配准则是利用整幅图像直接对映射函数进行搜索。
基于小波变换的配准原理:图像配准过程中,如果对整幅图像进行搜索,计算量大、耗时长。为了减少搜索空间,可以利用小波变换构造多尺度图像金字塔,采取由粗到细的搜索策略,即只在最高层进行全搜索,逐层缩小搜索范围,大大提高搜索效率。图像经小波分解后分别得到低频和高频分量数据,低频子图像反映了原图像的平滑特征,高频系数分别反映了原图像水平、垂直和对角方法的亮度突变特征。该突变特征可用于图像配准的特征点(控制点),而且小波分解后子图尺寸减小2l(l表示分解层数)倍。因此为了减小计算量,需要找到小波分解后的子图配准与原图配准之间的关系。
基于小波变换的配准方案:基于小波变换的全局配准方案,其基本思想是:首先采用小波变换将原始图像逐级分解得到一个分辨率从低到高、规模由小到大的层次式结构(也称金字塔结构);然后在分辨率低的图像层,通过线性搜索或其他策略得到该分辨率下最优解的初步变换参数估计,并将此估计作为下一级图像层处理的搜索中心,使得变换参数估计在较高分辨率下逐级得到校正和精化,随着分辨率的提高,估计的精度随之提高,同时搜索的范围也逐级缩小,最终在最高分辨率的图层上得到满足精度要求的最优解。可见,在分辨率最低的图像层,即使采用线性搜索策略,由于其数据量与原始图像相比己经很小,计算量也会大大减小,而到了分辨率较高的图层,由于搜索的范围越来越小,那么虽然图像规模变大,计算量也得到了有效的控制。该方案的基本流程如下:
(1)对参考图像和待配准图像均采用小波变换进行逐级分解,得到不同分辨率和大小的两组金字塔图像;
(2)给定变换参数的搜索范围,在分辨率最低的图层上进行全搜索:依次取出搜索空间中的变换参数,对待配准图像对应的图层进行几何变换,采用基于灰度的配准方法(互相关法、最大互信息法等),得到该分辨率下最优解的初步变换参数估计,并将此估计作为下一级图像层处理的搜索中心;
(3)以上一层的搜索结果为搜索中心,在高一级分辨率下搜索变换参数,由粗到精逐步细化变换参数。最终在原始配准图像上得到满足精度要求的配准参数
该配准方案的特点可以归纳如下:
算法不需要人工干预,适合于大数据量的遥感图像自动配准。 与基于点特征的自动配准方案相比,在缺乏先验知识的情况下,避免了点-点匹配的方法因缺乏充足和准确的控制点而导致较大的配准误差。 利用了多分辨率小波的优势,采用由粗到精的搜索策略,减少了搜索空间,加速了处理过程,提高了图像配准的速度。
2.高分辨率SAR影像同名点自动匹配技术 图像自动配准大致包括以下3大步骤:(1)在主、辅影像中提取特征点,通过实施同名点搜索来获取同名点;(2)利用同名点信息来解求主、辅影像之间的变换函数;(3)对辅影像进行几何变换,并通过重采样来获得纠正后的配准影像。
在这3大步骤中,之所以同名点对的确定是自动配准流程中的关键环节,首先,因为它的配准精度将直接决定变换函数的解求及解求精度;其次,因为同名点搜索计算复杂度通常情况下较复杂,其在整个影像配准流程中占有较高的机时量。鉴于此,研究一种高精度、高效率的同名点搜索技术将显得格外重要。本文提出的同名点自动匹配算法大致包括以下3大步骤:(1)创建金字塔影像,并通过在金字塔影像上进行回溯搜索来确定初始变换函数类型及相应 的变换参数;(2)通过分层回溯逐层加密控制点来解求最佳变换函数类型及相应变换参数;(3)在原始影像分辨率下修正同名点坐标,以获取最终匹配同名点对。
3.图像配准技术研究进展
将配准技术概括为8个方面,包括:配准对象、特征提取、特征匹配、变换模型、优化策略、坐标变换与插值、系统实现及算法评估,并考虑每项内容的技术特性进行细分,然后依据某一算法的创新点进行分类。
4.图像配准方法及其在目标跟踪中的应用
图像配准方法可以分为基于灰度的配准和基于特征的配准。基于特征的图像配准方法有两个重要环节:特征提取和特征匹配。可以选取的特征包括点、线与区域。基于特征的图像配准方法主要有两方面优点:a.图像的特征点比图像的像素点要少很多,大大减少了匹配过程的计算量;b.特征点的提取过程可以减少噪声的影响,对灰度变化、图像形变以及遮挡等都有较好的适应能力。
基于点特征的图像配准方法:特征点的提取——特征点匹配——误匹配点剔除——配准参数计算
5.图像配准技术研究
图像之间的配准一般可分为以下5个步骤:
(l)从基准图像和参考图像中提取共有的控制结构,这种控制结构可以是物体的点、边缘和边界等;
(2)对每幅图像中的控制结构(特征点)进行匹配;(3)选择几何变换模型,并利用匹配特征点对来估计变换参数;(4)对图像实行坐标变换和灰度插值;(5)对配准的效果进行评估。
所有图像配准方法都可以归纳为对三个元素选择问题,即特征空间、相似性准则和搜索策。特征空间从图像中提取用于配准的信息,搜策略从图像转换集中选择用于匹配的变换方,相似性准则决定配准的相对价值,然后基于一结果继续搜索,直到找到能使相似性度量有人满意的结果的图像变换方式。根据图像配准这三个基元素选择的区别,图像配准方法通常分为三类:
(l)基于象素的配准方法,即根据待配准图像的相关函数、Fourier变换和各阶矩量之间的关系式来计算配准参数。
(2)基于特征的配准方法,即根据需要配准图像重要相同特征之间的几何关系确定配准参数。这类方法首先需要提取特征,如图像的边缘、角、点、线、曲率等具有不变性的特征。提取特征可在空间域内进行,也可在变换域内进行。在空间域内常使用的特征包括边缘、区域线的端点、线交叉点、区域中心、曲率不连续点等。其中边缘和区域边界最常用,可以由边缘检测方法和区域分割方法得到;基于特征的配准方法是图像配准中最常见的方法,对于不同特性的图像,选择图像中容易提取,并能够在一定程度上代表待配准图像相似性的特征作为配准依据。基于特征的配准方法在图像配准方法中具有最强的适应性。
(3)基于模型的配准方法,这种方法是根据图像失真的数学模型来进行非线性校正式的配准。
前两种方法是全局图像配准技术,需要假设图像中的对象仅是刚性地改变位置、姿态和刻度,改变的原因往往是由受试者运动引起的。第三类方法只适合图像中对象之间局部的非线性的、非刚性的变形校正,这种失真通常由于成像系统空间编码的非线性引起的。所以,它需要根据成像系统的非线性失真模型来实现配准。前两类方法多用于图像的初步配准,且能够解析求解,后一类方法多用于图像的精细配准,通常利用非线性规划的方法数值求解。
3.26:
图像的配准和融合方法较多,主要分为三类:基于像素的配准方法,基于特征的配准方法和基于模型的配准方法。基于像素的配准方法多用于图像的初步配准,计算量小;基于特征的配准方法定位准确,计算量较大且要首先进行特征提取;基于模型的配准方法多用于图像的精细配准,但只适合图像中的对象之间的局部的非线性的非刚性的变形的校正。对于像素相关性大的图像,可利用图像间相同位置的特征点进行配准;对于像素相似性小的图像,需要先对图像进行特征提取,通过提取的特征点进行配准。
基于特征点的图像配准技术主要有两类方法: a)比较两幅图像的特征点及其周围像素的灰度、曲率等情况来计算特征点之间的相似程度,建立特征点之间的一一对应关系[1, 2]。由于仅考虑单个特征点之间的相似程度,常存在特征点误匹配的情况。b)改进的方法是建立特征点集之间的变换关系,主要使用Hausdorff距离来匹配两个特征点集[3, 4]。这类方法可以容忍点与点之间匹配的不准确,但是要求预先确定图像之间变换模型的参数搜索范围,而且在图像差异较大时计算量很大。
配准方法可分为以下几种:(l)基于控制点的匹配方式。控制结构为图像中的显著点(称为控制点),控制点可以是用户提供的,也可以由算法估计,然后对控制点进行匹配,估计几何变换参数并进行配准。(2)基于矩(monent一based)的配准方式口控制结构是复杂的图像矩,每幅图像被标准化,即与一个矩被归一化的参数位置进行匹配。(3)基于边缘的配准方式。控制结构是图像的边缘.通过比较边缘像素的密度或在符号层次上比较边缘来实施边缘匹配。几何变换参数直接导出并对其中一幅图像实施相应的变换.(4)基于相似性判据最优化的方式。选择一个几何变化并以各种参数值施于一幅图像上。对于每一个值,评价由相似性判据提取的控制结构。该值表明了控制结构匹配的程度,因此可以从判据的最优值实现配准。图像配准主要包括以下四个步骤:(l)从待配准的每幅图像中提取控制结构;(2)在每幅图像中对控制结构进行匹配;(3)从前两步中选择几何变换并对其参数 进行估计;根据图像配准的这三个基元素选择的区别,图像配准的方法通常可分为三类:(l)基于象素的配准方法,即根据待配准图像的相关函数、Fourier变换和各阶矩量之间的关系式来计算配准参数。(2)基于特征的配准方法,即根据需要配准图像重要相同特征之间的几何关系确定配准参数。这类方法首先需要提取特征,如图像的边缘、角、点、线、曲率等具有不变性的特征。提取特征可在空间域内进行,也可在变换域内进行。在空间域内常使用的特征包括边缘、区域线的端点、线交叉点、区域中心、曲率不连续点等。其中边缘和区域边界最常用,可以由边缘检测方法和区域分割方法得到;基于特征的配准方法是图像配准中最常见的方法,对于不同特性的图像,选择图像中容易提取,并能够在一定程度上代表待配准图像相似性的特征作为配准依据。基于特征的配准方法在图像配准方法中具有最强的适应性。(3)基于模型的配准方法,这种方法是根据图像失真的数学模型来进行非线性校正式的配准。前两种方法是全局图像配准技术,需要假设图像中的对象仅是刚性地改变位置、姿态和刻度,改变的原因往往是由受试者运动引起的。第三类方法只适合图像中对象之间局部的非线性的、非刚性的变形校正,这种失真通常由于成像系统空间编码的非线性引起的。所以,它需要根据成像系统的非线性失真模型来实现配准。前两类方法多用于图像的初步配准,且能够解析求解,后一类方法多用于图像的精细配准,通常利用非线性规划的方法数值求解。