计算机视觉方向综述：图像分割算法 -凯发k8国际首页登录

　　3.基于边缘检测的分割方法

　　基于边缘检测的图像分割算法试图通过检测包含不同区域的边缘来解决分割问题。它可以说是人们最先想到也是研究最多的方法之一。通常不同区域的边界上像素的灰度值变化比较剧烈，如果将图片从空间域通过傅里叶变换到频率域，边缘就对应着高频部分，这是一种非常简单的边缘检测算法。

　　边缘检测技术通常可以按照处理的技术分为串行边缘检测和并行边缘检测。串行边缘检测是要想确定当前像素点是否属于检测边缘上的一点，取决于先前像素的验证结果。并行边缘检测是一个像素点是否属于检测边缘高尚的一点取决于当前正在检测的像素点以及与该像素点的一些临近像素点。

　　最简单的边缘检测方法是并行微分算子法，它利用相邻区域的像素值不连续的性质，采用一阶或者二阶导数来检测边缘点。近年来还提出了基于曲面拟合的方法、基于边界曲线拟合的方法、基于反应-扩散方程的方法、串行边界查找、基于变形模型的方法。

　　边缘检测的优缺点：

　　(1)边缘定位准确;

　　(2)速度快;

　　(3)不能保证边缘的连续性和封闭性;

　　(4)在高细节区域存在大量的碎边缘，难以形成一个大区域，但是又不宜将高细节区域分成小碎片;

　　由于上述的(3)(4)两个难点，边缘检测只能产生边缘点，而非完整意义上的图像分割过程。这也就是说，在边缘点信息获取到之后还需要后续的处理或者其他相关算法相结合才能完成分割任务。

　　在以后的研究当中，用于提取初始边缘点的自适应阈值选取、用于图像的层次分割的更大区域的选取以及如何确认重要边缘以去除假边缘将变得非常重要。

　　结合特定工具的图像分割算法基于小波分析和小波变换的图像分割方法

　　小波变换是近年来得到的广泛应用的数学工具，也是现在数字图像处理必学部分，它在时间域和频率域上都有量高的局部化性质，能将时域和频域统一于一体来研究信号。而且小波变换具有多尺度特性，能够在不同尺度上对信号进行分析，因此在图像分割方面的得到了应用，

　　二进小波变换具有检测二元函数的局部突变能力，因此可作为图像边缘检测工具。图像的边缘出现在图像局部灰度不连续处，对应于二进小波变换的模极大值点。通过检测小波变换模极大值点可以确定图像的边缘小波变换位于各个尺度上，而每个尺度上的小波变换都能提供一定的边缘信息，因此可进行多尺度边缘检测来得到比较理想的图像边缘。

　　上图左图是传统的阈值分割方法，右边的图像就是利用小波变换的图像分割。可以看出右图分割得到的边缘更加准确和清晰

　　另外，将小波和其他方法结合起来处理图像分割的问题也得到了广泛研究，比如一种局部自适应阈值法就是将hilbert图像扫描和小波相结合，从而获得了连续光滑的阈值曲线。

　　基于遗传算法的图像分割

　　遗传算法(genetic algorithms，简称ga)是1973年由美国教授holland提出的，是一种借鉴生物界自然选择和自然遗传机制的随机化搜索算法。是仿生学在数学领域的应用。其基本思想是，模拟由一些基因串控制的生物群体的进化过程，把该过程的原理应用到搜索算法中，以提高寻优的速度和质量。此算法的搜索过程不直接作用在变量上，而是在参数集进行了编码的个体，这使得遗传算法可直接对结构对象(图像)进行操作。整个搜索过程是从一组解迭代到另一组解，采用同时处理群体中多个个体的方法，降低了陷入局部最优解的可能性，并易于并行化。搜索过程采用概率的变迁规则来指导搜索方向，而不采用确定性搜索规则，而且对搜索空间没有任何特殊要求(如连通性、凸性等)，只利用适应性信息，不需要导数等其他辅助信息，适应范围广。

　　遗传算法擅长于全局搜索，但局部搜索能力不足，所以常把遗传算法和其他算法结合起来应用。将遗传算法运用到图像处理主要是考虑到遗传算法具有与问题领域无关且快速随机的搜索能力。其搜索从群体出发，具有潜在的并行性，可以进行多个个体的同时比较，能有效的加快图像处理的速度。但是遗传算法也有其缺点：搜索所使用的评价函数的设计、初始种群的选择有一定的依赖性等。要是能够结合一些启发算法进行改进且遗传算法的并行机制的潜力得到充分的利用，这是当前遗传算法在图像处理中的一个研究热点。

　　基于主动轮廓模型的分割方法

　　主动轮廓模型(active contours)是图像分割的一种重要方法，具有统一的开放式的描述形式，为图像分割技术的研究和创新提供了理想的框架。在实现主动轮廓模型时，可以灵活的选择约束力、初始轮廓和作用域等，以得到更佳的分割效果，所以主动轮廓模型方法受到越来越多的关注。

　　该方法是在给定图像中利用曲线演化来检测目标的一类方法，基于此可以得到精确的边缘信息。其基本思想是，先定义初始曲线c，然后根据图像数据得到能量函数，通过最小化能量函数来引发曲线变化，使其向目标边缘逐渐逼近，最终找到目标边缘。这种动态逼近方法所求得的边缘曲线具有封闭、光滑等优点。

　　传统的主动轮廓模型大致分为参数主动轮廓模型和几何主动轮廓模型。参数主动轮廓模型将曲线或曲面的形变以参数化形式表达，kass等人提出了经典的参数活动轮廓模型即“snake”模型，其中snake定义为能量极小化的样条曲线，它在来自曲线自身的内力和来自图像数据的外力的共同作用下移动到感兴趣的边缘，内力用于约束曲线形状，而外力则引导曲线到特征此边缘。参数主动轮廓模型的特点是将初始曲线置于目标区域附近，无需人为设定曲线的的演化是收缩或膨胀，其优点是能够与模型直接进行交互，且模型表达紧凑，实现速度快;其缺点是难以处理模型拓扑结构的变化。比如曲线的合并或分裂等。而使用水平集(level set)的几何活动轮廓方法恰好解决了这一问题。

　　基于深度学习的分割
　　1.基于特征编码(feature encoder based)

　　在特征提取领域中vggnet和resnet是两个非常有统治力的方法，接下来的一些篇幅会对这两个方法进行简短的介绍

　　a.vggnet

　　由牛津大学计算机视觉组合和google deepmind公司研究员一起研发的深度卷积神经网络。它探索了卷积神经网络的深度和其性能之间的关系，通过反复的堆叠33的小型卷积核和22的最大池化层，成功的构建了16~19层深的卷积神经网络。vggnet获得了ilsvrc 2014年比赛的亚军和定位项目的冠军，在top5上的错误率为7.5%。目前为止，vggnet依然被用来提取图像的特征。

　　vggnet的优缺点

　　由于参数量主要集中在最后的三个fc当中，所以网络加深并不会带来参数爆炸的问题;

　　多个小核卷积层的感受野等同于一个大核卷积层(三个3x3等同于一个7x7)但是参数量远少于大核卷积层而且非线性操作也多于后者，使得其学习能力较强

　　vgg由于层数多而且最后的三个全连接层参数众多，导致其占用了更多的内存(140m)

　　b.resnet

　　随着深度学习的应用，各种深度学习模型随之出现，虽然在每年都会出现性能更好的新模型，但是对于前人工作的提升却不是那么明显，其中有重要问题就是深度学习网络在堆叠到一定深度的时候会出现梯度消失的现象，导致误差升高效果变差，后向传播时无法将梯度反馈到前面的网络层，使得前方的网络层的参数难以更新，训练效果变差。这个时候resnet恰好站出来，成为深度学习发展历程中一个重要的转折点。

　　resnet是由微软研究院的kaiming he等四名华人提出，他们通过自己提出的resnet unit成功训练出来152层的神经网络并在ilsvrc2015比赛中斩获冠军。resnet语义分割领域最受欢迎且最广泛运用的神经网络.resnet的核心思想就是在网络中引入恒等映射，允许原始输入信息直接传到后面的层中，在学习过程中可以只学习上一个网络输出的残差(f(x))，因此resnet又叫做残差网络。、

　　使用到resnet的分割模型：

　　efficient neural network(enet)：该网络类似于resnet的bottleneck方法;

　　resnet-38：该网络在训练or测试阶段增加并移除了一些层，是一种浅层网络，它的结构是resnet fcn;

　　full-resolution residual network(frrn)：frrn网络具有和resnet相同优越的训练特性，它由残差流和池化流两个处理流组成;

　　adapney：根据resnet-50的网络进行改进，让原本的resnet网络能够在更短的时间内学习到更多高分辨率的特征;

　　……

　　resnet的优缺点：

　　1)引入了全新的网络结构(残差学习模块)，形成了新的网络结构，可以使网络尽可能地加深;

　　2)使得前馈/反馈传播算法能够顺利进行，结构更加简单;

　　3)恒等映射地增加基本上不会降低网络的性能;

　　4)建设性地解决了网络训练的越深，误差升高，梯度消失越明显的问题;

　　5)由于resnet搭建的层数众多，所以需要的训练时间也比平常网络要长。