深度学习在图像处理领域的探究

> 中国论文网 >
科技论文 >
深度学习在图像处理领域的探究

深度学习在图像处理领域的探究

来源:用户上传作者:刘士豪姜博厚

　　摘要：新时期下，计算机网络时代的到来，让深度学习网络结构成为社会讨论的重点，并且在图像处理领域中发挥除了极大优势。为了能够进一步发挥深度学习在图像处理领域中的效用。该文首先提出图像处理和深度学习的含义，进而探究深度学习在图像处理领域中的应用。
　　关键词：深度学习;图像处理;应用;含义
　　中图分类号：TP18 文献标识码：A
　　文章编号：1009-3044（2020）06-0189-02
　　在信息时代下，数字图像成为最为常见的信息载体，可以说社会生产、人类生活中都已经充满了数字图像信息。信息技术的发展衍生出了大数据，让数字图像的产生速度、规模成几何形式增长，传统技术已经无法满足图像信息处理任务要求，社会更加迫切需要高效率、智能化的处理方案。对于图像处理来说，特征表达是重中之重，传统特征设计主要是人工完成，但由于过程十分复杂，对操作者自身要求非常高，所以自动化的高效图像处理是必然发展趋势。深度学习作为新时期的新概念，更多是在数据当中自动提取多层次特征信息，采用了数据驱动方法，通过相关的非线性转换，在原始数据中提取多层特性，让数字图像更具表达力、泛化力，从而满足图像处理高效陛的发展要求。
　　1图像处理技术
　　图像处理是将图像信息转化为数字信息，从而更好地被计算机识别、处理的一项现代化技术。图像处理大致上可以划分为图像分类、压缩、增强、编码、特征提取等一系列过程，为了保证图像足够清晰以及有效识别信息，图像处理要有多方面技术支撑提高图像分辨率与质量。
　　人工智能技术的发展也促进了图像处理技术发展，这样让图像处理技术在模式识别、机器视觉、多媒体技术等领域被广泛应用。智能技术的到来，让图像处理技术广泛融人人们的工作与之中，如二维码支付、车辆检测、指纹识别等，不仅方便了人们生活，也让人们对图像处理质量提出了更高要求。
　　2深度学习
　　深度学习是一种模仿人脑思考能力分析并解决问题的神经网络系统，通过深度学习对文字、图像、文本等信息进行提取和识别的一项技术。
　　2.1发展背景
　　在20世纪50年代，国外就提出了神经网络的概念，但由于当时缺乏网络训练算法理论、训练样本不足、计算机能力较差等影响，阻碍了神经网络进一步发展。新时期下，大数据、云计算等技术等到来，计算机性能得到了大幅度提升，延缓了训练低效性，大幅度增加训练数据可以有效降低拟合风险，根据无监督逐层训练策略和BP算法，让深层神经网络训练成为可能，这也让人们开始重点关注深度学习。
　　本质上深度学习模型就是深层的神经网络。整个系统为多隐层堆叠，每层都要处理上一层的输出信息，将初始输入、输出关系不大的数据，转变为更加紧密的数据关系，这样最后一层输出映射难以完成的任务成为可能，我们也可以将这种学习模式称之为“特征学习”。
　　2.2卷积神经网络架构
　　图像识别作为深度学习最早尝试的方式，其中最为重要的就是卷积神经网络。卷积神经网络可以分为三个层级堆叠，包括卷积层、池化层、全连接层，不同层次有着不同的特性和作用。（1）卷积层。主要负责提取数据特征，通过输入特征图x以及K个二维滤波器，通过卷积运算输出K个二维特征图。卷积运算具有很大的优势，首先可以提取相邻像素间的局部关系，其次是可以对图像进行平移、旋转、尺度等变换具备一定鲁棒性。（2）池化层。负责对卷积层输出结果进行处理，压缩所输出的特征图，这样可以降低特征图体积，减少网络计算复杂性，同时能够让特征图更加精简，有助于提取主要特征，降低特征表达维度，还能够对针对较小平移、变形具有鲁棒性。（3）全连接层。负责将所有特征连接起来，并将最终的连接结果（输出值1传输给分类器。
　　2.3神经网络的优化
　　在科学技术不断发展中，神经网络模型层数也越来越深，增加了训练数据集，模型内部结构也变得十分复杂。网络训练当中通常都会涉及拟合、梯度消失、梯度爆炸等问题，因此相关学者也针对性提出了几种神经网络的优化方法。首先，dropout优化技术。该项技术能够在深度学习网络训练当中，对神经网络单元按照相关概率将其从网络中暂时丢弃。这种丢弃是暂时性的，因此在使用随机梯度下降方法训练网络中，不同批量数据都在训练不同网络。该项技术在很大程度上打破了节点之间的关联性，提高了网络学习的泛化性，避免出现过度拟合等问题。其次，批量标准化（BN算法）。GooSe在2015年提出了BN算法理论，可以对深层次神经网络训练。BN算法能够规范所有层或某些层的输入，固定每一层输入信号均值和方差，这样即可避免出现梯度消失或梯度爆炸等问题。
　　3深度学习在图像领域中的应用
　　3.1图像识别
　　图像识别领域最早应用了深度学习技术，并且取得了非常高的成就，如早期都是AlexNet网络，就是在图像识别领域中的深层卷积神经网络，后续所发展的深度学习也都是以MexNet为基础。AlexNet实现了CNN结构的升级，网络变得更宽、更深，整个MexNet网络包括5个卷积层和3个全连接层。时至今日，在图像识别领域MexNet依然占据着统治地位，也决定了图像处理中深度学习的主题架构，即所前馈卷积神经网络，特征提取器为卷积层、池化层相互堆叠而成，并和多层全连接层相互连接，分类器信息流方向固定而单一。其主要应用表现在：
　　3.1.1网络结构局部修改
　　AlexNet发展下也衍生出了VGGNet网络。相比最初的MexNet网络，VGGN～网络采用了多个小型卷积核串联得加替换一个大型卷积核的方式。这样不仅不会影响卷积效果，还增加了很多非线性操作，在网络中提取更多、更丰富特征，减少了其中的参数量。VGGNet网络也证明了网络层次越深、特征越丰富，所得到的图像识别效果越好。
　　NIN网络再次对卷积核做出了调整，将单一线性卷积核转化为多层感知机MLP。CNN高层特征主要是由低层特征多种运算组合得到的结果，非线性运算组合可以让高层特征更具泛化性。MPL卷积核让NIN中一次卷积操作相当于之前多个卷积核操作的结果，所以在NIN网络中可以用较少层数实现更深的網络图像识别效果。　　这些创新和发展措施，可以有效地提高特征表达能力，提升了网络深度或卷积层操作复杂化，但都是局部的改变，前馈卷积神经网络的主体架构依然没变，依然是单一的特征图流向方式，一层连着一层，从而导致深层处理无法获取浅层特征图、浅层处理无法获取深层传来的梯度，网络模型训练难度大。
　　3.1.2网络结构主体变化
　　为了解决局部变化带来的负面影响，部分学者通过借鉴highway networks阀门控制信息流理论，提出了ResNet网络模型，改模型彻底改变了特征信息流向，如第Y层输出不再单一影响Y+I层，同时还会影响Y+2层，所以由两层组成一个残差学习块，改变了学习目标。ResNet网络中由多个残差块堆叠组成，中间夹杂着池化层，训练中只需学习输入、输出差别，可以保障信息整体完整性，降低了学习难度、简化了学习目标。
　　基于ResNet网络还衍生出了DenseNet网络，也是采用了类似残差块的方法，并且构建了稠密块。DenseNet网络中，每层的输出都之后层级的输入，数据聚合应用了拼接方法，并非是ResNet的相加方法，可以保障每组输入特征图维度保持一致性，这样更有助于网络信息交流。DenseNet网络的出现，缓解了梯度消失情况，强化了特征传播，简化了参数量。
　　这两种图像识别深度学习模型直接改变了特征信息流传输方向，可以实现跨层传输，并非是单一的前馈卷积神经网络，大大提升了图像识别的精度，符合当代人的思维模式，可以更好地识别物体。
　　3.2图像取证
　　3.2.1简单迁移
　　图像取证中应用深度学习的研究相对较少，部分学者尝试将深度学习融人相机源取证问题中，但是在获取图像中不同相机拍摄会遗留指纹特征，因此采用了AlexNet网络结构进行了学习，来提取了指纹特性，可以实现94%以上的相机模式分类精度。
　　3.2.2网络输入
　　图像取证和识别之间的差异主要是在区分图像内容的差异性，并且这个差异可以直接用人眼看到，取证主要是用于区分图像中微弱信号的操作指纹，形态差异非常小，无法用人眼直接看到。因此普通的深度學习模型难以胜任图像取证。部分学者通过对深度学习模型进行完善，以AlexNet网络为基础增设了预处理层，将取证指纹特征放大。通过改进实验结果精度提升了7%。图像取证难，必须改变网络输人，通过放大指纹特征，才能够更好地发挥特征提取、分类器的价值。
　　3.2.3适应取证结构
　　图像预处理作为取证的必要条件，额外增加预处理层也会让整个模型变得臃肿，因此部分学者采用了一种隐写分析取证的深度学习模型，在网络结构中整合了预处理。通过将30个空间模型滤波器初始化第一层卷积核，这样卷积核就具备了预处理功能。虽然取证和识别是两个方面，但学习模型简化也是必然发展趋势。图像取证上深度学习还处于初期发展阶段，未来会有更多的适用于图像取证的深度学习模型。
　　4结束语
　　综上所述，图像领域中的深度学习主要是以卷积神经网络为主，但在整个网络模型中需要有庞大的计算量，增加了网络训练时间，所以卷积运算形式简化会是一大发展趋势。再者，当今图像领域主要是研究灰度图像，彩色图像涉及较少，而将四元数与深度学习知识融合势必会提取更加丰富的彩色图像，进一步实现图像处理领域的一次突破。
转载注明来源:https://www.xzbu.com/8/view-15179051.htm

查看更多→

深度学习在图像处理领域的探究

相关文章