深度学习目标识别算法及运用研究

作者:未知

  摘要:文章主要论述了深度学习目标识别的算法,对其主要运用进行了研究分析。神经网络的结构是一种基于人脑结构设计的技术手段,卷积神经网络属于一种特殊的深度前馈网络信息,为了避免在不同层级之间信息链接产生参数冗余,通过局部链接以及权值共享的方式进行处理,卷积神经网络具有稀疏特征,可以链接符合生物神经元稀疏的响应特性,可以有效的降低网络的参数规模,使得模型训练更为简单便捷。
  关键词:深度学习目标识别算法;运用研究
  中图分类号:TP391.41   文献标识码:A   文章编号:1672-9129(2018)16-0023-01
  Abstract: this paper mainly discusses the algorithm of deep learning target recognition and analyzes its main application. The structure of the neural network is a technical means based on the design of the structure of the human brain. The convolution neural network belongs to a special deep feedforward network information. In order to avoid parameter redundancy between information links at different levels, through local links and weight sharing. The way to process, The convolution neural network has sparse characteristics, which can be linked to the sparse response characteristics of biological neurons, and can effectively reduce the parameter scale of the network, making the model training more simple and convenient.
  Key words: deep learning target recognition algorithm; Applied research
   1 深度學习目标识别算法
  卷积神经网络通过多层链接可以充分的表现自身的特征优势。在一般状况之下,卷积神经网络主要分为卷积、非线性、池化以及批量归一化四个基本性的操作。卷积的主要作用就是为了学习获得鲁棒性较高的特征。因为卷积具有平移不变形的特征,在卷积中可以将拓扑对应性以及鲁棒性特征有所保留,而非线性的操作主要就是通过激活函数的方式得以实现,利用弯曲或者扭曲的方式提升特征的表达能力。在多层网络中应用非线性操作可以提升模型整体的复杂度,增强模型高层语义特征的整体刻画特征与能力。
  1.1 R-CNN目标检测模型。R-CNN目标检测模型主要就是利用候选区域生成算法形成的候选目标区域,利用深度卷积神经网络候选区域特征,利用训练分类区进行分类分析,调整目标最小外界矩阵形框架,进而减少大量重复性的计算分析,利用深度学习方式具有表达力的优势,可以体征目标检测区域的精准度。
  1.2 POLO目标检测模型。 POLO模型就是基于回归方法的一种目标检测网络模型,利用一次CNN计算可以分析图像目标位置,可以将目标检测组件集合到神经网络系统中,将其输入为待检测的图像信息,输入目标类别以及目标的边界框,属于一种端对端的目标检测网络系统模型。
  1.3 RetinaNet目标检测模型。 RetinaNet模型属于基于回归目标检测的改进模型,利用改进标准交叉熵损失函数的方式处理不平衡的问题,降低目标损失函数的权值,达到提升目标精准度。
  2 深度学习目标识别算法运用研究
  计算机视觉领域在深度学习理论的支持之下不断的发展完善,在发展中目标旋转、姿态变化以及相似背景干扰等都是存在的问题,实现目标跟踪以及深度学习的有效融合是跟踪领域的研究的重点内容,为了解决存在的问题,将深度学习的特征学习与检测手段,综合目标跟踪方式,对相关目标进行大样本训练,获得目标的深度特征因素,可以在跟踪中判断尺度空间模型,对目标进行初步的定位分析,综合实际状况获得候选区域以及相关尺度信息,通过训练的方式获得深度学习检测模型信息,在对放大之后的候选区域目标进行精准的定位与检测,可以有效的避免目标出现误跟以及漏跟等问题。在应用双重相关滤波器的DSST深度学习目标跟踪算法中融入SSD深度学习,加入判断以及应对干扰的相关相应机制,可以避免目标遮挡以及目标自身旋转而产生的跟踪框漂移的问题。
  2.1具体步骤
  其具体操作方式如下:输入,视频帧输入,输入图像块上一帧的位置以及尺度,输入位置模型以及尺度模型,进行位置预测分析,将前一帧的目标位置为中心,扩大现有目标跟踪框尺度两倍,获得样本区域。判断分析,通过SSD在样本区域目标的初步定位,对相似目标的个数统计分析。在其候选目标多于一个的时候,要统一排序目标位置与原目标位置距离,确定最近的候选目标,将其作为新的目标,保留新的位置与尺度信息,标记存在的干扰项位置以及速度信息内容,通过Kalman 滤波预测轨迹信息,在下一帧中将预测获得的像素点作为直接排出位置,如果轨迹位置超过了样本区域,则要终止计算分析。计算获得新的预测位置,进行尺度预测,基于当前目标位置为基础,随机抽取一共27种尺寸中不同的不同样本,进行判断,分析是否存在尺度信息,如果存在尺度信息,则将其复制形成五份,在制作形成新的尺度样本。综合公式计算结果,获得尺度将其作为新的跟踪框,更新提取新的样本,更新位置模型以及尺度模型。
  2.2 模型建立与训练。 深度学习模型可以在海量的样本信息集中训练,抽取高维特征,保障结果的精准性。但是神经网络的训练会耗费大量的实践,通过线下的方式监测分析,进行干预训练,通过公式计算,将生产的predictive boxes 进行分析,提取与ground truth box符合的 positive boxes个数,将目标位置中对应的negative boxes,基于default boxes 置信度排序分析,从高进行选择,将比例控制为3:1,可以提升训练的稳定性,提升整体的性能指标。
  通过分析可以发现,跟踪成功率效果显著,利用深度学习监测的跟踪方式虽然增加了运算量,但是满足了实时性的要求,此种算法具有稳定性以及鲁棒的优势。
  结语:随着大数据与计算机的深入发展,在云计算的支持之下,深度学习高速发展,此种基于大脑神经启发设计算法以及深层的设计分析,在自然语言处理上效果显著,基于深度学习的目标检测方式逐渐发展成熟。分析深度学习目标识别算法,了解在实践中的应用,具有一定的实践价值与意义。
  参考文献:
  [1]程显毅,胡海涛,季国华,孙丽丽.基于深度学习监控场景下的多尺度目标检测算法研究[J].南京师范大学学报(工程技术版),2018,18(03):33-38.
  [2]张亚超. 基于深度视感知学习的目标检测算法与应用研究[D].兰州理工大学,2018.
转载注明来源:https://www.xzbu.com/1/view-14917097.htm

服务推荐