您好, 访客   登录/注册

基于深度学习的人脸识别技术探讨

来源:用户上传      作者:汪家琦 郭源

  摘   要:深度学习是目前人工智能领域中的新兴分支之一,利用这一技术可以让人脸识别技术的准确性得到提高,进一步提高信息安全保障。基于此,本文针对基于深度学习的人脸识别技术进行分析,在简单了解基础模型和训练集的基础上,从人脸预处理和特征融合入手,最终建立形成基于深度多模型融合的人脸识别。
  关键词:深度学习  人脸识别  准确性  人脸特征
  中图分类号:TP391                                 文献标识码:A                        文章編号:1674-098X(2020)01(a)-0149-02
  生物识别技术主要是利用人体固有特征进行身份鉴定,包括:指纹、虹膜、人脸等,作为识别技术的一种,人脸识别技术具有唯一性、不可复制性等特点,同时也是与生俱来的、无法复制的。现如今,人脸识别技术在多个领域中已经取代了传统识别技术,但在实际应用中,稳定性和误认率还需要得到进一步完善。
  1  基础模型和训练集
  基于深度学习的人脸识别技术有很多种,随着研究的深度,识别效果也在逐渐提升,但这些方式其本身的网络结构、训练集各不相同,因此在实际应用上各具优缺。因此,创建一个具有一定差异的基础模型对后续工作的开展非常重要,训练集对网络训练的效果的影响也是不能忽视的。
  1.1 基础模型
  近几年来,深度学习的人脸识别方式有很多,但完全公开的源码并不多,通过对目前已经公开源码的三个人脸识别模型进行分析。其中,VGGFace这一源码,精确度可以达到98.98%,其主要用于特征投影和模型识别,但其实际应用中,不同网络中的卷积层较多,因此,网络训练规模相对较大,足有548M。由上可知,VGGFace对硬件支撑的要求较高,因此无法在移动设备上运行,且模型训练和特征提取都非常耗时,而Caffe-face这一源码整体量级较轻,网络层数不深,模型参数较少,且可以在移动设备、嵌入式设备中应用,精确度达97.77%和98.13%。除了上述内容之外,Lightened CNN也是公开源码的模型之一,这一模型的精确度可以达到99.28%,学习效率较高,采用70W张人脸训练图像,仅迭代了28000次,就达到了99.28%的精确度。
  1.2 人脸数据集
  基于深度学习的人脸识别技术本身就需要得到大量的数据支持,虽然这些数据可以从网络上进行获取,如图1中展示的就是网络上可以获取的人脸数据,从图中可以看出所获取到的信息大都杂乱五章,需要进行人工标准。因此在开发基于深度学习的人脸识别技术的过程中,需要对人脸数据进行建立,通过对近几年里公开源码的人脸数据集进行分析,最终选择了CASIA-WebFace数据集和UMDfaces数据集,从而为后续的深度神经网络训练奠定基础,确保网络训练稳定开展,继而提高识别准确性。
  2  人脸预处理和特征融合
  2.1 人脸预处理
  在确定了就出模型和训练集后,还要对人脸预处理和特征融合进行分析,在不受限的情况下,人脸图像中含有大量和人脸信息无关的元素,包括:背景、光照等,这些元素会对识别过程产生影响,降低识别准确性,延长识别时间,通过人脸预处理后,就可以有效提高后续模型的精确度。如图2所示,基于深度学习的人脸识别技术可以通过网络自动学习人脸面部特征,继而提高人脸检测效率,结余时间成本,相比较传统检测方法而言,其具有较大的优势。MTCNN人脸检测算法在实际应用中可以提高人脸图像预处理效率,而仿射变化可以让人脸归一化质量得到进一步提高。最后,配合ASIA-WebFace数据集和UMDfaces数据集,可以将各种不同的人脸统一处理成为规范化的人脸图像,以此突出图像中的人脸信息。
  2.2 特征融合
  特征提取、特征融合是人脸识别方法的第二环节,在通过基础模型提取出图像后,利用MTCNN人脸检测算法和仿射变化完成图像的预处理,在此基础上,就可以对提取出相应的基础特征,作为后续深度神经网络输入的最终图像。在实际发展过程中,卷积神经网络是一种分层结构,可以对不同基础模型进行特征提取,而且如果降维得当,还可以得到更好的组合特征。基于多角度的人脸PCA算法,可以对高维基础特征进行降维,以此进行进一步的判定。在得到模型的基础特征后,可以发现特征的维度各不相同,直接融合会导致不同基础模型的权重存在较大差别,因此,需要进行降维,从而有效避免这一问题,分析降维后的基础模型在LFW上精度的变化,进一步测试组合特征[1]。
  3  基于深度多模型融合的人脸识别技术
  3.1 模型训练
  在完成基础模型、训练集、人脸预处理和特征融合的基础上,就可以正式进入特征训练,这也是人脸识别方法技术中的最后环节,也是最为重要的环节,通过构建深度多模型融合的深度神经网络,可以有效训练组合特征。这种神经网络的结构图包括一个输入层和三个全连接层,其中输入层的组合特征为:featureA、featureB,其大小分别是:768维和2048维。由于输入层的维度不同,网络后续层的具体参数也会出现一定的区别,其中三个全连接层,分别为指的是特征融合训练、人脸特征以及分类层和神经元个数。所有的网络训练和测试都采用Caffe框架实现,同时利用文本方式采用模型定义、参数设定、训练方法。使用单块GPU训练深度神经网络,参考CASIA-WebFace数据集和UMDfaces数据集作为两个训练集,参数设置上参考Lightened CNN中参数设置方法,采用随机梯度下降法,来完成测试。
  3.2 测试数据集和评价指标
  为了保证基于深度多模型融合的人脸识别技术的准确性,采用了两个人脸最全测试集进行检测,而评价指标则采用了ROC这一评价标准。通过具体的实验结果来看,相比较其他人脸识别方法而言,本文设计出的这种深度多模型融合的深度神经网络,在训练集较小的情况下,准确率分别为:99.1%和93.23%。因此应该适当提高0.57%和0.52%,由此可知,这种识别技术的整体效果较优。在此基础上之上,通过对测试数据的进一步分析,也能够看出基于深度多模型融合的深度神经网络在不同人脸最全测试集中各具优势,且获得了良好的效果,将两个基础模型中的优点进行结合,对模型进行进一步的改进,可以更好的发挥出模型功能,提高基础特征在组合特征中的权重。虽然本文设计的方式取得了较高的精确度,但在实际应用过程中,还需要对这一方法技术进行进一步完善,以此不断提高识别准确度,缩短时间成本,确保信息安全性[3]。
  4  结语
  综上所述,人脸识别技术是目前信息安全技术中较为常见的一种,在不同深度学习模型下,具有不同的功能。通过本文对人脸预处理和特征融合进行分析,得到了基于深度多模型融合的人脸识别技术,它不仅具有较强的表达能力,运算时间大幅度缩短,精度也得到了最大程度的提高,切实保证信息安全。
  参考文献
  [1] 齐忠文.基于深度学习的人脸识别技术研究[J].新媒体研究,2018,4(14):30-31.
  [2] 杨涵.基于深度学习的人脸识别算法研究[J].电子设计工程,2019,27(19):155-159.
  [3] 钟海波.基于深度学习的人脸识别技术在智慧安防建设中的应用[J].广东公安科技,2018,26(1):38-41.
转载注明来源:https://www.xzbu.com/1/view-15207877.htm