您好, 访客   登录/注册

基于深度学习的人脸识别浅析

来源:用户上传      作者:

  摘 要:随着计算机技术的飞速发展,信息化与智能化的便捷生活成为了人们的日常,信息的安全性和私人性的重要性成為人们日益关注的重点。作为身份信息验证的日常使用方式之一,人脸识别技术的发展也是智能化进步的成果之一。人脸是被是基于人的脸部特征信息进行身份识别的一种生物识别技术,得益于人工智能的迅猛发展,基于深度学习的人脸识别方法具有传统方法没有的优点,解决了身份认证技术所面临的大难题。在本文中,对基于深度学习的人脸识别的最新发展进行了总结,涵盖了技术与场景。
  关键词:人脸识别;深度学习;人工智能
  一、人脸识别步骤概述
  人脸识别是用摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行身份识别的一系列相关技术。完善的深度人脸识别系统首先通过人脸检测器定位面部,然后通过面部校准将人脸与标准化的规范坐标对齐。在真正进入到人脸识别功能之前,经过防欺骗模块来识别输入的图像数据是否是真实的活物或者是欺骗性的,这样可以避免不同类型的攻击。而识别模块主要由面部处理、深度特征提取和面部匹配组成[1]。
  其中,人脸识别的过程可以由如下式子来表示:
  M[F(PiIi,F(PjIj]
  这里,Ii和Ij分别代表两张不同的人脸照片;P代表数据处理以处理个人脸部变化,例如姿势,照明,表情,和遮挡;F表示特征提取,对人脸身份信息进行编码;M表示用于计算相似度得分的人脸匹配算法。
  二、面部数据处理
  面部数据处理是用于在训练和测试之前对数据进行预处理使其降低识别的困难度。尽管基于深度学习的人脸识别方法由于其强大的表征性而被广泛使用,但是Ghazi[2]等人证明了各种条件,如姿势,照明,表情和遮挡等等因素仍然影响着深度人脸识别的性能表现,在这种情况下,面部的预处理就十分有益了。人脸数据处理的方法可以分为“一对多增强”和“多对一归一化”。
  “一对多增强”是指从单个图像生成多批次的图像数据或者是多个不同姿态下的图像,使深度神经网络能够能加全面稳定地学习到人脸在不同环境下的不变特性。收集大型的数据库是非常耗时而且昂贵的。“一对多增强”的方法可以减轻数据收集的挑战,并且它们不仅可以用于增加训练数据,还可以用于增加测试数据的体量。与“一对多增强”相比,“多对一归一化”方法产生人脸正面图像并减少测试数据的外观变化,使面部易于对齐和比较。
  三、深层特征提取
  深度学习的网络架构可以分为主干网络和多路网络。随着ImageNet竞赛中所涌现出了大量高性能神经网络,许多经典的CNN架构如AlexNet,VGGNet,ResNet等,被广泛用作人脸识别中的基本模型[3]。当然除了主流网络之外,还有一些专门针对人脸是被所设计的用来提高功能性的网络架构。此外,往往在采用主干网络作为基础的同时,通常还会训练具有多个输入或多个任务的子网络用来针对一种输入或进行一种特定类型的任务。
  四、损失函数
  损失函数是用来评估模型的预测值与真实值的不一致程度的非负值函数。当损失函数越小时,模型的鲁棒性就越强,通常使用L(Y,fx)来表示。模型的结构风险函数包括了经验风险项和正则项,通常可以表示成如下式子:
  θ*=argminθ1N∑Ni=1Lyi,fxi;θ+λΦ(θ)
  前面部分的均值函数用来表示的是经验风险项,其中Lyi,fxi;θ代表的是损失函数,是经验风险函数的核心部分;后面部分表示的是正则化项或者惩罚项,通常使用L1函数、L2函数等代表的正则函数。公式旨在找到一个能够使目标函数最小的值即使预测值与真实值的差异性最小。机器学习作为一种优化方法,学习目标就是找到优化的目标函数——损失函数和正则项的组合;有了目标函数的“正确的打开方式”,才能通过合适的机器学习算法求解优化。
  五、基于深度学习的人脸比对
  在利用海量数据和适当的损失函数训练深度网络之后,每个测试图像通过网络以获得深度特征表示。在提取到了深度特征之后,常常用余弦距离或者是L2距离来表示两个特征之间的相似度,同时最邻近单元和阈值比较也常被用于识别任务。除此之外,还引入了其他方法,例如度量学习,基于稀疏表示的分类器等。
  其中人脸比对可以分为面部验证和面部识别。面部验证旨在找到一种新的指标,使两个类之间更加可分,同样地也可以使用在基于深度特征提取的面部匹配;面部识别的思想是得到一张输入人脸图像与人脸数据库中的多张人脸的相似度,进而找到输入人脸的身份信息,相当于是一对多的人脸身份验证。
  六、应用场景
  近些年来,为了建设平安城市,许多公共场所配置了许多智能化的监控系统,这些系统中的够高速高清的抓拍行人图像信息,并够快速地得到其身份信息。在这些系统中,人脸识别就显得尤为重要了,在机场、车站等人流重要出入口通道中都配备了人脸识别环节,其通过图像采集设备所捕捉的人脸图像同数据库中的人脸数据进行匹配,得到人物最为相近的身份信息。人脸识别的市场场景范围很广,从私人信息验证设备到公共安全监控设施。其应用领域可以分为金融领域、安防领域、人社领域、刑侦领域。
  七、存在的缺陷和发展趋势
  得助于大量的具有标识的数据,先进的算法和不断强大的GPU,基于深度学习的人脸识别在近距离正面人脸的面部验证、相似度面部识别和跨年龄识别等某些测试中已经超越了人类的表现,但是仍有许多问题待解决。对应于大规模的数据集,通过一次性或者低次数人脸识别和多姿势的大规模人脸识别将成为未来研究的焦点;与人类本能相比,机器还需要更加高效地算法;如何了解到深度人脸识别当中的深层意义或者说是打开深度神经网络这个黑匣子,具有十分重要的意义;提高系统的防御性是人脸识别系统仍需增进的部分;如何构建一个更加通用的系统或者是可以在很少修改后应用于每个场景的系统可能是未来的研究发展方向。
  参考文献:
  [1]Wang M,Deng W.Deep face recognition:A survey[J].arXiv preprint arXiv:1804.06655,2018.
  [2]Ghazi M M,Ekenel H K.A Comprehensive Analysis of Deep Learning Based Representation for Face Recognition[J].2016.
  [3]景晨凯,宋涛,庄雷,等.基于深度卷积神经网络的人脸识别技术综述[J].计算机应用与软件,2018(1):223-231.
转载注明来源:https://www.xzbu.com/1/view-15088012.htm