您好, 访客   登录/注册

一种基于双分支车道线实例分割的检测算法

来源:用户上传      作者:

  摘   要:在人工智能的時代,自动驾驶技术越来越成熟,技术中包含的自动车道保持功能占有重要的地位,这对自动驾驶中的后续车道偏离与预警起着关键性的作用。文章利用深度学习技术,针对现有双分支车道线实例分割检测算法存在的准确率受批量影响、准确率不理想等问题,在车道线实例分割中采用自适配归一化函数,并使用传统的SGD优化器对整个模型进行优化解决实验过程中的效率问题。在TuSimple车道数据集进行实验,在性能方面准确率与原始算法相比从96.4%提高到98.6%。
  关键词:深度学习;双分支实例分割;自适配归一化
  近年来,交通事故频发,危及生命。事故发生的原因主要是驾驶员的疏忽、注意力分散等人为因素[1]。许多公司已经提出并应用了很多改善和减少交通事故的方法。在这些方法中,道路感知和车道线检测起着非常重要的作用,车道线检测帮助指导车辆方向,用于提高道路交通的安全性。
  1    算法概述
  本文主要是以双分支的车道线检测方法[2]为基础,把LaneNet与H-Net结合,将车道线检测问题作为实例分割[3]问题,执行实时车道线检测的任务(见图1)。LaneNet的框架是基于编码器-解码器的稍加修改的双分支ENet网络[4]。图1中第一个分支车道线分割分支向每个像素分配车道线ID输出每个像素车道段即输出二进制车道段,具有两个输出类别(背景和车道),输出的是哪些像素属于一个通道线而哪些不是。通过这样做减轻车道线变化的问题,可以处理可变数量的车道线。而另一个分支车道线嵌入分支进一步将分段的车道线像素分解成不同的车道线实例,用基于one-shot的方法做距离度量学习[5],该方法易于集成在标准的前馈神经网络中,可用于实时处理。然后用预测出来的二进制的图片去覆盖实例的图片。最后使用H-Net进行曲线三阶多项式拟合,将图像转换为鸟瞰视图,估计理想透视变换的参数,并且将车道线重新投影到图像上输出最后的车道线结果,该方法解决道路平面变动的影响,透视变换使车道线拟合对路面变化具有鲁棒性。为了解决使用一种归一化函数而导致性能欠佳的影响,使用自适配归一化,加速模型训练,提升模型准确度。使用传统的随机梯度下降(Stochastic Gradient Descent,SGD)优化器对整个模型进行优化并训练网络直到收敛,而不是像Davy等使用Adam,因为经过实验SGD优化器在训练过程中更稳定,并且在程序运行时不会轻易地陷入NaN错误。
  2    SN算法简介
  批量归一化(BN)[6]是以batch的维度作归一化的归一化方式,对batch是独立的,车道线检测任务中输入的图像数据很大,较大的batch size会导致内存不够用,所以本研究在车道线实例分割中不用BN而改用自适配归一化(Switchable Normalization,SN)。SN训练学习为深度神经网络的不同归一化层选择不同的归一化器,组合IN[7],LN[8]和BN 3种类型的统计信息,这些统计信息分别通过渠道方式、分层方式和小批量方式进行估算,能够在深度神经网络中以端到端的方式学习其重要性权重,从而在BN,IN和LN之间切换使用。
  3 实验与结果分析
  3.1  评价标准
  设Cim表示正确点的数量,Sim表示实际真实点的数量。当实际真实点和预测点之间的差异小于某个阈值时,这个点就是正确的。每个图像的平均正确点准确度为:
  (1)
  3.2  实验结果
  本文采用TuSimple车道数据集,在ubuntu 16.04(x64),python3.5,Cuda-9.0,cudnn-7.0,TensorFlow 1.10.0上进行实验。实验结果显示检测速度为50 pfs,能够达到实时性。
  和原算法[2]相比,本实验使用SN训练学习为深度神经网络的不同归一化层选择不同的归一化器,使模型误差减少,从而提高了准确率,准确率可以达到98.6%,明显优于使用同一个数据集下TuSimple2017挑战赛结果。
  4    结语
  本文优化了端到端的双分支车道线实例分割检测方法,受近期实例分割技术的启发,解决了使用单一归一化函数的性能不佳问题,与其他相关的深度学习方法相比,该方法可以提高检测的准确度,具有鲁棒性,还可以应对不同数量车道线,并且能做到实时性。由于对遮挡面积较大的目标车道线检测效果还不太明显.后续工作还需要对上述算法进行针对性的改进和优化。
  [参考文献]
  [1]BELLIS E,PAGE J.National motor vehicle crash causation survey(NMVCCS)[Z].Washington DC:National Highway Traffic Safety Administration,2008.
  [2]DAVY N,BERT D B,STAMATIOS G.Towards end-to-end lane detection:an instance segmentation approach[EB/OL].(2018-02-15)[2020-02-10].https://arxiv.org/abs/1802.05591,2018.
  [3]HE K,GKIOXARI G,DOLLAR P,et al. Mask R-CNN.[EB/OL].(2017-06-17)[2020-02-10] .https://arxiv.org/abs/1703.06870.
  [4]PASZKE A,CHAURASIA A,KIM S,et al.ENet:a deep neural network architecture for real-time semantic segmentation[EB/OL].(2016-06-16)[2020-02-10].https://dblp.uni-trier.de/search?q=abs%2F1606.02147.
  [5]BRABANDERE B D,NEVEN D,VAN GOOL L.Semantic instance segmentation with a discriminative loss function[J].Computing Research Repository,2017(8):255.
  [6]SERGEY I,CHRISTIAN S. Batch normalization:accelerating deep network training by reducing internal covariate shift.[C] Lille:International Conference on Machine Learning,2015.
  [7]DMITRY U,ANDREA V,VICTOR L. Instance normalization:The missing ingredient for fast stylization[EB/OL].(2016-09-27)[2020-02-10].https://arxiv.org/abs/1607.08022.
  [8]JIMMY L B,JAMIE R K,GEOFFREY E, et al.Layer normalization[EB/OL](2016-07-21)[2020-02-10].https://arxiv.org/abs/1607.06450.
  [9]XINGANG P,JIANPING S,ING L,et al.Spatial as deep:spatial CNN for traffic scene understanding[C]San Francisco:the Association for the Advance of Artificial Intelligence Confrence,2018.
转载注明来源:https://www.xzbu.com/8/view-15150891.htm