基于深度学习的交通标志检测与识别算法研究

发布时间:2020-11-22 07:19
   在自动驾驶领域,交通标志的准确检测和识别是确保在自然场景下实现自动驾驶的关键技术,具有非常重要的研究意义。自动驾驶系统中的车载摄像头采集的图像一般都是高分辨率的全景图像,交通标志在图像中所占尺寸较小,通用的目标检测模型中,模型检测效果较差。本文以车载摄像头图像中的交通标志作为研究对象,研究了针对高分辨率图像中交通标志所占尺寸较小、检测率较低、实时性较差的问题,及网络模型体积较大难以部署在移动端嵌入式设备上等一系列问题。主要研究内容和工作如下:(1)针对YOLOv3网络模型存在的较小交通标志漏检问题,重新设计并实现了交通标志检测网络模型,提出了Traffic Signs-YOLOv3(简称:TS-YOLOv3)网络模型。通过加权多尺度特征融合网络提高了交通标志的检测精度,有效解决了较小交通标志漏检的问题。(2)改进模型先验框聚类算法的计算方式,运用K-Means++聚类算法得到9个适用于交通标志数据集检测的先验框,使用数据增强方法丰富了交通标志数据集,增强卷积神经网络模型的鲁棒性。(3)研究YOLOv3网络模型的后处理算法,当交通标志重叠出现在图像中时,NMS(Non-Maximum Suppression,非极大值抑制)算法优先选择分类置信度最高的候选框,并去除重叠的候选框,导致重叠的交通标志只有一个能被检测到。将NMS算法改成Soft-NMS算法,通过将重叠的候选框的分类置信度降低,保留存在一定程度重叠的不同目标的候选框,解决了图像中交通标志存在重叠现象导致的漏检问题。(4)为解决训练得到的TS-YOLOv3网络模型存在的占用内存空间较大,需要GPU加速计算才可以做到实时检测的问题,通过合并卷积层与BN层实现加速计算,并运用模型剪枝算法压缩网络模型体积。剪枝后得到的TS-YOLOv3-Prune网络模型权重大小减少了33倍,识别速度提升了10倍,同时可以保持识别精度基本不变。实验结果表明:本文提出的方法解决了车载摄像头采集的图像中,由于交通标志占比率低导致的漏检问题,同时实现了模型压缩,得到了精度相当、模型精简、实时性好的轻量级交通标志检测模型。
【学位单位】:长春工业大学
【学位级别】:硕士
【学位年份】:2020
【中图分类】:TP18;U463.6;TP391.41
【部分图文】:

框架图,框架,算法,目标检测


第2章YOLO系列目标检测与模型压缩7第2章YOLO系列目标检测与模型压缩目标检测技术作为计算机视觉的重要方向,已广泛应用于自动驾驶汽车、智能视频监控、工业检测、机器人导航等许多领域。随着计算机视觉任务的性能提升,复杂的网络模型通常具有占用存储空间大、消耗计算资源多的特点,这使得模型部署在移动端嵌入式设备上受到了限制。如何减少存储占用、减少计算资源、降低网络带宽成为模型压缩算法亟待解决的问题。在进一步开展研究之前,首先需要对YOLO系列目标检测算法的原理和发展历程进行回顾与总结,其次介绍模型压缩算法,对比分析各种模型压缩算法的特点,并结合交通标志检测与识别这一实际应用场景,选出最适合作为交通标志检测任务的网络模型和模型压缩算法。2.1YOLO系列目标检测2.1.1YOLOv1YOLO模型最早是由JosephRedmon等人在2015年发布的,YOLO将目标检测看作回归问题,将整个图像分割为固定数量的网格单元,每个网格单元被看作一个候选框,然后网络检测候选框中是否存在一个或多个对象。YOLO模型的目标检测过程分为三步,第一步:将输入图像大小缩放为448×448尺寸,并将图片划分为7×7网格;第二步:卷积层负责提取特征,全连接层负责预测目标;第三步:通过NMS算法过滤得到最终候选框。大致流程如图2.1所示。图2.1YOLO算法框架YOLO使用了GoogLeNet作为骨干架构,如图2.2所示,与其不同的是,使用了更少的参数,24个卷积层,2个全连接层,将GoogLeNet的3个输出层改为1个输出层,为了提高模型的精度,JosephRedmon运用迁移学习的策略在ImageNet上进行预训练。

架构图,骨干,架构,边界框


第2章YOLO系列目标检测与模型压缩8图2.2YOLO的骨干架构作为监督学习,需要先构造好训练样本,才能让模型从中学习。YOLO预测过程如图2.3所示,首先将图像分成7×7的网格,判断每个网格是否存在负责预测目标的中心,然后每个网格需要预测2个边界框,网格负责预测类别信息,边界框负责预测坐标信息(,,,)centercenterxywh,其中(,)centercenterxy表示边界框的中心坐标,(w,h)表示边界框的宽度和高度,最后将坐标信息进行归一化处理。每个边界框除了要预测目标的位置之外,还要预测置信度,置信度代表了所预测的网格中含有目标的置信度和概率值,用公式来表示:()*truthrpredconfidence=PObjectIOU(2.1)其中()rPObject表示该网格是否存在负责预测目标中心的概率,存在为1,不存在为0,truthpredIOU表示预测边界框与真实边界框的交集和并集的比值,简称交并比,可以衡量在数据集中目标检测的准确度,最理想的情况是完全重叠。由于每个网格只能预测2个边界框,所以当相邻的物体数量过多时,YOLO会出现漏检的情况,这在后面的版本中做了优化。图2.3YOLO预测过程

预测过程,边界框


第2章YOLO系列目标检测与模型压缩8图2.2YOLO的骨干架构作为监督学习,需要先构造好训练样本,才能让模型从中学习。YOLO预测过程如图2.3所示,首先将图像分成7×7的网格,判断每个网格是否存在负责预测目标的中心,然后每个网格需要预测2个边界框,网格负责预测类别信息,边界框负责预测坐标信息(,,,)centercenterxywh,其中(,)centercenterxy表示边界框的中心坐标,(w,h)表示边界框的宽度和高度,最后将坐标信息进行归一化处理。每个边界框除了要预测目标的位置之外,还要预测置信度,置信度代表了所预测的网格中含有目标的置信度和概率值,用公式来表示:()*truthrpredconfidence=PObjectIOU(2.1)其中()rPObject表示该网格是否存在负责预测目标中心的概率,存在为1,不存在为0,truthpredIOU表示预测边界框与真实边界框的交集和并集的比值,简称交并比,可以衡量在数据集中目标检测的准确度,最理想的情况是完全重叠。由于每个网格只能预测2个边界框,所以当相邻的物体数量过多时,YOLO会出现漏检的情况,这在后面的版本中做了优化。图2.3YOLO预测过程
【参考文献】

相关期刊论文 前3条

1 贾永红;胡志雄;周明婷;姬伟军;;自然场景下三角形交通标志的检测与识别[J];应用科学学报;2014年04期

2 冯春贵;祝诗平;王海军;贺园园;;基于改进模板匹配的限速标志识别方法研究[J];西南大学学报(自然科学版);2013年04期

3 朱双东;刘兰兰;陆晓峰;;一种用于道路交通标志识别的颜色—几何模型[J];仪器仪表学报;2007年05期



本文编号:2894332

论文下载
论文发表

本文链接:http://www.bigengculture.com/shoufeilunwen/xixikjs/2894332.html

分享