文、编辑 | 念初
地铁客运量统计对于有效引导乘客、提高各车厢使用率具有重要意义。
然而,现有方法无法准确提供站台各闸口的上下车人数,遮挡问题严重影响了监测结果。
在本研究中,介绍了一种实时地铁客流量无锚目标检测技术,该技术简单、有效且速度足够快,可以安装在站台大门上方的边缘设备上运行。
该技术类似摄像头捕捉,需要用圆探测器设计一个无锚物体检测网络,用来检测乘客的头部。
圆探测器预测一个圆来定位和绑定目标,而不是传统的边界框。然后应用一种简单但有效的基于循环方法,来识别和跟踪视频中的乘客。
它在NVIDIA RTX 2080显卡设备上运行时最高可达每秒 111 帧,在NVIDIA Jetson Nano 显卡设备上运行时最高可达 7.8帧,在地铁目标检测数据集上的准确率高达 97.1%。
实时监测客流量的意义在世界各地的城市中,地铁列车系统是最重要的城市交通系统之一。与其他方式相比,地铁的主要优势是压倒性的有效载荷能力。
这种能力依赖于灵活的列车调度和有效引导,使站台上每节车厢的有效载荷都达到满载和平衡。
随着地铁列车变得越来越长,平衡每节车厢的有效载荷非常重要。因此,每个门的客流量是实时统计地铁客流量的关键因素。
多年来,许多地铁公司主要使用这些常见类型的客流量监测:视频监控、称重、和闸机。这些方法可能存在准确性和效率低下的问题。
这些方法不能准确地提供出入或离开每节车厢和火车闸门的乘客人数。因此,它们不能成为乘客引导和列车调度的可靠实时证据。
随着传感器和计算机技术的发展,基于视频传感器的检测器开始流行起来。传统的计算机视觉被应用于上述任务,但它们在很大程度上依赖于受控条件并且容易受到变化的影响。
早期的工作尝试首先提取图像中的全局特征,例如纹理、梯度、边缘特征,或局部特征。然后,他们直接学习从图像块到计数的映射。
然而,这些基于手工特征的方法不仅精度低,而且总是忽略空间信息。
近年来,许多学者研究了利用深度神经网络解决检测问题的可能性,已经进行了许多优秀的工作。
尽管这些方法可以高精度地检测视线内的目标,但在目标的遮挡、尺度变化和旋转等更复杂的情况下,它们仍然不能很好地工作。
一些学者尝试使用有线网络来统计更粗粒度的人群,他们研究有线网络从整幅图像中学习多尺度特征,并以监督或自我监督的方式直接预测人群中的人数。
这些方法的计算消耗可能不适合移动设备,并且难以在边缘设备上平衡精度和速度。
尽管后一种使用多尺度信息的方法在某些遮挡和多尺度变化的情况下效果很好,但它们无法提供不同拍摄角度下的精确乘客数量。
在这项研究中,考虑到准确性和硬件容量约束之间的权衡,本文引入了一种实时地铁客流量的枚举范式。
这种范例简单、有效且足够快,可以在边缘设备上运行。首先,开发了一个包含来自现实世界的各种类型乘客的数据集。
视频数据位于安装在站台屏蔽门顶部的摄像头拍摄的视频中,瞄准地铁门和站台屏蔽门之间的缝隙。这个拍摄角度,可以消除遮挡问题,随后就可以设计新的网络来检测乘客。
设计基于深层聚合网络结构,并根据任务对其进行简化,还应用其他方法作为帮助网络在边缘设备上运行的基本块。
该网络将 RGB 图像作为输入,并以无锚点的方式预测乘客头部和身体的位置和大小。特别是设计的网络预测边界是圆,而不是框来呈现目标的大小,因此我们将其命名为圆探测器。
为了标记和跟踪视频中的乘客,我们提出了一种基于头部预测的算法,该算法基本上依赖于通过圆交并集测量的头部关系。
最后,记录每一位乘客的移动轨迹,统计地铁站台的客流量。这项研究的贡献可以总结如下:
(1)这项研究是第一个采用无锚式检测网络来解决监测地铁客流量问题的研究。
(2)在一定程度上,圆探测器降低了计算成本并使推理速度更快,所提出的圆探测器网络在检测人头时具有更好的旋转一致性。
研究方法示例首先通过圆探测器获取一帧视频来检测人头。检测后,将基于圆交并集测量的识别应用于结果和前一个以跟踪乘客。
当完成多帧跟踪后,就可以得到上下车乘客的数量,算法的整个流程如下图所示。
1、圆探测器无锚主干
在下图中,主干网络采用anchor-free风格设计。尽管 CenterNet 兼具高性能和简单性,但它在边缘设备中的计算成本仍然很高。因此,我们简化了骨干网络并通过使用圆形表示减少了预测热图的数量。
由于检测乘客的摄像头处于固定俯仰角,图像中人头的大小和外观相对固定。因此,特征图的多尺度融合是必不可少的,但在此场景中可以减少。
2、圆探测器用圆框识别
通常,目标检测任务使用边界框来标记图像中的目标。一旦确定了边界框的中心点,边界框表示就需要一个网络来预测两个维度变量,即宽度和高度。
殊不知在乘客流量监测任务中,目标是人头,通常在俯视图中呈圆形。在这种情况下,使用圆表示不仅只需要预测一个维度变量即半径,而且在人头检测任务中也有多重好处。
如下图所示,与边界框表示相比,圆表示只有一个自由度。
尽管在大多数情况下人的头部是圆形的,但边界框表示主要是为定向检测方法设计的。换句话说,它不一定针对圆形目标检测进行了优化。
圆表示在推理时需要较少的计算成本,较少的预测输出意味着网络训练的难度较小,并且在简单网络模型上的性能更好。
实验数据集为了开发包含地铁站每日客流量的数据集,一个包含高清摄像头和边缘计算单元的设备安装在地铁门和站台屏蔽门之间的缝隙顶部。
实验在广东的地铁站安装了 24 个设备,并记录每个站台屏蔽门每日乘客上下车视频。在这些视频中,有6508 张图像来构建地铁目标检测数据集中的乘客检测任务。
目标检测数据集不仅包含检测任务图像及其标签,如乘客、异物和乘客异常行为,还包含大量的日常地铁视频数据。
研究从目标检测数据集中,收集了 6508 张图像作为训练数据和 20 次地铁行驶数据来验证我们的算法。
虽然摄像机安装在固定角度,但许多变体会导致图像质量下降。例如,由于边缘设备的限制,视频的帧率大约为 8 到 10 帧,这会导致图像帧模糊。
照明可能因一个 站台屏蔽门而异,并导致光源的不同情况。特别是红色和白色的闪光灯带安装在平台的末端,这给监测任务带来了挑战。
对于每帧的推理时间,我们在 CPU 和 GPU 上都进行了测试。最好的模型在 GPU 上每帧运行 9 毫秒。虽然可能看不出有太大的提升,但在 CPU 上运行时情况更清晰。
圆探测器每帧仅花费 130 毫秒,几乎快了 14.7 倍并保持了高精度。它的性能满足了我们实时监测任务的速度要求。
当进一步查看检测结果时,可以看到圆形表示如何影响无锚设计网络的结果。
结论:这项研究中提出了一种基于无锚主干检测网络圆探测器的实时乘客量监测算法。它使用摄像头从俯视角度记录乘客在真实地铁站上下车的日常视频。
文中的研究设计了一个名为圆探测器的无锚网络,并将其用作检测器的主干,以检测每一帧中的乘客头部。
在检测后提出了一种简单但有效的基于圆表示的跟踪和枚举算法。比较参数和时间消耗,并在真实世界的数据集上测试了整监测算法,证明它是有效的,并且足够灵敏可以实时工作的。
参考文献:1.DG Lowe著,《来自尺度不变关键点的独特图像特征》卷。60,没有。2,第 91-110 页,2004 年。
2.N. Dalal 和 B. Triggs著,《用于人体检测的定向梯度直方图》卷。1,第 886-893 页,2005 年 6 月。
3.T. Ojala、M. Pietikäinen 和 T. Mäenpää著,《具有局部二元模式的灰度和旋转不变纹理分类》第 404-420 页,2000 年。
4.R. Girshick、J. Donahue、T. Darrell 和 J. Malik著,《用于准确对象检测和语义分割的丰富特征层次结构》第 580-587 页,2014 年 6 月。
5.R. Girshick著,《Fast R-CNN》第 1440-1448 页,2015 年 12 月。
6.S. Ren、K. He、R. Girshick 和 J. Sun著,《Faster R-CNN:使用区域建议网络实现实时目标检测》卷39,第 1137-1149 页,2017 年 6 月。
,Copyright © 2008-2022 秒下下载站
m.down10s.com .All Rights Reserved