基于视频的行人检测与属性分析

行人检测与属性分析通过视频分析,实现对监控区域中的人群人数分布、人群外观属性、行人运动轨迹进行精确分析, 该研究在安防监控、自动驾驶及线下商业领域具有重要的意义。


Scale-aware Progressive Optimization Network

简介: 人群计数由于广阔的应用前景而引起了越来越多地关注。 该领域最大的挑战之一是人群尺度的巨大变化,其严重影响了密度估计的准确性。 为此,本文提出了一种用于人群计数的尺度感知渐进优化网络(SPO-Net), 该网络可以克服高度拥挤场景中的尺度变化问题以实现高质量的密度图估计。 具体而言,SPO-Net的第一阶段(BPS)主要集中于对输入图像进行预处理, 并从分离的多层特征中融合高级语义信息和低级空间信息。 SPO-Net的第二阶段(RGS),旨在从多尺度特征和循环训练方式中学习一个尺度适应的网络。 此外,为了更好地学习多尺寸区域的局部相关性并减少冗余计算,网络在每次循环中引入了具有类比目标的不同监督, 称为渐进优化策略。 本文在三个具有挑战性的人群计数数据集上进行的广泛实验不仅证明了SPO-Net中每个部分的有效性, 而且证明了本文提出的方法与以往方法相比的优越性。

ACM MultiMedia (ACM MM), 2020

Self-Bootstrapping Pedestrian Detection in Downward-Viewing Fisheye Cameras Using Pseudo-Labeling

简介: 垂直鱼眼摄像头由于其大视角、避免了遮挡等优点被广泛应用于视频监控领域。 然而由于缺乏具有实例标注的行人数据集,基于垂直鱼眼视频的行人分析研究受到严重制约。 针对于此,本文创新地提出一种基于区域分割的垂直鱼眼行人自动标注方法,可实现具有实例标注的垂直鱼眼行人数据集的自动构造。 本文首先根据入射光线与摄像头的光轴形成的夹角将垂直鱼眼镜头的监控区域分为斜照和垂直两个区域,然后分别对两个区域中行人进行标注: 在斜照区域,利用斜照区域行人与现有数据集中行人存在一定相似程度的特点,使用微调后的全监督行人检测网络对该区域行人进行标注; 在垂直区域,通过利用监控视频中行人存在时间和空间连贯性的特点,使用视觉跟踪算法,结合斜照区域的行人检测的结果,对该区域行人进行标注。 本文方法生成具有实例标注的垂直鱼眼行人数据集可直接用于训练垂直鱼眼行人检测网络,也为其它垂直鱼眼视频分析领域提供数据支持。

International Conference on Multimedia & Expo (ICME), 2020
[论文]

Scale-Aware Rolling Fusion Network for Crowd Counting

简介: 在人群计数的任务中,存在遮挡,背景干扰和人群大尺度变化等因素,影响人群计数的精度,其中人群尺度的变化对计数的影响最大。 本文提出了一个两阶段的尺度感知循环融合网络用于解决人群计数中存在的挑战。 首先第一阶段使用一个有非对称的编码-解码结构,在尽可能保留图片中提取的信息的同时排除了部分干扰信息。 其次第二阶段的循环监督网络,不同于以往通过多列或多分支的结构,使用循环结构逐步提取多尺度特征并在循环中使用监督渐进优化提取的特征。 与以往的方法相比,循环监督网络的优势是不需要通过增加参数却能够通过循环极大地丰富感受野,从而更好地解决人群尺度变化的问题。 本文的方法在三个广泛使用的公开的人群计数数据集上进行了测试并取得了最优的结果。

International Conference on Multimedia & Expo (ICME), 2020
[论文]

ADCrowdNet: An Attention-Injective Deformable Convolutional Network for Crowd Understanding

简介: 人群计数中背景干扰和尺度变化会对密度回归的准确度造成巨大的影响, 本研究通过设计一个注意力图生成器,将网络注意力集中在人群从而大大减少背景干扰。 同时,利用可变形卷积设计了一个多尺度特征提取的网络。 最终将两者结合预测高质量的密度图实现更精确的人群计数。

Computer Vision and Pattern Recognition (CVPR), 2019
[论文]

Weak-structure-aware visual object tracking with bottom-up and top-down context exploration

简介: 由于运动、形状变形、遮挡和周围环境的影响,物体的外观会发生很大的变化,影响物体检测和跟踪的结果。 研究提出了一种利用目标及其周围环境的弱结构对目标进行建模和定位的方法, 并通过与现有方法的对比验证了所提出方法的优越性。

Signal Processing: Image Communication (SPIC), 2018
[论文]

Hierarchical Ensemble of Background Models for PTZ-based Video Surveillance

简介: 研究了一种适用于PTZ摄像机的视频监控分层背景模型,在此基础上实现了由背景建模、 观测帧配准和目标跟踪三个关键部分构成的跟踪系统,并且在多个具有挑战性的场景中取得了优异的跟踪效果。

IEEE Transactions on Cybernetics (TCYB), 2015
[论文]

Back to top