matlab dpm目标检测,车辆目标检测-程序员宅基地

技术标签: matlab dpm目标检测  

原标题:车辆目标检测

车辆是视频场景中最关键的对象之一,车辆 和 人 是视频检测永恒的话题。

车辆检测是车辆分析中关键的一步,是后续进行 的基础。

关于检测的方法和框架有很多,不外乎是特征训练和分类,这里推荐两篇综述性文章:

[1] Benenson R, Omran M, Hosang J, et al.Ten Years of Pedestrian Detection, What Have We Learned?[M]// Computer Vision - ECCV 2014 Workshops. Springer International Publishing, 2014:613-627.

http://rodrigob.github.io/documents/2014_eccvw_ten_years_of_pedestrian_detection_with_supplementary_material.pdf

[2] P.Dollar, C. Wojek,B. Schiele, et al.Pedestrian detection: an evaluation of the state of the art[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(4): 743-761.

http://vision.ucsd.edu/~pdollar/files/papers/DollarPAMI12peds.pdf

•开放检测算法框架及代码:

关于目标检测的框架及代码非常多,这里列出来几个:

名声在外的 DPM

Deformable Part Models,专业做行人检测,对于车辆检测等刚体目标 并无太多优势。

参考代码:https://people.eecs.berkeley.edu/~rbg/latent/index.html

INRIA Object Detection and Localization Toolkit

基于HOG特征的行人检测方法,由Dalal于 2005年

参考代码:http://pascal.inrialpes.fr/soft/olt/

doppia code

这是一个代码集合,2015年更新,内容包含:

a) Pedestrian detection at 100 frames per second, R. Benenson. CVPR, 2012.

b) 实时的 Stixels estimation without depth map computation.

c) Fast stixels estimation for fast pedestrian detection.

d) Seeking the strongest rigid detector.

e) Ten years of pedestrian detection, what have we learned?

f) Face detection without bells and whistles.

下载地址:https://bitbucket.org/rodrigob/doppia

Pitor Dollar Detector

有一个代码集合,大牛名字命名,全称为:Piotr’s Computer Vision Matlab Toolbox

下载地址:https://pdollar.github.io/toolbox/

•开放训练数据集 (行人检测):

MIT 行人数据集

MIT 早期公开数据集(2000年),共924张行人图片(ppm格式,宽高为64×128),只含正面和背面两个视角,无负样本,未区分训练集和测试集。

该数据集目前已很少使用,但由于公开较早,影响力比较大,因此作者把它列在第一个。

下载地址:http://cbcl.mit.edu/software-datasets/PedestrianData.html

Caltech Pedestrian 行人数据集

该数据库是目前规模较大的行人数据库(2014年),采用车载摄像头拍摄,约10个小时左右,视频的分辨率为640×480,30帧/秒。

标注了约250,000帧(约137分钟),350000个矩形框,2300个行人,提供了相应的Matlab工具包。

下载地址:

http://www.vision.caltech.edu/Image_Datasets/CaltechPedestrians/

NICTA 行人数据集

目前规模较大的静态图像行人数据库,25551张含单人的图片,5207张高分辨率非行人图片(2008年)。

数据库中已分好训练集和测试集,方便不同分类器的比较。

下载地址:http://www.nicta.com.au/category/research/computer-vision/tools/automap-datasets/

INRIA Person

目前使用最多的静态行人检测数据集,由“HOG+SVM”的作者Dalal创建(2005年)。

训练集有正样本614张(包含2416个行人),负样本1218张;测试集有正样本288张(包含1126个行人),负样本453张。

下载地址:http://pascal.inrialpes.fr/data/human/

另外,还有TUD、ETHZ、USC、CVC等数据集,当然你可能也知道大名鼎鼎的 ImageNet(里面会有少部分行人),当然公版数据集也仅仅在于自己测试用,想要得到更好的检测效果,你必须训练自己的数据集。

•开放训练数据集 (车辆检测):

MIT - CBCL 车辆数据集

由 MIT 提供的车辆数据集(2000年),主要用于车辆检测和识别中,共有516张128*128格式为ppm的图像。

下载地址:http://cbcl.mit.edu/software-datasets/CarData.html

KITTI

这是一个测试交通场景中 车辆检测、追踪、语义分割等算法的公开数据集。由丰田汽车主导,目前在测试自动驾驶等识别算法中应用比较多。

实际上,KITTI 已经成为 ADAS行业的 实际效果检测标准。

下载地址:http://www.cvlibs.net/datasets/kitti/index.php

UA-DETRAC

车辆检测和跟踪的大规模数据集,可以作为 KITTI 的补充。

数据集主要拍摄于北京和天津的道路过街天桥(京津冀场景有福了),并 手动标注了 8250 个车辆 和 121万目标对象外框。

附带的 Toolkit 统一了数据接口,里面包含了几种 State-Of-The-Art 的检测和跟踪方法(大家可以进行测试比较)。

数据集:DETRAC-Train-Images (5.22GB, 60 sequences)

DETRAC-Test-Images (3.94GB, 40 sequences)

检测:DETRAC-Train-Detections (DPM, ACF, R-CNN, CompACT)

DETRAC-Test-Detections (DPM, ACF, R-CNN, CompACT)

下载地址:http://detrac-db.rit.albany.edu/

• ACF 算法

ACF是指 Aggregate Channel Features,包含在 Piotr Dollar 工具箱内(目前更新至3.50),作为目标检测算法,在行人检测领域有不错的表现。

这里我们把他应用在车检上,借助 DETRAC 数据集进行训练。

Piotr Dollar 工具箱采用 Matlab接口,因此,在实际应用中需要 封装为 C++接口 ,基本步骤如下:

1. 安装Matlab编译器

命令行输入mex -setup,根据提示安装matlab compilers;

注意选择compiler类型,matlab自带的编辑器 或者对应你用的VS版本。

2. 安装生成器

命令行中输入mbuild -setup。

3. 生成c++库文件

调用命令mcc -W cpplib:XXX -T link:lib XXX.m;

前面的XXX表示生成的dll文件名,后面的XXX.m对应matlab源文件,生成后文件包括:XXX(.h. lib .dll)。

关于 Matlab 的其他调用方式 根据需要也可以尝试。

数据训练:

作者采用 Detrac 数据进行训练,具体训练过程按住不表,直接看 检测效果(近端检测还是很不错的):

责任编辑:

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_34853336/article/details/116073826

智能推荐

linux下编译GDAL外加扩展格式支持(五)--完-程序员宅基地

文章浏览阅读229次。接1、2、3、4篇。10、安装mysql支持安装fedora15或者16系统时若选择安装mysql数据库,则必须自行安装mysql开发包。因为自带默认数据库不会安装这个包。否则会遇到mysql错误:ogr_mysql.h:34:23: fatal error: my_global.h: No such file or directory#问题原因:找不到mysql头文件..._linux gdal netcdf5

Linux tc qdisc 模拟网络丢包延时-程序员宅基地

文章浏览阅读1.2k次。Linux tc qdisc 模拟网络丢包延时_tc qdisc

linux64bit 安装 jdk 1.7-程序员宅基地

文章浏览阅读336次。linux64bit 安装 jdk 1.7下载地址 : https://edelivery.oracle.com/otn-pub/java/jdk/7u21-b11/jdk-7u21-linux-x64.rpm0. 卸载rpm版的jdk: #rpm -qa|grep jdk 显示:jdk-1.6.0_10-fcs 卸载:#rpm -e --nodep..._liunx64位得jdk1.7

【Linux笔记】-----Nginx/LVS/HAProxy负载均衡的优缺点_中间件应用场景nginx lvs proxy-程序员宅基地

文章浏览阅读552次。开始听到负载均衡的时候,我第一反应想到的是链路负载均衡,在此之前主要是在学习网络方面知识,像在NA、NP阶段实验做链路负载均衡时常会遇到,后来还接触到SLB负载分担技术,这都是在链路基础上实现的。 其实负载均衡可以分为硬件实现负载均衡和软件实现负载均衡。 硬件实现负载均衡:常见F5和Array负载均衡器,配套专业维护服务,但是成本昂贵。 软件实现负载均衡:常见开源免费的负载均衡软件有Ngin..._中间件应用场景nginx lvs proxy

多维时序 | MATLAB实现CNN-LSTM多变量时序预测_cnn可以进行多步预测-程序员宅基地

文章浏览阅读4.7k次。多维时序 | MATLAB实现CNN-LSTM多变量时序预测目录多维时序 | MATLAB实现CNN-LSTM多变量多步预测基本介绍模型特点程序设计学习总结参考资料基本介绍本次运行测试环境MATLAB2020b,MATLAB实现CNN-LSTM多变量多步预测。模型特点深度学习使用分布式的分层特征表示方法自动提取数据中的从最低层到最高层固有的抽象特征和隐藏不变结构. 为了充分利用单个模型的优点并提高预测性能, 现已提出了许多组合模型。CNN 是多层前馈神经网络, 已被证明在提取隐藏_cnn可以进行多步预测

随便推点

【9.3】用户和组的管理、密码_polkitd:input 用户和组-程序员宅基地

文章浏览阅读219次。3.1 用户配置文件和密码配置文件3.2 用户组管理3.3 用户管理3.4 usermod命令3.5 用户密码管理3.6 mkpasswd命令_polkitd:input 用户和组

pca算法python代码_三种方法实现PCA算法(Python)-程序员宅基地

文章浏览阅读670次。主成分分析,即Principal Component Analysis(PCA),是多元统计中的重要内容,也广泛应用于机器学习和其它领域。它的主要作用是对高维数据进行降维。PCA把原先的n个特征用数目更少的k个特征取代,新特征是旧特征的线性组合,这些线性组合最大化样本方差,尽量使新的k个特征互不相关。关于PCA的更多介绍,请参考:https://en.wikipedia.org/wiki/Prin..._inprementation python code of pca

内存地址Linux下内存分配与映射之一-程序员宅基地

文章浏览阅读35次。发一下牢骚和主题无关:地址类型:32位的cpu,共4G间空,其中0-3G属于用户间空地址,3G-4G是内核间空地址。用户虚拟地址:用户间空程序的地址物理地址:cpu与内存之间的用使地址总线地址:外围总线和内存之间的用使地址内核逻辑地址:内存的分部或全体射映,大多数情况下,它与物理地址仅差一个偏移量。如Kmalloc分..._linux 内存条与内存地址

自动化测试介绍_自动化测试中baw库指的什么-程序员宅基地

文章浏览阅读1.3k次,点赞2次,收藏16次。什么是自动化测试?   做测试好几年了,真正学习和实践自动化测试一年,自我感觉这一个年中收获许多。一直想动笔写一篇文章分享自动化测试实践中的一些经验。终于决定花点时间来做这件事儿。  首先理清自动化测试的概念,广义上来讲,自动化包括一切通过工具(程序)的方式来代替或辅助手工测试的行为都可以看做自动化,包括性能测试工具(loadrunner、jmeter),或自己所写的一段程序,用于_自动化测试中baw库指的什么

a0图框标题栏尺寸_a0图纸尺寸(a0图纸标题栏尺寸标准国标)-程序员宅基地

文章浏览阅读1.6w次。A0纸指的是一平方米大小的白银比例长方形纸(长为1189mm宽为841mm)。A0=1189mm*841mm A1=841mm*594mm 相当于1/2张A0纸 A2=594mm*420mm 相当于1/4.A1图纸大小尺寸:841mm*594mm 即长为841mm,宽为594mm 过去是以多少"开"(例如8开或16开等)来表示纸张的大小,我国采用国际标准,规定以 A0、A1、A2、.GB/T 14..._a0图纸尺寸

TreeTable的简单实现_treetable canvas-程序员宅基地

文章浏览阅读966次。最终效果图:UI说明:针对table本身进行增强的tree table组件。 tree的数据来源是单元格内a元素的自定义属性:level和type。具体代码如下:Java代码 DepartmentEmployeeIDposi_treetable canvas