目标检测与图片分类的区别-FlyAI

目标检测与图片分类的区别

目标检测

最后更新 2020-04-28 15:37 阅读 7051

最后更新 2020-04-28 15:37

阅读 7051

目标检测

问题：

图像分类与目标检测的区别

目标检测架构的基本网络

将一个预训练的分类网络作为深度学习目标检测架构（例如 Faster R-CNN、SSD 或者 YOLO）。

深度学习目标检测器的模块

图 4： VGG16 基本网络是 SSD 深度学习目标检测框架的一个特征抽取模块。

首先我们要知道，深度学习目标检测器有很多模块，子模块以及更小的子模块，但是我们今天要重点关注的是深度学习入门者所困惑的两个：

基本网络就是常用的分类 CNN 架构，包括：

通常这些网络在大数据集上进行预训练来进行分类，例如 ImageNet，它们可以学习到很多具有鉴别能力的滤波器。

目标检测框架由很多组成部分和子模块构成：

Faster R-CNN 框架包括：候选区域网络（RPN）一组锚点ROI 池化模块最终基于区域的卷积神经网络

SSD（单步检测器，single shot detectors）包括：多框（MultiBox）先验（Priors）固定先验（Fixed priors）

图 4 描述了 SSD 框架内部的 VGG-16 网络。

通常，我们需要在基本网络上进行网络手术。这种修改包括：

变成全卷积的形式，并接受任意输入维度。
剪除了基本网络中更深层的卷积和池化层，将它们以一系列新层（SSD）、新模块（Faster R-CNN），或者这两者的一些组合代替。这里的「网络手术」是一种口语化的说法，它的意思是移除基本网络中的一些原始卷积层，将它们用新层替代。网络手术也是讲究策略的，我们移除一些不需要的部分，然后用一组新的部分来替代它们。

然后，当我们开始训练我们的框架进行目标检测时，（1）新层、模块和（2）基本网络的权重都被修改了。

图片来自知乎-田昊

讨论

500字

表情

发送

删除确认

是否删除该条评论？

取消删除