Mask-CNN:用于细粒度图像识别的零件定位和描述符选择
深度学习
最后更新 2020-06-15 11:24 阅读 11550
最后更新 2020-06-15 11:24
阅读 11550
深度学习
Mask-CNN: Localizing Parts and Selecting Descriptors for Fine-Grained Image Recognition
核心思想和贡献
提出
定位分割网络和细粒度分类网络有助于细粒度部件特征的提取
算法综合分析
1、先使用细粒度类别的标签来训练一个定位的网络,可以用erase cam作为gt训练faster rcnn定位出object。单独两个cam训练作为gt训练faster rcnn定位出两个part。然后做特征的提取。
2、本文将mask 以应用在特征上再进行avg pooling 和max pooling 得到不同的特征表征。增强了特征的丰富性
3、本文将mask 应用在特征上使得得到的特征可以抛弃掉背景特征的干扰。
思考
对于原先三分支的提高,最好应该是把cam图crop下来再进行特征的提取比较科学,只提取局部特征。最好应该利用得到的三个cam图来训练faster rcnn来得到三个定位,然后只截取三个定位的特征的堆叠来做细粒度分类更加准确。
赞
讨论
500字
表情
删除确认
是否删除该条评论?
取消
删除