1024程序员节—蝴蝶分类开源竞赛
最后更新 2020/12/11 15:53
阅读 9737
图像分类
天涯·明月·刀
21
获得赞7
发布的文章2
答辩的项目Batch大小为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为93.06。
最后更新 2020/12/11 15:53
阅读 9737
图像分类
一、问题分析
本赛题任务主要是通过对200类蝴蝶建立精准的分类模型。数据集大约有20,223张,涵盖200个物种,116属,23个亚科和5个科的四个不同级别。
细颗粒度分类,在图像分类中是比较有挑战性的。普通的分类大多类间差距较大,比如说飞机和轮船,在图像特征上比较好区分,但细颗粒度图片,大体上属于同一类,比如猫的分类、狗的分类,类间差距小,很多特征相似,甚至相同,一般的分类网络,可能取得的效果并不好,所以要取得好的成绩并不容易。
图片中的蝴蝶有的比较大,有的比较小,图片大小也不一致,不同种类,数据有多有少,存在一定的不平衡,这些都给训练增加难度。
在网络选择方面,首选带Attention的网络,比如seresnet系列,这类网络在细颗粒度分类上,应该会比其他网络会好一点。
二、网络介绍
对于图片分类,如果没有什么特别要求,一般两种方法最有效,模型集成和交叉验证。其实这两种方法是相似的,都是训练多个模型,再对判定结果进行平均,或者加权。缺点是训练时间长,在工程上并不实用,感觉有点像无赖打法。 不过选择什么样的模型集成,却是要不断尝试,耗费大
请先绑定您的微信账号 点击立即绑定
敬请谅解,如有疑问请联系FlyAI客服