手写英文字体识别(名企内推)
最后更新 2020/10/27 16:03
阅读 5398
ResNeXt ResNeSt
别人的公园
9
获得赞0
发布的文章1
答辩的项目Batch大小为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为87.06。
最后更新 2020/10/27 16:03
阅读 5398
ResNeXt ResNeSt
大家好,我是别人的公园。
我的介绍主要分三个部分展开,分别是数据处理、模型方法和感想与建议。
一、数据处理
首先是数据这一块训练数据最大的特点就是,碎片化,很杂乱,看上去分布似乎一样,其实包含了很多噪声。
但是由于标签只提供了数据的内容,没有提供bounding box或者是mask,因此这也是整个比赛提分的最大障碍。
针对这个问题,我用了一个最笨的办法。就是引入个人强先验知识。
我首先针对所有图像进行了数据长宽分布的统计,横轴是长,纵轴是宽,可以看到这个分布就是这个样子,然后我根绝图片尺寸的分布对不同尺寸的图像进行了裁切。
当然这个裁切
请先绑定您的微信账号 点击立即绑定
敬请谅解,如有疑问请联系FlyAI客服