医疗文本分类
最后更新 2020/05/11 11:44
阅读 14536
BERT TensorFlow 文本分类
mohoho
4
获得赞0
发布的文章1
答辩的项目Batch大小为50,循环次数为8次,通过在线上环境完成训练,模型最优精度评分为83.27。
最后更新 2020/05/11 11:44
阅读 14536
BERT TensorFlow 文本分类
一、赛题分析
本赛题是一个文本的多分类问题,一般来说这种问题,都可以交给bert来解决 数据的特点在于:
1. 需要分类的label较多
2. 各个类别的样例数不均衡,样例最多的妇产科是第二多的神经科的2.5倍,更是样例最少的数百倍
3. 所给数据非常漂亮,省去了许多数据预处理
二、 核心思路
选用模型
BERT: BERT的全称是Bidirectional Encoder Representation from Transformers,即双向
请先绑定您的微信账号 点击立即绑定
敬请谅解,如有疑问请联系FlyAI客服