仇恨言论识别

分享给好友

2019-08-08 15:00:00
开始提交

2019-09-07 15:00:00
最终提交结束

自由训练

参赛权限提示

当前赛题需能力值达到 $vue{itemranking} 才可以正常提交训练哦~

当前赛题仅允许 600 能力值以下的新手可以正常提交训练哦~

报名参赛

下载当前代码

您可使用自己熟悉的编辑器实现算法并通过命令行
提交任务到FlyAI云端训练。确认下载体验吗?

$vue{upDataType ? '上传样例压缩包' : '上传代码压缩包' }

请将代码文件压缩为zip格式,文件大小不超过10M 提示:请确认删除"data"⽂件夹后进行上传操作

将文件拖拽至此处或点击此处选择文件

$vue{complete < 99 ? '上传中' : '上传完成'} $vue{complete}

$vue{fileName}
线上GPU运行环境:
FlyAl推荐如下配置,如有问题可手动添加或修改!

GPU环境

深度学习框架

其它依赖

提交
提交

提交确认

设置好参数后点击“确定“发布GPU训练任务

EPOCHS

BATCH SIZE

绑定你的微信账号

用于本地环境登录和实时接收训练通知

打开微信,使用扫一扫功能分享给好友

绑定你的微信账号

用于本地环境登录和实时接收训练通知

温馨提示

$vue{csv_msg}

知道了
提交结果文件

$vue{csvName == '' ? '仅支持上传 CSV 格式的文件' : csvName+' 上传中...'}

$vue{csvName}上传成功
取消 确认提交

提交成功

系统正在测评您的结果文件,

您可通过右侧【我的提交-查看记录详情】进行查看

知道了
  • 赛事介绍
  • 竞赛排行榜
  • 自由练习榜单
  • 讨论($vue{comment_count})
  • 学习资源

$vue{item.rank_name}

大赛简介

此数据集包含25000多条推文内容。仇恨言论识别任务:查看短文,并确定它是否为 0(包含仇恨言论),1(冒犯性的,但没有仇恨言论),2(一点也没有冒犯性)。

赛事主题和数据说明

赛题描述

通过实现算法并提交训练,获取奖金池奖金。小提示:抢先更新算法排行榜,有更大机会获取高额奖金哦!

数据来源

HOLDistinguish

数据描述

由于需要提交代码作品在云端进行训练,参赛数据集不对外开放。仅提供调试数据。

字段说明:

文件名 字段名称 字段类型 备注
text string 不为空 文本
label int 大于等于 0, 小于等于 2 分类标签

参考文献:

[1]Racial Bias in Hate Speech and Abusive Language Detection Datasets

评审标准

算法输入输出格式

输入字段: text,

输出字段: label,

评审指标说明

  • 精确率(Precision,简称为P):正确预测为正的占全部预测为正的比例
  • 召回率(Recall,简称为R):正确预测为正的占全部实际为正的比例
  • F1-Score 是精确率和召回率的一种加权平均,它的最大值为1,最小值为0
  • 计算公式如下:
  • 评审计算公式
超过 90分 的成绩会在48小时内更新到排行榜,不要着急哦!
第三名

NLP-Learner

暂未公开
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为92.45。

2019-09-07 19:33:33

1602.00

暂未公开
第三名

sakuranew

大神经验
batch数据为500,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为92.40。

2019-09-03 11:17:10

951.00

大神经验
第三名

凉心半浅良心人

暂未公开
batch数据为32,循环次数为3次,通过在线上环境完成训练,模型最优精度评分为92.34。

2019-08-21 13:13:33

769.00

暂未公开
4

永不息的舞步

暂未公开
batch数据为32,循环次数为50次,通过在线上环境完成训练,模型最优精度评分为92.17。

2019-08-24 14:40:46

352.50

暂未公开
5

zyccyz

暂未公开
batch数据为32,循环次数为3次,通过在线上环境完成训练,模型最优精度评分为92.11。

2019-09-10 02:18:20

暂未公开
6

未名湖畔的落叶

暂未公开
batch数据为32,循环次数为5次,通过在线上环境完成训练,模型最优精度评分为92.09。

2019-08-10 21:15:09

187.50

暂未公开
7

Sunny^_^Today

暂未公开
batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为92.06。

2019-09-08 07:03:47

暂未公开
8

迷途小书童

暂未公开
batch数据为128,循环次数为3次,通过在线上环境完成训练,模型最优精度评分为91.49。

2019-09-05 04:23:17

暂未公开
9

yphacker

暂未公开
batch数据为32,循环次数为8次,通过在线上环境完成训练,模型最优精度评分为91.21。

2019-09-02 19:02:46

暂未公开
10

gboy

暂未公开
batch数据为1,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为91.07。

2019-09-06 21:53:43

暂未公开
11

Noah

暂未公开
batch数据为128,循环次数为16次,通过在线上环境完成训练,模型最优精度评分为90.68。

2019-08-16 11:14:30

暂未公开
12

learnFromBest

暂未公开
batch数据为32,循环次数为8次,通过在线上环境完成训练,模型最优精度评分为90.64。

2019-08-24 10:00:13

暂未公开
13

killf

暂未公开
batch数据为32,循环次数为20次,通过在线上环境完成训练,模型最优精度评分为90.51。

2019-08-10 07:57:44

1.25

暂未公开
14

麦小杨

暂未公开
batch数据为32,循环次数为4次,通过在线上环境完成训练,模型最优精度评分为90.45。

2019-08-17 20:39:36

暂未公开
15

向颖聪

暂未公开
batch数据为64,循环次数为7次,通过在线上环境完成训练,模型最优精度评分为90.45。

2019-08-29 14:32:22

暂未公开
16

那棵树

暂未公开
batch数据为64,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为90.35。

2019-08-15 00:25:22

暂未公开
17

未过及格线

暂未公开
batch数据为32,循环次数为800次,通过在线上环境完成训练,模型最优精度评分为90.17。

2019-09-04 17:25:58

暂未公开
18

莫须有の嚣张

暂未公开
batch数据为64,循环次数为20次,通过在线上环境完成训练,模型最优精度评分为89.96。

2019-08-11 17:09:54

暂未公开
19

Xin Yao

暂未公开
batch数据为128,循环次数为20次,通过在线上环境完成训练,模型最优精度评分为89.76。

2019-08-10 12:14:24

暂未公开
20

无......有

暂未公开
batch数据为64,循环次数为16次,通过在线上环境完成训练,模型最优精度评分为89.76。

2019-09-11 07:47:12

暂未公开
21

风轻云淡

暂未公开
batch数据为64,循环次数为50次,通过在线上环境完成训练,模型最优精度评分为89.71。

2019-08-24 15:41:41

暂未公开
22

nigeiwochi

暂未公开
batch数据为5,循环次数为100次,通过在线上环境完成训练,模型最优精度评分为89.53。

2019-08-13 12:47:47

暂未公开
23

探索之路

暂未公开
batch数据为128,循环次数为1000次,通过在线上环境完成训练,模型最优精度评分为89.53。

2019-08-14 09:29:49

暂未公开
24

雨殇残风

暂未公开
batch数据为100,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为89.37。

2019-09-01 19:23:15

暂未公开
25

AMERICA

暂未公开
batch数据为1000,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为89.30。

2019-09-05 22:45:41

暂未公开
26

HxH

暂未公开
batch数据为64,循环次数为5次,通过在线上环境完成训练,模型最优精度评分为89.22。

2019-08-30 15:32:04

暂未公开
27

summer 丶

暂未公开
batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为89.13。

2019-09-16 09:31:37

暂未公开
28

为之奈何

暂未公开
batch数据为128,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为89.11。

2019-08-22 10:33:02

暂未公开
29

大木淡漠

暂未公开
batch数据为256,循环次数为1340次,通过在线上环境完成训练,模型最优精度评分为89.07。

2019-08-09 05:04:36

暂未公开
30

指尖、泪残留

暂未公开
batch数据为500,循环次数为64次,通过在线上环境完成训练,模型最优精度评分为88.92。

2019-08-17 12:43:48

暂未公开
31

重阳

暂未公开
batch数据为500,循环次数为20次,通过在线上环境完成训练,模型最优精度评分为88.82。

2019-09-09 21:03:22

暂未公开
32

Cwinq

暂未公开
batch数据为10,循环次数为50次,通过在线上环境完成训练,模型最优精度评分为88.78。

2019-08-14 03:16:06

暂未公开
33

happyprince

暂未公开
batch数据为500,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为88.73。

2019-08-09 00:00:22

暂未公开
34

紫湘醉

暂未公开
batch数据为512,循环次数为50次,通过在线上环境完成训练,模型最优精度评分为88.73。

2019-09-16 17:59:06

暂未公开
35

头重脚轻

暂未公开
batch数据为500,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为88.68。

2019-09-09 07:26:33

暂未公开
36

天才一小本

暂未公开
batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为88.66。

2019-09-04 15:42:05

暂未公开
37

还是要继续

暂未公开
batch数据为500,循环次数为5次,通过在线上环境完成训练,模型最优精度评分为88.63。

2019-09-18 20:52:01

暂未公开
38

==

暂未公开
batch数据为32,循环次数为20次,通过在线上环境完成训练,模型最优精度评分为88.46。

2019-09-08 15:32:18

暂未公开
39

Robinbg

暂未公开
batch数据为64,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为88.32。

2019-08-31 14:41:28

暂未公开
40

夏1564457098

暂未公开
batch数据为32,循环次数为100次,通过在线上环境完成训练,模型最优精度评分为88.29。

2019-08-29 19:06:19

暂未公开
41

年小舜

暂未公开
batch数据为500,循环次数为1000次,通过在线上环境完成训练,模型最优精度评分为88.16。

2019-08-21 14:22:20

暂未公开
42

绝缘体

暂未公开
batch数据为500,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为88.08。

2019-09-10 04:03:35

暂未公开
43

暂未公开
batch数据为64,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为88.06。

2019-08-24 16:59:44

暂未公开
44

白开水

暂未公开
batch数据为100,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为87.99。

2019-08-15 10:05:30

暂未公开
45

cl

暂未公开
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为87.96。

2019-08-25 03:53:44

暂未公开
46

FC

暂未公开
batch数据为64,循环次数为100次,通过在线上环境完成训练,模型最优精度评分为87.93。

2019-09-06 01:15:46

暂未公开
47

AiFool

暂未公开
batch数据为1024,循环次数为1000次,通过在线上环境完成训练,模型最优精度评分为87.91。

2019-08-14 17:00:04

暂未公开
48

cnn

暂未公开
batch数据为1000,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为87.84。

2019-09-05 12:56:51

暂未公开
49

丁远东

暂未公开
batch数据为128,循环次数为16次,通过在线上环境完成训练,模型最优精度评分为87.82。

2019-08-22 17:03:40

暂未公开
50

宇宙

暂未公开
batch数据为64,循环次数为1000次,通过在线上环境完成训练,模型最优精度评分为87.81。

2019-08-23 18:55:43

暂未公开
51

雷咖啡

暂未公开
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为87.79。

2019-08-22 19:56:00

暂未公开
52

玖月初识

暂未公开
batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为87.75。

2019-08-12 13:32:01

暂未公开
53

暂未公开
batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为87.70。

2019-08-31 19:52:01

暂未公开
54

nlp-ygq

暂未公开
batch数据为500,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为87.42。

2019-09-10 05:23:34

暂未公开
55

就是很任性

暂未公开
batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为87.29。

2019-08-31 23:05:49

暂未公开
56

六个骨头

暂未公开
batch数据为500,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为87.27。

2019-08-22 22:18:47

暂未公开
57

duoge

暂未公开
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为87.26。

2019-08-22 11:59:32

暂未公开
58

暂未公开
batch数据为128,循环次数为64次,通过在线上环境完成训练,模型最优精度评分为87.10。

2019-08-22 19:44:19

暂未公开
59

丅丄

暂未公开
batch数据为256,循环次数为100次,通过在线上环境完成训练,模型最优精度评分为86.67。

2019-09-06 01:50:06

暂未公开
60

qck15570179927

暂未公开
batch数据为32,循环次数为50次,通过在线上环境完成训练,模型最优精度评分为86.67。

2019-09-07 23:14:51

暂未公开
61

ALC

暂未公开
batch数据为500,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为86.21。

2019-08-18 14:57:34

暂未公开
62

ON-looker

暂未公开
batch数据为32,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为86.07。

2019-08-09 20:34:59

暂未公开
63

binwang672012@gmail.com

暂未公开
batch数据为32,循环次数为100次,通过在线上环境完成训练,模型最优精度评分为85.49。

2019-08-13 17:43:37

暂未公开
64

小帆

暂未公开
batch数据为500,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为84.90。

2019-09-02 16:08:03

暂未公开
65

青青子衿

暂未公开
batch数据为500,循环次数为1000次,通过在线上环境完成训练,模型最优精度评分为84.86。

2019-08-16 11:26:46

暂未公开
66

中华田园

暂未公开
batch数据为32,循环次数为100次,通过在线上环境完成训练,模型最优精度评分为84.56。

2019-09-09 22:07:02

暂未公开
67

trickornot

暂未公开
batch数据为1,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为79.90。

2019-08-09 05:24:11

暂未公开
68

chen_tesdt

暂未公开
batch数据为32,循环次数为100次,通过在线上环境完成训练,模型最优精度评分为68.44。

2019-08-30 22:19:50

暂未公开
第一名
弱鸡瑟瑟发抖 2020-01-19 00:16:47
2020-01-19 00:16:47
91.17
第二名
infinite 2019-12-30 14:26:41
2019-12-30 14:26:41
90.95
第三名
对方正在输入 2019-11-17 15:53:24
2019-11-17 15:53:24
90.31
4
AMERICA 2019-10-07 20:33:19
2019-10-07 20:33:19
89.82
5
天才一小本 2019-12-08 18:15:30
2019-12-08 18:15:30
89.24
6
红但丁 2019-10-07 19:58:46
2019-10-07 19:58:46
89.12
7
土豆土豆大土豆 2019-10-09 11:47:07
2019-10-09 11:47:07
89.12
8
Jeremy 2019-10-09 22:30:35
2019-10-09 22:30:35
89.12
9
徐文强 2019-10-15 21:48:35
2019-10-15 21:48:35
89.12
10
秦殇 2019-10-18 14:48:34
2019-10-18 14:48:34
89.12
11
cracked2 2019-10-31 14:03:35
2019-10-31 14:03:35
89.12
12
starlitskyly 2019-11-04 23:26:38
2019-11-04 23:26:38
89.12
13
帅蛋帅帅 2019-11-15 11:16:57
2019-11-15 11:16:57
89.12
14
Jave 2019-11-17 19:42:23
2019-11-17 19:42:23
89.12
15
0.0呔! 2019-11-18 10:48:54
2019-11-18 10:48:54
89.12
16
abc1574928501 2019-11-28 16:32:11
2019-11-28 16:32:11
89.12
17
wy1572255365 2019-12-01 23:45:50
2019-12-01 23:45:50
89.12
18
+ + 2019-12-05 14:14:20
2019-12-05 14:14:20
89.12
19
会员1571973877 2020-02-22 09:00:43
2020-02-22 09:00:43
89.12
20
阿华田不如阿华甜 2020-03-18 14:03:45
2020-03-18 14:03:45
89.12
21
五岳风@2016 2020-04-16 21:30:04
2020-04-16 21:30:04
89.12
22
高峰 2020-08-21 11:06:55
2020-08-21 11:06:55
89.12
23
曾逸信 2021-09-20 18:24:02
2021-09-20 18:24:02
89.12
24
flyai会员1641450783 2022-01-07 08:12:11
2022-01-07 08:12:11
89.12
25
小瑜.R 2019-11-14 19:49:14
2019-11-14 19:49:14
87.32
讨论
500字
表情
发送
删除确认
是否删除该条评论?
取消 删除
$vue{item.user_name}

$vue{item.title} $vue{item.title}

$vue{items}
$vue{item.like_count}
$vue{item.comment_counts}
$vue{item.comment_counts}
阅读 $vue{item.views}

这里还没有内容哦

挑战者大赛 官方交流群

我的记录

你还没有任何提交记录喔...

  • 参赛流程
  • 常见问题

第一步:参赛选手从FlyAI官网选择比赛报名,需下载样例代码

下载的项目中不包含数据集,运行main.py会自动下载调试数据集

本地调试根据不同数据集会提供10%~100%数据,全量数据提交到GPU后会自动更新替换

下载样例代码,解压后在样例代码上编写自己的模型代码,压缩后再在上传代码位置进行上传,就可以查看自己得分。

第二步:本地代码调试

本地配置Python3.5以上的运行环境,并安装项目运行所需的Python依赖包 app.json是项目的配置文件

在main.py中编写神经网络,没有框架限制

在prediction.py测试模型是否评估成功

main.py中需在class Main(FlyAI) 类中实现自己的训练过程

第三步:提交到GPU训练,保存模型

本地调试完成之后,提交代码到GPU,在全量数据上训练模型,保存最优模型。

提交GPU的方式有:网站在线提交。

第四步:评估模型,获取奖金,实时提现

GPU训练完成后,会调用prediction.py中的predict方法进行评估,并给出最后得分

高分的参赛选手,可实时获取奖金,通过微信提现

Q:如何获得奖金?

A:超过项目设置的最低分,根据公式计算,就可以获得奖金。

Q:比赛使用什么框架?

A:比赛支持常用的机器学习和深度学习框架,比如TensorFlow,PyTorch,Keras,Scikit-learn等。

Q:怎么参加比赛,需不需要提交csv文件?

A:FlyAI竞赛平台无需提交csv文件,在网页上点击报名,下载项目,使用你熟练的框架,修改main.py中的网络结构和数据处理,在prediction.py中进行加载模型及预测。将代码文件压缩为.zip格式,文件大小不超过10M,之后在网站进行在线提交就可以了。

Q:比赛排行榜分数怎么得到的?

A:参加项目竞赛必须实现 prediction.py 中的predict方法。调用模型得出评分。

Q:平台机器什么配置?

A:目前每个训练独占一块V100显卡,显存10G。

Q:本地数据集在哪?

A:可以本地使用ide运行 main.py 下载数据。

Q:FAI训练积分不够用怎么办?

A:目前GPU免费使用,可以进入到:我的积分,通过签到和分享等途径获得大量积分。

Q:离线训练代码不符合规范问题?

A:main.py中可以使用args.EPOCHS和args.BATCH。