中文垃圾短信识别

分享给好友

2019-07-12 15:00:00
开始提交

2019-08-11 15:00:00
最终提交结束

自由训练

剩余奖金 ¥ 569
参赛权限提示

当前赛题需能力值达到 $vue{itemranking} 才可以正常提交训练哦~

当前赛题仅允许 600 能力值以下的新手可以正常提交训练哦~

报名参赛
  • 赛事介绍
  • 竞赛排行榜
  • 奖金记录
  • 讨论($vue{comment_count})

绑定你的微信账号

用于本地环境登录和实时接收训练通知

打开微信,使用扫一扫功能分享给好友

绑定你的微信账号

用于本地环境登录和实时接收训练通知

温馨提示

$vue{csv_msg}

知道了
提交结果文件

$vue{csvName == '' ? '仅支持上传 CSV 格式的文件' : csvName+' 上传中...'}

$vue{csvName}上传成功
取消 确认提交

提交成功

系统正在测评您的结果文件,

您可通过右侧【我的提交-查看记录详情】进行查看

知道了

大赛简介

此数据集包含80万条中文短信,内容涉及广告、推销、生活等。

垃圾短信是指未经用户同意向用户发送的用户不愿意收到的短信息,或用户不能根据自己的意愿拒绝接收的短信息,主要包含以下属性:(一)未经用户同意向用户发送的商业类、广告类等短信息;(二)其他违反行业自律性规范的短信息。垃圾短信泛滥,已经严重影响到人们正常生活、运营商形象乃至社会稳定。通过查看短信,确定它是否是垃圾短信 0)非垃圾短信,1)垃圾短信

参赛须知

参赛时间: 本次竞赛无时间限制,长期有效开放

参赛方式

  • 方式一:
  • 在线查看样例根据FlyAI样例模版实现算法并使用云端免费GPU进行模型训练获得最终成绩得分
  • 方式二:
  • 下载FlyAI样例模版进行本地调试并提交到云端使用免费GPU进行模型训练获得最终成绩得分,在本地进行代码调试的教程请查看[文档中心]

参赛选手说明

  • 参赛人员身份信息需保证真实、有效,大赛主办方仅将个人信息用于赛事数据授权及颁奖使用
  • 欢迎海内外的在校学生,算法工程师和所有AI爱好者参与
  • 本次竞赛报名形式:以个人形式本地提交作品线上审核,并且以最终提交算法得分作为唯一有效成绩
  • 在比赛截止日期前,团队中成绩最高分作为本团队的最终成绩
  • 报名成功后请加入FlyAI竞赛交流群,一起学习进步!重要通知也将在群内发布,不要错过哦

比赛作品说明

  • 参赛选手需要配合组委会对比赛作品的有效性与真实性进行验证
  • 不同团队/个人,提交相似结果文件,取消双方所有人员参赛资格
  • 多开小号报名、提交,一经发现将取消参赛资格
  • 禁止使用外部链接下载代码替换本项目代码
  • 比赛过程中,通过脚本获取比赛数据,成绩无效
  • 使用线上测试集进行训练或者使用非官方提供的外部数据进行训练,成绩无效
  • 使用的预训练模型需为FlyAI官方审核通过的模型,使用非官方验证预训练模型,成绩无效
  • 提交的代码具备可解释性并且其它开源框架可复现
  • 所有相似代码将一律不通过审核!!情况多次出现者封号处理
  • 如有发现利用非正常手段作弊行为,奖金一律不发放。之前所获得奖金金额官方有权收回,情节严重者封号处理
  • 提交代码即视为阅读并同意以上比赛作品说明

大赛奖项设置

奖项说明:

奖项设置 获奖人数 奖金额度说明(按最终得分评判)
参与奖(总奖金30%) 所有人 不同得分区间获得相应的竞赛奖金
突破奖(总奖金20%) 所有人 更新排行榜得分,获取相应竞赛奖金
排名奖(总奖金50%) 第一周/月前3名(冠、亚、季军) 项目上线第一周、第一个月; Time_P(周) = 0.5,Time_P(月) = 0.5;K1=0.5,K2=0.3,K3=0.2;
不同框架奖励 所有人 获得60FAI币用于GPU训练资源消耗

赛事主题和数据说明

赛题描述

通过实现算法并提交训练,获取奖金池奖金。小提示:抢先更新算法排行榜,有更大机会获取高额奖金哦!

数据来源

SpamMessage

数据描述

由于需要提交代码作品在云端进行训练,参赛数据集不对外开放。仅提供调试数据,可通过使用本地调试的方式获取调试数据集。本地调试和提交指南请查看[文档中心]

字段说明:

文件名 字段名称 字段类型 备注
text string 不为空 文本
label int 大于等于 0, 小于等于 1 分类标签

参考文献:

[1]hrwhisper

评审标准

算法输入输出格式

输入字段: text,

输出字段: label,

评审指标说明

  • 准确率(Accuracy):对于给定的测试数据集,预测正确的样本数与实际总样本数之比
  • True,表示预测正确的样本数数量
  • Total Number of Samples,表示实际总样本数数量
  • 计算公式如下:

比赛常见问题说明

Q:比赛使用什么框架?

  • 比赛支持常用的机器学习和深度学习框架,比如TensorFlow,PyTorch,Keras,Scikit-learn、MXNet等。

Q:怎么参加比赛,需不需要提交CSV文件?

  • FlyAI竞赛平台提供免费云端GPU资源,报名后可以使用自己熟练的框架,修改main.py中的网络结构和processor.py中的数据处理;仅部分赛题支持CSV方式提交,请仔细阅读参赛方式相关内容。

Q:比赛排行榜分数怎么得到的?

  • 参加项目竞赛必须实现 model.py 中的predict_all方法。系统通过该方法,调用模型得出评分。

$vue{item.rank_name}

超过 95分 的成绩会在48小时内更新到排行榜,不要着急哦!
第三名

提供者:gboy

1253.73

batch数据为256,循环次数为4次,通过在线上环境完成训练,模型最优精度评分为99.94。

2019-07-18 23:45:46

1253.73

99.94

第三名

提供者:雨中冰言

batch数据为32,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为99.91。

2019-09-18 10:47:04

99.91

第三名

提供者:Sunny^_^Today

757.86

batch数据为64,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为99.90。

2019-07-14 14:44:37

757.86

99.90

4

提供者:快来追我呀

500.00

batch数据为128,循环次数为8次,通过在线上环境完成训练,模型最优精度评分为99.90。

2019-07-18 15:21:46

500.00

99.90

5

提供者:MingTi

batch数据为16,循环次数为3次,通过在线上环境完成训练,模型最优精度评分为99.90。

2020-09-08 13:24:41

99.90

6

提供者:BMW开空调

batch数据为512,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为99.89。

2019-07-16 03:15:33

99.89

7

提供者:geeker

batch数据为128,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为99.89。

2019-07-18 12:44:14

99.89

8

提供者:yphacker

batch数据为256,循环次数为4次,通过在线上环境完成训练,模型最优精度评分为99.89。

2019-08-14 09:00:44

99.89

9

提供者:wmqian

batch数据为500,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为99.89。

2020-03-26 16:15:30

99.89

10

提供者:Perl

229.50

batch数据为64,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为99.88。

2019-07-16 23:37:09

229.50

99.88

11

提供者:✿ 蒋小米要fighting✿

batch数据为256,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为99.88。

2019-07-17 10:49:02

99.88

12

提供者:AiFool

106.75

batch数据为1024,循环次数为1000次,通过在线上环境完成训练,模型最优精度评分为99.88。

2019-07-18 23:37:30

106.75

99.88

13

提供者:阿甲

batch数据为128,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为99.88。

2019-07-19 11:11:32

99.88

14

提供者:gu-dx

batch数据为500,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为99.88。

2019-07-30 08:36:26

99.88

15

提供者:KD

batch数据为256,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为99.88。

2019-10-26 20:12:58

99.88

16

提供者:xuhaishan

batch数据为128,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为99.88。

2020-11-21 13:20:54

99.88

17

提供者:linlh

11.72

batch数据为64,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为99.87。

2019-07-14 14:23:32

11.72

99.87

18

提供者:小林子

batch数据为64,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为99.87。

2019-07-24 15:36:59

99.87

19

提供者:xxl

batch数据为64,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为99.87。

2019-12-19 10:28:04

99.87

20

提供者:曙光

batch数据为256,循环次数为4次,通过在线上环境完成训练,模型最优精度评分为99.86。

2019-07-27 12:17:02

99.86

21

提供者:弱鸡瑟瑟发抖

batch数据为500,循环次数为3200次,通过在线上环境完成训练,模型最优精度评分为99.86。

2020-01-22 07:53:06

99.86

22

提供者:乐1601786794

batch数据为50,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为99.86。

2020-11-30 19:58:07

99.86

23

提供者:nonot

batch数据为500,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为99.85。

2019-07-26 08:30:32

99.85

24

提供者:flyai会员1603595851

batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为99.85。

2020-11-04 13:50:59

99.85

25

提供者:nlp-ygq

batch数据为500,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为99.84。

2019-07-18 20:09:10

99.84

26

提供者:灵翼侠

batch数据为128,循环次数为5次,通过在线上环境完成训练,模型最优精度评分为99.84。

2019-07-20 01:47:39

99.84

27

提供者:佚名

batch数据为500,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为99.84。

2019-07-27 20:49:28

99.84

28

提供者:TheKernel

batch数据为256,循环次数为4次,通过在线上环境完成训练,模型最优精度评分为99.84。

2019-08-01 16:48:34

99.84

29

提供者:这个宇宙不太短

batch数据为500,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为99.84。

2019-08-01 16:57:12

99.84

30

提供者:指尖、泪残留

batch数据为500,循环次数为64次,通过在线上环境完成训练,模型最优精度评分为99.84。

2019-08-18 07:55:20

99.84

31

提供者:.x

batch数据为256,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为99.84。

2019-10-22 23:33:58

99.84

32

提供者:年少无为!

batch数据为1024,循环次数为2次,通过在线上环境完成训练,模型最优精度评分为99.84。

TensorFlow

CNN+BILSTM

2020-02-26 21:34:24

99.84

33

提供者:learnFromBest

23.44

batch数据为128,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为99.83。

2019-07-14 05:20:35

23.44

99.83

34

提供者:此方一泉

batch数据为128,循环次数为2次,通过在线上环境完成训练,模型最优精度评分为99.83。

2019-07-16 17:41:01

99.83

35

提供者:Robinbg

batch数据为256,循环次数为16次,通过在线上环境完成训练,模型最优精度评分为99.83。

2019-08-17 04:02:44

99.83

36

提供者:有分儿就行

batch数据为500,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为99.83。

2019-09-05 13:51:24

99.83

37

提供者:瞻彼淇奥

batch数据为32,循环次数为5次,通过在线上环境完成训练,模型最优精度评分为99.82。

TensorFlow

seq2seq

2019-07-16 19:05:05

99.82

38

提供者:风轻云淡

batch数据为512,循环次数为20次,通过在线上环境完成训练,模型最优精度评分为99.82。

2019-07-26 07:58:17

99.82

39

提供者:AMERICA

batch数据为64,循环次数为3次,通过在线上环境完成训练,模型最优精度评分为99.82。

2019-10-08 18:07:25

99.82

40

提供者:snow兵

batch数据为500,循环次数为64次,通过在线上环境完成训练,模型最优精度评分为99.82。

TensorFlow

LSTM+Attention

2019-11-18 23:10:12

99.82

41

提供者:Jн ♪ヾ

batch数据为500,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为99.81。

2019-07-15 06:42:05

99.81

42

提供者:nigeiwochi

batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为99.81。

2019-07-16 05:06:18

99.81

43

提供者:梳碧湖的砍柴人

batch数据为500,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为99.81。

2019-07-26 19:47:31

99.81

44

提供者:AlphaU

batch数据为500,循环次数为2次,通过在线上环境完成训练,模型最优精度评分为99.81。

2020-04-17 07:54:41

99.81

45

提供者:Xin Yao

46.88

batch数据为64,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为99.80。

Keras

Bert

2019-07-14 20:08:07

46.88

99.80

46

提供者:ss

batch数据为500,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为99.80。

2020-11-25 21:41:37

99.80

47

提供者:sp

batch数据为256,循环次数为4次,通过在线上环境完成训练,模型最优精度评分为99.79。

2019-07-22 19:50:43

99.79

48

提供者:ChenS

batch数据为500,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为99.78。

2019-10-22 18:49:13

99.78

49

提供者:弗兰克1566442094

batch数据为64,循环次数为28次,通过在线上环境完成训练,模型最优精度评分为99.77。

2019-08-23 15:57:39

99.77

50

提供者:iris

batch数据为256,循环次数为4次,通过在线上环境完成训练,模型最优精度评分为99.76。

2019-07-21 16:38:14

99.76

51

提供者:binwang672012@gmail.com

batch数据为128,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为99.74。

2019-07-29 13:37:39

99.74

52

提供者:Lew

batch数据为500,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为99.73。

2019-07-27 17:26:46

99.73

53

提供者:小小

batch数据为128,循环次数为7次,通过在线上环境完成训练,模型最优精度评分为99.69。

2019-10-18 16:56:49

99.69

54

提供者:释然

batch数据为128,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为99.67。

2019-07-20 04:19:39

99.67

55

提供者:岭南水电工

2.93

batch数据为64,循环次数为2次,通过在线上环境完成训练,模型最优精度评分为99.66。

2019-07-15 03:35:41

2.93

99.66

56

提供者:小瑜.R

batch数据为64,循环次数为15次,通过在线上环境完成训练,模型最优精度评分为99.64。

2019-11-18 06:11:51

99.64

57

提供者:trickornot

1497.50

batch数据为1,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为99.53。

2019-07-15 15:15:46

1497.50

99.53

58

提供者:Nathan1563805247

batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为99.53。

2019-07-24 05:19:33

99.53

59

提供者:infinite

batch数据为64,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为99.50。

2019-12-26 19:31:38

99.50

60

提供者:太阳花

1.46

batch数据为128,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为99.47。

2019-07-15 01:16:58

1.46

99.47

61

提供者:yosef

batch数据为2000,循环次数为2次,通过在线上环境完成训练,模型最优精度评分为93.19。

2019-07-15 10:21:17

93.19

62

提供者:flyai会员1603805120

batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为90.12。

2020-11-19 11:23:46

90.12

63

提供者:桑染

batch数据为64,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为90.11。

2019-07-18 15:42:33

90.11

64

提供者:叫我小菜鸟

batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为90.11。

2019-08-13 14:43:55

90.11

65

提供者:bradzuo的小号

batch数据为32,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为90.11。

2020-07-15 09:48:50

90.11

66

提供者:丅丄

batch数据为128,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为90.11。

2020-07-16 01:11:30

90.11

2019-08-12
快来追我呀

模型得分为99.9,本次获得排名奖奖金为250

2019-08-12 15:00:01

Sunny^_^Today

模型得分为99.9,本次获得排名奖奖金为375

2019-08-12 15:00:01

gboy

模型得分为99.94,本次获得排名奖奖金为625

2019-08-12 15:00:01

2019-07-19
快来追我呀

模型得分为99.9,本次获得排名奖奖金为250

2019-07-19 15:00:02

Sunny^_^Today

模型得分为99.9,本次获得排名奖奖金为375

2019-07-19 15:00:02

gboy

模型得分为99.94,本次获得排名奖奖金为625

2019-07-19 15:00:02

gboy

模型得分为99.94,本次获得实时奖励奖金为3.73

2019-07-19 10:30:46

2019-07-15
太阳花

模型得分为99.47,本次获得实时奖励奖金为1.46

2019-07-15 14:36:52

岭南水电工

模型得分为99.53,本次获得实时奖励奖金为2.93

2019-07-15 14:35:32

Sunny^_^Today

模型得分为99.9,本次获得实时奖励奖金为7.86

2019-07-15 14:34:44

linlh

模型得分为99.87,本次获得实时奖励奖金为11.72

2019-07-15 14:33:40

learnFromBest

模型得分为99.83,本次获得实时奖励奖金为23.44

2019-07-15 14:31:02

Xin Yao

模型得分为99.65,本次获得实时奖励奖金为46.88

2019-07-15 14:21:53

AiFool

模型得分为99.87,本次获得实时奖励奖金为106.75

2019-07-15 14:19:44

Perl

模型得分为99.71,本次获得实时奖励奖金为229.5

2019-07-15 14:17:57

trickornot

模型得分为99.17,本次获得实时奖励奖金为397

2019-07-15 14:17:18

trickornot

模型得分为98.87,本次获得实时奖励奖金为1100.5

2019-07-15 14:17:03

讨论
500字
表情
每日优质讨论奖励 20FAI
发送
每日优质讨论奖励 20FAI
删除确认
是否删除该条评论?
取消 删除

挑战者大赛 官方交流群

我的记录

你还没有任何提交记录喔...

使用指南

  • windows客户端
  • windows命令行
  • Mac/Linux

1.进入代码编辑页下载当前代码

2.本地解压缩代码包文件,双击执行 flyai.exe 程序

第一次使用需要使用微信扫码登录 杀毒软件可能会误报,点击信任该程序即可

3.开启 FlyAI-Jupyter 代码调试环境

运行flyai.exe程序,点击"使用jupyter调试"按钮自动打开jupyter lab 操作界面

运行 run main.py 命令即可在本地训练调试代码

如果出现 No Model Name "xxx"错误,需在 requirements.txt 填写项目依赖

4.下载本地测试数据

运行flyai.exe程序,点击"下载数据"按钮,程序会下载100条调试数据

5.提交训练到GPU

运行flyai.exe程序,点击"提交GPU训练"按钮,代码将自动提交到云端GPU进行训练

返回sucess状态,代表提交离线训练成功,训练结束会以微信和邮件的形式发送结果通知

项目中有新的Python包引用,必须在 requirements.txt 文件中指定包名,不填写版本号将默认安装最新版

更多参赛帮助请查看文档中心

1.进入代码编辑页下载当前代码

2.打开运行,输入cmd,打开终端

Win+R 输入 cmd

3.使用终端进入到项目的根目录下

cd path\to\project

4.开启 FlyAI-Jupyter 代码调试环境

在终端执行命令 flyai.exe ide 打开调试环境(第一次使用需要使用微信扫码登录)

操作过程有延迟,请耐心等待

运行 run main.py 命令即可在本地训练调试代码

如果出现 No Model Name "xxx"错误,需在 requirements.txt 填写项目依赖

5.提交训练到GPU

在FlyAI-Jupyter环境下运行 !flyai.exe train 将代码提交到云端GPU免费训练

返回sucess状态,代表提交离线训练成功,训练结束会以微信和邮件的形式发送结果通知

项目中有新的Python包引用,必须在 requirements.txt 文件中指定包名,不填写版本号将默认安装最新版

6.下载本地测试数据

首次成功执行本地调试命令后,将在本地代码包中自动生成"data"数据集文件夹

7.使用自己的Python环境

flyai.exe path=xxx 可以设置自己的Python路径

flyai.exe path=flyai 恢复系统默认Pyton路径

更多参赛帮助请查看文档中心

1.进入代码编辑页下载当前代码

2.使用终端进入到项目的根目录下

cd path\to\project

3.初始化环境登录

使用如下命令授权 flyai 脚本: chmod +x ./flyai

4.开启 Jupyter 代码调试环境

在终端执行命令 ./flyai ide 打开调试环境(第一次使用需要使用微信扫码登录) 操作过程有延迟,请耐心等待

运行 run main.py 命令即可在本地训练调试代码

如果出现 No Model Name "xxx"错误,需在 requirements.txt 填写项目依赖

或使用终端

执行下列命令本地安装环境并调试

./flyai test 注意:如果出现 permission denied 错误,需使用sudo运行

如果出现 No Model Name "xxx"错误,需在 requirements.txt 填写项目依赖

执行test命令,会自动下载100条测试数据到项目下

如果使用本地IDE开发,可以自行安装 requirements.txt 中的依赖,运行 main.py 即可

5.提交训练到GPU

在FlyAI-Jupyter环境下运行 !./flyai train 将代码提交到云端GPU免费训练 返回sucess状态,代表提交离线训练成功,训练结束会以微信和邮件的形式发送结果通知

或者在终端下使用 ./flyai train -b=32 -e=10

项目中有新的Python包引用,必须在 requirements.txt 文件中指定包名,不填写版本号将默认安装最新版

6.下载本地测试数据

首次成功执行本地调试命令后,将在本地代码包中自动生成"data"数据集文件夹

7.使用自己的Python环境

./flyai path=xxx 可以设置自己的Python路径

./flyai path=flyai 恢复系统默认Pyton路径

更多参赛帮助请查看文档中心