- 赛事介绍
- 竞赛排行榜
- 奖金记录
- 讨论($vue{comment_count})
- 学习资源
大赛简介
此数据集是Quora网站公开的数据集,包含了40万条数据。每条数据由两个看起来相似的问题及问题是否重复的标签组成。该数据集可用来训练具有判断能力的NLP模型。
参赛须知
参赛时间: 本次竞赛无时间限制,长期有效开放
参赛方式
参赛选手说明
- 参赛人员身份信息需保证真实、有效,大赛主办方仅将个人信息用于赛事数据授权及颁奖使用
- 欢迎海内外的在校学生,算法工程师和所有AI爱好者参与
- 本次竞赛报名形式:以个人形式本地提交作品线上审核,并且以最终提交算法得分作为唯一有效成绩
- 在比赛截止日期前,团队中成绩最高分作为本团队的最终成绩
- 报名成功后请加入FlyAI竞赛交流群,一起学习进步!重要通知也将在群内发布,不要错过哦
比赛作品说明
- 参赛选手需要配合组委会对比赛作品的有效性与真实性进行验证
- 不同团队/个人,提交相似结果文件,取消双方所有人员参赛资格
- 多开小号报名、提交,一经发现将取消参赛资格
- 禁止使用外部链接下载代码替换本项目代码
- 比赛过程中,通过脚本获取比赛数据,成绩无效
- 使用线上测试集进行训练或者使用非官方提供的外部数据进行训练,成绩无效
- 使用的预训练模型需为FlyAI官方审核通过的模型,使用非官方验证预训练模型,成绩无效
- 提交的代码具备可解释性并且其它开源框架可复现
- 所有相似代码将一律不通过审核!!情况多次出现者封号处理
- 如有发现利用非正常手段作弊行为,奖金一律不发放。之前所获得奖金金额官方有权收回,情节严重者封号处理
- 提交代码即视为阅读并同意以上比赛作品说明
大赛奖项设置
奖项说明:
奖项设置 |
获奖人数 |
奖金额度说明(按最终得分评判) |
参与奖(总奖金30%) |
所有人 |
不同得分区间获得相应的竞赛奖金 |
突破奖(总奖金20%) |
所有人 |
更新排行榜得分,获取相应竞赛奖金 |
排名奖(总奖金50%) |
第一周/月前3名(冠、亚、季军) |
项目上线第一周、第一个月; Time_P(周) = 0.5,Time_P(月) = 0.5;K1=0.5,K2=0.3,K3=0.2; |
不同框架奖励 |
所有人 |
获得60FAI币用于GPU训练资源消耗 |
赛事主题和数据说明
赛题描述
通过实现算法并提交训练,获取奖金池奖金。小提示:抢先更新算法排行榜,有更大机会获取高额奖金哦!
数据来源
DuplicatedQusetions
数据描述
由于需要提交代码作品在云端进行训练,参赛数据集不对外开放。仅提供调试数据。
字段说明:
文件名 |
字段名称 |
字段类型 |
备注 |
question1 |
string |
不为空 |
第一个问题 |
question2 |
string |
不为空 |
第二个问题 |
labels |
int |
大于等于 0, 小于等于 1 |
问题是否重复 |
参考文献:
[1]http://qim.ec.quoracdn.net/quora_duplicate_questions.tsv
评审标准
算法输入输出格式
输入字段:
question1,
question2,
输出字段:
labels,
评审指标说明
- 准确率(Accuracy):对于给定的测试数据集,预测正确的样本数与实际总样本数之比
- True,表示预测正确的样本数数量
- Total Number of Samples,表示实际总样本数数量
- 计算公式如下:
比赛常见问题说明
Q:比赛使用什么框架?
- 比赛支持常用的机器学习和深度学习框架,比如TensorFlow,PyTorch,Keras,Scikit-learn、MXNet等。
Q:怎么参加比赛,需不需要提交CSV文件?
- FlyAI竞赛平台提供免费云端GPU资源,报名后可以使用自己熟练的框架,修改main.py中的网络结构和processor.py中的数据处理;仅部分赛题支持CSV方式提交,请仔细阅读参赛方式相关内容。
Q:比赛排行榜分数怎么得到的?
- 参加项目竞赛必须实现 model.py 中的predict_all方法。系统通过该方法,调用模型得出评分。
超过 80分 的成绩会在48小时内更新到排行榜,不要着急哦!
batch数据为64,循环次数为3次,通过在线上环境完成训练,模型最优精度评分为90.23。
batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为89.10。
batch数据为128,循环次数为4次,通过在线上环境完成训练,模型最优精度评分为88.87。
4
batch数据为512,循环次数为100次,通过在线上环境完成训练,模型最优精度评分为87.58。
5
batch数据为256,循环次数为300次,通过在线上环境完成训练,模型最优精度评分为83.37。
6
batch数据为32,循环次数为5次,通过在线上环境完成训练,模型最优精度评分为82.89。
7
batch数据为32,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为82.24。
8
batch数据为128,循环次数为50次,通过在线上环境完成训练,模型最优精度评分为81.22。
9
batch数据为1024,循环次数为5000次,通过在线上环境完成训练,模型最优精度评分为79.92。
10
batch数据为256,循环次数为6000次,通过在线上环境完成训练,模型最优精度评分为79.87。
11
batch数据为512,循环次数为6000次,通过在线上环境完成训练,模型最优精度评分为79.51。
12
batch数据为92,循环次数为20次,通过在线上环境完成训练,模型最优精度评分为78.44。
13
batch数据为6,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为78.20。
14
batch数据为1024,循环次数为3000次,通过在线上环境完成训练,模型最优精度评分为77.53。
15
batch数据为48,循环次数为3次,通过在线上环境完成训练,模型最优精度评分为76.19。
16
batch数据为32,循环次数为3次,通过在线上环境完成训练,模型最优精度评分为75.82。
17
batch数据为256,循环次数为3000次,通过在线上环境完成训练,模型最优精度评分为75.55。
18
batch数据为512,循环次数为512次,通过在线上环境完成训练,模型最优精度评分为75.02。
19
batch数据为1024,循环次数为6000次,通过在线上环境完成训练,模型最优精度评分为74.19。
20
batch数据为512,循环次数为8000次,通过在线上环境完成训练,模型最优精度评分为73.83。
21
batch数据为256,循环次数为6000次,通过在线上环境完成训练,模型最优精度评分为73.75。
22
batch数据为128,循环次数为3000次,通过在线上环境完成训练,模型最优精度评分为73.44。
23
batch数据为256,循环次数为3000次,通过在线上环境完成训练,模型最优精度评分为72.62。
24
batch数据为64,循环次数为2000次,通过在线上环境完成训练,模型最优精度评分为71.66。
25
batch数据为64,循环次数为3000次,通过在线上环境完成训练,模型最优精度评分为71.50。
26
batch数据为128,循环次数为20次,通过在线上环境完成训练,模型最优精度评分为71.16。
27
batch数据为64,循环次数为3次,通过在线上环境完成训练,模型最优精度评分为71.01。
28
batch数据为256,循环次数为3000次,通过在线上环境完成训练,模型最优精度评分为70.93。
29
batch数据为256,循环次数为3000次,通过在线上环境完成训练,模型最优精度评分为70.45。
30
batch数据为32,循环次数为2400次,通过在线上环境完成训练,模型最优精度评分为69.98。
31
batch数据为128,循环次数为2000次,通过在线上环境完成训练,模型最优精度评分为68.45。
32
batch数据为64,循环次数为3次,通过在线上环境完成训练,模型最优精度评分为68.33。
33
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为68.33。
34
batch数据为128,循环次数为100次,通过在线上环境完成训练,模型最优精度评分为68.33。
35
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为68.33。
36
batch数据为32,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为68.33。
37
batch数据为500,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为68.33。
38
batch数据为32,循环次数为5次,通过在线上环境完成训练,模型最优精度评分为68.33。
39
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为68.33。
40
batch数据为64,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为68.33。
41
batch数据为50,循环次数为50次,通过在线上环境完成训练,模型最优精度评分为68.33。
42
batch数据为64,循环次数为20次,通过在线上环境完成训练,模型最优精度评分为68.33。
43
batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为68.33。
44
batch数据为128,循环次数为60次,通过在线上环境完成训练,模型最优精度评分为68.33。
45
batch数据为64,循环次数为5次,通过在线上环境完成训练,模型最优精度评分为68.33。
46
batch数据为128,循环次数为5次,通过在线上环境完成训练,模型最优精度评分为68.33。
47
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为68.33。
48
batch数据为64,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为68.33。
49
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为68.33。
50
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为68.33。
51
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为68.33。
52
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为68.33。
53
batch数据为64,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为68.33。
54
batch数据为128,循环次数为15次,通过在线上环境完成训练,模型最优精度评分为68.33。
55
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为68.33。
56
batch数据为64,循环次数为20次,通过在线上环境完成训练,模型最优精度评分为68.33。
57
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为68.33。
58
batch数据为64,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为68.33。
59
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为68.33。
60
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为68.33。
61
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为68.33。
62
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为68.33。
63
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为68.33。
64
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为68.33。
65
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为68.33。
66
batch数据为256,循环次数为500次,通过在线上环境完成训练,模型最优精度评分为67.73。
67
batch数据为128,循环次数为2000次,通过在线上环境完成训练,模型最优精度评分为67.46。
68
batch数据为512,循环次数为1000次,通过在线上环境完成训练,模型最优精度评分为66.34。
69
batch数据为32,循环次数为100次,通过在线上环境完成训练,模型最优精度评分为63.16。
70
batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为63.16。
71
batch数据为20,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为63.16。
72
batch数据为300,循环次数为50次,通过在线上环境完成训练,模型最优精度评分为63.16。
73
batch数据为256,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为63.16。
74
batch数据为1000,循环次数为3000次,通过在线上环境完成训练,模型最优精度评分为63.16。
75
batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为63.16。
76
batch数据为32,循环次数为100次,通过在线上环境完成训练,模型最优精度评分为63.16。
77
batch数据为32,循环次数为5次,通过在线上环境完成训练,模型最优精度评分为63.16。
78
batch数据为128,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为63.16。
79
batch数据为256,循环次数为5000次,通过在线上环境完成训练,模型最优精度评分为51.05。
80
batch数据为2048,循环次数为5次,通过在线上环境完成训练,模型最优精度评分为22.91。
2020-03-30
- cyh12315
-
模型得分为80.49,本次获得实时奖励奖金为1.13元
2020-03-30 14:17:34
2019-11-29
- liuchenxu
-
模型得分为83.25,本次获得实时奖励奖金为2.25元
2019-11-29 10:33:57
2019-11-28
- SHUU
-
模型得分为82.89,本次获得实时奖励奖金为4.5元
2019-11-28 14:23:09
2019-10-11
- alwaysbetter
-
模型得分为89.1,本次获得实时奖励奖金为4.22元
2019-10-11 14:09:03
2019-07-29
- 凉心半浅良心人
-
模型得分为90.23,本次获得实时奖励奖金为6元
2019-07-29 14:02:30
- 凉心半浅良心人
-
模型得分为89.97,本次获得实时奖励奖金为25元
2019-07-29 12:34:19
- 凉心半浅良心人
-
模型得分为88.62,本次获得实时奖励奖金为33.75元
2019-07-29 11:37:31
2019-07-24
- 未名湖畔的落叶
-
模型得分为80.51,本次获得实时奖励奖金为9元
2019-07-24 10:54:42
2019-06-06
- NLP-Learner
-
模型得分为88.87,本次获得实时奖励奖金为147.5元
2019-06-06 10:46:49
2019-05-25
- 唱跳RAP打篮球
-
模型得分为87.58,本次获得排名奖奖金为375元
2019-05-25 15:00:02
2019-05-06
- 唱跳RAP打篮球
-
模型得分为87.58,本次获得排名奖奖金为225元
2019-05-06 15:00:02
2019-04-30
- 唱跳RAP打篮球
-
模型得分为84.32,本次获得实时奖励奖金为36元
2019-04-30 17:50:36