- 赛事介绍
- 竞赛排行榜
- 奖金记录
- 讨论($vue{comment_count})
- 学习资源
大赛简介
此数据集涵盖了24 万家餐馆,54 万用户,440 万条评论/评分数据。每条数据包含用户对餐馆的四个维度的评分(总体,环境,口味,服务),评分为从1到5的整数。该数据集适合做推荐系统、情感/观点/评论 倾向性分析
参赛须知
参赛时间: 本次竞赛无时间限制,长期有效开放
参赛方式
参赛选手说明
- 参赛人员身份信息需保证真实、有效,大赛主办方仅将个人信息用于赛事数据授权及颁奖使用
- 欢迎海内外的在校学生,算法工程师和所有AI爱好者参与
- 本次竞赛报名形式:以个人形式本地提交作品线上审核,并且以最终提交算法得分作为唯一有效成绩
- 在比赛截止日期前,团队中成绩最高分作为本团队的最终成绩
- 报名成功后请加入FlyAI竞赛交流群,一起学习进步!重要通知也将在群内发布,不要错过哦
比赛作品说明
- 参赛选手需要配合组委会对比赛作品的有效性与真实性进行验证
- 不同团队/个人,提交相似结果文件,取消双方所有人员参赛资格
- 多开小号报名、提交,一经发现将取消参赛资格
- 禁止使用外部链接下载代码替换本项目代码
- 比赛过程中,通过脚本获取比赛数据,成绩无效
- 使用线上测试集进行训练或者使用非官方提供的外部数据进行训练,成绩无效
- 使用的预训练模型需为FlyAI官方审核通过的模型,使用非官方验证预训练模型,成绩无效
- 提交的代码具备可解释性并且其它开源框架可复现
- 所有相似代码将一律不通过审核!!情况多次出现者封号处理
- 如有发现利用非正常手段作弊行为,奖金一律不发放。之前所获得奖金金额官方有权收回,情节严重者封号处理
- 提交代码即视为阅读并同意以上比赛作品说明
大赛奖项设置
奖项说明:
奖项设置 |
获奖人数 |
奖金额度说明(按最终得分评判) |
参与奖(总奖金20%) |
所有人 |
根据基线得分与100分之间,分成5个奖金区间;不同得分区间获得相应的竞赛奖金。 |
突破奖(总奖金10%) |
所有人 |
更新排行榜最高分数,获得相应的竞赛奖金 |
排名奖(总奖金70%) |
月赛前5名 |
奖金发放最终以月为单位,前5名获奖占比以K系数表示,分别为:0.45,0.25,0.15,0.1,0.05 |
不同框架奖励 |
所有人 |
获得60FAI币用于GPU训练资源消耗 |
赛事主题和数据说明
数据来源
MallRatings
数据描述
由于需要提交代码作品在云端进行训练,参赛数据集不对外开放。仅提供调试数据。
字段说明:
文件名 |
字段名称 |
字段类型 |
备注 |
userId |
int |
不为空 |
用户id |
restId |
int |
不为空 |
引用的id |
rating |
int |
大于等于 0, 小于等于 5 |
总体评分 |
rating_env |
int |
大于等于 1, 小于等于 5 |
环境评分 |
rating_flavor |
int |
大于等于 1, 小于等于 5 |
口味评分 |
rating_service |
int |
大于等于 1, 小于等于 5 |
服务评分 |
timestamp |
int |
不为空 |
评分时间戳 |
comment |
string |
不为空 |
评论内容 |
参考文献:
[1]https://github.com/SophonPlus/ChineseNlpCorpus
评审标准
算法输入输出格式
输入字段:
comment,
输出字段:
rating,
评审指标说明
- 准确率(Accuracy):对于给定的测试数据集,预测正确的样本数与实际总样本数之比
- True,表示预测正确的样本数数量
- Total Number of Samples,表示实际总样本数数量
- 计算公式如下:
比赛常见问题说明
Q:比赛使用什么框架?
- 比赛支持常用的机器学习和深度学习框架,比如TensorFlow,PyTorch,Keras,Scikit-learn、MXNet等。
Q:怎么参加比赛,需不需要提交CSV文件?
- FlyAI竞赛平台提供免费云端GPU资源,报名后可以使用自己熟练的框架,修改main.py中的网络结构和processor.py中的数据处理;仅部分赛题支持CSV方式提交,请仔细阅读参赛方式相关内容。
Q:比赛排行榜分数怎么得到的?
- 参加项目竞赛必须实现 model.py 中的predict_all方法。系统通过该方法,调用模型得出评分。
超过 95分 的成绩会在48小时内更新到排行榜,不要着急哦!
batch数据为64,循环次数为3000次,通过在线上环境完成训练,模型最优精度评分为46.65。
batch数据为128,循环次数为5次,通过在线上环境完成训练,模型最优精度评分为41.83。
batch数据为1000,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为41.25。
4
batch数据为32,循环次数为3000次,通过在线上环境完成训练,模型最优精度评分为37.70。
5
batch数据为80,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为37.65。
6
batch数据为256,循环次数为5000次,通过在线上环境完成训练,模型最优精度评分为34.76。
7
batch数据为512,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为33.48。
8
batch数据为512,循环次数为1000次,通过在线上环境完成训练,模型最优精度评分为33.14。
9
batch数据为1024,循环次数为5次,通过在线上环境完成训练,模型最优精度评分为26.36。
10
batch数据为32,循环次数为150次,通过在线上环境完成训练,模型最优精度评分为25.58。
11
batch数据为64,循环次数为10000次,通过在线上环境完成训练,模型最优精度评分为25.58。
12
batch数据为1024,循环次数为100次,通过在线上环境完成训练,模型最优精度评分为25.58。
13
batch数据为16,循环次数为1000次,通过在线上环境完成训练,模型最优精度评分为25.58。
14
batch数据为256,循环次数为1000次,通过在线上环境完成训练,模型最优精度评分为25.57。
15
batch数据为128,循环次数为2000次,通过在线上环境完成训练,模型最优精度评分为23.65。
16
batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为8.09。
17
batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为6.60。
18
batch数据为256,循环次数为12次,通过在线上环境完成训练,模型最优精度评分为6.41。
19
batch数据为128,循环次数为2000次,通过在线上环境完成训练,模型最优精度评分为6.40。
20
batch数据为32,循环次数为160次,通过在线上环境完成训练,模型最优精度评分为6.13。
21
batch数据为1024,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为5.29。
22
通过在线上环境完成训练,模型最优精度评分为4.60。
23
batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为4.60。
24
batch数据为500,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为4.60。
25
batch数据为128,循环次数为500次,通过在线上环境完成训练,模型最优精度评分为4.60。
26
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
27
batch数据为64,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为4.60。
28
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
29
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
30
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
31
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
32
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
33
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
34
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
35
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
36
batch数据为128,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
37
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
38
batch数据为32,循环次数为300次,通过在线上环境完成训练,模型最优精度评分为4.60。
39
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
40
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
41
batch数据为3000,循环次数为64次,通过在线上环境完成训练,模型最优精度评分为4.60。
42
batch数据为32,循环次数为5次,通过在线上环境完成训练,模型最优精度评分为4.60。
43
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
44
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
45
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
46
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
47
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
48
batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为4.60。
49
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
50
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
51
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
52
batch数据为64,循环次数为3次,通过在线上环境完成训练,模型最优精度评分为4.60。
53
batch数据为64,循环次数为3次,通过在线上环境完成训练,模型最优精度评分为4.60。
54
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
55
batch数据为5000,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为4.60。
56
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
57
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
58
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
59
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
60
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
61
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
62
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
63
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
64
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
65
batch数据为500,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为4.60。
66
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
67
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
68
batch数据为500,循环次数为32次,通过在线上环境完成训练,模型最优精度评分为4.60。
69
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
70
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
71
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
72
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
73
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
74
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
75
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
76
batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为4.60。
77
batch数据为64,循环次数为2000次,通过在线上环境完成训练,模型最优精度评分为3.70。
78
batch数据为128,循环次数为1500次,通过在线上环境完成训练,模型最优精度评分为3.67。
79
batch数据为300,循环次数为1次,通过在线上环境完成训练,模型最优精度评分为0.00。