3981个中文文字图像识别

分享给好友

2019-01-01 12:00:00
开始提交

2019-01-31 12:00:00
最终提交结束

自由训练

剩余奖金 ¥ 250
参赛权限提示

当前赛题需能力值达到 $vue{itemranking} 才可以正常提交训练哦~

当前赛题仅允许 600 能力值以下的新手可以正常提交训练哦~

报名参赛

绑定你的微信账号

用于本地环境登录和实时接收训练通知

打开微信,使用扫一扫功能分享给好友

绑定你的微信账号

用于本地环境登录和实时接收训练通知

温馨提示

$vue{csv_msg}

知道了
提交结果文件

$vue{csvName == '' ? '仅支持上传 CSV 格式的文件' : csvName+' 上传中...'}

$vue{csvName}上传成功
取消 确认提交

提交成功

系统正在测评您的结果文件,

您可通过右侧【我的提交-查看记录详情】进行查看

知道了
  • 赛事介绍
  • 竞赛排行榜
  • 奖金记录
  • 讨论($vue{comment_count})
  • 学习资源

$vue{item.rank_name}

大赛简介

本数据集为3981个中文文字的图片数据集,图片已经剪裁完成,每个文字有多种不同字体下提取的图片。

1.ASCII码范围,[0x21--0x7e]。

2.汉字标点符号,14个。

3.常用的3981个字汉字。取自《义务教育语文课程标准(2011版)》

参赛须知

参赛时间: 本次竞赛无时间限制,长期有效开放

参赛方式

  • 方式一:
  • 在线查看样例根据FlyAI样例模版实现算法并使用云端免费GPU进行模型训练获得最终成绩得分
  • 方式二:
  • 下载FlyAI样例模版进行本地调试并提交到云端使用免费GPU进行模型训练获得最终成绩得分,在本地进行代码调试的教程请查看[文档中心]

参赛选手说明

  • 参赛人员身份信息需保证真实、有效,大赛主办方仅将个人信息用于赛事数据授权及颁奖使用
  • 欢迎海内外的在校学生,算法工程师和所有AI爱好者参与
  • 本次竞赛报名形式:以个人形式本地提交作品线上审核,并且以最终提交算法得分作为唯一有效成绩
  • 在比赛截止日期前,团队中成绩最高分作为本团队的最终成绩
  • 报名成功后请加入FlyAI竞赛交流群,一起学习进步!重要通知也将在群内发布,不要错过哦

比赛作品说明

  • 参赛选手需要配合组委会对比赛作品的有效性与真实性进行验证
  • 不同团队/个人,提交相似结果文件,取消双方所有人员参赛资格
  • 多开小号报名、提交,一经发现将取消参赛资格
  • 禁止使用外部链接下载代码替换本项目代码
  • 比赛过程中,通过脚本获取比赛数据,成绩无效
  • 使用线上测试集进行训练或者使用非官方提供的外部数据进行训练,成绩无效
  • 使用的预训练模型需为FlyAI官方审核通过的模型,使用非官方验证预训练模型,成绩无效
  • 提交的代码具备可解释性并且其它开源框架可复现
  • 所有相似代码将一律不通过审核!!情况多次出现者封号处理
  • 如有发现利用非正常手段作弊行为,奖金一律不发放。之前所获得奖金金额官方有权收回,情节严重者封号处理
  • 提交代码即视为阅读并同意以上比赛作品说明

大赛奖项设置

奖项说明:

奖项设置 获奖人数 奖金额度说明(按最终得分评判)
参与奖(总奖金30%) 所有人 不同得分区间获得相应的竞赛奖金
突破奖(总奖金20%) 所有人 更新排行榜得分,获取相应竞赛奖金
排名奖(总奖金50%) 第一周/月前3名(冠、亚、季军) 项目上线第一周、第一个月; Time_P(周) = 0.5,Time_P(月) = 0.5;K1=0.5,K2=0.3,K3=0.2;
不同框架奖励 所有人 获得60FAI币用于GPU训练资源消耗

赛事主题和数据说明

数据来源

OCRWords

数据描述

由于需要提交代码作品在云端进行训练,参赛数据集不对外开放。仅提供调试数据,可通过使用本地调试的方式获取调试数据集。本地调试和提交指南请查看[文档中心]

字段说明:

文件名 字段名称 字段类型 备注
image_path file_path 不为空 图片的相对路径
name int 不为空 图片中中文的16进制ASCII码
label int 大于等于 0, 小于等于 3980 图片的标注标签

参考文献:

[1]

评审标准

算法输入输出格式

输入字段: image_path,

输出字段: label,

评审指标说明

  • 准确率(Accuracy):对于给定的测试数据集,预测正确的样本数与实际总样本数之比
  • True,表示预测正确的样本数数量
  • Total Number of Samples,表示实际总样本数数量
  • 计算公式如下:

比赛常见问题说明

Q:比赛使用什么框架?

  • 比赛支持常用的机器学习和深度学习框架,比如TensorFlow,PyTorch,Keras,Scikit-learn、MXNet等。

Q:怎么参加比赛,需不需要提交CSV文件?

  • FlyAI竞赛平台提供免费云端GPU资源,报名后可以使用自己熟练的框架,修改main.py中的网络结构和processor.py中的数据处理;仅部分赛题支持CSV方式提交,请仔细阅读参赛方式相关内容。

Q:比赛排行榜分数怎么得到的?

  • 参加项目竞赛必须实现 model.py 中的predict_all方法。系统通过该方法,调用模型得出评分。
超过 55分 的成绩会在48小时内更新到排行榜,不要着急哦!
第三名

gboy

150.46

batch数据为256,循环次数为8000次,通过在线上环境完成训练,模型最优精度评分为99.25。

2019-05-28 15:14:21

150.46

99.25

第三名

trickornot

1002.93

batch数据为256,循环次数为9000次,通过在线上环境完成训练,模型最优精度评分为99.16。

2019-04-24 02:33:38

1002.93

99.16

第三名

大木淡漠

636.72

batch数据为256,循环次数为8000次,通过在线上环境完成训练,模型最优精度评分为99.10。

2019-04-23 23:56:39

636.72

99.10

4

丶人狠话不多

1474.50

batch数据为64,循环次数为8500次,通过在线上环境完成训练,模型最优精度评分为98.63。

2019-04-19 04:55:22

1474.50

98.63

5

Winteriscoming

batch数据为256,循环次数为250次,通过在线上环境完成训练,模型最优精度评分为97.99。

2019-04-22 15:17:51

97.99

6

善假于物

38.44

batch数据为512,循环次数为5000次,通过在线上环境完成训练,模型最优精度评分为97.80。

PyTroch

CNN

2019-04-19 22:58:30

38.44

97.80

7

Daiccccc

224.75

batch数据为50,循环次数为8000次,通过在线上环境完成训练,模型最优精度评分为97.75。

2019-04-19 02:22:28

224.75

97.75

8

baseline2

16.46

batch数据为256,循环次数为200次,通过在线上环境完成训练,模型最优精度评分为93.63。

2019-04-19 21:41:26

16.46

93.63

9

bestfitting

batch数据为256,循环次数为300次,通过在线上环境完成训练,模型最优精度评分为93.51。

2019-04-20 03:29:04

93.51

10

trick_or_treat

346.88

batch数据为64,循环次数为2000次,通过在线上环境完成训练,模型最优精度评分为92.15。

2019-04-16 22:02:37

346.88

92.15

11

lyming

11.72

batch数据为512,循环次数为10000次,通过在线上环境完成训练,模型最优精度评分为91.46。

2019-04-22 23:29:19

11.72

91.46

12

你猜猜我是谁

93.75

batch数据为256,循环次数为1000次,通过在线上环境完成训练,模型最优精度评分为89.61。

2019-04-16 16:32:38

93.75

89.61

13

喵喵

53.44

batch数据为128,循环次数为5000次,通过在线上环境完成训练,模型最优精度评分为85.37。

2019-04-20 10:53:09

53.44

85.37

14

hhy

5.86

batch数据为128,循环次数为10000次,通过在线上环境完成训练,模型最优精度评分为82.80。

2019-04-25 00:07:57

5.86

82.80

15

打脸啪啪啪

7.50

batch数据为512,循环次数为10000次,通过在线上环境完成训练,模型最优精度评分为70.31。

2019-04-23 11:00:44

7.50

70.31

16

tik_boa

60.00

batch数据为64,循环次数为5000次,通过在线上环境完成训练,模型最优精度评分为68.01。

2019-04-20 22:32:58

60.00

68.01

17

yangsmile

3.75

batch数据为128,循环次数为100次,通过在线上环境完成训练,模型最优精度评分为67.20。

2019-04-28 14:56:35

3.75

67.20

18

天天向上

batch数据为64,循环次数为5000次,通过在线上环境完成训练,模型最优精度评分为43.03。

2019-04-16 04:19:59

43.03

19

就是很任性

batch数据为1000,循环次数为70次,通过在线上环境完成训练,模型最优精度评分为37.30。

2019-04-17 09:54:16

37.30

20

落海的咸鱼

batch数据为3096,循环次数为500次,通过在线上环境完成训练,模型最优精度评分为18.98。

2019-04-19 20:22:51

18.98

21

poplar

batch数据为256,循环次数为9000次,通过在线上环境完成训练,模型最优精度评分为7.91。

2019-06-11 03:08:24

7.91

22

玄学上分

batch数据为128,循环次数为10000次,通过在线上环境完成训练,模型最优精度评分为6.86。

2019-04-17 21:29:59

6.86

23

DDBG

batch数据为64,循环次数为10000次,通过在线上环境完成训练,模型最优精度评分为3.59。

2019-04-18 20:59:03

3.59

24

kongd

batch数据为256,循环次数为2500次,通过在线上环境完成训练,模型最优精度评分为1.62。

2019-04-15 23:57:00

1.62

25

懒散小青年

batch数据为100,循环次数为200次,通过在线上环境完成训练,模型最优精度评分为0.83。

2019-04-22 18:01:28

0.83

26

zhiduanqingchang

batch数据为64,循环次数为3000次,通过在线上环境完成训练,模型最优精度评分为0.45。

2019-04-17 23:11:24

0.45

27

GodLovesJonny

batch数据为64,循环次数为6000次,通过在线上环境完成训练,模型最优精度评分为0.29。

2019-04-19 20:42:13

0.29

28

horson

batch数据为128,循环次数为1000次,通过在线上环境完成训练,模型最优精度评分为0.25。

2019-04-15 16:20:00

0.25

29

Gifford

batch数据为64,循环次数为1000次,通过在线上环境完成训练,模型最优精度评分为0.06。

2019-04-18 22:47:51

0.06

30

helloworld

batch数据为64,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为0.05。

2019-04-18 18:13:09

0.05

31

啊哒~

batch数据为256,循环次数为10000次,通过在线上环境完成训练,模型最优精度评分为0.05。

2019-10-23 10:57:11

0.05

32

3D高清版环视系统-蒙

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.05。

2019-11-04 18:29:17

0.05

33

Gemini

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.05。

2019-12-19 16:16:36

0.05

34

UPDATA

batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为0.05。

2019-12-24 23:38:47

0.05

35

konfident

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.05。

2020-03-07 14:10:05

0.05

36

flyai会员1601564370

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.05。

2020-10-20 16:39:26

0.05

37

Reluminia

batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为0.04。

2019-04-17 21:15:55

0.04

38

Silence

batch数据为64,循环次数为1000次,通过在线上环境完成训练,模型最优精度评分为0.04。

2019-04-26 14:51:12

0.04

39

ChangeBio

batch数据为64,循环次数为3000次,通过在线上环境完成训练,模型最优精度评分为0.03。

PyTorch

Densenet

2019-04-30 09:41:29

0.03

40

刘喵兄

batch数据为64,循环次数为10000次,通过在线上环境完成训练,模型最优精度评分为0.02。

2019-04-15 20:30:46

0.02

41

liyonghong

batch数据为128,循环次数为50次,通过在线上环境完成训练,模型最优精度评分为0.02。

2019-04-16 12:20:16

0.02

42

MagicCodes

batch数据为32,循环次数为10次,通过在线上环境完成训练,模型最优精度评分为0.02。

2019-04-19 16:11:12

0.02

43

qqm

batch数据为32,循环次数为1000次,通过在线上环境完成训练,模型最优精度评分为0.02。

2019-04-26 18:35:22

0.02

44

ROC

batch数据为128,循环次数为100次,通过在线上环境完成训练,模型最优精度评分为0.02。

2019-04-29 12:33:37

0.02

45

cyh12315

batch数据为64,循环次数为30次,通过在线上环境完成训练,模型最优精度评分为0.00。

2020-03-26 12:30:22

0.00

2019-05-29
gboy

模型得分为99.25,本次获得实时奖励奖金为150.46

2019-05-29 14:14:41

2019-05-15
丶人狠话不多

模型得分为98.63,本次获得排名奖奖金为250

2019-05-15 15:00:02

大木淡漠

模型得分为99.1,本次获得排名奖奖金为375

2019-05-15 15:00:02

trickornot

模型得分为99.16,本次获得排名奖奖金为625

2019-05-15 15:00:02

2019-04-29
yangsmile

模型得分为67.2,本次获得实时奖励奖金为3.75

2019-04-29 10:45:01

2019-04-25
hhy

模型得分为82.8,本次获得实时奖励奖金为5.86

2019-04-25 13:45:03

2019-04-24
trickornot

模型得分为99.16,本次获得排名奖奖金为375

2019-04-24 16:07:49

大木淡漠

模型得分为99.1,本次获得排名奖奖金为250

2019-04-24 16:07:49

2019-04-23
打脸啪啪啪

模型得分为67.93,本次获得实时奖励奖金为7.5

2019-04-23 12:52:44

lyming

模型得分为82.75,本次获得实时奖励奖金为11.72

2019-04-23 12:48:32

baseline2

模型得分为93.63,本次获得实时奖励奖金为1.46

2019-04-23 12:48:08

喵喵

模型得分为83.23,本次获得实时奖励奖金为23.44

2019-04-23 12:48:00

baseline2

模型得分为67.25,本次获得实时奖励奖金为15

2019-04-23 12:47:52

喵喵

模型得分为69.88,本次获得实时奖励奖金为30

2019-04-23 12:46:52

trickornot

模型得分为92.29,本次获得实时奖励奖金为2.93

2019-04-23 12:46:34

大木淡漠

模型得分为91.92,本次获得实时奖励奖金为11.72

2019-04-23 12:46:26

善假于物

模型得分为93.55,本次获得实时奖励奖金为23.44

2019-04-23 12:46:21

2019-04-17
Daiccccc

模型得分为97.14,本次获得实时奖励奖金为131

2019-04-17 20:48:47

Daiccccc

模型得分为91.24,本次获得实时奖励奖金为93.75

2019-04-17 20:48:32

善假于物

模型得分为63.3,本次获得实时奖励奖金为15

2019-04-17 20:48:20

trick_or_treat

模型得分为92.15,本次获得实时奖励奖金为187.5

2019-04-17 20:48:10

trick_or_treat

模型得分为87.46,本次获得实时奖励奖金为46.88

2019-04-17 20:47:57

你猜猜我是谁

模型得分为89.61,本次获得实时奖励奖金为93.75

2019-04-17 20:47:52

trick_or_treat

模型得分为73.18,本次获得实时奖励奖金为112.5

2019-04-17 20:47:45

丶人狠话不多

模型得分为94.97,本次获得实时奖励奖金为607

2019-04-17 20:47:37

tik_boa

模型得分为64.21,本次获得实时奖励奖金为60

2019-04-17 20:47:11

丶人狠话不多

模型得分为89.99,本次获得实时奖励奖金为617.5

2019-04-17 20:47:06

讨论
500字
表情
每日优质讨论奖励 20FAI
发送
每日优质讨论奖励 20FAI
删除确认
是否删除该条评论?
取消 删除
$vue{item.user_name}

$vue{item.title} $vue{item.title}

$vue{items}
$vue{item.like_count}
$vue{item.comment_counts}
$vue{item.comment_counts}
阅读 $vue{item.views}

这里还没有内容哦

挑战者大赛 官方交流群

我的记录

你还没有任何提交记录喔...

使用指南

  • windows客户端
  • windows命令行
  • Mac/Linux

1.进入代码编辑页下载当前代码

2.本地解压缩代码包文件,双击执行 flyai.exe 程序

第一次使用需要使用微信扫码登录 杀毒软件可能会误报,点击信任该程序即可

3.开启 FlyAI-Jupyter 代码调试环境

运行flyai.exe程序,点击"使用jupyter调试"按钮自动打开jupyter lab 操作界面

运行 run main.py 命令即可在本地训练调试代码

如果出现 No Model Name "xxx"错误,需在 requirements.txt 填写项目依赖

4.下载本地测试数据

运行flyai.exe程序,点击"下载数据"按钮,程序会下载100条调试数据

5.提交训练到GPU

运行flyai.exe程序,点击"提交GPU训练"按钮,代码将自动提交到云端GPU进行训练

返回sucess状态,代表提交离线训练成功,训练结束会以微信和邮件的形式发送结果通知

项目中有新的Python包引用,必须在 requirements.txt 文件中指定包名,不填写版本号将默认安装最新版

更多参赛帮助请查看文档中心

1.进入代码编辑页下载当前代码

2.打开运行,输入cmd,打开终端

Win+R 输入 cmd

3.使用终端进入到项目的根目录下

cd path\to\project

4.开启 FlyAI-Jupyter 代码调试环境

在终端执行命令 flyai.exe ide 打开调试环境(第一次使用需要使用微信扫码登录)

操作过程有延迟,请耐心等待

运行 run main.py 命令即可在本地训练调试代码

如果出现 No Model Name "xxx"错误,需在 requirements.txt 填写项目依赖

5.提交训练到GPU

在FlyAI-Jupyter环境下运行 !flyai.exe train 将代码提交到云端GPU免费训练

返回sucess状态,代表提交离线训练成功,训练结束会以微信和邮件的形式发送结果通知

项目中有新的Python包引用,必须在 requirements.txt 文件中指定包名,不填写版本号将默认安装最新版

6.下载本地测试数据

首次成功执行本地调试命令后,将在本地代码包中自动生成"data"数据集文件夹

7.使用自己的Python环境

flyai.exe path=xxx 可以设置自己的Python路径

flyai.exe path=flyai 恢复系统默认Pyton路径

更多参赛帮助请查看文档中心

1.进入代码编辑页下载当前代码

2.使用终端进入到项目的根目录下

cd path\to\project

3.初始化环境登录

使用如下命令授权 flyai 脚本: chmod +x ./flyai

4.开启 Jupyter 代码调试环境

在终端执行命令 ./flyai ide 打开调试环境(第一次使用需要使用微信扫码登录) 操作过程有延迟,请耐心等待

运行 run main.py 命令即可在本地训练调试代码

如果出现 No Model Name "xxx"错误,需在 requirements.txt 填写项目依赖

或使用终端

执行下列命令本地安装环境并调试

./flyai test 注意:如果出现 permission denied 错误,需使用sudo运行

如果出现 No Model Name "xxx"错误,需在 requirements.txt 填写项目依赖

执行test命令,会自动下载100条测试数据到项目下

如果使用本地IDE开发,可以自行安装 requirements.txt 中的依赖,运行 main.py 即可

5.提交训练到GPU

在FlyAI-Jupyter环境下运行 !./flyai train 将代码提交到云端GPU免费训练 返回sucess状态,代表提交离线训练成功,训练结束会以微信和邮件的形式发送结果通知

或者在终端下使用 ./flyai train -b=32 -e=10

项目中有新的Python包引用,必须在 requirements.txt 文件中指定包名,不填写版本号将默认安装最新版

6.下载本地测试数据

首次成功执行本地调试命令后,将在本地代码包中自动生成"data"数据集文件夹

7.使用自己的Python环境

./flyai path=xxx 可以设置自己的Python路径

./flyai path=flyai 恢复系统默认Pyton路径

更多参赛帮助请查看文档中心