TensorFlow识别复杂验证码以及搭建生产环境(1)—— 收集训练集
0x00 前言
最近我们的教务系统升级可,这是我们新教务系统的验证码。(如下图)

如果能够识别这个验证码,就能够自动登录,避免手工输入验证码所带来的烦恼,为一些自动化操作奠定基础,例如,自动选课:完美避免抢不上课,自动查成绩,查完成绩还可以发邮件或者短信:那样就可以不用老是登上系统查成绩了,一切都是自动化完成。(如下图)

想法很完美,但是要如何实现呢,为了识别验证码,我们首先要收集足够多的训练素材。
这个纯粹是个手工活,经过博主的不屑努力,花费了大量的人力物力,终于收集了8万4千余张训练素材。
每张图片都以正确答案标注(如下图)

由于上传文件的大小限制
最多上传110M大小的文件,因此上传2万多张图片的训练集。
下载地址
欢迎关注本站公众号,获取更多程序园信息