Skip to content

鸭大CAS验证中心验证码识别,使用LeNet+caffe,图片从教务系统爬取,进行去噪等预处理。

Notifications You must be signed in to change notification settings

Songyima/SYSUvc

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 

Repository files navigation

SYSUvc

1、数据的采集(collectvc.py)

数据采集链接是鸭大的CAS验证中心中的验证码url
为了提高识别率,我还进行了一些图像处理,整个流程如下:

1、分割图片,原图长90px,刚好字符类似均匀分布(90/4)
2、把字符旁边的干扰线去掉,如果研究一下jsp生成验证码,就会发现背景、字符、干扰线一般在三个颜色区间,经实验发现干扰线极有可能类似这样:

setColor(this.getRandColor(random, 0, 15))
—— 启发就是把像素值<=15的点变成白色

3、图像灰度化和二值化,需要用到OpenCV(python中 import cv2)处理完之后如下图:
图片描述文字

2、把数据分成训练级和测试集(create_train_test_txt.py)

3、把图片转换成LMDB(create_lmdb.sh)

4、根据需要修改train.prototxt&solver.prototxt(我们用的是LeNet模型)

超参数 意义
batch_size 一次迭代图片
base_lr 学习率
test_iter 测试需要的迭代数
test_interval 迭代多少次后测试一次(一般迭代完全部图片就测试)
snapshot 保存caffemodel

5、训练(train_command.sh)

6、测试(testMyNet.py),从鸭大的验证码那里拿一张图片,分割,检测并输出分类

7、更进一步(testSE.py,实现教务系统自动查成绩、课表,怕查水表没有上传

About

鸭大CAS验证中心验证码识别,使用LeNet+caffe,图片从教务系统爬取,进行去噪等预处理。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published