SYSUvc

1、数据的采集（collectvc.py)

数据采集链接是鸭大的CAS验证中心中的验证码url
为了提高识别率，我还进行了一些图像处理，整个流程如下：

1、分割图片，原图长90px，刚好字符类似均匀分布（90/4）
2、把字符旁边的干扰线去掉，如果研究一下jsp生成验证码，就会发现背景、字符、干扰线一般在三个颜色区间，经实验发现干扰线极有可能类似这样：

setColor(this.getRandColor(random, 0, 15))
—— 启发就是把像素值<=15的点变成白色

3、图像灰度化和二值化，需要用到OpenCV（python中 import cv2）处理完之后如下图：

2、把数据分成训练级和测试集（create_train_test_txt.py）

3、把图片转换成LMDB（create_lmdb.sh）

4、根据需要修改train.prototxt&solver.prototxt（我们用的是LeNet模型）

超参数	意义
batch_size	一次迭代图片
base_lr	学习率
test_iter	测试需要的迭代数
test_interval	迭代多少次后测试一次（一般迭代完全部图片就测试）
snapshot	保存caffemodel

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
validate_code		validate_code
.gitattributes		.gitattributes
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

SYSUvc

1、数据的采集（collectvc.py)

2、把数据分成训练级和测试集（create_train_test_txt.py）

3、把图片转换成LMDB（create_lmdb.sh）

4、根据需要修改train.prototxt&solver.prototxt（我们用的是LeNet模型）

5、训练(train_command.sh)

6、测试（testMyNet.py），从鸭大的验证码那里拿一张图片，分割，检测并输出分类

7、更进一步（testSE.py，实现教务系统自动查成绩、课表，怕查水表没有上传）

About

Uh oh!

Releases

Packages

Languages

Songyima/SYSUvc

Folders and files

Latest commit

History

Repository files navigation

SYSUvc

1、数据的采集（collectvc.py)

2、把数据分成训练级和测试集（create_train_test_txt.py）

3、把图片转换成LMDB（create_lmdb.sh）

4、根据需要修改train.prototxt&solver.prototxt（我们用的是LeNet模型）

5、训练(train_command.sh)

6、测试（testMyNet.py），从鸭大的验证码那里拿一张图片，分割，检测并输出分类

7、更进一步（testSE.py，实现教务系统自动查成绩、课表，怕查水表没有上传）

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages