今天我们上实训课时实训老师给我们发布了选题,我们小组的选题为验证码识别,这个题目还是挺有难度的,真是令我头大٩(ŏ﹏ŏ、)۶。。
毫无头绪的我决定找chatgpt问问。看到挺多不错的适合的深度学习模型。比如积神经网络(CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM)……其中准确率比较高的3个分别是LeNet-5、VGG-16/VGG-19、ResNet。LeNet-5适合处理简单的数字验证码,VGG-16/VGG-19适合处理较复杂的验证码。而ResNet对于复杂的验证码和噪声干扰较大的情况非常有效。各个模型都有自己的优势。
我们小组觉得使用ResNet(大胆!,居然用这么难的),那么什么是ResNet呢?下面内容摘自维基百科残差神经网络
残差神经网络(Residual Neural Network,简称ResNet)[1]属于深度学习模型的一种,其核心在于让网络的每一层不直接学习预期输出,而是学习与输入之间的残差关系。这种网络通过添加“跳跃连接”,即跳过某些网络层的连接来实现身份映射,再与网络层的输出相加合并。
关于Resnet实现验证码识别,我在谷歌看到了一篇很不错的实现感兴趣的可以去看看https://www.kaggle.com/code/johnbergmann/captcha-resnet50-classifier/notebook