1 设计概述
本系统为基于监控视频的课堂自动签到系统。旨在使用现成的视频监控摄像头来采集课堂图像并通过图像处理算法和深度学习算法来实现学生的自动签到。该系统高效,可节省老师课堂点名时间,推动教学信息化的发展。当然,该系统也可以用在会议等需要签到的场所,应用广泛。
2 模块功能
该系统主要分为三个模块,分别的数据集模块,训练模块,识别模块。数据集模块主要任务是产生数据集,将事先采集分类好的数据添加上标签并整理成规范的数据集以供训练模块对数据集进行训练。训练模块的任务是使用卷积神经网络 CNN 对数据集进行学习并生成预测模型。识别模块主要是通过载入训练模块产生的模型对监控视频进行识别。各个模块的关系,如图1所示
Figure 1: 模块关系图
2.1 数据集模块
数据集模块主要任务是产生数据集,将事先采集分类好的数据添加上标签并整理成规范的数据集以供训练模块对数据集进行训练,其具体流程如图2
Figure 2: 数据模块流程图
2.2 训练模块
在训练模块中,将数据进行预处理,包括,从数据集中分出验证集和测试集,将数据集中的数据进行归一化,将标签值进行独热编码 (one-hot) 使其变成二进制的向量。
Feature Maps 13*13*
145728
Hidden units
Hidden Units 512
Outputs 30
接着,将数据装入如图3进行训练,其中,激活函数使用 relu,ANN 网络输出层使用 softmax。本模型基于 Keras,需 TensorFlow GPU 支持。
训练完成之后,将模型保存为.h5文件。
2.3 识别模块
读取训练模块生成的.h5文件, 对实际视频监控进行识别。并将识别的结果用矩形框标记在人脸上,以查看识别准确性。
3 效果及结论
模型的识别结果如图4-8所示,识别效果差强人意,能识别到的人,准确率较高。由于一开始设计,只用于识别 30 人,部分人脸没有建立数据库,后期可以继续扩大数据库至全班范围。数据库的大小,一定程度上,收到人脸检测器的影响,本实验使用的是 Opencv自带的,harr人脸检测器,其受光照影响比较大,需改进该人脸检测器,或者使用别的性能更优的高鲁棒性人脸检测器, 使得更多的人脸可以被采集到,这样才能保证人脸数据集的建立。一旦保证的数据集足够,且人 脸检测效果良好,神经网络的训练问题不大,可以得到比较全面的检测结果。
Figure 4: 识别结果 1
Figure 5: 识别结果 2

Figure 6: 识别结果 3
Figure 7: 识别结果 4
Figure 8: 识别结果 5