AI助力自考助学招生报名照片处理(西南财经大学继续(网络)教育学院)
自考助学招生报名环节的证件照采集工作关键而复杂。尽管表面简单,这一环节潜藏着多方面的问题和挑战,并深刻影响整个招生流程。主要问题包括:1)照片质量问题——如人像比例、轮廓清晰度、颜色搭配、文件大小、像素及表情不达标,造成学生需多次上传照片,体验下降;2)照片审核问题——如不达标照片退回增加招生工作难度,学校在进行人工审核中面临时效、标准一致性和工作量的挑战;3)身份验证问题——如非本人证件照上传和身份证人脸像照片的准确性检验,确保信息真实性。各方面问题均加大了招生工作的复杂度,并影响学生报名体验。本案例通过运用AI技术FastDeploy、face_recognition、Dlib、GFPGAN、ArcFace和DragGAN,专注于优化自考助学招生的证件照采集与审核环节,旨在减少考生操作的反复并提高体验。解决方案在报名平台上提供了全自动的报名照片处理功能,包括照片背景更换、照片剪裁、电子照片文件大小调整和图片检测等功能,帮助考生在报名前准备符合要求的照片。不同于市面上其他应用,该方案更加注重提高照片上报的合格率和优化考生的操作体验。该方案具有相当的普适性,有较大地拓展空间,在此更多的是抛砖引玉,以便能改造更多的传统应用提质增效。
在自考助学普及和拓展的背景下,招生报名环节中的证件照采集工作逐渐呈现出其不可忽视的关键性。这一环节,尽管在外在表现上显得单纯简洁,却潜藏着丰富而复杂的问题和挑战,对整个招生流程的顺利进行形成着深远的影响。考生通常需要反复上传照片,以期达到这些要求,体验较差。历年自考助学新生注册中有千分之几的照片由于不达标被退回,增加招生工作复杂度并影响学生报名体验;学校在进行人工审核照片的过程中,面临及时性不足、标准不统一及工作强度大的多重困境。部分学校要求学生在报名时同时提交身份证人脸像照片,旨在与证件照进行人脸相似度分析,保证信息的准确和真实;上传的身份证人面像中,身份证本身上面有一层未完全脱落的薄胶纸,严重影响与证件照的人脸相似度对比。一些学校初次涉足招生业务,缺乏相关经验和策略,容易陷入各种问题;我们期望通过分享相关工作的经验和技巧,帮助这些学校避免问题,提升整体招生工作质量。信息采集的需求贯穿各类招生报名环节,应用场景极为多样和宽泛,这进一步强调了优化此环节工作的重要性。总结而言,证件照的采集与审核环节在自考助学招生中是一个充满挑战但至关重要的环节,亟需现代科技—特别是人工智能技术—的介入以实现流程的优化和改进。如何减少考上操作的反复,提高操作体验、提供最终照片上报的合格率,是本案例探讨的主要思路。在解决证件照拍照,市面上有很多相关的应用,比如扫描王全能宝中的证件照功能、支付宝、微信小程序上面也有类似的功能,能提供证件照的拍摄采集。所以只需考生在报名时提供1寸证件照即可,我们在报名平台提供自考助学报名照片全自动处理[https://apps.swufe-online.com/zk/photoHelper.html]功能,同时也提供照片更换背景、照片剪裁、电子照片文件大小调整和图片检测等功能,便于考生在报名前就能准备好符合报名要求的照片。人像在图像矩阵框内水平居中,左右对称。头顶发际距上边沿50-110像素;眼睛所在位置距上边沿200-300像素;脸部宽度(两脸颊之间)180-300像素;文件大小:20-40KB之间,扩展名应为:.jpg;照片背景颜色值:蓝色R:67、G:142、B:219;双眼自然睁开,嘴唇自然闭合,人像水平居中,面部无高光;人物姿态与表情:坐姿端正,表情自然,双眼自然睁开并平视,耳朵对称,左右肩膀平衡,嘴唇自然闭合;眼镜:常戴眼镜者应配戴眼镜,但不得戴有色(含隐形)眼镜,镜框不得遮挡眼睛,眼镜不能有反光;佩饰及遮挡物:不得使用头部覆盖物(宗教、医疗和文化 需要时,不得遮挡脸部或造成阴影)。不得佩戴耳环、项链等饰品。头发不得遮挡眉毛、眼睛与耳朵。不宜化妆;证件照电子图像文件规格要求是宽480像素×高640像素,对头顶发际、眼睛和脸部的位置都有相关的要求,所以需要通过OpenCV依据图片是宽高比例决定是截取两边,还是上下边,把图片放到像素符合要求画布里面。为了达到报名照片图像要求,需要进行如下图所示的环节:由于对照片背景颜色值(蓝色R:67、G:142、B:219)要求是一个定值,所以利用FastDeploy技术,快速识别并替换证件照的背景,确保背景颜色的统一和合规。FastDeploy是一款全场景、易用灵活、极致高效的AI推理部署工具,提供了开箱即用的部署体验,实现端到端的推理性能优化,实现人像扣图,能非常容易整合到此案例中。主要代码如下:img_bg = np.zeros(shape, dtype=np.uint8)res_pred = self.model.predict(img)vis_img_with_bg = fd.vision.swap_background(img, img_bg, res_pred)使用dlib技术,对人脸、五官进行精确定位,获取面部68个特征信息。这包括发际线、眼睛位置和是否张嘴、脸部宽度等,从而实现对证件照的自动处理和校正。其中,对于眼睛闭合和嘴唇张开的识别,主要使用了眼睛长宽比(EAR)和嘴部长宽比(MAR)来进行判断,这都是十分成熟的应用,比如在面部识别判断是否疲劳,也是类似的相关应用场景。在个别检测到嘴巴张开的情况,如果考生又不愿意重新提供新的照片,在目前的技术下,也是可以进行微调,当下十分火热的DragGAN就是最好的选择。
DragGan,由Drag(拉伸)和GAN(生成对抗网络的简称)组成,DragGAN模型本质上是给各种GAN开发的一种交互式图像操作方法,实现了通过鼠标拉伸图像即可自动生成新图像的神奇功能。如下图所示:其他比如对发际线的调整等,利用OpenCV结合面部特征信息,就能轻松实现。
GFPGAN是腾讯在人像复原、超分等方面的佳作,是用于真实世界面部修复的实用算法,它利用封装在预训练面部 GAN(例如 StyleGAN2)中的丰富多样的先验来进行盲脸修复。类似的算法还有CodeFormer,能面部修复(裁剪和对齐的面部)。由于本案例是证件照,主要特征在面部,使用GFPGAN更为有利。在对上传的照片通过OpenCV的Laplacian、Sobel算子,识别照片是否模糊,首先将图片转换为灰度图像,再计算Laplacian变换结果的方差,然后求取该方差的平均值:image_var = cv2.Laplacian(image_gray, cv2.CV_64F).var()laplacian_var = f'{np.mean (image_var):.2f}'根据经验值,laplacian_var的值只要大于20,整个图片的质量基本能达到要求。如果低于经验阈值,就再使用GFPGAN进行restorer.enhance处理。为了提供信息采集的准确性,会在招生环节增加要求学生同时提供身份证人脸像照片,将与上传的证件照做人脸相似度分析,对低于70%的做人工核实。人脸相似度可以使用ArcSoft虹软ArcFace 3.0免费离线人脸识别SDK,进行本地部署。在人脸相似度识别过程中,会出现证件照和身份证人面像照片都是本人,确相似度很低的情况。主要原因是身份证本身上面有一层未完全脱落的薄胶纸或污染,或身份证照片是二次翻拍的情况,这是只要对身份证人面像照片进行一次GFPGAN图像增强处理,平均能提高相似度20%,这样能大大降低考生再次补传照片的情况。⑴ 如果在对照片背景颜色值(蓝色R:67、G:142、B:219)要求只要接近就可以的情况下,适当放宽要求,以最大限度降低多次操作。在做背景色比对的过程中,需要将图片转换为HSV颜色空间再进行比较。⑵ 在获取头发顶部边沿的过程中,首先需要将图像转换为灰度图,再对灰度图像进行高斯模糊处理;然后,使用阈值方法将图像分割为二值图像。主要代码如下:gray = cv2.cvtColor(self.img, cv2.COLOR_BGR2GRAY)gray = cv2.GaussianBlur(gray, (5, 5), sigmaX=0)thresh1 = cv2.threshold(gray, 115, 255, cv2.THRESH_BINARY)⑶ 在招生报名平台处理照片上传后,可用增加一些后台微服务,对照片的背景色、嘴巴是否张开等再做批量确认,筛选出疑似的情况,将照片复制到单独的文件目录,便于人工确认,最大限度地降低偏差。经过上述技术的应用和整合,本案例在学院从开始2023年春季试用,在自考234考次注册中,一次性顺利上报所有考生照片注册,我们在证件照采集环节取得了以下显著成效:效率显著提高:自动化处理减少了人工检查和重复劳动,大大加速了证件照的处理速度。质量得到保障:技术的介入使得每张证件照都能达到规定的标准,避免了因为质量问题导致的重传或退回。资源得到节省:减少了大量的人工检查、手动修正和重新采集的需求,从而节省了时间和成本。对污染照片的处理效果明显:对于身份证上的污染照片,经过GFPGAN修复后,其人脸相似度平均提高了20%。技术的普及化与实用化:本案例表明,当我们面对传统环节中的问题时,技术手段的引入可以为其提供高效和优质的解决方案。细节决定成败:在证件照采集这样一个被视为“琐碎”的环节中,每一个细节的把控都是关键。而AI技术的介入,正是帮助我们更好地掌握这些细节。未来更多的应用场景:此次的成功经验表明,相似的技术方案可以应用于更多的场景和行业中,为传统流程带来革命性的变革。通过AI技术的介入,我们不仅提高了自考助学招生报名的效率和质量,更展示了技术和传统业务结合的无限可能性。相关链接
关于开展2024中国高校远程与继续教育优秀案例征集活动的通知
![]()