“好!“沈清雪接过u盘,打开自己的电脑,开始工作。
两人就这样並肩坐著,各自忙各自的。
工作室里很安静,只有键盘的敲击声和电脑风扇的嗡鸣声。
偶尔沈清雪会问一句“这个字是什么“,陈阳就凑过去看一眼,然后告诉她。
时间一点点流逝。
晚上九点,模型训练完第二轮,准確率提升到95%。
晚上十一点,第三轮完成,准確率96。5%。
“累不累?“陈阳问沈清雪。
“还好。“沈清雪伸了个懒腰,“就是眼睛有点酸。“
“休息一下吧。“陈阳说,“出去走走。“
两人走出工作室,来到楼下的小区花园。
秋天的夜晚有些凉,风吹过来,树叶沙沙作响。
小区里很安静,只有几盏路灯还亮著。
“陈阳,“沈清雪忽然说,“我觉得一起做一件事情,一起努力,一起看著它慢慢成长。这种感觉,比上课有意思多了。“
陈阳看著她,月光下,她的脸上带著认真的表情。
“辛苦你了。“陈阳说,“明明可以在宿舍休息,却跟著我熬夜。“
“我愿意啊。“沈清雪笑道,“而且我也学到了很多东西。以前只是写写作业,现在才知道真正的项目是什么样的。“
两人在花园里走了一圈,然后回到工作室继续工作。
凌晨两点,陈阳完成了后处理模块的开发。
这个模块会对识別结果进行多重验证:
身份证號码必须是18位,前17位是数字,最后一位是数字或x身份证號码的前6位是地区码,必须是有效的行政区划代码身份证號码的7-14位是出生日期,必须是合理的日期(比如月份不能超过12)身份证號码的最后一位是校验码,可以根据前17位计算出来性別信息必须与身份证號码的第17位对应(奇数为男,偶数为女)
这些规则可以过滤掉大部分识別错误。
“清雪,测试数据整理好了吗?“陈阳问。
“好了。“沈清雪揉了揉眼睛,把excel文件发给他,“500张都录完了。“
“辛苦了。“陈阳接收文件,“现在开始测试。“
他写了一个批量测试脚本,把500张测试图片全部跑一遍。
测试程序开始运行,进度条慢慢前进。
沈清雪坐在旁边,紧张地看著屏幕。
十分钟后,测试完成。
陈阳打开结果报告:
总测试样本:500张
成功识別:497张
识別错误:2张
识別失败:1张
综合准確率:99。4%
平均识別时间:0。9秒
“99。4%!“沈清雪惊呼,“真的做到了!“