“我们用的那个开源ocr库,標称准確率80%,实际跑起来干扰太大,很多任务反覆失败,整体效率比预计慢了至少30%。”
李伟补充:“复杂点的验证码,重试五六次都过不去,ip都可能被封。”
“而且,不少网站在升级验证码,难度还在增加。我估计……再过一两周,成功率可能掉到70%以下。”
办公室里一片沉默,只有伺服器风扇的噪音。
80%准確率……陈阳心里毫无波澜。
这本就在他预料之中。
他从一开始就知道,这个开源ocr只是个临时凑数的玩意儿。
周毅还在那里小心翼翼地建议:“陈总,要不……我试试优化一下算法?我之前看过一些论文,说是可以用svm分类器……“
“不用。“陈阳打断他,语气很平静,
“那条路是死的。传统图像处理的天花板太低,投入產出比极差。浪费时间。”
“那……”
周毅不知所措:“我们怎么办?”
陈阳没有立刻回答,转过身,看著窗外。
手指无意识地敲击桌面。
確认著下一步计划的时间节点。
卷积神经网络的核心代码他早已写好。
gpu並行计算的思路也已成竹在胸。
陈阳转回身,看著三个等待指令的员工,
“我这边新的识別引擎已经基本完成,需要几天时间进行最终的部署、优化和接口封装。”
他的语气篤定。
“几天后,准確率会稳定在98%以上。”
“98%?!“
三人同时愣住,虽然知道老板厉害,但这跨度……也太嚇人了!
周毅结结巴巴地问:“陈、陈总……您是说……您在开发新的算法?”
“嗯。“
陈阳点点头,
“全新的算法。差不多快好了。”
“那我们……“
李伟问道,“需要帮您做什么吗?”
“收集验证码图片。”
陈阳下达指令,
“种类越多越好,数量越多越好。”
“这是新引擎最后的『磨刀石。”
当天晚上,办公室只剩下陈阳和王磊。
“磊子,明天跟我去电脑城。”