如何评价 12306 的图片型验证码?
关注者
2,868被浏览
848,837登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏
UPDATE: 有人提到验证问题中文字的识别。所以加入了 tesseract 试了下,Good Case不多,需要改进。这里只是展示可行性。
----
中午看到这个验证码就囧了。
以前和同学讨论过图片验证码的问题,结论就是不靠谱。
- 图片过于复杂、混淆过多、条件太诡异时会挡住大部分正常用户
- 容易被枚举,题库太弱,不如字符组合可能性多
- 破解门槛不一定高于字符型Captcha
目测12306图片是低分辨率网络图片。猜想用公共服务就足够破解了,不需要自己搞机器学习什么一类。公共服务例如:
- 百度识图 百度识图——以图搜信息,发现更多可能
- Google图片 http://images.google.com
- ...
撸代码,试运行,一次通过,放截图:
第一次:
第二次:
挂上 tesseract 识别试试(其实用过都知道官方训练数据准确率不高),来个Good Case。
结论:
233333 ~
代码:
andelf/fuck12306 · GitHub