John之气旋斩 John之气旋斩
关注数: 1 粉丝数: 82 发帖数: 1,582 关注贴吧数: 8
给百度贴吧的建议 采用reCAPTCHA,为世界书籍事业贡献力量每天上百度的人很多,IP党也不少,填的验证码也很多何不利用资源呢reCAPTCHA 是卡内基梅隆大学的一帮人搞出来的,它的技术并没有什么先进之处,但是创意有点意思。世界上面有很多将图书电子化的计划,基本是把书籍扫描了以后用 OCR 软件识别。有些情况下面 OCR 软件自己觉得某些词的识别结果并不是非常有把握。通常情况下面是通过雇佣劳力来肉眼校对。reCAPTCHA 项目认为这个工作不妨交给全世界大量填写认证码的人来完成。一般图形认证码系统都是只生成一个单词的,reCAPTCHA 生成的图片里面有两个单词,其中一个是机器生成的,有正确结果的单词,另一个则是扫描出来的有问题的单词,这个词没有正确结果。如果用户提交上来的结果里面机器生成的那个是对的,那么系统就认为另外一个也很有可能是对的。一幅扫描图片展示给多个用户如果结果都是一样的,他就将这个结果作为最终校对结果。这样就实现了利用人力来分布式校对文稿的目的。更具体的细节可以看 http://recaptcha.net/learnmore.html当然,有人可能会疑惑这样就防止不了spam了不会的,在使用中会显示两个单词,其中一个单词是已知正确的,必须输入正确,另外一个是未确定正确内容的,那么通过这个步骤,用户在输入验证码的过程中,就同时实现了两个功能,一个是防spam,另外一个就是人力OCR。可以参考http://seo.g2soft.net/2008/03/10/recaptcha-help-ocr.html
1 下一页