level 6
GiDot
楼主
各位资深的站长想来也都会遇到过这样一种情况:每天都会有无数的垃圾信息和留言出现在网站论坛、留言本或者博客中。而我们能做的,难道仅仅只是被动的来一条删一条么?只要是锁,总会有一把能打开它的钥匙。这把过滤广告垃圾的钥匙到底是哪一把?各位编程高手,请跟贴亮出你的钥匙。 通过观察发现,这些垃圾信息并非手工发送,当信息中包含中文时在UTF-8页面中所显示的是一堆堆让人烦躁的乱码。只有机器人才会统一的把发送留言的编码规定成GB2312。如果是机器人,那么总会有一定的规律可循。 通常过滤机器人的办法是在发帖时使用图片验证,但目前来讲图片验证的效果并不好,比如PJHOME的博客就使用了图片验证,但它却是广告垃圾的最大受害群体,当然这个博客的图片验证过于简单,但复杂的类似百度贴吧,一样被机器破解了,每天都会有机器人发帖。封ID,它会另注册新的,封IP,人家用代理服务器。 能来这里的绝大都是程序员,为了净化我们生存的网络环境,每位程序员都有权力和义务去做这件事情。所以从今起,百度ASP吧讲开转贴并置顶来探讨过滤广告垃圾的攻防策略。 向各位编程高手发出挑战书:展现你们才华的时刻到了,尽情发挥你们想象力和创造力,战胜机器人! 注意:新手也可以参加咨询和讨论,但严禁发水贴与广告,违者严惩不怠,绝不姑息。
2006年09月06日 06点09分
1
