技术讨论:如何过滤机器人的广告留言
asp吧
全部回复
仅看楼主
level 6
GiDot 楼主
  各位资深的站长想来也都会遇到过这样一种情况:每天都会有无数的垃圾信息和留言出现在网站论坛、留言本或者博客中。而我们能做的,难道仅仅只是被动的来一条删一条么?只要是锁,总会有一把能打开它的钥匙。这把过滤广告垃圾的钥匙到底是哪一把?各位编程高手,请跟贴亮出你的钥匙。  通过观察发现,这些垃圾信息并非手工发送,当信息中包含中文时在UTF-8页面中所显示的是一堆堆让人烦躁的乱码。只有机器人才会统一的把发送留言的编码规定成GB2312。如果是机器人,那么总会有一定的规律可循。  通常过滤机器人的办法是在发帖时使用图片验证,但目前来讲图片验证的效果并不好,比如PJHOME的博客就使用了图片验证,但它却是广告垃圾的最大受害群体,当然这个博客的图片验证过于简单,但复杂的类似百度贴吧,一样被机器破解了,每天都会有机器人发帖。封ID,它会另注册新的,封IP,人家用代理服务器。  能来这里的绝大都是程序员,为了净化我们生存的网络环境,每位程序员都有权力和义务去做这件事情。所以从今起,百度ASP吧讲开转贴并置顶来探讨过滤广告垃圾的攻防策略。  向各位编程高手发出挑战书:展现你们才华的时刻到了,尽情发挥你们想象力和创造力,战胜机器人!  注意:新手也可以参加咨询和讨论,但严禁发水贴与广告,违者严惩不怠,绝不姑息。
2006年09月06日 06点09分 1
level 1
很简单,提交的留言必须通过审核才能在前台显示。
2006年09月07日 10点09分 4
level 0
假如你做一个贴吧或者论坛,也要所发帖子让你审核后才显示?4楼的别逗了
2006年09月07日 11点09分 5
level 6
GiDot 楼主
回6楼,留言本可以递交到后台,但是论坛呢?贴吧呢?IP可以用代理掩盖的,一样可以欺骗。这不是主流办法。
2006年09月08日 05点09分 7
level 1
采用不可逆的图片加密码!这是比较实际的解决办法!
2006年09月14日 08点09分 9
level 0
能否详细说明什么是不可逆的图片加密?
2006年09月14日 13点09分 10
level 0
跑题了,楼上滴!你这种人该被淘汰才对,这么嚣张!
2006年09月18日 14点09分 14
level 2
HTTP是一种无状态协议,只能在POST时进行一系列强制验证,BAIDU的验证吗做的就很不错。还要提醒大家一句:不要把简单的事情复杂化。
2006年09月19日 02点09分 15
level 1
15楼的态度大错特错,没有人要把简单的问题复杂化,更没有人说百度的验证码做的不好,但是有机器人能破解它的验证码,这不就失去验证码的意义了吗,验证码主要用来防止机器人的提交。所以大家讨论下更好的防止机器人的措施。这个问题看似简单,但是没有你想象的那么容易,随便加个码可以挡人眼睛,让人手动输入下几个字符,但是这样验证码就根本没有任何意义,验证码主要是防止程序短时间内发大量的垃圾内容,这才是真正的意义。
2006年09月19日 13点09分 16
level 0
16楼说的很好,这个题目看似轻松,但的确是网络难题。这个不仅在于技术,更在于防卫的思路。
2006年09月20日 01点09分 17
level 2
那是你验证码除了问题!!其实通过验证码可以很好的防止机器人的不过在生成的验证码要注意了,我发现很多初学者把验证码写在隐藏的表单域中,这时机器人不读出来才怪了,还有验证码的图片是要根据程序生成的,有很多人现在直接
这样很不好根据图片地址就可以知道了,所以这个是一定要根据程序生成的,ASP.JSP.PHP.NET里面实现这个很轻松的.如果你做到了这个,还被机器人骚扰的话那就不是这的问题了,我敢说是你程序其他地方出了漏洞了.
2006年09月24日 02点09分 18
level 2
相信进这个帖子的每位同行都了解验证码的真实意义。我这里说几个问题1、图片验证吗是当前条件下最有效的方式(之一)。随着互联网的发展,一些人为了某些利益,不惜利用机器人发送大量垃圾广告,这在一定程度上严重影响了网络秩序,因此才有了验证吗的概念。熟悉HTTP协议的人都知道,HTTP是一种开放协议。这在一定程度上也增加了防范垃圾广告的难度。当然,讨论验证吗也必须在这个前提下进行。几乎全部的网站不约而同地选择了图片验证吗。事实证明,这是一种非常有效的解决方式。在目前情况下,通过软件识别图片字符信息是有一定难度的,特别是图片加入干扰吗更是增加了识别的难度。2、图片验证吗只有正确使用才能有效防范机器人广告。我这里没有例子,但我可以说大多数有“图片验证吗”的站点仍然遭受机器人骚扰都是因为没有正确使用图片验证吗。图片验证吗也只有正确使用才能有效防范机器人广告的攻击,当然,这和庞大的程序员队伍素质参差不齐是分不开的。
2006年09月25日 12点09分 19
level 0
图片验证码应该很难破解的吧?恕我孤陋寡闻,百度贴吧的图片验证有被破解吗?
2006年09月26日 05点09分 20
level 1
太简单了吧!基本上所说留言本,字段都差不多。。自己写一个,把字段添的个性点。。基本上发不进来留言!记得要显示全部添,添不全就提示重新添!
2006年09月26日 08点09分 21
level 0
验证码技术含量问题
2006年09月29日 03点09分 22
level 0
验证码 没什么可讨论的验证码的技术问题 杂点之类的
2006年10月01日 08点10分 23
level 1
要留言需要注册然后在注册的时候系统读取用户所在时区,然后留一个选择:“请选择您现在的时间”通过判断时间和时区来减少机器注册成功率
2006年10月02日 06点10分 24
level 1
我用一个笨办法,有效克服了机器人的问题:对提交表单的相关页面进行动态改名,不知道大家能不能明白我的意思,我是设置的取当前服务器时间进行加密处理后作为文件名,然后定时改名,具体的细节大家自己去完善吧
2006年10月05日 08点10分 25
level 6
GiDot 楼主
25楼,昨晚受老爸的启发,我想到一个可以过滤机器人的方法,和你完全一致。不过要改文件名得需要FSO,还不如在后面加一个参数,这个参数值每天一换。
2006年10月05日 11点10分 26
level 1
我采用了一个办法,目前来看效果还可以。---------------------在显示留言界面的页面里成生一个随机数字,用Session变量记住该数字;然后调用MD5算法模块把此数字加密;并用留言的form里的一个hidden字段记住该加密后的数字串;在保存留言的页面,判断hidden传递的值,是否不为空串,不为undefined,不为null;Session变量不为空串,不为null;而且此Session变量经过MD5加密后的字串与hidden字段传递过来的字串相等。以上判断通过后,即可认为是正常提交,否则予以拦截并放弃存储操作。-------------------------------以上方法不知是否健壮,不过我使用感觉还是不错的,很长时间没发现有留言机器人发帖了。请各位朋友指正一下。
2006年10月11日 04点10分 27
1 2 3 4 尾页