level 11
一、蜘蛛爬取原理
大自然的蜘蛛我相信大家都看到过,通过网来进行爬取的而搜索引擎的蜘蛛是通过链接来爬取的蜘蛛在网页上爬取到一个链接就会把它放到一个单独的数据库。这些数据库都是有特性的特性就是域名的后缀。
常用的后缀有.net.org.com.cn.com.cn等等。
蜘蛛会把这些域名后缀的链接放到一个数据库,然后逐个去爬取,这可能是很多站长朋友的一个误区。蜘蛛是不会像用户一样直接点击进入的如果那样,那么这个蜘蛛就可以一直在外面不用回家了因为每个网页都是有链接不断的循环的爬不完的
百度反向链接蜘蛛也是会爬取的有些朋友称之为相关域。百度相关域的意思就是说,只要有一个页面被百度收录了并且这个页面包括妳的域名,比方:这不是一个超链接,但是只有百度收录了写的这篇文章的页面,那么蜘蛛是会把这个域名列入它数据库的然后也会爬取。并且也会计算权重,这就是所说的链接诱饵,用来吸引蜘蛛。
2017年05月02日 09点05分