爬虫技术吧
爬虫技术爱好者的自由交流平台
关注: 1,469 主题: 7,161 帖子: 7,161
时下热门
最新回复
最新发布
2
2019-12-23
  大家都知道采集数据是要花时间,可是也不能一直等着,尤其是需要采集大量数据的情况下。那么如何提高爬虫采集效率就是十分关键的,那小编带大伙儿一块去了解如何……
1
2019-11-08
很多朋友在使用代理IP的时候,想知道代理IP的剩余有效时间,想在IP失效前进行切换,避免IP失效后影响业务的正常运行。那么如何获取代理IP的剩余有效时间呢……
4
2019-11-07
写爬虫用多进程好?还是多线程好?
3
2019-10-15
1、打开Python3,导入urllib的request,调用ProxyHandler,它可以接收芝麻代理IP的参数。 2、把IP地址以字典的形式放入其中……
0
2019-10-09
寻求爬APP数据的大佬,长期合作,会的可以私聊!
1
2019-09-29
1、打开Python3,导入urllib的request,调用ProxyHandler,它可以接收代理IP的参数。 2、把IP地址以字典的形式放入其中,设……
2
2019-09-13
爬取速度过快出现的验证码处理方法
16
2019-08-24
首先要掌握一些 Python 的基本代码: 如果你没有一点编程基础,可能花1-2周,每天3小时; 理解爬虫的原理:先弄清楚大框架,然后再从基础慢慢学起。
0
2019-08-01
ip是有时长的,超过这个时间,ip就无法使用了,需要重新从芝麻http提取ip。
2
2019-07-31
今天,芝麻HTTP就为大家简单介绍一下爬虫和反爬虫的相关问题! 爬虫:使用任何技术手段,批量获取网站信息的一种方式。 反爬虫:使用任何技术手段,阻止别人批……
3
2019-07-20
scrapy 和 scrapy-redis的区别介绍
2
2019-07-18
芝麻HTTP可以在线检测代理ip的速度。
2
2019-07-16
爬虫代理ip可以直接提取使用,比如在浏览器上设置代理,也可以放在代码里,芝麻http有相应的代码demo,可以进行参考。
1
2019-07-09
  1、User-Agent伪装和轮换。   2、降低抓取频率,设置访问时间间隔。   3、使用芝麻HTTP代理,不断更换ip来爬内容。
3
2019-04-26
爬虫技术那么强,有没大神指导指导,让菜鸟学习一下
0
2019-03-19
API格式提取 API就是url链接,用户的程序需要支持API的读取,定期从url中获取代理IP的相关信息,其文本格式如下: (1)默认文本格式
0
2019-02-27
一 前言 在网站的采集过程中,每天都要面对网站的各种反爬虫技术,然而我们要想拿到数据,就需要针对性的制定很多方法来突破他们的反爬。例如,在采集数据过程中目……
0
2019-02-26
传统API提取式代理,通过URL定时获取代理IP信息,需验证IP的可用性、更换代理设置,同时需要设计多线程异步IO,实现代理IP并发处理,不仅繁琐,而且影……
0
2019-02-25
有没有质量好的代理推介,像亿牛云提供的动态转发模式的.
7
2018-10-24
有谁会爬虫技术!
3
2018-07-26
生活从来就不是一件容易的事!
首页 22 23 24 25 26 27 28 尾页