30行代码的爬虫，超详细的配置说明，要的拿走 - python3吧

level 6

import requests
from lxml import etree
import time
def down_image( page ):
print(f'页面{page}，开始')
t1 = time.time()
# page页面跳转
url = f'https://www.36992.com/girls/list-{page}.html'
resp = requests.get(url)
网页链接 = 'gbk'
with open('index.html', 'wb') as f:
f.write(resp.content)
tree = etree.HTML(resp.content)
# 页面标签，XPath的高级用法，相对路径
node_list = tree.xpath('//dd')
sub_url_list = []
for node in node_list:
# 获取网页路径，加if是规范写法
if len(node.xpath('./a/img/@src')) > 0:
img_url =str(node.xpath('./a/img/@src')[0]).replace("pic_360","pic")
# print(sub_url)
# 获取图片名称及格式，加if是规范写法
if len(node.xpath('./a/img/@title')) > 0:
title = node.xpath('./a/img/@title')[0]
sub_url_list.append((img_url, title))
#
# exit(2)
# 开始保存图片
for sub_url, title in sub_url_list:
suffix = sub_url.split('.')[-1]
img_content = requests.get(sub_url).content
with open(f'D:/123/456/{title}.{suffix}', 'wb') as f:
f.write(img_content)
f.close()
print(f'页面{page}，完成')
if __name__ == '__main__':
for page in range(1,60):
down_image(page)

2021年08月10日 06点08分 1

level 6

贴吧用户_5SDS9P2 楼主

2021年08月10日 06点08分 2

level 6

贴吧用户_5SDS9P2 楼主

2021年08月10日 06点08分 3

level 6

贴吧用户_5SDS9P2 楼主

1

2021年08月10日 07点08分 4

level 6

上帝的宠儿☎😺

大佬带带我

2021年08月11日 01点08分 5

level 6

贴吧用户_5SDS9P2 楼主

顶

2021年08月11日 05点08分 6

level 6

上帝的宠儿☎😺

学废了

2021年08月12日 02点08分 7

level 6

贴吧用户_5SDS9P2 楼主

123

2021年08月13日 01点08分 8

level 6

贴吧用户_5SDS9P2 楼主

111

2021年08月16日 01点08分 9

level 6

贴吧用户_5SDS9P2 楼主

奇迹

2021年08月25日 08点08分 10

level 6

贴吧用户_5SDS9P2 楼主

zhi

2021年08月30日 03点08分 11

level 6

贴吧用户_5SDS9P2 楼主

没人

2021年09月01日 01点09分 12

level 6

贴吧用户_5SDS9P2 楼主

where

2021年09月02日 08点09分 15

level 6

贴吧用户_5SDS9P2 楼主

多

2021年09月03日 06点09分 16

level 6

贴吧用户_5SDS9P2 楼主

重复

2021年09月03日 06点09分 17