〖20220320〗〖蚁问友答〗写了个简单爬虫,自动爬取antwiki上的标本图
蚂蚁吧
全部回复
仅看楼主
level 13
小裸蛹🍀
楼主
因为自己突然有这方面的需求,所以就学了学写了一个。挺简单的,应该刚好勉强能用。链接放下面了,不知道各位蚁友用的到吗?
2022年03月20日 06点03分
1
level 13
小裸蛹🍀
楼主
链接:
网页链接
提取码:c92t
2022年03月20日 06点03分
2
level 13
小裸蛹🍀
楼主
链接里面有三个文件,.txt是使用方法,.py是代码文件(开源),.exe是可执行文件,前两个都不用管,只有这个文件就可以运行了。
2022年03月20日 06点03分
3
吧务
level 16
Snowkings
2022年03月20日 06点03分
4
小裸蛹🍀
雪王觉得这个有价值吗?我是最近想对比手里的一个标本就写了一个
2022年03月20日 06点03分
Snowkings
@小裸蛹🍀
要是能弄个antweb的就更好了,那边图多。
2022年03月20日 07点03分
小裸蛹🍀
@Snowkings
好,那我写写试试
2022年03月20日 07点03分
level 13
小裸蛹🍀
楼主
然后介绍下使用方法:
把.exe文件放在想保存图片的路径下,双击打开。输入属名,注意必须是拉丁文的属名,中文不行,而且首字母必须大写。输入后敲击回车,就会开始运行
2022年03月20日 06点03分
5
level 13
小裸蛹🍀
楼主
程序会自动遍历antwiki里属于这个属的物种,自动进入物种的主页,下载图片:包括右上角的四张图片,中间可能会有的生态图,以及下面可能会有的标本图。下载的全部都是点击图片链接进去的高清图。
2022年03月20日 06点03分
6
吧务
level 16
ScottWestern
牛🐮🐮🐮
2022年03月20日 06点03分
7
小裸蛹🍀
这个其实挺简单,就百十行代码
2022年03月20日 06点03分
ScottWestern
@小裸蛹🍀
没学过
2022年03月20日 06点03分
-蚂蚁之美-
@小裸蛹🍀
《简单》
2022年03月20日 07点03分
小裸蛹🍀
@-蚂蚁之美-
可能这就是术业有专攻吧
,这里面还一堆回车和注释,几十行对业内人士来说真的眯眯项目
2022年03月20日 07点03分
level 13
小裸蛹🍀
楼主
在运行的过程中,每个物种主页有多少张图片,以及每个物种的图片文件名都会在程序的黑框框里打印出来,就像上一楼里运行后的那样。同时在同一路径下还会生成一个log.txt记录。下载的图片会放在同一路径下。
2022年03月20日 06点03分
8
level 13
小裸蛹🍀
楼主
下载全部完成后,程序不会关闭,会在最后一行显示“下载成功”。如果程序运行着运行着自己关了,那多半是运行出错了,也可能是网络问题比如响应超时,可以反馈给我,我试着修一修(初学者,我尽量)
2022年03月20日 06点03分
9
level 13
小裸蛹🍀
楼主
用法基本介绍完了。
然后如果使用出现问题、有什么建议或者想要的功能,可以在这个贴里反馈给我。
如果有问题,我未来还会更新程序并在这个贴里发布。
2022年03月20日 06点03分
10
level 13
火天堂
蚁吧真是藏龙卧虎
2022年03月20日 07点03分
11
小裸蛹🍀
藏龙卧虎不敢当
,只能说各个专业各个行业的都有蚂蚁爱好者
2022年03月20日 08点03分
level 9
闪士(#太阳)
惊了
2022年03月20日 08点03分
12
上官羽祺
不过这个写的真的很好,顶顶顶!
2022年03月28日 07点03分
level 15
弓背好玩💯👻
不明觉厉
2022年03月20日 08点03分
13
小裸蛹🍀
真明了就不会觉厉了
2022年03月20日 09点03分
level 13
小裸蛹🍀
楼主
emm自己测了一下,果然还是有点问题,极个别的主页里的图片还是找不着,而且比较大的属比如弓背大头这种的容易中间断开,我再想想解决方案
2022年03月20日 12点03分
14
level 12
上官羽祺
厉害!我也接触过类似的,真的挺难的啊
2022年03月28日 07点03分
15
1
2
尾页