〖20220320〗〖蚁问友答〗写了个简单爬虫,自动爬取antwiki上的标本图
蚂蚁吧
全部回复
仅看楼主
level 13
小裸蛹🍀 楼主
因为自己突然有这方面的需求,所以就学了学写了一个。挺简单的,应该刚好勉强能用。链接放下面了,不知道各位蚁友用的到吗?
2022年03月20日 06点03分 1
level 13
小裸蛹🍀 楼主
链接:网页链接
提取码:c92t
2022年03月20日 06点03分 2
level 13
小裸蛹🍀 楼主
链接里面有三个文件,.txt是使用方法,.py是代码文件(开源),.exe是可执行文件,前两个都不用管,只有这个文件就可以运行了。
2022年03月20日 06点03分 3
吧务
level 16
2022年03月20日 06点03分 4
[小乖]雪王觉得这个有价值吗?我是最近想对比手里的一个标本就写了一个
2022年03月20日 06点03分
@小裸蛹🍀 要是能弄个antweb的就更好了,那边图多。
2022年03月20日 07点03分
@Snowkings 好,那我写写试试[捂嘴笑]
2022年03月20日 07点03分
level 13
小裸蛹🍀 楼主
然后介绍下使用方法:
把.exe文件放在想保存图片的路径下,双击打开。输入属名,注意必须是拉丁文的属名,中文不行,而且首字母必须大写。输入后敲击回车,就会开始运行
2022年03月20日 06点03分 5
level 13
小裸蛹🍀 楼主
程序会自动遍历antwiki里属于这个属的物种,自动进入物种的主页,下载图片:包括右上角的四张图片,中间可能会有的生态图,以及下面可能会有的标本图。下载的全部都是点击图片链接进去的高清图。
2022年03月20日 06点03分 6
吧务
level 16
牛🐮🐮🐮
2022年03月20日 06点03分 7
这个其实挺简单,就百十行代码[小乖]
2022年03月20日 06点03分
@小裸蛹🍀 没学过[乖][乖][乖]
2022年03月20日 06点03分
@小裸蛹🍀 《简单》
2022年03月20日 07点03分
@-蚂蚁之美- 可能这就是术业有专攻吧[笑尿],这里面还一堆回车和注释,几十行对业内人士来说真的眯眯项目[小乖]
2022年03月20日 07点03分
level 13
小裸蛹🍀 楼主
在运行的过程中,每个物种主页有多少张图片,以及每个物种的图片文件名都会在程序的黑框框里打印出来,就像上一楼里运行后的那样。同时在同一路径下还会生成一个log.txt记录。下载的图片会放在同一路径下。
2022年03月20日 06点03分 8
level 13
小裸蛹🍀 楼主
下载全部完成后,程序不会关闭,会在最后一行显示“下载成功”。如果程序运行着运行着自己关了,那多半是运行出错了,也可能是网络问题比如响应超时,可以反馈给我,我试着修一修(初学者,我尽量)
2022年03月20日 06点03分 9
level 13
小裸蛹🍀 楼主
用法基本介绍完了。
然后如果使用出现问题、有什么建议或者想要的功能,可以在这个贴里反馈给我。
如果有问题,我未来还会更新程序并在这个贴里发布。
2022年03月20日 06点03分 10
level 13
蚁吧真是藏龙卧虎
2022年03月20日 07点03分 11
藏龙卧虎不敢当[小乖],只能说各个专业各个行业的都有蚂蚁爱好者[滑稽]
2022年03月20日 08点03分
level 9
惊了[惊哭]
2022年03月20日 08点03分 12
不过这个写的真的很好,顶顶顶!
2022年03月28日 07点03分
level 15
不明觉厉[真棒]
2022年03月20日 08点03分 13
真明了就不会觉厉了[你懂的]
2022年03月20日 09点03分
level 13
小裸蛹🍀 楼主
emm自己测了一下,果然还是有点问题,极个别的主页里的图片还是找不着,而且比较大的属比如弓背大头这种的容易中间断开,我再想想解决方案
2022年03月20日 12点03分 14
level 12
厉害!我也接触过类似的,真的挺难的啊[笑尿]
2022年03月28日 07点03分 15
1 2 尾页