教你如何制作自己的世界邮票目录
外国邮票吧
全部回复
仅看楼主
level 7
xifeng91 楼主
今天发点特别的,收集外国邮票也有7、8年了,趟了不少坑,特别是目录,纸质的买了不少,scott、香槟基本都是全的,米歇尔也有几本,其他的一些专目也有一些,电子版就更多了,不说花钱,主要是很多买了基本上很少看,现在主要是看scott电子版和stampworld(世界有票网),目录的最大问题一个是图不全并且图太小,费眼睛,另外除了英语别的真看不懂,翻译软件用着也费劲。
不过说实话,stampworld网站做的真不错,不过在国内,访问速度太费劲了,所以非常麻烦,这个是最大问题,如果要是自己有一个stampworld网站放在本地能访问,随时能查看,并且能修正或者增加一些自己的批注,这样应该是极好的。
五一的时候因为疫情也没出去,在家呆着没事决定自己做一个,以前搞过一段时间开发,虽然有很多年没从事这个工作了,不过还有点底子,所以决定用python把stampworld的邮票信息和图片通过爬虫爬下来,再写个网站把信息按我的方式展示出来,还不太完善,先给大家看看目前得效果:
首页是按6大洲显示各个国家:
点击国家,会显示这个国家所有的地区,最多分3层,以法国为例,有点多,分两个截图展示:
每个国家和地区都可以点进去,按类型、年份进行目录查询,点击法国出现左侧菜单,特别长
2022年05月07日 23点05分 1
level 7
xifeng91 楼主
随便展示一些爬完的国家和地区,目前爬完大几十个:
法国
摩纳哥
安道尔
澳大利亚
昆士兰
2022年05月07日 23点05分 2
level 7
xifeng91 楼主
web页面还有很多需要优化的地方,最近事比较多先放一放,比如排版显示的优化,最重要的是加上编辑和批注的功能,这样自己也能编辑说明或增加其他信息。
下面简单介绍一下方法,介绍之前声明一点,扒世界邮票网只是为了私人查询使用,不会对外,也不会copy给他人,因为这个网站的工作人员付出了巨大的心血,爬虫也是有规矩的,还请见谅,所以只是给大家介绍一下思路:
首先是设计目录结构,按stampworld的架构我分成了5个级别:大洲-国家-一级地区-二级地区-三级地区,大家可以看上面法国的示例,这个是通过每个国家显示页来爬取的
有了国家后,就是要按每个国家的类型和年份进行目录爬取,这个是通过https://www.stampworld.com/zh/sitemap/这页进行逐级爬虫,把每个国家的目录生成
有了上述的目录后,就是按目录的链接将所有的文字和图片进行爬取,我用的python的scrapy,代码写的有点乱,详细的就不发了
文字信息的提取,就发个局部吧:
图片是专门写了个spider单独爬的,最后是web页面,拿java写的,就不多说了:
大概是这么个过程,描述的很粗糙,只是抛砖引玉,和大家交流一下。
2022年05月08日 00点05分 3
1