【技术贴】如何记录一个人的贴吧发言
花开伊人语吧
全部回复
仅看楼主
level 11
2018年12月12日 17点12分 1
level 11
这个破脚本竟然稳定运转了接近4年时间【虽然大部分时间都在摸鱼
代码以前存在SAE上,后来随着工作代码迁到了gitee,最后更新于2015年。
使用环境:Java+Selenium+Jenkins。
2018年12月12日 17点12分 2
level 11
这东西的起源是14年底的时候,为了跟上白姐姐贴吧的流窜轨迹写的。
写了这玩意后尾随白姐姐容易多了,每10分钟提示一次白姐姐最近流窜路线。
问我为啥尾随?
因为当时对白姐姐有非分之想呗。
开始的时候还挺好玩,差不多白姐姐发了贴就能互动。
慢慢地白姐姐发现我每次都能准时出现在她的任何帖子下就问我原因
我说写了监控脚本。
她说我是变态。
我想想,确实挺变态的。
不过白姐姐也没说不让尾随
这脚本也就没关
再后来,我结婚了,离贴吧也远了
白姐姐也不再是当年那个好糊弄的小女孩了
只是偶尔的时候通过这程序跑到白姐姐帖子下面聊两句
2018年12月12日 17点12分 3
level 11
今天整理代码时点开了源码
发现几年前写的东西简直就是凑合
正好趁着白姐姐脱团,这代码我就删掉
了留个思路,万一以后有用呢。
基本原理是:
selenium驱动chromedriver打开无界面的chrome浏览器;
使用百度贴吧高级搜索白姐姐最近的十条发言记录;
通过Xpath定位获取每个发言的标题,内容,发言贴吧和时间;
以上四种信息存为一条数据,共计10条存为一个List;
读取一个File文件,File文件中记录之前保存下来的最近十条发言;
将List中的数据与File中的数据合并去重:
如果合并去重后数据数量为20,则File清空,将List数据存入File,并把List数据存入记录白姐姐发言的Excel;退出程序。
如果合并去重后数据数量为10,则退出程序。
如果合并去重后数据数量为10<N<20,则File清空,取最新10条合并去重后数据存入File,并将最新的N-10条数据存入记录白姐姐发言的Excel;退出程序。
以上脚本打成jar包,并将启动jar包命令编成bat文件。
jenkins构建自由风格工程,每10分钟执行一次bat文件。
2018年12月12日 17点12分 4
level 11
2018年12月12日 17点12分 5
level 11
2018年12月12日 17点12分 6
level 9
这种东西为何要艾特我,谁会用得上啊[喷]
2018年12月13日 01点12分 7
你不想监控你女神吗
2018年12月13日 01点12分
@公子の小白 什么鬼,我哪来的女神
2018年12月13日 02点12分
@轶景张扬 哦,那就是你老婆
2018年12月13日 03点12分
level 13
我用来监控楼上吗
2018年12月13日 05点12分 9
行啊。
2018年12月13日 05点12分
level 13
[喷]
2018年12月13日 05点12分 10
level 1
[what]已婚了
2018年12月20日 16点12分 12
嗯啊。
2018年12月21日 01点12分
level 1
我需要,请艾特我
2019年12月02日 06点12分 14
level 1
我需要,请艾特我
2020年03月14日 08点03分 15
level 1
为了创建贴吧,需要全吧发言30条
2020年04月28日 08点04分 16
1