【技术交流】又论天气——来自百度的天气数据抓取
rainmeter吧
全部回复
仅看楼主
level 8
風º桑
楼主
一楼献给度娘
2018年07月30日 03点07分
1
level 8
風º桑
楼主
事出有因,我的win10一用上天气插件,雨滴就极易自动崩溃,本着原装就是最好的,翻了下RM的手册,决定采用WebParser来抓取并处理。
2018年07月30日 03点07分
2
風º桑
还是发下ini文件吧。。。打开皮肤目录直接粘贴替换就行。狗爪度/s/1srgZhsAUuvC5UoaYqbrxyA 提取码 7x2h
2019年05月22日 23点05分
灿烂初阳
@風º桑
请问可以补一下链接吗?这个取消了
2020年02月04日 09点02分
532085552
链接被取消了楼主能再分享一下么、
2020年02月06日 04点02分
風º桑
@灿烂初阳
修复中。。。百度可能反爬虫了,打算换成搜狗
2020年02月10日 13点02分
level 8
風º桑
楼主
下面开始。
百度的天气请求很简单,直接百度搜索“天气”就可以了,度娘会自动判断地理位置,调用国家天气的数据。
2018年07月30日 04点07分
3
level 8
風º桑
楼主
采用查看元素,定位数据所在的标签。
然后查看源码,搜索标签。
第一次匹配就是结果,下面是整齐的数据。
2018年07月30日 04点07分
4
level 8
風º桑
楼主
我只采用了温度和预报,大家有需要的可以自己加匹配项。需要解释的是这里:
.*[\r\n].*[\r\n].*(.*)[\r\n].*[\r\n].*p>
这里用了多个匹配换行,原因是度娘这里的数据有着迷之换行和空格,换行这里先处理掉,空格下面再处理。原始数据看下面
2018年07月30日 04点07分
6
level 8
風º桑
楼主
最后说下调用。
2018年07月30日 04点07分
7
level 8
風º桑
楼主
至此,就全部结束了,感谢大家看完这篇,如有不对或不清楚的地方,欢迎提出,谢谢。
2018年07月30日 04点07分
8
拜读伊苏
获取数据最头疼的是,明明在网页里有显示,而且在查看元素里面也有对应数据,但是网页源代码里面没有这个,学习一下以后,简单的正则表达式获取数据很简单,反而是找个靠谱的网址比较费劲。
2019年01月11日 07点01分
風º桑
回复
�ݶ�����
: 对,这就是用度娘的原因。我试过其他API,都不太满意。度**较稳定,抓取次数也没有任何限制。要说缺点,就是国外的ip支持不好
2019年01月11日 16点01分
吧务
level 14
🌸雪月花
好
2018年07月30日 05点07分
9
level 8
風º桑
楼主
被吞了一楼。。。不贴图了,直接码吧。。。
WebParser代码如下:
[Weather]
Measure=Plugin
Plugin=WebParser
Url=
http://www.baidu.com/s?wd=
天气
RegExp="(?siU)<span class="op_weather4_twoicon_shishi_title">(.*)span>.*<i class="op_weather4_twoicon_shishi_sub">(.*)i>.*<p class="op_weather4_twoicon_temp">.*p>.*<p class="op_weather4_twoicon_temp">(.*)p>.*<p class="op_weather4_twoicon_weath".*title="">.*[\r\n].*[\r\n].*(.*)[\r\n].*[\r\n].*p>"
2018年07月30日 07点07分
10
level 1
林竹梦影
谢楼楼
2019年02月07日 09点02分
12
level 1
longfinal
很不错构想,已经可以实现提取天气预报等数据,但是如何显示所在地?请教一个问题:如何提取网页中的关键字例如“云南昆明”(动态地址)
?
2019年05月10日 06点05分
13
C哥888
看天气网的网站后面的编号是多少复制即可
2019年05月10日 08点05分
風º桑
只要前面有标签,或者说关键字,就能正则定位匹配
2019年05月12日 09点05分
level 3
堕落痕季
仰望大佬
2019年05月21日 01点05分
14
level 3
戈登豆荚
教教我怎么改吧
2019年05月21日 07点05分
15
風º桑
文件我放到二楼了
2019年05月22日 23点05分
戈登豆荚
真好,万分感谢
2019年05月23日 11点05分
level 1
wsadcn
简直完美!
2019年07月16日 09点07分
16
吧务
level 9
朱门高悬云帆♋
不同浏览器和系统从网站服务器返回的源码可能不相同的,雨滴手册里面有一个附带小程序,可以看到雨滴插件请求返回的源码,可以减少失误
2019年07月16日 22点07分
17
風º桑
现在我的脚本改成了先down下来再匹配,因为不保证一直有网,没有时空荡荡的难受。这种情况下,只要参照down下来的文件和rain本身带的调试功能,基本都能判断清楚
2019年07月17日 09点07分
朱门高悬云帆♋
@風º桑
有这种操作?读取下载下来的文件吗?是用到lua插件了吗
2019年07月17日 12点07分
風º桑
没有,还是那个插件,file协议就可以读取本地文件,本地网页路径前加个file://就可以用浏览器读取,在插件里也是,url填这种网址就行,还可以搭配系统环境变量,使其更灵活。但是有些软件的file要求得把\变成/,具体试试就知道了
2019年07月17日 23点07分
朱门高悬云帆♋
好吧,我大概知道了
2019年07月17日 23点07分
1
2
尾页