[求助] 想要抓取新浪微博得正文在判断该内容的积极性 - java吧

level 10

清风丶醉l 楼主

如题求助首先解决如何获取新浪微博正文的内容，我自己目前也在研究还是没有什么结果用的 httpclient，只不过确实不懂这玩意，希望有懂得网络蜘蛛的大牛来帮个忙

2014年04月03日 13点04分 1

level 10

清风丶醉l 楼主

自己研究一个星期了还是没有什么实质的结果，还是决定转变策略还和吧里的人交流一下，希望吧里的朋友过来帮忙指点一下

2014年04月03日 13点04分 2

level 10

清风丶醉l 楼主

还没人来？求助帖都没人看？真变得这么水了？

2014年04月03日 13点04分 3

level 12

夜轩浪

httpclient + jsoup，这个其实没什么难的啊，微博搜索的地址是http://s.weibo.com/，你随便搜一个词然后用火狐或者chrome去分析它的请求就可以了，然后用httpclient模拟发送，我做过这个，主要要注意的就是返回的页面是一堆js，里面包含了html代码，你要用正则把HTML代码抓出来

2014年04月03日 13点04分 4