求助求助,面试官给的题,说是自学完成
ruby吧
全部回复
仅看楼主
level 1
1. 随便找一个词,用于在百度搜索查询一个搜索结果. 拿到底部的10个’相关搜索词’. 这10个词逐个在百度下拉框里获取新的词
2. 遍历所有词汇,重复步骤1 直到抓到10万个不同的关键词. 存到数据库中.
3. 遍历这10万个词汇, 向百度查询搜索结果, 用程序解析这个结果 把前10名的title,域名记录到数据库中
4. 所有网络请求的部分用5个线程来执行.
5. 所有http请求用socket实现
2014年11月26日 03点11分 1
level 1
不求怎么实现的代码,只求给个大体的方向,去学习,用到的关键技术和实现思路,不胜感激
2014年11月26日 03点11分 2
level 1
2014年11月26日 04点11分 3
level 1
2014年11月26日 04点11分 4
level 1
这个不难
一天就能刷到10万。
技术方面也没有什么难点。 就是一般学的知识就能做到
2014年11月26日 14点11分 5
给个清晰点的思路吧
2014年11月26日 14点11分
回复 tianqing370687 : 主是开5个线程爬一个又一个的页面。 取得html代码 分析html 分析html用正则匹配自己需要的东西 title 啦。 底部相关词啊。都可以用正则匹配。
2014年11月26日 14点11分
哈哈,看来你也是投了艺龙
2014年12月04日 16点12分
level 1
有没有给你说多久让你完成?
2014年11月26日 14点11分 6
尽快吧,说是看看我的学习效率
2014年11月26日 15点11分
1