求助,帮帮孩子
hive吧
全部回复
仅看楼主
level 2
唐乙男 楼主
1. 简答题
已知:
hive中已建一表,表名为 sogou_500w,表中存储着用户访问搜索引擎的相关数据。
表中具体字段如下:
ts string //访问时间
uid string //用户ID,是根据用户使用浏览器访问搜索引擎时的cookie信息自动赋值的
keyword tring //用户搜索关键词
rank int //URL在返回结果中的排名
url string //用户点击的URL
使用HQL语句完成下面题目:
1、查询 sogou_500w中前10条数据。(提示:使用limit)
2、统计每个用户访问搜索引擎的次数(提示:按uid进行分组)
3、统计每个用户访问搜索引擎的次数,并显示访问搜索引擎次数大于30次的用户 uid 和统计次数。(提示:使用having对分组设置条件)
4、统计每个用户访问搜索引擎次数,按由大到小排序,显示前20名用户的 uid 和统计次数。(提示:使用order by 或 sort by)
2022年05月09日 12点05分 1
level 2
唐乙男 楼主
有大佬给个答案吗[乖]
2022年05月09日 12点05分 2
level 2
1.select * from sogou_500w limit 10;
2.select uid,count(*) from sogou_500w group by uid;
3.select uid,count(*) from sogou_500w group by uid having count(*) >30 ;
4.
selecct uid,cnt from (
select uid,count(*) cnt from sogou_500w group by uid ) a order by cnt limit 20
2022年08月05日 08点08分 3
level 2
基本垃圾操作,不会转行吧
2022年08月05日 08点08分 4
1