level 2
唐乙男
楼主
1. 简答题
已知:
hive中已建一表,表名为 sogou_500w,表中存储着用户访问搜索引擎的相关数据。
表中具体字段如下:
ts string //访问时间
uid string //用户ID,是根据用户使用浏览器访问搜索引擎时的cookie信息自动赋值的
keyword tring //用户搜索关键词
rank int //URL在返回结果中的排名
url string //用户点击的URL
使用HQL语句完成下面题目:
1、查询 sogou_500w中前10条数据。(提示:使用limit)
2、统计每个用户访问搜索引擎的次数(提示:按uid进行分组)
3、统计每个用户访问搜索引擎的次数,并显示访问搜索引擎次数大于30次的用户 uid 和统计次数。(提示:使用having对分组设置条件)
4、统计每个用户访问搜索引擎次数,按由大到小排序,显示前20名用户的 uid 和统计次数。(提示:使用order by 或 sort by)
2022年05月09日 12点05分
1
已知:
hive中已建一表,表名为 sogou_500w,表中存储着用户访问搜索引擎的相关数据。
表中具体字段如下:
ts string //访问时间
uid string //用户ID,是根据用户使用浏览器访问搜索引擎时的cookie信息自动赋值的
keyword tring //用户搜索关键词
rank int //URL在返回结果中的排名
url string //用户点击的URL
使用HQL语句完成下面题目:
1、查询 sogou_500w中前10条数据。(提示:使用limit)
2、统计每个用户访问搜索引擎的次数(提示:按uid进行分组)
3、统计每个用户访问搜索引擎的次数,并显示访问搜索引擎次数大于30次的用户 uid 和统计次数。(提示:使用having对分组设置条件)
4、统计每个用户访问搜索引擎次数,按由大到小排序,显示前20名用户的 uid 和统计次数。(提示:使用order by 或 sort by)