下面来看下数据仓库数据分析过程中使用到比较经典的Hive SQL的使用。
有十万个淘宝店铺,每个顾客访问任意一个店铺时都会生成一条访问日志,访问日志表为visit,其中uid为用户id,store为店铺名称,统计店铺的uv;
1
select store, count(distinct uid) from visit group by store;
有一亿个用户存储在user表中,有字段uid,age(年龄),total_consume(消费总金额),使用hive sql或者spark sql按照用户年龄大小降序排序,如果年龄相同按照消费总金额升序排列;
1
select uid, age, total_consume from `user` order by age desc, total_consume;
Just do it.
书山有路勤为径,学海无涯苦作舟。
欢迎关注微信公众号:【程序员写书】
喜欢宠物的朋友可以关注:【电巴克宠物Pets】
一起学习,一起进步。
