该文件是一个电商网站某一天用户购买商品的订单成交数据,每一行有多个字段,用空格分割,字段的含义如下
用户ID ip地址 商品分类 购买明细 商品金额
A 202.106.196.115 手机 iPhone8 8000
问题1.计算出各个省的成交量总额(结果保存到文件中)中)
问题2.计算每个省成交量的top3(结果保存到文件中)
问题3.计算每个商品分类的成交总额,并按照从高到低排序(结果保存到文件中)
问题4.构建每一个用户的用户画像,就是根据用户购买的具体商品,给用户打上一个标签,为将来的商品推荐系统作数据支撑
说明:如果一个用户购买了一个iPhone8,对应有多个标签:果粉、高端人士、数码一族
请将下面的规则数据保存到文件中,并作为标签规则(三个字段分别代表id、商品、对应的标签):
1 iPhone8 果粉
2 iPhone8 高端人士
3 iPhone8 数码一族
4 布莱奥尼西服 高端人士
5 布莱奥尼西服 商务男士
6 婴儿床 育儿中
7 迪奥香水 高端人士
8 迪奥香水 白富美
9 婴儿车 育儿中
10 iPhone8手机壳 果粉
11 iPhone8手机壳 高端人士
12 iPhone8手机壳 数码一族
13 spark实战 IT人士
14 spark实战 屌丝
15 Hadoop编程指南 IT人士
16 Hadoop编程指南 屌丝
17 奶粉 育儿中
用户ID ip地址 商品分类 购买明细 商品金额
A 202.106.196.115 手机 iPhone8 8000
问题1.计算出各个省的成交量总额(结果保存到文件中)中)
问题2.计算每个省成交量的top3(结果保存到文件中)
问题3.计算每个商品分类的成交总额,并按照从高到低排序(结果保存到文件中)
问题4.构建每一个用户的用户画像,就是根据用户购买的具体商品,给用户打上一个标签,为将来的商品推荐系统作数据支撑
说明:如果一个用户购买了一个iPhone8,对应有多个标签:果粉、高端人士、数码一族
请将下面的规则数据保存到文件中,并作为标签规则(三个字段分别代表id、商品、对应的标签):
1 iPhone8 果粉
2 iPhone8 高端人士
3 iPhone8 数码一族
4 布莱奥尼西服 高端人士
5 布莱奥尼西服 商务男士
6 婴儿床 育儿中
7 迪奥香水 高端人士
8 迪奥香水 白富美
9 婴儿车 育儿中
10 iPhone8手机壳 果粉
11 iPhone8手机壳 高端人士
12 iPhone8手机壳 数码一族
13 spark实战 IT人士
14 spark实战 屌丝
15 Hadoop编程指南 IT人士
16 Hadoop编程指南 屌丝
17 奶粉 育儿中
用户的行为数据,根据规则打上对应的标签,然后将数据存储到文件中
订单数据
A 202.106.196.115 手机 iPhone8 8000
B 202.106.0.20 服装 布莱奥尼西服 199
C 202.102.152.3 家具 婴儿床 2000
D 202.96.96.68 家电 电饭锅 1000
F 202.98.0.68 化妆品 迪奥香水 200
H 202.96.75.68 食品 奶粉 600
J 202.97.229.133 图书 Hadoop编程指南 90
A 202.106.196.115 手机 手机壳 200
B 202.106.0.20 手机 iPhone8 8000
C 202.102.152.3 家具 婴儿车 2000
D 202.96.96.68 家具 婴儿车 1000
F 202.98.0.68 化妆品 迪奥香水 200
H 202.96.75.68 食品 婴儿床 600
J 202.97.229.133 图书 spark实战 80