HIVE调优有两点是很好用的
摘:https://speakerdeck.com/philiptromans/hive-optimisation-tips-tricks
1.MapJoin
旧版本HIVE需要自行在查询/子查询的SELECT关键字后面添加/*+ MAPJOIN(tablelist) */提示优化器转化为MapJoin。高版本只需设置:
set hive.auto.convert.join=true;
HIVE自行选择小表作为LEFT的左表。
2.parallel
设置该参数是控制在同一个sql中的不同的job是否可以同时运行,默认是false,设置如下
set hive.exec.parallel=true;
HIVE调优有两点是很好用的
摘:https://speakerdeck.com/philiptromans/hive-optimisation-tips-tricks
1.MapJoin
旧版本HIVE需要自行在查询/子查询的SELECT关键字后面添加/*+ MAPJOIN(tablelist) */提示优化器转化为MapJoin。高版本只需设置:
set hive.auto.convert.join=true;
HIVE自行选择小表作为LEFT的左表。
2.parallel
设置该参数是控制在同一个sql中的不同的job是否可以同时运行,默认是false,设置如下
set hive.exec.parallel=true;