hive开启动态分区，文件压缩 - 代码天地

hive开启动态分区，文件压缩

其他 2021-03-20 03:01:59 阅读次数: 0

开启动态分区

set hive.exec.dynamic.partition.mode=nonstrict;
set hive.exec.dynamic.partition=true;

开启压缩

set hive.exec.compress.output=true;
set mapred.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec;

开启文件合并默认大小为128M

set hive.merge.tezfiles=true;
set hive.merge.smallfiles.avgsize=128000000;
set hive.merge.size.per.task=128000000;

创建表

CREATE EXTERNAL TABLE `namespace.tableName`(
`字段名称` string COMMENT "描述"
)
PARTITIONED BY ( 
  `ymd` string)
ROW FORMAT DELIMITED 
  FIELDS TERMINATED BY '\u0005' 
STORED AS INPUTFORMAT 
  'org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  'hdfs路径';

查询分区数据写入对应分区

insert into table namespace.tableName partition(分区字段)
select 'sms',mktactivitynbr,phonenum as phone
case sms_result when '0' then '1' else '0' end as code，ymd
from namespace.tableName 
where ymd>=20210104 and ymd<=20210110 and 字段 in('0','1','23') ;

set hive.exec.dynamic.partition.mode=nonstrict;
set hive.exec.dynamic.partition=true;
set hive.exec.compress.output=true;
set mapred.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec;
insert overwrite table dmp_mcc_contact_view partition(ymd) select * from dmp_mcc_contact_view where ymd>=20201127 and ymd<=20201129;

猜你喜欢

转载自blog.csdn.net/qq_44962429/article/details/112761486

hive开启动态分区，文件压缩

Hive开启mapjoin优化、并行执行、动态分区

hive动态分区与静态分区

Hive动态分区

Hive动态分区配置

Hive之动态分区

hive-动态分区

hadoop hive 动态分区

Hive 动态分区案例

Hive - 动态分区操作

Hive动态分区报错

Hive分区（静态分区+动态分区）

【Spark-SparkSQL】SparkSQL 查询分区数据时会对Hive全表进行扫描（执行SparkSQL程序查询Hive数据时，开启动态资源分配导致分配资源过大，程序无法执行）

Hive之——Hive分区（静态分区+动态分区）

HIVE动态分区实战 HIVE动态分区实战

hive中的静态分区与动态分区

hive中动态分区与静态分区

Hive的静态分区和动态分区

Apache Hive 动态分区与静态分区的区别

Hive静态分区和动态分区

hive SQL 静态分区和动态分区

hive动态分区和静态分区

[Hive基础]-- 动态分区与静态分区

hive的动态分区和静态分区

hive动态分区与半自动分区

hive 静态分区与动态分区（笔记）

HIVE动态分区参数配置

Hive静态和动态分区

hive 1.1.0 动态分区实现

Hive动态和静态分区

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)