20180604早课记录24-Hive

1. hive数据分为哪两块?分别存储在哪?

元数据和数据本身; mysql等关系型数据库 和 hdfs

2. hive的建表SQL语句你们觉得里有哪些内容?(不光光是字段的定义)

定义分区,分隔字符,内外表之分

3. 默认的换行符和分割符是什么?

/t /r

4. 加载数据或本地数据到hive表或者覆盖hive表,语法是什么?

LOAD DATA LOCAL INPATH 'xxx' OVERWRITE INTO TABLE xxxx;

5.hive的执行引擎是mr,请问哪种hive SQL是触发mr job的

带聚合函数,某些insert,还有create table as select

6. create table a as select * from b; 你们觉得有没有mr job?

7. 谈谈你们对分区表的理解? 怎样定义的,怎样加载数据,怎么查询

定义:CREATE TABLE order_created_partition (
order_number string,
event_time string
)
PARTITIONED BY (event_month string)
ROW FORMAT DELIMITED FIELDS TERMINATED BY "\t";
加载数据:LOAD DATA LOCAL INPATH "/tmp/order_created.txt"
OVERWRITE INTO TABLE order_created_partition
PARTITION (event_month='2017-12');
查询:select * from test1.order_created_partition
where event_month='2017-12';

8. 静态分区表和动态分区表是什么区别?

静态只能自己手动建立分区表 动态可以设置分区字段然后自动分区

9. 查看函数的是什么语法?

desc function xxx

10. (拓展题)hive一般我们用来做数据插入和追加,不会去更新删除数据,那么hive支持这种操作吗?该加什么参数呢?

支持

猜你喜欢

转载自blog.51cto.com/10814168/2125944