将清洗好的数据映射到Hive里去

其他 2019-04-03 20:56:06 阅读次数: 0

集群清洗好的数据：

数据模型：

baidu	CN	E	20160715153139	4.82.54.2	v2.go2yd.com	http://v1.go2yd.com/user_upload/1531633977627104fdecdc68fe7a2c4b96b2226fd3f4c.mp4_bd.mp4	5826

启动Hive，并创建对应的分区外部表

创建表

create external table g6_access(
cdn string,
region string,
level string,
time string,
ip string,
domain string,
url string,
traffic bigint
) partitioned by (day string)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'
LOCATION '/g6/hadoop/access/clear'

将相关的数据源复制到 Hive表对应的Location里面

hadoop fs -cp /g6/hadoop/access/output/day=20190325 /g6/hadoop/access/clear/day=20190325

注意：分区是一个文件夹，文件夹里面包含着数据文件，LOCATION里面装的是分区的那整个文件

最后再将表更新

alter table g6_access add if not exists partition(day='20190325');

查询表

猜你喜欢

转载自blog.csdn.net/qq_34341930/article/details/88800017

将清洗好的数据映射到Hive里去

ETL工具Kettle（数据清洗好帮手）

hbase表映射到hive

hive：hbase表映射到hive中

hbase的表映射到hive中

hive映射到hbase及性能分析

scala 将函数映射到集合

将Ubuntu 的文件映射到windows 中

将JDBC的resultSet映射到JavaBaen

将本地项目映射到外网

将内网资源映射到公网

将SEH异常映射到NET异常

SQL Server将数据库的用户名映射到登录名

使用SQLXML将XML文件映射到关系数据库

怎样将直接数据库中Json字段,映射到Mybatis中的Map类型?

Flutter中用于将 JSON 数据映射到 Dart 对象的库有哪些？

Hbase中的列式表映射到hive的外表

Spark SQL读取hbase映射到hive表-----异常记录

hibernate bean映射到数据库

数据映射到任意区间

logstash测试将数据写到es里去

python：基于GeoPandas和GeoViews库将GEDI激光高程数据映射到交互式地图

使用Holer将本地端口映射到公网

linux将80端口映射到8080

使用ngrok将web服务映射到公网

Mac下NATAPP将内网映射到外网

将本地地址映射到指定定制

如何免费的将本地Web服务映射到外网

Spring MVC将异常映射到HTTP状态码

如何将网络上的共享文件映射到本地

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)