Hive远程数据库模式安装
安装hive的步骤:
1、解压安装
2、修改环境变量
vi /etc/profile
export HIVE_HOME=/opt/bigdata/hive-2.3.4
将bin目录添加到PATH路径中
3、修改配置文件,进入到/opt/bigdata/hive-2.3.4/conf
//修改文件名称,必须修改,文件名称必须是hive-site.xml
mv hive-default.xml.template hive-site.xml
//增加配置:
进入到文件之后,将文件原有的配置删除,但是保留最后一行,
从<configuration></configuration>,将光标移动到<configuration>这一行,
在vi的末行模式中输入以下命令
:.,$-1d
意思是将光标当前位置删除至倒数第二行,只留最后一行
//增加如下配置信息:
<property>
<name>hive.metastore.warehouse.dir</name>
<value>/user/hive/warehouse</value>
</property>
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://node01:3306/hive?createDatabaseIfNotExist=true</value>
</property>
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.jdbc.Driver</value>
</property>
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>root</value>
</property>
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>123</value>
</property>
4、添加MySQL的驱动包拷贝到lib目录
5、执行初始化元数据数据库的步骤
schematool -dbType mysql -initSchema
会在mysql中创建一个hive库,里面会有57张表
之后就可以输入hive,进入hive客户端
6、执行hive启动对应的服务
jps中多一个RunJar
在hive2中Hive-on-version已经deprecated,consider spark and tez engine,否则使用1.x
7、执行相应的hive SQL的基本操作
create table tbl (id int,name string);
desc tbl;
desc formatted tbl;
这些一堆信息,保存在哪儿?
在mysql中的TBLS表,保存表信息
COLUMNS_V2表,保存列信息
insert into tbl values (1,1);
查看yarn,有任务
查看hdfs,有文件000000_0
hdfs dfs get 000000_0
cat -A 000000_0
vim 000000_0
要想输入他这种有颜色的1^A1
就得在vim中
1
Ctrl+V
Ctrl+A
1
即可得到,要不然直接shift+6不管用,没颜色
那么hive为什么会在hdfs中创建文件呢,我们没有配置hdfs相关的东西呀
其实,在Hadoop时,我们已经配置了HADOOP_HOME,所以hive会依据自己的默认配置自动去寻找hadoop地址