Hive简介

学习Hive之前得先学习hdfs和mr，当学完mr之后会发现，操作数据还是很麻烦，首先得具备一定的开发能力，还得对mr的原理有一定的了解才能写出对应的代码得到想要的结果，效率确实有点低下，不利于hadoop的发展，后来大神们就搞出了一套像写sql一样操作hdfs数据的分布式计算框架Hive。

Hive不是数据库，更像是数据仓库，因为本质是HDFS+MR，所以它具备了HDFS的所有缺点，比如：不适合应用于实时系统、不能对行集数据进行增删改操作、用于处理离线批处理数据等。

Hive是一套实现了类SQL的接口

Hive的HQL和MySQL的SQL非常类似，很多命令都是通用的，比如创建数据库、创建表、查询、修改表结构等

Hive安装

从apache官方网站http://mirrors.shu.edu.cn/apache/hive/下载想要的版本，我下的1.2.2

在虚拟机中可以使用如下命令下载压缩包

wget http://mirrors.shu.edu.cn/apache/hive/hive-1.2.2/apache-hive-1.2.2-bin.tar.gz

解压出来

tar -xf apache-hive-1.2.2-bin.tar.gz

改一下文件目录名称(个人喜好)

mv apche-hive-1.2.2-bin apache-hive-1.2.2

安装JDK

这个就不详细写了，大概描述一下过程

1.下载jdk

2.解压

3.在/etc/profile中配置环境变量

4.使环境变量生效

source /etc/profile

安装mysql

参考MySQL安装与主从配置的前半部分

在mysql中创建hive数据库

mysql -uroot -p12340101

mysql>create database hive character set latin1;//记住一定要将字符集设置为latin1，否则Hive不能正常工作

hive目前支持derby和mysql来存储元数据，默认也是derby，但是它非常不好用，建议大家不要偷懒，还是装一个MYSQL然后配置一下URL、USERNAME、PASSWORD就OK

配置Hive

进入到Hive的安装目录

cd conf

cp hive-default.xml.template hive-site.xml

vi hive-site.xml

将如下内容粘贴到Hive中

<configuration>
<property>
  <name>javax.jdo.option.ConnectionURL</name>
    <value>jdbc:mysql://hadoop00:3306/hive?createDatabaseIfNotExist=true</value>
      <description>JDBC connect string for a JDBC metastore</description>
      </property>

<property>
  <name>javax.jdo.option.ConnectionDriverName</name>
    <value>com.mysql.jdbc.Driver</value>
      <description>Driver class name for a JDBC metastore</description>
      </property>

<property>
  <name>javax.jdo.option.ConnectionUserName</name>
    <value>root</value>
      <description>username to use against metastore database</description>
      </property>

<property>
  <name>javax.jdo.option.ConnectionPassword</name>
    <value>12340101</value>
      <description>password to use against metastore database</description>
      </property>
</configuration>

将mysql-connector-java-5.1.32.jar（mysql的驱动包）复制到Hive安装目录下的lib中