Hive-0.7.1安装(Ubuntu Server11.04+Hadoop-0.20.2)
官方安装指南地址:https://cwiki.apache.org/confluence/display/Hive/GettingStarted
?
我这里只描述了一下安装环境的伪分布式安装
?
安装环境:
Ubuntu Server 11.04
Jdk1.6.27
Hadoop-0.20.2
?
先决条件:
安装了JDK1.6和hadoop-0.17以上版本Hadoop已经启动并运行在Hadoop为Hive设计几个备用目录hadoop fs -mkdir /tmphadoop fs -mkdir /user/hive/warehouse(当数据由HIVE管理时,数据存储于此)hadoop fs chmod g+w /tmphadoop fs chmod g+w /user/hive/warehouse?
安装过程:
下载安装包 hive-0.7.1-bin.tar.gz解压:tar -xzvf hive-0.7.1-bin.tar.gz配置环境变量(1) 执行:vi ~/.bashrc?
(2) 在结尾处添加:
export HIVE_HOME=hive的解压目录
export PATH=${HIVE_HOME}/bin:${PATH}
(3) 应用设置执行:source ~/.bashrc
(4) 执行hive进入hive shell界面
?
我在配的时候这里出现了一个错误:
?
解决:
配置hadoop-0.20.2/conf/hadoop-env.sh中配置
export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:/home/hadoop/hadoop/hadoop-0.20.2/lib:/home/hadoop/hadoop/hive-0.7.1/lib/jline-0.9.94.jar:
再执行hive成功进入。
?
疑问:在解决这个问题后,又做了个一个实验,将该文件中的export HADOOP_CLASSPATH。。。注释掉后,执行hive依然成功。没弄明白为什么会这样。求高手指点,万分感谢^_^
?
?
配置管理:
hive的默认配置文件为:<install-dir>/conf/hive-default.xml我们要改变配置的话,新建<install-dir>/conf/hive-site.xml,此文件中的属性会重写默认配置?
查询示例(使用hadoop in action中的例子):
?
?