hive的操作

来源:互联网 发布:杭州贰贰网络咋样 编辑:程序博客网 时间:2024/06/10 07:54

Hive中的表实际上就是hdfs中的文件夹,
Hive的表其实就是HDFS的目录/文件,按表名把文件夹分开。如果是分区表,则分区值是子文件夹,可以直接在M/R Job里使用这些数据。

1 Hive是SQL解析引擎,它将SQL语句转译成M/R Job然后在Hadoop执行。
2 创建一个表 以’\t‘划分

 create table teacher (id bigint, name string) row format delimited fields terminated by '\t';    

3 上传本地文件到hive
load data local inpath '/root/wenjian/people' into table teacher;
(如果这个地方不写local 那就是默认从hdfs上上传)
代码如下 load data inpath '/people.txt' into table teacher;
4 按照id查询,降序输出

 select * from teacher order by id desc;

5 create database mazhongyi;创建数据库,在hfs上显示为mazhongyi.db
可以在mazhongyi.db上创建一些新的表,前提必须use mazhongyi
然后执行建表指令 例如

create table user (int bigint, name string) row format delimited fields terminated by '\t';
0 0