Hive外部表分区是怎样的,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。
1:定义
未被external修改的是内部表(MANAGED TABLE),被external修饰的为外部表(EXTERNAL TABLE)
创建外部表语法:
create external table person2(
id int,
name string,
hobby array<string>,
addr map<string,string>
)
row format delimited
fields terminated by ','
collection items terminated by '-'
map keys terminated by ':'
location '/user/person2'
;
2:区别
1)内部表数据由hive自身管理,外部表数据由hdfs来管理
内部表数据存储的位置默认/user/hive/warehouse,
外部表数据存储的位置由用户自己指定
2)删除内部表会直接删除元数据和存储数据
删除外部表仅仅只会删除元数据,HDFS上的文件不会删除。
3:分区表
1)定义语法
create table p1(
id int,
name string,
hobby array<string>,
addr map<string,string>
)
partitioned by (p_dt string)
row format delimited
fields terminated by ','
collection items terminated by '-'
map keys terminated by ':'
;
注意:分区字段不能和表中的字段重复,若要创建分区表,必须在表定义的时候创建partition
看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注天达云行业资讯频道,感谢您对天达云的支持。