博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
将数据直接上传到分区目录(hdfs)上,让Hive分区表和数据产生关联有哪些方式?
阅读量:4073 次
发布时间:2019-05-25

本文共 328 字,大约阅读时间需要 1 分钟。

前言

本文隶属于专栏《1000个问题搞定大数据技术体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!

本专栏目录结构和参考文献请见

正文

方案一:上传数据后修复表

hdfs dfs -mkdir -p 分区目录hdfs dfs -put 分区目录hive> msck repair table 表名

方案二: 上传数据后添加分区

hdfs dfs -mkdir -p 分区目录hdfs dfs -put 分区目录hive> alter table 表名 add partition();

提示:这里如果直接将新的分区文件上传到hdfs上,因为hive没有对应的元数据所以是无法査询到数据的,所以我们要进行表修复或者添加分区。

转载地址:http://szgji.baihongyu.com/

你可能感兴趣的文章
Java NIO
查看>>
Java大数据:Hbase分布式存储入门
查看>>
Java大数据:全文搜索引擎Elasticsearch入门
查看>>
大数据学习:Hadoop入门学习书单
查看>>
大数据学习:Spark SQL入门简介
查看>>
大数据学习:Spark RDD操作入门
查看>>
大数据框架:Spark 生态实时流计算
查看>>
大数据入门:Hive和Hbase区别对比
查看>>
大数据入门:ZooKeeper工作原理
查看>>
大数据入门:Zookeeper结构体系
查看>>
大数据入门:Spark RDD基础概念
查看>>
大数据入门:SparkCore开发调优原则
查看>>
大数据入门:Java和Scala编程对比
查看>>
大数据入门:Scala函数式编程
查看>>
【数据结构周周练】002顺序表与链表
查看>>
C++报错:C4700:使用了非初始化的局部变量
查看>>
【数据结构周周练】003顺序栈与链栈
查看>>
C++类、结构体、函数、变量等命名规则详解
查看>>
C++ goto语句详解
查看>>
【数据结构周周练】008 二叉树的链式创建及测试
查看>>