这篇文章的内容主要围绕Linux系统怎么安装sqoop进行讲述,文章内容清晰易懂,条理清晰,非常适合新手学习,值得大家去阅读。感兴趣的朋友可以跟随小编一起阅读吧。希望大家通过这篇文章有所收获!
sqoop简介:
正如Sqoop的名字所示:Sqoop是一个用来将关系型数据库和Hadoop中的数据进行相互转移的工具,可以将一个关系型数据库(例如Mysql、Oracle)中的数据导入到Hadoop(例如HDFS、Hive、Hbase)中,也可以将Hadoop(例如HDFS、Hive、Hbase)中的数据导入到关系型数据库(例如Mysql、Oracle)中。如下图所示:
2、Sqoop架构 Sqoop架构:
正如上图所示:Sqoop工具接收到客户端的shell命令或者Java api命令后,通过Sqoop中的任务翻译器(Task Translator)将命令转换为对应的MapReduce任务,而后将关系型数据库和Hadoop中的数据进行相互转移,进而完成数据的拷贝。
sqoop-1.4.7安装配置流程
(1) Sqoop环境前提:
Hadoop
关系型数据库(MySQL/Oracle)
HBase
Hive
ZooKeeper
(2) 解压sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz安装包到目标目录下:
(3) 为后续方便,重命名Sqoop文件夹:
(4) 修改配置文件:
(5) 关联Hive:
(5) 配置环境变量:
(6) 启动查看版本号
(7) 添加驱动:
导入MySQL驱动到sqoop/lib下
导入Oracle驱动到sqoop/lib下
3. Sqoop操作
(1) 常用参数:
参数查看:Sqoop官网 -> documentation -> Sqoop User Guide
import 导入数据到集群
export 从集群导出数据
create-hive-table 创建hive表
import-all-tables 指定关系型数据库所有表到集群
list-databases 列出所有数据库
list-tables 列出所有数据库表
merge 合并数据
codegen 获取某张表数据生成JavaBean并打Jar包
(2) import——Sqoop的导入操作:
(3) emport——Sqoop的导出操作:
(4) 列出所有数据库:
(5) 获取数据库表数据生成JavaBean:
(6) 合并hdfs中不同目录下的数据:
感谢你的阅读,相信你对“Linux系统怎么安装sqoop”这一问题有一定的了解,快去动手实践吧,如果想了解更多相关知识点,可以关注天达云网站!小编会继续为大家带来更好的文章!