|
Apache Sqoop是一种用于Apache Hadoop与关系型数据库之间结构化、非结构化数据转换的工具,它是Java语言编写的数据迁移开源工具。我们可以通过Sqoop这个工具实现传统的关系型数据库(RDBMS)与Hadoop平台的数据迁移,即一方面,通过Sqoop工具可以从传统关系型数据库将数据导入到Hadoop平台中,其中导入的数据可以供给MapReduce程序使用,也可以给其他Hadoop组件(HBase、Hive等)使用;另一方面,通过在Hadoop平台中对数据进行分析后可再次通过Sqoop工具将分析结果导回到关系数据库中。Sqoop工具专为大数据迁移到Hadoop平台进行设计,其工作模式通过划分数据集并创建Hadoop任务进行数据迁移。目前,任何一个支持JDBC规范的传统关系型数据库都可以使用Sqoop工具进行数据迁移,如Oracle、MySQL、SQL Server和DB2等数据库。同时,Sqoop具有容错性,是Hadoop生态系统中不可分割的一部分,有助于Hadoop平台与传统关系型数据库之间的数据传输。 【出处】刘丽敏,廖志芳,周筠.大数据采集与预处理技术,中南大学出版社,2018年12月第1版.
|