Hadoop平台Sqoop组件使用示例
来源:互联网 发布:吴雨霏 吴哥窟 知乎 编辑:程序博客网 时间:2024/06/02 12:45
下面是自己学习中实际测试,环境(centOS、Sqoop 1.4.4.2.1.1.0-385、Hive 0.13.0.2.1.1.0-385):
- 查询mysql所有数据库:sqoop list-databases --connect "jdbc:mysql://localhost:3306/" --username root --password 123456
- 查询mysql数据库所有表:sqoop list-tables --connect "jdbc:mysql://localhost:3306/test" --username root --password 123456
- 将mysql的表结构导入到hive中:sqoop create-hive-table --connect "jdbc:mysql://localhost:3306/test" --table status--username root --password 123456 --hive-table status 注:(1)--table status为mysql中的数据库status中的表, --hive-table status为hive中新建的表名称
- 将mysql中的表导入到hive:sqoop import --connect "jdbc:mysql://localhost:3306/test" --username root --password 123456 --table status --hive-import 注:(1)不管hive是否存在status表都会导入成功
- 将hive表导入到mysql中:sqoop export --connect jdbc:mysql://localhost:3306/test --username root --password 123456--table status --export-dir /apps/hive/warehouse/status --input-fields-terminated-by '\001' 注:(1)--export-dir指出hive中status表在hdfs上的存储位置,可以查看hive-site.xml 中由 ${hive.metastore.warehouse.dir} 指定的数据仓库的目录,所有的 Table 数据(不包括 External Table)都保存在这个目录中。 (2)--input-fields-terminated-by 指出hive的表字段分隔符,hive默认分隔符为'\001'。 (3)将hive中的表导入到mysql中时,如果导入的数据的主键和mysql中的主键相同则导入失败(实际测试hadoop执行map-reduce程序执行到map-100%时一直卡主) (4)导出的时候mysql中必须已经存在对应的表
- 将mysql表导入到hdfs中:sqoop import --connect jdbc:mysql://localhost:3306/sqoop_test --username root --password 123456 --table status -m 1 --target-dir /sqoop_mysql_to_hdfs/ 注:(1)-m参数指定是用map数量 (2)--target-dir参数指定存放在hdfs上目的文件目录,使用hadoop fs -cat /sqoop_mysql_to_hdfs/part-m-00000查看HDFS上文件信息
- 将hdfs文件导入到mysql中:sqoop export --connect jdbc:mysql://localhost:3306/sqoop_test --username root --password 123456 --table status --input-fields-terminated-by ',' --export-dir /sqoop_mysql_to_hdfs/part-m-00000 -m 1 注:(1)--input-fields-terminated-by 指出hdfs文件中存储的分隔符,示例查看命令:hadoop fs -cat /sqoop_mysql_to_hdfs/part-m-00000。 (2)将hdfs中的表导入到mysql中时,如果导入的数据的主键和mysql中的主键相同则导入失败(实际测试hadoop执行map-reduce程序执行到map-100%时一直卡主) (3)导出的时候mysql中必须已经存在对应的表
0 0
- Hadoop平台Sqoop组件使用示例
- sqoop使用示例
- hadoop插件sqoop使用案例
- Hadoop-Sqoop
- hadoop(八) - sqoop安装与使用
- 【hadoop sqoop】sqoop1的安装和使用
- hadoop(2): 安装&使用 sqoop
- hadoop中的sqoop工具的使用
- Hadoop集群中sqoop的安装使用
- Mapr 安装hadoop的组件(十)——安装Sqoop
- hadoop平台下的数据导入导出工具Sqoop
- hadoop大数据平台手动搭建(五)-sqoop
- hadoop FileSystem使用示例
- [Sqoop]Sqoop使用
- Sqoop安装与使用(sqoop-1.4.5 on hadoop 1.0.4)
- hadoop学习之sqoop(7):sqoop的安装与使用
- Hadoop入门(三):Sqoop和Hive的使用
- sqoop使用及hadoop 启动时候warning处理
- Android 按字节读写文件
- win7卸载Linux系列系统的方法
- 推荐!国外程序员整理的 C++ 资源大全
- Quartz定时设置
- 寻找最大子序列并输出
- Hadoop平台Sqoop组件使用示例
- 上海软件工程师工资待遇调查
- Android-RecyclerView-Item点击事件设置
- GOOGLE JAVA STYLE
- 技术笔记1_ASP.net:如何让DropDownList之类的单值绑定控件绑定多个字段值
- 黑马程序员--OC--分类
- 如何实现可变参数函数
- Notification
- [第一天]JVM JDK JRE JSE是什么 关系?都有什么用,都怎么样工作的