美文网首页
hive集群迁移

hive集群迁移

作者: 似水之星 | 来源:发表于2019-08-29 13:52 被阅读0次

一、主要任务

1、建立hive表
2、建立分区
3、验证数据
4、配置调度任务
5、校验任务

二、hive建表语句

  • 获取所有hive库所有表的建表语句
#!/bin/bash
rm -rf databases.txt
hive -e " show databases; exit ;"  | grep -v "WARN"> databases
#sleep(2)
rm -rf ./tables/*
for database in `cat databases`
do
  {
  hive -S -e " use $database ;  show tables ; exit ;"  | grep -v "WARN"> ./tables/$database
  rm -rf ./desc_table/$database
  for table in `cat ./tables/$database`
  do
     hive -e "use $database ; show create table $table ;"  | grep -v "WARN">> ./desc_table/$database
  done
  }
done
  • 获取指定库表建表语句
  database=$1
  echo ${database}
  hive -S -e " use $database ;  show tables ; exit ;"  | grep -v "WARN"> ./tables/$database
  rm -rf ./desc_table/$database
  for table in `cat ./tables/$database`
  do
     hive -e "use $database ; show create table $table ;"  | grep -v "WARN">> ./desc_table/$database
  done

三、自动建立分区

MSCK REPAIR TABLE table_name;

使用oozie调度建立分区

  hive -e "ALTER TABLE ods_tidb.${hive_table_name} DROP IF EXISTS partition(dt='${partitions1}');ALTER TABLE ods_tidb.${hive_table_name} ADD partition(dt='${partitions1}') LOCATION '/user/hive/ods_tidb/${hive_table_name}/${partitions1}'"

使用oozie调度建立两个分区

  db_start=1
  db_end=14
  while [ ${db_start} != ${db_end} ]
  do
  mysql_database_name=${db_pre}${db_start} 
  file_name=${mysql_table_name}'.sh'

  #库3是测试库
  if [ ${db_start} != 3 ];then
  hive -e "ALTER TABLE ods_tidb.${hive_table_name} DROP IF EXISTS partition(database_name='${partitions1}',dt='${partitions2}');ALTER TABLE ods_tidb.${hive_table_name} ADD partition(database_name='${partitions1}',dt='${partitions2}') LOCATION '/user/hive/ods_tidb/${hive_table_name}/${partitions1}/${partitions2}'"
  fi

  let "db_start = ${db_start} + 1"

  done


相关文章

  • hdfs文件迁移

    hadoop跨集群之间迁移HDFS数据 不同hadoop集群之间迁移hive数据 hadoop跨集群之间迁移hiv...

  • 一篇文章教你自建hadoop集群迁移到EMR

    自建集群要迁移到EMR集群,往往需要迁移已有数据。本文主要介绍hdfs数据和hive meta数据如何迁移。 前置...

  • hive的这些事(一)——hive数据迁移

    比如需要把生产的hive集群数据迁移到另一个集群,hive提供了2个命令工具,可以实现表的批量迁移。 [expor...

  • hive集群迁移

    一、主要任务 1、建立hive表2、建立分区3、验证数据4、配置调度任务5、校验任务 二、hive建表语句 获取所...

  • hive 跨集群迁移表

    1. export table xxx to '/tmp/xxxx'; 2.hadoop fs - get /tm...

  • CDH集群间的数据迁移方案

    目前不同公司多多少少存在Hive数据库在不同集群间的数据迁移需求,我们只要在CDH新版本集群搭建完成之后,即可进...

  • Spark版本升级二三事

    起因:部门准备将数据仓库开发工具从Hive SQL大规模迁移至Spark SQL。此前集群已经自带了Spark-1...

  • 集群之间hive表数据迁移

    前言 这几天在做集群之间的hive表数据迁移,方法比较笨,但是亲测有效,能够实现预期目标。 操作流程 1、在本地集...

  • Hive 安装

    安装 Hadoop 集群 参考 Docker Hadoop 集群搭建 下载 Hive Hive下载地址本实例下载版...

  • Hive分区表跨集群迁移

    (1)先从集群1使用hadoop fs -get将文件下载到本地磁盘(2)再使用hadoop fs -put将数据...

网友评论

      本文标题:hive集群迁移

      本文链接:https://www.haomeiwen.com/subject/riybectx.html