HDFS迁移参数说明

南墨2年前技术文章987
  1. HDFS迁移命令如下:

    hadoop distcp -Ddfs.namenode.kerberos.principal.pattern=* -Dmapreduce.job.hdfs-servers.token-renewal.exclude=源集群主nnip,目标集群主nnip -Dmapreduce.task.timeout=1800000 -Dmapreduce.map.memory.mb=4096 -Dmapreduce.job.user.classpath.first=true -libjars */hadoop-distcp*.jar -m 20 -bandwidth 30 -strategy dynamic -prbugpcaxtq -numListstatusThreads 40 -update -append -delete hdfs://源集群主nnIP:端口/路径 hdfs://目标集群主nn节点IP:8020/路径

  2. 命令中涉及参数说明:

    1. dfs.namenode.kerberos.principal.pattern   允许通过身份验证的相关用户,推荐配置*

    2. mapreduce.job.hdfs-servers.token-renewal.exclude token刷新说包含的集群

    3. mapreduce.task.timeout 迁移mr任务超时时间

    4. mapreduce.map.memory.mb 迁移mr任务单个task的gc大小

    5. mapreduce.job.user.classpath.first 针对迁移mr任务优先使用的jar路径

    6. -libjars */hadoop-distcp*.jar 引用的jar包路径

    7. -m 迁移map数

    8. -bandwidth 迁移单个map的带宽

    9. -strategy 迁移模式

    10. -numListstatusThreads 迁移线程数

    11. -update 是否包含更新

    12. -append 是否包含追加

    13. -delete 是否包含删除

    14. -p[rbugpcaxt]

      r: replication number

      b: block size u: user

      g: group

      p: permission

      c: checksum-type

      a: ACL

      x: XAttr

      t: timestamp

相关文章

可持续集成工具

可持续集成工具

持续集成中常用的 Jenkins 替代方案。1BuildMaster项目地址:https://inedo.com/buildmasterInedo 的 BuildMaster 是 Jenkins 替代...

Scheduler调度器

一、论 Pod 调度在 kubernetes 中,无论是 Deployment、Statefulset 等多种控制器,它最终都是创建 Pod,在 Pod 创建是需要被调度到 Kubernetes 集群...

kubebuilder 开发operator初探

1、使用kubebuilder初始化$ mkdir project$ cd project$ kubebuilder init --domain tutorial.kubebuilder.io --r...

docker安装及常用操作

docker安装及常用操作

一、安装docker1、移除以前docker相关包sudo yum remove docker \      ...

Pod 资源利用率计算

Pod CPU使用率即在过去的一段时间里进程占用的CPU时间与CPU总时间的比率,如果有多个CPU或者多核,需要将每个CPU的时间相加。container_cpu_usage_seconds_tota...

Docker镜像是有仓库

在Docker中,当我们执行 docker pull xxx 的时候 ,它实际上是从 hub.docker.com 这个地址去查找,这就是 Docker 公司为我们提供的公共仓库。在工作中,我们不可能...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。