HDFS迁移参数说明

南墨2年前技术文章1006
  1. HDFS迁移命令如下:

    hadoop distcp -Ddfs.namenode.kerberos.principal.pattern=* -Dmapreduce.job.hdfs-servers.token-renewal.exclude=源集群主nnip,目标集群主nnip -Dmapreduce.task.timeout=1800000 -Dmapreduce.map.memory.mb=4096 -Dmapreduce.job.user.classpath.first=true -libjars */hadoop-distcp*.jar -m 20 -bandwidth 30 -strategy dynamic -prbugpcaxtq -numListstatusThreads 40 -update -append -delete hdfs://源集群主nnIP:端口/路径 hdfs://目标集群主nn节点IP:8020/路径

  2. 命令中涉及参数说明:

    1. dfs.namenode.kerberos.principal.pattern   允许通过身份验证的相关用户,推荐配置*

    2. mapreduce.job.hdfs-servers.token-renewal.exclude token刷新说包含的集群

    3. mapreduce.task.timeout 迁移mr任务超时时间

    4. mapreduce.map.memory.mb 迁移mr任务单个task的gc大小

    5. mapreduce.job.user.classpath.first 针对迁移mr任务优先使用的jar路径

    6. -libjars */hadoop-distcp*.jar 引用的jar包路径

    7. -m 迁移map数

    8. -bandwidth 迁移单个map的带宽

    9. -strategy 迁移模式

    10. -numListstatusThreads 迁移线程数

    11. -update 是否包含更新

    12. -append 是否包含追加

    13. -delete 是否包含删除

    14. -p[rbugpcaxt]

      r: replication number

      b: block size u: user

      g: group

      p: permission

      c: checksum-type

      a: ACL

      x: XAttr

      t: timestamp

相关文章

Docker镜像是有仓库

在Docker中,当我们执行 docker pull xxx 的时候 ,它实际上是从 hub.docker.com 这个地址去查找,这就是 Docker 公司为我们提供的公共仓库。在工作中,我们不可能...

在kubernetes中,让某个node成为专属节点

如何让node 去”选择”只有谁(pod)能部署到自身上面?看了下现有的Node Selectors、Node Affinity、Node Taints, 经过比对,发现Node Taints 更适合...

hdfs短路读

hdfs短路读

原理当客户端执行数据块副本短路读时,Client与DataNode的交互过程具体如下图:含义如下:(1)DFSClient通过requestShortCircuitShm()接口向DataNode请求...

ranger对接metastore

ranger对接metastore

前提:本文前提是基于集群中已经安装部署了ranger组件、hive组件的情况下,增加ranger metastore插件的对接。安装部署1、ranger metastore插件编译插件下载 https...

helm chart包编写

helm chart包编写

相关文档https://helm.sh/zh/docs/charttemplateguide/getting_started/编写helm chart包创建chart包```Plain Text h...

HDFS业务类型与相关架构优化措施

低延迟业务计算密集型业务,低延迟业务,这一类业务通常是对大量NameNode文件目录访问为主的(权限判断,文件存在性,文件信息查询等对NameNode元数据操作为主的)。因此需要针对NameNode的...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。