HDFS迁移参数说明

南墨1年前技术文章718
  1. HDFS迁移命令如下:

    hadoop distcp -Ddfs.namenode.kerberos.principal.pattern=* -Dmapreduce.job.hdfs-servers.token-renewal.exclude=源集群主nnip,目标集群主nnip -Dmapreduce.task.timeout=1800000 -Dmapreduce.map.memory.mb=4096 -Dmapreduce.job.user.classpath.first=true -libjars */hadoop-distcp*.jar -m 20 -bandwidth 30 -strategy dynamic -prbugpcaxtq -numListstatusThreads 40 -update -append -delete hdfs://源集群主nnIP:端口/路径 hdfs://目标集群主nn节点IP:8020/路径

  2. 命令中涉及参数说明:

    1. dfs.namenode.kerberos.principal.pattern   允许通过身份验证的相关用户,推荐配置*

    2. mapreduce.job.hdfs-servers.token-renewal.exclude token刷新说包含的集群

    3. mapreduce.task.timeout 迁移mr任务超时时间

    4. mapreduce.map.memory.mb 迁移mr任务单个task的gc大小

    5. mapreduce.job.user.classpath.first 针对迁移mr任务优先使用的jar路径

    6. -libjars */hadoop-distcp*.jar 引用的jar包路径

    7. -m 迁移map数

    8. -bandwidth 迁移单个map的带宽

    9. -strategy 迁移模式

    10. -numListstatusThreads 迁移线程数

    11. -update 是否包含更新

    12. -append 是否包含追加

    13. -delete 是否包含删除

    14. -p[rbugpcaxt]

      r: replication number

      b: block size u: user

      g: group

      p: permission

      c: checksum-type

      a: ACL

      x: XAttr

      t: timestamp

相关文章

MySQL 在线开启 GTID

MySQL 在线开启 GTID

描述生产环境上也会遇到需要开启 GTID ,有什么风险?如何在线开启?本篇 SOP 将介绍。GTID 限制由于基于 GTID 复制依赖于事务,所有开启 GTID 时,有些 MySQL 特性不支持:事务...

Linux 文本三剑客 - Grep

grep 是一个最初用于 Unix 操作系统的命令行工具。在给出文件列表或标准输入后,grep 会对匹配一个或多个正则表达式的文本进行搜索,并只输出匹配(或者不匹配)的行或文本。1970 年代,Uni...

Kafka 手动调整分区副本存储

Kafka 手动调整分区副本存储

              在生产环境中,每台服务器的配置和性能不一致,但是Kafka只会根据自己的代码规则创建对应的分区副本,就会导致个别服务器存储压力较大。所有需要手动调整分区副本的存储。测试:创...

数据湖技术之iceberg(十二)Flink与Iceberg整合-SQL API操作

数据湖技术之iceberg(十二)Flink与Iceberg整合-SQL API操作

1.SQL API 创建Iceberg表并写入数据StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnv...

Kubernetes网络模型与CNI网络插件

Kubernetes网络模型与CNI网络插件

在 Flannel 的网络插件中,容器跨主机网络的两种实现方法:UDP 和 VXLAN。它们有一个共性,就是用户的容器都连接在 docker0 网桥上。而网络插件则在宿主机上创建了一个特殊的设备(UD...

 MySQL优化器特性(九)行数评估

MySQL优化器特性(九)行数评估

查询的行数在成本计算中起了很重要的作用:1、row_evaluate_cost和行数直接相关2、需要访问多少索引页面,和行数直接相关。根据页面大小和平均索引条目长度计算每个索引页面的记录数,根据记录数...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。