HDFS迁移参数说明

南墨12个月前技术文章512
  1. HDFS迁移命令如下:

    hadoop distcp -Ddfs.namenode.kerberos.principal.pattern=* -Dmapreduce.job.hdfs-servers.token-renewal.exclude=源集群主nnip,目标集群主nnip -Dmapreduce.task.timeout=1800000 -Dmapreduce.map.memory.mb=4096 -Dmapreduce.job.user.classpath.first=true -libjars */hadoop-distcp*.jar -m 20 -bandwidth 30 -strategy dynamic -prbugpcaxtq -numListstatusThreads 40 -update -append -delete hdfs://源集群主nnIP:端口/路径 hdfs://目标集群主nn节点IP:8020/路径

  2. 命令中涉及参数说明:

    1. dfs.namenode.kerberos.principal.pattern   允许通过身份验证的相关用户,推荐配置*

    2. mapreduce.job.hdfs-servers.token-renewal.exclude token刷新说包含的集群

    3. mapreduce.task.timeout 迁移mr任务超时时间

    4. mapreduce.map.memory.mb 迁移mr任务单个task的gc大小

    5. mapreduce.job.user.classpath.first 针对迁移mr任务优先使用的jar路径

    6. -libjars */hadoop-distcp*.jar 引用的jar包路径

    7. -m 迁移map数

    8. -bandwidth 迁移单个map的带宽

    9. -strategy 迁移模式

    10. -numListstatusThreads 迁移线程数

    11. -update 是否包含更新

    12. -append 是否包含追加

    13. -delete 是否包含删除

    14. -p[rbugpcaxt]

      r: replication number

      b: block size u: user

      g: group

      p: permission

      c: checksum-type

      a: ACL

      x: XAttr

      t: timestamp

相关文章

Wireshark工具使用

Wireshark工具使用

一、介绍wireshark是一款免费、开源的网络抓包工具。项目地址如下:https://github.com/wireshark/wireshark应用如下:1. 网络管理员会使用wireshark来...

Python 装饰器

1、闭包自由变量:未在本地作用域中定义的变量。例如定义在内层函数外的外层函数的作用域中的变量。闭包:就是一个概念,出现在嵌套函数中,指的是内层函数引用到了外层函数的自由变量,就形成了闭包。很多语言都有...

Spark优化之配置参数

Spark优化之配置参数

一、资源参数优化所谓的Spark资源参数调优,其实主要就是对Spark运行过程中各 个使用资源的地方,通过调节各种参数,来优化资源使用的效率,从而提升Spark作业的执行性能。以下参数就是Spark中...

数据湖技术之iceberg(十)Structured Streaming实时写入Iceberg

数据湖技术之iceberg(十)Structured Streaming实时写入Iceberg

目前Spark中Structured Streaming只支持实时向Iceberg中写入数据,不支持实时从Iceberg中读取数据,下面案例我们将使用Structured Streaming从Kafk...

oracle安装实例的响应文件模板解析

位置在:db解压目录下database/response/dbca.rsp###############################################################...

MySQL 评估 ALTER TABLE 进度(5.7)

MySQL 评估 ALTER TABLE 进度(5.7)

一、前言问题:大表里执行 ALTER TABLE 的时候,经常会比较忐忑,会面临 “跑又跑不完 Kill 也不敢 Kill” 的窘境。需求:客户在执行 ALTER TABLE 时也会让我们来评估影响的...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。