Java-API对HDFS的操作（IDEA版）

芒果2年前 (2023-11-07)技术文章1161

前期工作

首先就是安装maven

在win系统下不配置hadoop环境，直接运行代码会报错，显示缺少winutils.exe 和 hadoop.dll 两个文件

首先添加pom.xml文件

<groupId>org.apache.hadoop</groupId>

<artifactId>hadoop-common</artifactId>

</dependency>

<groupId>org.apache.hadoop</groupId>

<artifactId>hadoop-hdfs</artifactId>

</dependency>

<groupId>org.apache.hadoop</groupId>

<artifactId>hadoop-client</artifactId>

</dependency>

<groupId>junit</groupId>

<artifactId>junit</artifactId>

<version>RELEASE</version>

</dependency>

</dependencies>

</project>

创建一个HDFSJavaAPI的类

创建目录

package com.hdfsdemo;

import java.io.BufferedInputStream;

import java.io.FileInputStream;

import java.io.InputStream;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FSDataOutputStream;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IOUtils;

import org.apache.hadoop.util.Progressable;

/**

* HDFS Java API文件操作

public class HDFSJavaAPI {

public static void main(String[] args) throws Exception {

System.setProperty("HADOOP_USER_NAME", "root");

createDir();

createFile();

outFile();

deleteFile();

copyFromLocalFile();

copyToLocalFile();

updateFlileProgress();

deleteFile();

}

/**

* 定义创建目录方法

public static void createDir() throws Exception {

Configuration conf = new Configuration();

conf.set("fs.default.name", "hdfs://172.16.121.194:8020");

FileSystem hdfs = FileSystem.get(conf);

// 创建目录

boolean isok = hdfs.mkdirs(new Path("hdfs:/mydir"));

if (isok) {

System.out.println("创建目录成功!");

} else {

System.out.println("创建目录失败！");

}

hdfs.close();

}

/**

* 定义创建文件方法

public static void createFile() throws Exception {

Configuration conf = new Configuration();

conf.set("fs.default.name", "hdfs://172.16.121.194:8020");

FileSystem fs = FileSystem.get(conf);

// 打开一个输出流

FSDataOutputStream outputStream = fs.create(new Path(

"hdfs:/newfile2.txt"));

// 写入文件内容

outputStream.write("我是文件内容1\n我是文件内容2\n我是文件内容3".getBytes());

outputStream.close();

fs.close();

System.out.println("文件创建成功！");

}

// 删除文件

public static void deleteFile() throws Exception {

Configuration conf = new Configuration();

conf.set("fs.default.name", "hdfs://172.16.121.194:8020");

FileSystem fs = FileSystem.get(conf);

Path path = new Path("hdfs:/newfile2.txt");

boolean isok = fs.deleteOnExit(path);

if (isok) {

System.out.println("删除成功!");

} else {

System.out.println("删除失败！");

}

fs.close();

}

// 复制上传本地文件

public static void copyFromLocalFile() throws Exception {

// 1.创建配置器

Configuration conf = new Configuration();

conf.set("fs.default.name", "hdfs://172.16.121.194:8020");

// 2.取得FileSystem文件系统实例

FileSystem fs = FileSystem.get(conf);

// 3.创建可供hadoop使用的文件系统路径

Path src = new Path("D:/copy_test.txt"); // 本地目录/文件

Path dst = new Path("hdfs:/"); // 目标目录/文件

// 4.拷贝上传本地文件（本地文件，目标路径）至HDFS文件系统中

fs.copyFromLocalFile(src, dst);

System.out.println("文件上传成功!");

}

// 监控文件上传进度

public static void updateFlileProgress() throws Exception {

Configuration conf = new Configuration();

conf.set("fs.default.name", "hdfs://172.16.121.194:8020");

InputStream in = new BufferedInputStream(

new FileInputStream("D:/soft/test.zip"));

FileSystem fs = FileSystem.get(conf);

//上传文件并监控上传进度

FSDataOutputStream outputStream = fs.create(new Path("hdfs:/test.zip"),

new Progressable() {

public void progress() {//回调方法显示进度

System.out.print(".");

}

});

IOUtils.copyBytes(in, outputStream, 4096, false);

}

// 复制下载文件

public static void copyToLocalFile() throws Exception {

// 1.创建配置器

Configuration conf = new Configuration();

conf.set("fs.default.name", "hdfs://172.16.121.194:8020");

// 2.取得FileSystem文件系统实例

FileSystem fs = FileSystem.get(conf);

// 3.创建可供hadoop使用的文件系统路径

Path src = new Path("hdfs:/newfile2.txt");// 目标目录/文件

Path dst = new Path("D:/new.txt"); // 本地目录/文件

// 4.从HDFS文件系统中拷贝下载文件（目标路径，本地文件）至本地

// fs.copyToLocalFile(src, dst);

fs.copyToLocalFile(false, src, dst, true);

System.out.println("文件下载成功!");

}

// 查看文件内容并输出

public static void outFile() throws Exception {

// 1.创建配置器

Configuration conf = new Configuration();

conf.set("fs.default.name", "hdfs://172.16.121.194:8020");

// 2.取得FileSystem文件系统实例

FileSystem fs = FileSystem.get(conf);

InputStream in = fs.open(new Path("hdfs:/newfile2.txt"));

IOUtils.copyBytes(in, System.out, 4096, false);

IOUtils.closeStream(in);

}

上面代码中的参数"hdfs://hadoop1:8020"是hadoop配置文件中core-site.xml的配置信息:fs.defaultFS，

例如要创建一个.txt文件

只需要调用createFile();

例如调用上传文件只需要调用copyFromLocalFile();

标签: 大数据运维

返回列表

上一篇：mysql8 rpm安装教程

下一篇：oracle数据库日志清理

使用Sqoop将数据从Hive导入MySQL（一）

使用Sqoop将数据从Hive导入MySQL首先查看csv数据类型创建类似的hive表并导入数据CREATE TABLE data ( province STRING, code INT,...

Sentry管理Hive目录acl -setacl不生效

CDH在启动Sentry后/user/hive/warehouse这个目录 hdfs手动setacl会不生效首先确保hdfs参数dfs.namenode.acls.enabled=true；还有另一个...

CDH实操--客户端安装

概述安装CDH客户端，主要是方便在CDH部署节点以外，通过客户端的方式连接CDH上的hdfs，hive和hbase服务1、安装jdk（适配CDH即可，一般1.8）2、获取安装包3、部署安装包把安装包解...

大数据高可用系列--kudu高可用应急方案

1 设置机架感知1.1 前置说明 1.9版本后的kudu已经支持机架感知（cdh6之后的版本中的kudu已支持），由于kudu的每个Tablet一般是三副...

Gartner权威报告解读｜应用可观测性列为2023年重要战略技术趋势！

Gartner于今日发布企业机构在2023年需要探索的十大战略技术趋势。Gartner杰出研究副总裁Frances Karamouzis表示：“为了在经济动荡时期增加企业机构的盈利，首席信息官和IT高...

Hive 重新编译-解决Tez JobName的问题

本文采用linux编译首先下载源码https://dlcdn.apache.org/hive/hive-3.1.2/apache-hive-3.1.2-src.tar.gz源码位置ql/src/jav...

Java-API对HDFS的操作（IDEA版）

相关文章

使用Sqoop将数据从Hive导入MySQL（一）

Sentry管理Hive目录acl -setacl不生效

CDH实操--客户端安装

大数据高可用系列--kudu高可用应急方案

Gartner权威报告解读｜应用可观测性列为2023年重要战略技术趋势！

Hive 重新编译-解决Tez JobName的问题

发表评论

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号

Java-API对HDFS的操作（IDEA版）

相关文章

使用Sqoop将数据从Hive导入MySQL（一）

Sentry管理Hive目录acl -setacl不生效

CDH实操--客户端安装

大数据高可用系列--kudu高可用应急方案

Gartner权威报告解读｜应用可观测性列为2023年重要战略技术趋势！

Hive 重新编译-解决Tez JobName的问题

发表评论 取消回复

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?dcf8139ce75b768b71dccc5e589b983c"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

发表评论

©Copyrights 2016-2022 YUNCHE 浙ICP备2021017017号