美文网首页我爱编程
二、HDFS分布式文件系统

二、HDFS分布式文件系统

作者: 薛定谔的猫_1406 | 来源:发表于2018-03-29 15:23 被阅读0次

一、课程内容

二、想当然的分布式文件系统

三、什么是分布式文件系统

HDFS架构 HDFS副本存放策略(Rack指的是机架)

四、HDFS环境搭建之伪分布式安装步骤

修改配置文件

五、JAVA API操作HDFS

5.1 使用IDEA创建maven项目并且引入依赖的jar包

5.2 使用Java API操作HDFS

·

package com.imooc.hadoop.hdfs;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.*;

import org.apache.hadoop.io.IOUtils;

import org.apache.hadoop.util.Progressable;

import org.junit.After;

import org.junit.Before;

import org.junit.Test;

import java.io.BufferedInputStream;

import java.io.File;

import java.io.FileInputStream;

import java.io.InputStream;

import java.net.URI;

/**

* Hadoop HDFS Java API 操作

*/

public class HDFSApp {

    public static final String HDFS_PATH = "hdfs://hadoop000:8020";

    FileSystem fileSystem = null;

    Configuration configuration = null;

    /**

    * 创建HDFS目录

    */

    @Test

    public void mkdir() throws Exception {

        fileSystem.mkdirs(new Path("/hdfsapi/test"));

    }

    /**

    * 创建文件

    */

    @Test

    public void create() throws Exception {

        FSDataOutputStream output = fileSystem.create(new Path("/hdfsapi/test/a.txt"));

        output.write("hello hadoop".getBytes());

        output.flush();

        output.close();

    }

    /**

    * 查看HDFS文件的内容

    */

    @Test

    public void cat() throws Exception {

        FSDataInputStream in = fileSystem.open(new Path("/hdfsapi/test/a.txt"));

        IOUtils.copyBytes(in, System.out, 1024);

        in.close();

    }

    /**

    * 重命名

    */

    @Test

    public void rename() throws Exception {

        Path oldPath = new Path("/hdfsapi/test/a.txt");

        Path newPath = new Path("/hdfsapi/test/b.txt");

        fileSystem.rename(oldPath, newPath);

    }

    /**

    * 上传文件到HDFS

    *

    * @throws Exception

    */

    @Test

    public void copyFromLocalFile() throws Exception {

        Path localPath = new Path("/Users/rocky/data/hello.txt");

        Path hdfsPath = new Path("/hdfsapi/test");

        fileSystem.copyFromLocalFile(localPath, hdfsPath);

    }

    /**

    * 上传文件到HDFS

    */

    @Test

    public void copyFromLocalFileWithProgress() throws Exception {

        InputStream in = new BufferedInputStream(

                new FileInputStream(

                        new File("/Users/rocky/source/spark-1.6.1/spark-1.6.1-bin-2.6.0-cdh5.5.0.tgz")));

        FSDataOutputStream output = fileSystem.create(new Path("/hdfsapi/test/spark-1.6.1.tgz"),

                new Progressable() {

                    public void progress() {

                        System.out.print(".");  //带进度提醒信息

                    }

                });

        IOUtils.copyBytes(in, output, 4096);

    }

    /**

    * 下载HDFS文件

    */

    @Test

    public void copyToLocalFile() throws Exception {

        Path localPath = new Path("/Users/rocky/tmp/h.txt");

        Path hdfsPath = new Path("/hdfsapi/test/hello.txt");

        fileSystem.copyToLocalFile(hdfsPath, localPath);

    }

    /**

    * 查看某个目录下的所有文件

    */

    @Test

    public void listFiles() throws Exception {

        FileStatus[] fileStatuses = fileSystem.listStatus(new Path("/"));

        for(FileStatus fileStatus : fileStatuses) {

            String isDir = fileStatus.isDirectory() ? "文件夹" : "文件";

            short replication = fileStatus.getReplication();

            long len = fileStatus.getLen();

            String path = fileStatus.getPath().toString();

            System.out.println(isDir + "\t" + replication + "\t" + len + "\t" + path);

        }

    }

    /**

    * 删除

    */

    @Test

    public void delete() throws Exception{

        fileSystem.delete(new Path("/"), true);

    }

    @Before

    public void setUp() throws Exception {

        System.out.println("HDFSApp.setUp");

        configuration = new Configuration();

        fileSystem = FileSystem.get(new URI(HDFS_PATH), configuration, "hadoop");

    }

    @After

    public void tearDown() throws Exception {

        configuration = null;

        fileSystem = null;

        System.out.println("HDFSApp.tearDown");

    }

}

·

相关文章

  • 一. 介绍

    一、hadoop介绍 hadoop版本: cdh5.7.0 二、分布式文件系统HDFS 二 HDFS架构 Mast...

  • 大数据Hadoop之HDFS认识

    源自Google的GFS(Google分布式文件系统)论文,分布式文件系统(HDFS)是GFS的克隆版。HDFS负...

  • 关于Hadoop中hdfs架构了解

    hadoop中hdfs的结构图 HDFS:分布式文件系统被设计成适合运行在通用硬件的分布式文件系统。HDFS是一个...

  • 认识Zookeeper

    zookeeper是一个类似hdfs(Hadoop分布式文件系统或HDFS是基于Java的分布式文件系统,允许您在...

  • HDFS基本架构及原理

    HDFS 概述 HDFS(Hadoop Distributed File System,Hadoop分布式文件系统...

  • 大数据基础

    HDFS分布式文件系统 MapReduce分布式计算框架

  • 大数据工具Hadoop快速入门4-HDFS读写教程

    什么是HDFS? 管理跨网络的存储特定操作的文件系统称为分布式文件系统。 HDFS是一种分布式文件系统,用于存储在...

  • HDFS

    一、HDFS简介 Hadoop Distributed filesystem:Hadoop分布式文件系统 HDFS...

  • HDFS分布式文件系统原理及shell的使用

    1. HDFS简介 Hadoop分布式文件系统(HDFS)被设计成适合运行普通pc上的分布式文件系统。总的设计思想...

  • Hadoop HDFS分布式文件系统Docker版

    一、Hadoop文件系统HDFS 构建单节点的伪分布式HDFS 构建4个节点的HDFS分布式系统 nameNode...

网友评论

    本文标题:二、HDFS分布式文件系统

    本文链接:https://www.haomeiwen.com/subject/dfpscftx.html