Hadoop单词统计

作者: FantJ | 来源:发表于2018-07-29 15:15 被阅读5次

1. 本地创建文本文件

[root@s166 fantj]# mkdir input
[root@s166 fantj]# cd input/
[root@s166 input]# echo "hello fantj" > file1.txt
[root@s166 input]# echo "hello hadoop" > file2.txt
[root@s166 input]# echo "hello mapreduce" > file3.txt
[root@s166 input]# ls
file1.txt  file2.txt  file3.txt

2. 将文件上传到hadoop

[root@s166 input]# hadoop fs -mkdir /wordcount
[root@s166 input]# hadoop fs -ls /
Found 1 items
drwxr-xr-x   - root supergroup          0 2018-07-27 07:51 /wordcount
[root@s166 input]# cd ..
[root@s166 fantj]# ls
download  hadoop  input  jdk
[root@s166 fantj]# hadoop fs -put input/* /wordcount
[root@s166 fantj]# hadoop fs -ls /wordcount
Found 3 items
-rw-r--r--   3 root supergroup         12 2018-07-27 07:52 /wordcount/file1.txt
-rw-r--r--   3 root supergroup         13 2018-07-27 07:52 /wordcount/file2.txt
-rw-r--r--   3 root supergroup         16 2018-07-27 07:52 /wordcount/file3.txt

3. 启用hadoop自带单词统计进行处理

[root@s166 fantj]# cd /home/fantj/hadoop/share/hadoop/
[root@s166 hadoop]# ls
common  hdfs  httpfs  kms  mapreduce  tools  yarn
[root@s166 hadoop]# cd mapreduce/
[root@s166 mapreduce]# ls
hadoop-mapreduce-client-app-2.7.0.jar     hadoop-mapreduce-client-hs-plugins-2.7.0.jar       hadoop-mapreduce-examples-2.7.0.jar
hadoop-mapreduce-client-common-2.7.0.jar  hadoop-mapreduce-client-jobclient-2.7.0.jar        lib
hadoop-mapreduce-client-core-2.7.0.jar    hadoop-mapreduce-client-jobclient-2.7.0-tests.jar  lib-examples
hadoop-mapreduce-client-hs-2.7.0.jar      hadoop-mapreduce-client-shuffle-2.7.0.jar          sources
[root@s166 mapreduce]# hadoop jar hadoop-mapreduce-examples-2.7.0.jar wordcount /wordcount /print

查看结果

[root@s166 mapreduce]# hadoop fs -ls /print
Found 2 items
-rw-r--r--   3 root supergroup          0 2018-07-27 07:55 /print/_SUCCESS
-rw-r--r--   3 root supergroup         37 2018-07-27 07:55 /print/part-r-00000
[root@s166 mapreduce]# hadoop fs -cat /print/part-r-00000
fantj   1
hadoop  1
hello   3
mapreduce   1

相关文章

  • Hadoop单词统计

    1. 本地创建文本文件 2. 将文件上传到hadoop 3. 启用hadoop自带单词统计进行处理 查看结果

  • Hadoop简单单词统计

    WordCount 需求: 在一堆给定的文本文件中统计输出每一个单词出现的总次数 Step 1. 数据格式准备 创...

  • Hadoop中单词统计案例

    文档的源代码地址和软件,需要的下载就可以了(访问密码:7567) https://url56.ctfile.com...

  • Storm设计一个Topology用来统计单词的TopN的实例

    Storm的单词统计设计 一:Storm的wordCount和Hadoop的wordCount实例对比 二:Sto...

  • MR编程实例之单词次数统计

    本文讲解利用MR实现简单的单词统计功能。 创建com.test.hadoop.wordcount包,然后在包中创建...

  • 单词统计

    有一个文本文件,被分成了4份,分别放到了4台服务器中存储 Text1:the weather is goodTex...

  • Hadoop实战之wordcount

    基于linux系统使用hadoop 本文使用hadoop对文本进行单词计数,并输出到本地 启动hadoop 启动s...

  • Hadoop String预备知识

    基础练习: 熟悉Hadoop streaming工作机制,用streaming机制进行词频统计,对Hadoop思想...

  • Hadoop篇(四)——案例:词频统计

    1Hadoop经典案例--词频统计 1.1 Hadoop经典案例:词频统计 这是一个非常经典的例子,几乎在任何的h...

  • MapReduce案例

    一、单词统计 需求分析统计每个单词出现的次数 输入样例 输出样例 示例代码 二、温度统计 需求分析统计每一年的每个...

网友评论

    本文标题:Hadoop单词统计

    本文链接:https://www.haomeiwen.com/subject/gmogmftx.html