Welcome to Scribd!

Wordcount

Uploaded by

21020279 Trần Diệu Anh

0% found this document useful (0 votes)

12 views3 pages

This document provides instructions for running a word count MapReduce job on Hadoop. It involves installing Hadoop and Java, writing a WordCount Java class, compiling the code into a JAR file, and then running the JAR on Hadoop to count the words in a text file and output the results.

Original Description:

hadoop hdfs

Original Title

wordcount

Copyright

Available Formats

TXT, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as TXT, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as txt, pdf, or txt

0% found this document useful (0 votes)

12 views3 pages

Wordcount

Uploaded by

21020279 Trần Diệu Anh

Copyright:

Available Formats

Download as TXT, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as txt, pdf, or txt

Jump to Page

You are on page 1of 3

Search inside document

Demo WordCOunt

1. Make sure Hadoop is installed and running:

✍️ hadoop version

2. Make sure Java is running correctly:

✍️ java -version
✍️ javac -version

3. File WordCount.java :

import java.io.IOException;
import java.util.StringTokenizer;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class WordCount {

public static class TokenizerMapper

extends Mapper<Object, Text, Text, IntWritable>{

private final static IntWritable one = new IntWritable(1);

private Text word = new Text();

public void map(Object key, Text value, Context context

) throws IOException, InterruptedException {
StringTokenizer itr = new StringTokenizer(value.toString());
while (itr.hasMoreTokens()) {
word.set(itr.nextToken());
context.write(word, one);
}
}
}

public static class IntSumReducer

extends Reducer<Text,IntWritable,Text,IntWritable> {
private IntWritable result = new IntWritable();

public void reduce(Text key, Iterable<IntWritable> values,

Context context
) throws IOException, InterruptedException {
int sum = 0;
for (IntWritable val : values) {
sum += val.get();
}
result.set(sum);
context.write(key, result);
}
}

public static void main(String[] args) throws Exception {

Configuration conf = new Configuration();
Job job = Job.getInstance(conf, "word count");
job.setJarByClass(WordCount.class);
job.setMapperClass(TokenizerMapper.class);
job.setCombinerClass(IntSumReducer.class);
job.setReducerClass(IntSumReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(IntWritable.class);
FileInputFormat.addInputPath(job, new Path(args[0]));
FileOutputFormat.setOutputPath(job, new Path(args[1]));
System.exit(job.waitForCompletion(true) ? 0 : 1);
}
}

4. Create new folder:

Demo = (input_data(data.txt) + java_class + WordCount.java)

5. ✍️ export HADOOP_CLASSPATH=$(hadoop classpath)

- Make sure it has been: ✍️ echo $HADOOP_CLASSPATH

6. Create a directory on HDFS:

✍️ hadoop fs -mkdir /<DIRECTORY_NAME>

- And create a directory inside for the input

✍️ hadoop fs -mkdir <HDFS_INPUT_DIRECTORY>

- Upload the input file to that directory:

✍️ hadoop fs -put <INPUT_FILE> <HDFS_INPUT_DIRECTORY>

- Check it go to: localhost:9870

7. Change the current directory to the demo directory

✍️ cd <TUTORIAL_DIRECTORY>

- Compile the java code:

✍️ javac -classpath ${HADOOP_CLASSPATH} -d <CLASSES_FOLDER> <TUTORIAL_JAVAFILE>

Then <CLASSED_FOLDER> has 3 .class files.

- Put the output files in one jar file:

✍️ jar -cvf <JAR_FILE_NAME> -C <CLASSES_FOLDER>/ .
- Now we have the .jar file

8. Run the jar file on Hadoop

✍️ hadoop jar <JAR_FILE> <CLASS_NAME> <HDFS_INPUT_DIRECTORY>
<HDFS_OUTPUT_DIRECTORY>

9. Result:
hadoop dfs -cat <HDFS_OUTPUT_DIRECTORY>/*

Rest Assured Api Testing PDF
Document15 pages
Rest Assured Api Testing PDF
Automation Testing
No ratings yet
Run Wordcount
Document3 pages
Run Wordcount
Khushi Patil
No ratings yet
DSBDA GRP B Print
Document21 pages
DSBDA GRP B Print
tmhrrsmorde
No ratings yet
To Count Using Map and Reduce Program: Wordcount - Java
Document2 pages
To Count Using Map and Reduce Program: Wordcount - Java
Ramya Devi
No ratings yet
Prácticas Bigdata: 1. Lanzar Un Proceso Mapreduce Contra El Cluster
Document3 pages
Prácticas Bigdata: 1. Lanzar Un Proceso Mapreduce Contra El Cluster
Christiam Niño
No ratings yet
BDF Lab1
Document6 pages
BDF Lab1
shaliniiii
No ratings yet
6 - Simple Wordcount
Document2 pages
6 - Simple Wordcount
Xavier TxA
No ratings yet
Hadoop Char Count
Document1 page
Hadoop Char Count
kavya kav
No ratings yet
ADA Lab Manual
Document34 pages
ADA Lab Manual
nalluri_08
No ratings yet
Hadoop WordCount
Document2 pages
Hadoop WordCount
kavya kav
No ratings yet
Installation of Apache Hadoop 2. Word Count Program
Document25 pages
Installation of Apache Hadoop 2. Word Count Program
necn cse-b 2nd-year
No ratings yet
1ST PROGRAM Hadoop
Document5 pages
1ST PROGRAM Hadoop
akshithasonia333
No ratings yet
Map Reduce Example
Document6 pages
Map Reduce Example
Jajang Nurjaman
No ratings yet
BDA3
Document7 pages
BDA3
nikithakatta0
No ratings yet
Customer - 3.java: Import Import Import Import Import Import Import Import
Document15 pages
Customer - 3.java: Import Import Import Import Import Import Import Import
Karthik Raj
No ratings yet
Bda Final 11jan
Document7 pages
Bda Final 11jan
G dileep Kumar
No ratings yet
MapReduce Example
Document3 pages
MapReduce Example
Ravi Chander
No ratings yet
Import Import Import Import Import Import Import Import Public Class Extends Implements Public Void Throws
Document6 pages
Import Import Import Import Import Import Import Import Public Class Extends Implements Public Void Throws
SARAVANAN
No ratings yet
Practical-1: Aim: Hadoop Configuration and Single Node Cluster Setup and Perform File Management Task in
Document61 pages
Practical-1: Aim: Hadoop Configuration and Single Node Cluster Setup and Perform File Management Task in
Parth
No ratings yet
12 CodigoNetbeans
Document5 pages
12 CodigoNetbeans
Miguel Angel
No ratings yet
CS246 TA Session: Hadoop Tutorial: Peyman Kazemian 1/11/2011
Document13 pages
CS246 TA Session: Hadoop Tutorial: Peyman Kazemian 1/11/2011
smitanair143
No ratings yet
Word Count Problem: INT 312 Hargobind Singh
Document18 pages
Word Count Problem: INT 312 Hargobind Singh
Ayush Kumar Gupta
No ratings yet
BDA LabManual
Document20 pages
BDA LabManual
posprojectz
No ratings yet
Map Reduce
Document4 pages
Map Reduce
chetanruparel07aws
No ratings yet
SalesData Map Reduce
Document3 pages
SalesData Map Reduce
bhavana16686
No ratings yet
Big Data
Document25 pages
Big Data
Anu Graphics
No ratings yet
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
Document5 pages
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
riya k
No ratings yet
Step 2 - First MapReduce Program
Document25 pages
Step 2 - First MapReduce Program
Santosh Kumar Desai
No ratings yet
Hadoop
Document19 pages
Hadoop
Ashok Kumar
No ratings yet
BDALab Assn4
Document9 pages
BDALab Assn4
Deepti Agrawal
No ratings yet
Exp 4 Word Count
Document4 pages
Exp 4 Word Count
munish kumar agarwal
No ratings yet
Week 10
Document4 pages
Week 10
THANU SREE
No ratings yet
BDT Lab Manual
Document48 pages
BDT Lab Manual
Vishnu Vardhan H
No ratings yet
Experiment: Word Count in Hadoop
Document12 pages
Experiment: Word Count in Hadoop
SAMINA ATTARI
No ratings yet
Abrir y Guardar Archivo de Texto TXT NetBeans
Document4 pages
Abrir y Guardar Archivo de Texto TXT NetBeans
Alex Retroville
No ratings yet
ContarPalabras Java
Document2 pages
ContarPalabras Java
Yeisson Miranda
No ratings yet
Merge Files Store in A Directory To A File
Document3 pages
Merge Files Store in A Directory To A File
msodhani
No ratings yet
Average of Integer: Driver
Document3 pages
Average of Integer: Driver
niharika sunkara
No ratings yet
Hadoop
Document51 pages
Hadoop
Ravitej Tadinada
No ratings yet
Cloudera Academic Partnership 4 PDF
Document38 pages
Cloudera Academic Partnership 4 PDF
EL MAMOUN ABDELLAH
No ratings yet
Assignment 2-033
Document13 pages
Assignment 2-033
DHARSHANA C P
No ratings yet
WordCount Program Hadoop Task 2
Document7 pages
WordCount Program Hadoop Task 2
20261A6757 VIJAYAGIRI ANIL KUMAR
No ratings yet
Import Import Import Import Import Import Import Import Public Class Extends Implements
Document7 pages
Import Import Import Import Import Import Import Import Public Class Extends Implements
SARAVANAN
No ratings yet
Tutorial-Counting Words in File (S) Using Mapreduce: Prerequisites
Document11 pages
Tutorial-Counting Words in File (S) Using Mapreduce: Prerequisites
saiconze
No ratings yet
Execute Java Map Reduce Sample Using Eclipse
Document9 pages
Execute Java Map Reduce Sample Using Eclipse
Arjun S
No ratings yet
BDALab Assn4
Document9 pages
BDALab Assn4
Deepti Agrawal
No ratings yet
Word Count
Document3 pages
Word Count
niharika sunkara
No ratings yet
Map Reduce
Document3 pages
Map Reduce
Riya Jana
No ratings yet
Bda Experiment 7: Roll No. A-52 Name: Janmejay Patil Class: BE-A Batch: A3 Date of Experiment: Date of Submission Grade
Document8 pages
Bda Experiment 7: Roll No. A-52 Name: Janmejay Patil Class: BE-A Batch: A3 Date of Experiment: Date of Submission Grade
Alka
No ratings yet
TP JMS
Document3 pages
TP JMS
Maïmouna Koné
No ratings yet
Converting
Document4 pages
Converting
vinhxuann
No ratings yet
Big Data - ASSIGNMENT 2
Document15 pages
Big Data - ASSIGNMENT 2
DHARSHANA C P
No ratings yet
Program: Domparser - Java
Document4 pages
Program: Domparser - Java
Janani Shree
No ratings yet
Java Programs
Document31 pages
Java Programs
Raghu Gowda
No ratings yet
Experiment No: 1: Create Different Entities Dynamically
Document43 pages
Experiment No: 1: Create Different Entities Dynamically
vinay Deshmukh
No ratings yet
kODING Perpustakaan
Document14 pages
kODING Perpustakaan
okta
No ratings yet
DBMS Mini Project Report
Document15 pages
DBMS Mini Project Report
Abhijeet
No ratings yet
Consuming An Input File: Michael Hoffman
Document18 pages
Consuming An Input File: Michael Hoffman
KIRAKRATOS
No ratings yet
Big Data
Document67 pages
Big Data
B21A4530 Ashritha
No ratings yet
50 Recipes for Programming Node.js
From Everand
50 Recipes for Programming Node.js
Jamie Munro
Rating: 3 out of 5 stars
3/5 (4)