Welcome to Scribd!

Experiment: Word Count in Hadoop

Uploaded by

0% found this document useful (0 votes)

7 views12 pages

This document provides instructions for running a word count experiment using Hadoop: 1. Create a Java project in Eclipse called wordCountJob with classes for wordcount, wordMapper, and wordReducer that contain code for a word count MapReduce job. 2. Add the necessary Hadoop jar files to the project build path. 3. Export the project as a jar file called wordCount.jar, copy sample input text to the src folder, and run the jar file, specifying input and output directories.

Original Description:

Original Title

wordcount-converted

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

0% found this document useful (0 votes)

7 views12 pages

Experiment: Word Count in Hadoop

Uploaded by

SAMINA ATTARI

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

Jump to Page

You are on page 1of 12

Search inside document

EXPERIMENT : WORD COUNT IN HADOOP

1. Go to eclipse and create new -> java project -> wordCountJob

2. Right click on project wordCountJob -> new -> class

Name the classes : 1. wordcount

2.wordMapper
3. wordReducer
Copy paste the following codes in these files

Prog 1 : WordCount .java

import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.mapreduce.Job;

public class wordCount

{
public static void main(String[] args) throws Exception
{
if (args.length != 2)
{
System.out.printf("Usage: WordCount <input dir> <output
dir>\n");
System.exit(-1);
}
Job job = new Job();
job.setJarByClass(wordCount.class);
job.setJobName("wordCount");
FileInputFormat.setInputPaths(job, new Path(args[0]));
FileOutputFormat.setOutputPath(job, new Path(args[1]));
job.setMapperClass(wordMapper.class);
job.setReducerClass(wordReducer.class);
job.setMapOutputKeyClass(Text.class);
job.setMapOutputValueClass(IntWritable.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(IntWritable.class);
boolean success = job.waitForCompletion(true);
System.exit(success ? 0 : 1);
}
}
Prog 2 : WordMapper.java

import java.io.IOException;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;
public class wordMapper extends Mapper<LongWritable, Text, Text,
IntWritable>
{
@Override
public void map(LongWritable key, Text value, Context context)
throws IOException, InterruptedException
{
String line = value.toString();
for (String word : line.split("\\W+"))
{
if (word.length() > 0)
context.write(new Text(word), new
IntWritable(1));
}
}
}
Program 3 : WordReducer.java

import java.io.IOException;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;
public class wordReducer extends Reducer<Text, IntWritable, Text,
IntWritable>
{
@Override
public void reduce(Text key, Iterable<IntWritable> values, Context
context) throws IOException, InterruptedException
{
int wordCount = 0;
for (IntWritable value : values)
wordCount += value.get();
context.write(key, new IntWritable(wordCount));
}
}

3. Right click on wordCountJob -> build path -> add external

archives
Go to file system-> usr-> lib->hadoop-> click on the selected file
shown in below fig
Add this one too

Go to mozilla firefox and type Hadoop core 1.2.1 jar download -

> download the first one below
Add this like the previous jar files to the project path(right click
project->build path->external archives->downloads)

4. Right click wordCountJob-> export->JAVA->jar file

Name the file wordCount.jar and click finish
5. Copy paste this inside your wordCountJob-> src folder from
your workspace(very important step, don’t miss this!)

6. Open terminal and go into src

7. Create a text file sample.txt inside your src folder and type
content of your choice

Listing contents of file

8. Run the jar file with the below command(sampleoutdir is to

take our output)
9. List contents of sampleoutdir.

CS1702 Worksheet 7 - Built in Functions and Methods v1 (2022-2023)
Document8 pages
CS1702 Worksheet 7 - Built in Functions and Methods v1 (2022-2023)
John Moursy
No ratings yet
E-Commerce Website: Major Project Report
Document19 pages
E-Commerce Website: Major Project Report
Akash Negi
No ratings yet
Cracking Software 0418
Document38 pages
Cracking Software 0418
aaabbb
100% (3)
Import Import Import Import Import Import Import Import Public Class Extends Implements Public Void Throws
Document6 pages
Import Import Import Import Import Import Import Import Public Class Extends Implements Public Void Throws
SARAVANAN
No ratings yet
Steps: /usr/lib/hadoop-0.20/ Usr/lib/hadoop-0.20/lib
Document4 pages
Steps: /usr/lib/hadoop-0.20/ Usr/lib/hadoop-0.20/lib
Karthick Jothivel
No ratings yet
Part B Assignment - No - 1
Document6 pages
Part B Assignment - No - 1
opscoldy
No ratings yet
Developing A Simple Map-Reduce Program For Hadoop: Big Data Course CS6350 Professor: Dr. Latifur Khan
Document22 pages
Developing A Simple Map-Reduce Program For Hadoop: Big Data Course CS6350 Professor: Dr. Latifur Khan
Kaushal Prajapati
No ratings yet
Practical-1: Aim: Hadoop Configuration and Single Node Cluster Setup and Perform File Management Task in
Document61 pages
Practical-1: Aim: Hadoop Configuration and Single Node Cluster Setup and Perform File Management Task in
Parth
No ratings yet
Run Wordcount
Document3 pages
Run Wordcount
Khushi Patil
No ratings yet
BDA Lab 8 Manual
Document7 pages
BDA Lab 8 Manual
Mydah Nasir
No ratings yet
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
Document5 pages
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
riya k
No ratings yet
Step 2 - First MapReduce Program
Document25 pages
Step 2 - First MapReduce Program
Santosh Kumar Desai
No ratings yet
Wordcount
Document3 pages
Wordcount
21020279 Trần Diệu Anh
No ratings yet
BDT Lab Manual
Document48 pages
BDT Lab Manual
Vishnu Vardhan H
No ratings yet
DSBDA GRP B Print
Document21 pages
DSBDA GRP B Print
tmhrrsmorde
No ratings yet
Import Import Import Import Import Import Import Import Public Class Extends Implements
Document7 pages
Import Import Import Import Import Import Import Import Public Class Extends Implements
SARAVANAN
No ratings yet
12 CodigoNetbeans
Document5 pages
12 CodigoNetbeans
Miguel Angel
No ratings yet
MapReduce Word Count Program
Document6 pages
MapReduce Word Count Program
shaliniiii
No ratings yet
Lab Manual
Document86 pages
Lab Manual
pthuynh709
No ratings yet
Tutorial-Counting Words in File (S) Using Mapreduce: Prerequisites
Document11 pages
Tutorial-Counting Words in File (S) Using Mapreduce: Prerequisites
saiconze
No ratings yet
BDA3
Document7 pages
BDA3
nikithakatta0
No ratings yet
Bda Final 11jan
Document7 pages
Bda Final 11jan
G dileep Kumar
No ratings yet
CC Hadoop Lab
Document6 pages
CC Hadoop Lab
Claudia Ardelean
No ratings yet
Lab2 WC
Document2 pages
Lab2 WC
wisesharkwhale
No ratings yet
BDM Lab Manual 2
Document4 pages
BDM Lab Manual 2
Vijay Mano
No ratings yet
Exp 4 Word Count
Document4 pages
Exp 4 Word Count
munish kumar agarwal
No ratings yet
Execute Java Map Reduce Sample Using Eclipse
Document9 pages
Execute Java Map Reduce Sample Using Eclipse
Arjun S
No ratings yet
WordCount Program Hadoop Task 2
Document7 pages
WordCount Program Hadoop Task 2
20261A6757 VIJAYAGIRI ANIL KUMAR
No ratings yet
Map Reduce Example
Document6 pages
Map Reduce Example
Jajang Nurjaman
No ratings yet
Big Data Manual
Document19 pages
Big Data Manual
Madhubala J
No ratings yet
Activity 2
Document31 pages
Activity 2
patilbhavesh991209
No ratings yet
LMS
Document34 pages
LMS
SurajYT Vlogs
No ratings yet
Bda Experiment 7: Roll No. A-52 Name: Janmejay Patil Class: BE-A Batch: A3 Date of Experiment: Date of Submission Grade
Document8 pages
Bda Experiment 7: Roll No. A-52 Name: Janmejay Patil Class: BE-A Batch: A3 Date of Experiment: Date of Submission Grade
Alka
No ratings yet
Hadoop Administrator Training - Lab Hand Book
Document12 pages
Hadoop Administrator Training - Lab Hand Book
debkrc
No ratings yet
ADA Lab Manual
Document34 pages
ADA Lab Manual
nalluri_08
No ratings yet
@bigdatalabfile 09
Document35 pages
@bigdatalabfile 09
goatrip2024
No ratings yet
Palak
Document10 pages
Palak
Dolly Mehra
No ratings yet
Bda Lab
Document47 pages
Bda Lab
pawan
No ratings yet
Practical No 8 (C)
Document3 pages
Practical No 8 (C)
jenni koko
No ratings yet
Tut 3
Document4 pages
Tut 3
Huy Trần Quang
No ratings yet
BDA4
Document7 pages
BDA4
nikithakatta0
No ratings yet
6 - Simple Wordcount
Document2 pages
6 - Simple Wordcount
Xavier TxA
No ratings yet
OOP Lab01 EnvironmentSetup&JavaBasics
Document17 pages
OOP Lab01 EnvironmentSetup&JavaBasics
Viet Le
No ratings yet
Cloudera Academic Partnership 4 PDF
Document38 pages
Cloudera Academic Partnership 4 PDF
EL MAMOUN ABDELLAH
No ratings yet
Experiment No: 1: Create Different Entities Dynamically
Document43 pages
Experiment No: 1: Create Different Entities Dynamically
vinay Deshmukh
No ratings yet
MA Journal
Document35 pages
MA Journal
Rohit Miryala
No ratings yet
Hive User Defined Functions: Step 1: Code
Document5 pages
Hive User Defined Functions: Step 1: Code
ritesh_aladdin
No ratings yet
Mean Stack Questions
Document71 pages
Mean Stack Questions
suneel sekhar
No ratings yet
Hadoop WordCount
Document2 pages
Hadoop WordCount
kavya kav
No ratings yet
BDA LabManual
Document20 pages
BDA LabManual
posprojectz
No ratings yet
How To Install Java Onto Your System: Java Platform (JDK) 7 Jdk-7-Windows-I586.exe
Document7 pages
How To Install Java Onto Your System: Java Platform (JDK) 7 Jdk-7-Windows-I586.exe
Ajay Kumar
No ratings yet
Apache Ant Tampa JUG
Document17 pages
Apache Ant Tampa JUG
Sabapathy Kannappan
No ratings yet
Big Data Fundamentals and Platforms Assginment 3
Document6 pages
Big Data Fundamentals and Platforms Assginment 3
sagar srivastava
No ratings yet
AJLabEx1to6 Without Border
Document18 pages
AJLabEx1to6 Without Border
Dhyaneshwar
No ratings yet
Big Data
Document25 pages
Big Data
Anu Graphics
No ratings yet
Java Native Methods
Document29 pages
Java Native Methods
Gopal Reddy Karri
No ratings yet
Exp 12
Document3 pages
Exp 12
Jayanth Ranga
No ratings yet
1-Implementing A Java Program
Document13 pages
1-Implementing A Java Program
pratigya g
No ratings yet
Big Data
Document23 pages
Big Data
Yashika Singh
No ratings yet
Java and Project Delivery: E&CE 250 Winter 2002
Document21 pages
Java and Project Delivery: E&CE 250 Winter 2002
shiansa
No ratings yet
Inspiring Powershell Articles
From Everand
Inspiring Powershell Articles
Murat Yildirimoglu
No ratings yet
Report
Document69 pages
Report
SAMINA ATTARI
No ratings yet
Data Leakage Detection
Document5 pages
Data Leakage Detection
SAMINA ATTARI
No ratings yet
Black Book
Document49 pages
Black Book
SAMINA ATTARI
No ratings yet
Sqoop Implementation Revised
Document7 pages
Sqoop Implementation Revised
SAMINA ATTARI
No ratings yet
17 19 HMMs
Document23 pages
17 19 HMMs
SAMINA ATTARI
No ratings yet
Using Sqooptool To Transfer Data Between Hadoop and Mysql: Implementation
Document4 pages
Using Sqooptool To Transfer Data Between Hadoop and Mysql: Implementation
SAMINA ATTARI
No ratings yet
CFD Analysis of Single Stage Pulse Tube Cryocooler
Document36 pages
CFD Analysis of Single Stage Pulse Tube Cryocooler
SAMINA ATTARI
No ratings yet
Machine Learning Lab Manual
Document43 pages
Machine Learning Lab Manual
SAMINA ATTARI
No ratings yet
Hbase Commands: Create ',' '
Document7 pages
Hbase Commands: Create ',' '
SAMINA ATTARI
No ratings yet
Practical-02 PC
Document12 pages
Practical-02 PC
SAMINA ATTARI
No ratings yet
Digital Image Processing Lab Experiment-1 Aim: Gray-Level Mapping Apparatus Used
Document21 pages
Digital Image Processing Lab Experiment-1 Aim: Gray-Level Mapping Apparatus Used
SAMINA ATTARI
No ratings yet
Internship Report Performance Analysis of Cryogenic Adsorber System
Document47 pages
Internship Report Performance Analysis of Cryogenic Adsorber System
SAMINA ATTARI
No ratings yet
Stock Market Prediction: Santa Clara University
Document44 pages
Stock Market Prediction: Santa Clara University
SAMINA ATTARI
No ratings yet
Experiment No. 6 Aim: To Learn Basics of Openmp Api (Open Multi-Processor Api) Theory What Is Openmp?
Document6 pages
Experiment No. 6 Aim: To Learn Basics of Openmp Api (Open Multi-Processor Api) Theory What Is Openmp?
SAMINA ATTARI
No ratings yet
Mansi Kadam PC Lab Assignment 1
Document4 pages
Mansi Kadam PC Lab Assignment 1
SAMINA ATTARI
No ratings yet
L7 Candidate Elimination PDF
Document5 pages
L7 Candidate Elimination PDF
SAMINA ATTARI
No ratings yet
Maker's Square GUIDELINES 2017
Document5 pages
Maker's Square GUIDELINES 2017
SAMINA ATTARI
No ratings yet
Practical 1P: Parallel Computing Lab Name: Dhruv Shah Roll - No:201080901 Batch: IV
Document3 pages
Practical 1P: Parallel Computing Lab Name: Dhruv Shah Roll - No:201080901 Batch: IV
SAMINA ATTARI
No ratings yet
Parallel Computing Lab Manual PDF
Document51 pages
Parallel Computing Lab Manual PDF
SAMINA ATTARI
No ratings yet
Assignment 4: Rachana Chaudhari 171081014 Ty Btech It
Document4 pages
Assignment 4: Rachana Chaudhari 171081014 Ty Btech It
SAMINA ATTARI
No ratings yet
Anomaly Detection of Android Malware Using One-Class K-Nearest Neighbours (OC-KNN)
Document12 pages
Anomaly Detection of Android Malware Using One-Class K-Nearest Neighbours (OC-KNN)
SAMINA ATTARI
No ratings yet
Combinepdf
Document45 pages
Combinepdf
SAMINA ATTARI
No ratings yet
Hospital Management System Database Project 1
Document1 page
Hospital Management System Database Project 1
SAMINA ATTARI
No ratings yet
Technical Paper Technical Paper Presentation Presentation: What's at Stake - Rewards and Prizes
Document4 pages
Technical Paper Technical Paper Presentation Presentation: What's at Stake - Rewards and Prizes
SAMINA ATTARI
No ratings yet
Mahendra Yadav
Document4 pages
Mahendra Yadav
Raj Mandloi
No ratings yet
Chapter 3 Questions
Document6 pages
Chapter 3 Questions
Mariam Heikal
No ratings yet
The OTRS Comparison.: Features. Services. Requirements
Document18 pages
The OTRS Comparison.: Features. Services. Requirements
Perico
No ratings yet
Sharmila Krishnappa Resume
Document2 pages
Sharmila Krishnappa Resume
KaranMPai
No ratings yet
Berg 1998
Document3 pages
Berg 1998
Klaas van den Berg
No ratings yet
Database Programming With PL/SQL 1-1: Practice Activities
Document2 pages
Database Programming With PL/SQL 1-1: Practice Activities
Pop Ana
No ratings yet
61bdbf675e77f - Spreadsheet By-Shyam Gopal Timsina
Document16 pages
61bdbf675e77f - Spreadsheet By-Shyam Gopal Timsina
Anuska Thapa
No ratings yet
SQL Exam 6
Document20 pages
SQL Exam 6
gk.mobm33
No ratings yet
Use Case Modeling
Document31 pages
Use Case Modeling
pacharneajay
No ratings yet
FPL-I Lab Manual Final (10!6!15)
Document71 pages
FPL-I Lab Manual Final (10!6!15)
Shubham Patil
No ratings yet
Sharepoint: Beginner Training
Document29 pages
Sharepoint: Beginner Training
Yeifry Aguasvivas
No ratings yet
2 Bca Foxpro
Document3 pages
2 Bca Foxpro
wishpond
No ratings yet
University of Kashmir: Asmat Ara
Document4 pages
University of Kashmir: Asmat Ara
Asmat Ara
No ratings yet
Unit 3. Software
Document2 pages
Unit 3. Software
Ethan Goober
No ratings yet
Playing Sounds With AS3: Introduction To Sound Related Classes
Document6 pages
Playing Sounds With AS3: Introduction To Sound Related Classes
mame Magnaw
No ratings yet
Macros
Document35 pages
Macros
Manoj Bojja
No ratings yet
CV - Nguyễn Đình Quý
Document1 page
CV - Nguyễn Đình Quý
khanhnam
No ratings yet
Hadoop
Document7 pages
Hadoop
Mayank Rai
No ratings yet
AtomMotion Manual V1.0
Document211 pages
AtomMotion Manual V1.0
Adrian Melero
100% (1)
Anisation Systems
Document17 pages
Anisation Systems
Venkat Krishna
No ratings yet
Java Script Meterial
Document164 pages
Java Script Meterial
pavan Mamidanna
No ratings yet
Analyzing Microsoft Office Documents
Document10 pages
Analyzing Microsoft Office Documents
The Hungry Quokka
No ratings yet
How To Configure Listeners in Websphere Using TOCF (EE)
Document27 pages
How To Configure Listeners in Websphere Using TOCF (EE)
Nett2k
No ratings yet
Mystic
Document218 pages
Mystic
Mohit Gupta
No ratings yet
PDF Cocoa Programming For Os X The Big Nerd Ranch Guide 5 E Fifth Edition Online Ausg Chandler Ebook Full Chapter
Document53 pages
PDF Cocoa Programming For Os X The Big Nerd Ranch Guide 5 E Fifth Edition Online Ausg Chandler Ebook Full Chapter
dot.beitel948
100% (4)
Sudarshan H L: Objective
Document1 page
Sudarshan H L: Objective
PoovaiahkkNishan
100% (1)
Imperative To Functional Programming Succinctly
Document101 pages
Imperative To Functional Programming Succinctly
Iacob Razvan
100% (1)
Maghfiroh Izzani Maulani MQTT
Document24 pages
Maghfiroh Izzani Maulani MQTT
Andi Septiana
No ratings yet