Welcome to Scribd!

BDF Lab1

Uploaded by

0% found this document useful (0 votes)

8 views6 pages

This document contains the code for a word count program written in Java using Hadoop MapReduce. The program takes input text from a file, splits it into words using a tokenizer, maps each word to a count of 1, combines the counts, and reduces to a final count by summing the values for each word. It defines mapper and reducer classes to implement the word counting logic and main runs a MapReduce job, specifying the input/output paths and classes to use.

Original Description:

Original Title

BDF LAB1

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

0% found this document useful (0 votes)

8 views6 pages

BDF Lab1

Uploaded by

shaliniiii

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

Jump to Page

You are on page 1of 6

Search inside document

Word Count Program

import java.io.IOException;

import java.util.*;

import java.util.StringTokenizer;

import org.apache.hadoop.conf.*;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.*;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.*;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;

public class WordCount {

public static class TokenizerMapper

extends Mapper<Object, Text, Text, IntWritable>{

private final static IntWritable one = new IntWritable(1);

private Text word = new Text();

public void map(Object key, Text value, Context context

) throws IOException, InterruptedException {

StringTokenizer itr = new StringTokenizer(value.toString());

while (itr.hasMoreTokens()) {

word.set(itr.nextToken());

context.write(word, one);

public static class IntSumReducer

extends Reducer<Text,IntWritable,Text,IntWritable> {

private IntWritable result = new IntWritable();

public void reduce(Text key, Iterable<IntWritable> values,

Context context

) throws IOException, InterruptedException {

int sum = 0;

for (IntWritable val : values) {

sum += val.get();

result.set(sum);

context.write(key, result);

public static void main(String[] args) throws Exception {

Configuration conf = new Configuration();

Job job = Job.getInstance(conf, "word count");

job.setJarByClass(WordCount.class);

job.setMapperClass(TokenizerMapper.class);

job.setCombinerClass(IntSumReducer.class);

job.setReducerClass(IntSumReducer.class);
job.setOutputKeyClass(Text.class);

job.setOutputValueClass(IntWritable.class);

FileInputFormat.addInputPath(job, new Path(args[0]));

FileOutputFormat.setOutputPath(job, new Path(args[1]));

System.exit(job.waitForCompletion(true) ? 0 : 1);

Stung With Love (Sappho)
Document105 pages
Stung With Love (Sappho)
shaliniiii
No ratings yet
Rest Assured Api Testing PDF
Document15 pages
Rest Assured Api Testing PDF
Automation Testing
No ratings yet
6 - Simple Wordcount
Document2 pages
6 - Simple Wordcount
Xavier TxA
No ratings yet
To Count Using Map and Reduce Program: Wordcount - Java
Document2 pages
To Count Using Map and Reduce Program: Wordcount - Java
Ramya Devi
No ratings yet
Wordcount
Document3 pages
Wordcount
21020279 Trần Diệu Anh
No ratings yet
ADA Lab Manual
Document34 pages
ADA Lab Manual
nalluri_08
No ratings yet
MapReduce Example
Document3 pages
MapReduce Example
Ravi Chander
No ratings yet
Word Count
Document3 pages
Word Count
niharika sunkara
No ratings yet
Bda Final 11jan
Document7 pages
Bda Final 11jan
G dileep Kumar
No ratings yet
DSBDA GRP B Print
Document21 pages
DSBDA GRP B Print
tmhrrsmorde
No ratings yet
ContarPalabras Java
Document2 pages
ContarPalabras Java
Yeisson Miranda
No ratings yet
Prácticas Bigdata: 1. Lanzar Un Proceso Mapreduce Contra El Cluster
Document3 pages
Prácticas Bigdata: 1. Lanzar Un Proceso Mapreduce Contra El Cluster
Christiam Niño
No ratings yet
BDA3
Document7 pages
BDA3
nikithakatta0
No ratings yet
A
Document1 page
A
Misson Condor
No ratings yet
Installation of Apache Hadoop 2. Word Count Program
Document25 pages
Installation of Apache Hadoop 2. Word Count Program
necn cse-b 2nd-year
No ratings yet
Average of Integer: Driver
Document3 pages
Average of Integer: Driver
niharika sunkara
No ratings yet
Big Data
Document25 pages
Big Data
Anu Graphics
No ratings yet
Run Wordcount
Document3 pages
Run Wordcount
Khushi Patil
No ratings yet
Exp 4 Word Count
Document4 pages
Exp 4 Word Count
munish kumar agarwal
No ratings yet
Map Reduce
Document4 pages
Map Reduce
chetanruparel07aws
No ratings yet
Map Reduce
Document3 pages
Map Reduce
Riya Jana
No ratings yet
Customer - 3.java: Import Import Import Import Import Import Import Import
Document15 pages
Customer - 3.java: Import Import Import Import Import Import Import Import
Karthik Raj
No ratings yet
SalesData Map Reduce
Document3 pages
SalesData Map Reduce
bhavana16686
No ratings yet
12 CodigoNetbeans
Document5 pages
12 CodigoNetbeans
Miguel Angel
No ratings yet
Import Import Import Import Import Import Import Import Public Class Extends Implements Public Void Throws
Document6 pages
Import Import Import Import Import Import Import Import Public Class Extends Implements Public Void Throws
SARAVANAN
No ratings yet
Spring Boot
Document13 pages
Spring Boot
Sankha
No ratings yet
Map Reduce Example
Document6 pages
Map Reduce Example
Jajang Nurjaman
No ratings yet
Program: Domparser - Java
Document4 pages
Program: Domparser - Java
Janani Shree
No ratings yet
Codigo Haddop
Document3 pages
Codigo Haddop
Liliana Munar Muñoz
No ratings yet
Pig & Pig Optimizations: Thejas Nair Dev in Pig Team at Yahoo! Apache Pig PMC Member
Document23 pages
Pig & Pig Optimizations: Thejas Nair Dev in Pig Team at Yahoo! Apache Pig PMC Member
thejasmn
No ratings yet
CS246 TA Session: Hadoop Tutorial: Peyman Kazemian 1/11/2011
Document13 pages
CS246 TA Session: Hadoop Tutorial: Peyman Kazemian 1/11/2011
smitanair143
No ratings yet
Cloudera Academic Partnership 4 PDF
Document38 pages
Cloudera Academic Partnership 4 PDF
EL MAMOUN ABDELLAH
No ratings yet
Hadoop Training in Hyderabad
Document49 pages
Hadoop Training in Hyderabad
kellytechnologies
No ratings yet
XX
Document3 pages
XX
Houssayen Ben Ouhiba
No ratings yet
Week 10
Document4 pages
Week 10
THANU SREE
No ratings yet
Import Import Import Import Import Import Import Import Public Class Extends Implements
Document7 pages
Import Import Import Import Import Import Import Import Public Class Extends Implements
SARAVANAN
No ratings yet
BDALab Assn4
Document9 pages
BDALab Assn4
Deepti Agrawal
No ratings yet
Adv Java
Document26 pages
Adv Java
Aastha Geda
No ratings yet
Category B
Document31 pages
Category B
sdasd
No ratings yet
Category B
Document31 pages
Category B
sdasd
No ratings yet
Hadoop
Document19 pages
Hadoop
Ashok Kumar
No ratings yet
Simple Job Runner
Document5 pages
Simple Job Runner
Radu Dumbrăveanu
No ratings yet
Public Void Cargo (
Document19 pages
Public Void Cargo (
Katy blogss
No ratings yet
Abrir y Guardar Archivo de Texto TXT NetBeans
Document4 pages
Abrir y Guardar Archivo de Texto TXT NetBeans
Alex Retroville
No ratings yet
Basic Functionalities
Document20 pages
Basic Functionalities
IPS Siddharth.B
No ratings yet
Merge Files Store in A Directory To A File
Document3 pages
Merge Files Store in A Directory To A File
msodhani
No ratings yet
Untitled
Document48 pages
Untitled
Shoda Indiano
No ratings yet
Digital Assignment-1: Raghvendra Singh Sisodia 19bce1381
Document12 pages
Digital Assignment-1: Raghvendra Singh Sisodia 19bce1381
Raghvendra Sisodia
No ratings yet
Aplicatie Client-Server
Document10 pages
Aplicatie Client-Server
Andrei Neacsu
No ratings yet
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
Document5 pages
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
riya k
No ratings yet
Habitica Base Application
Document7 pages
Habitica Base Application
john
No ratings yet
Markov Chain Algorithm in Java
Document7 pages
Markov Chain Algorithm in Java
pismodedule
No ratings yet
J Frame Form Login, Register, Koneksi
Document11 pages
J Frame Form Login, Register, Koneksi
wula
No ratings yet
Converting
Document4 pages
Converting
vinhxuann
No ratings yet
BDALab Assn4
Document9 pages
BDALab Assn4
Deepti Agrawal
No ratings yet
Instructions To Connect Database in Derby
Document17 pages
Instructions To Connect Database in Derby
Rebekka
No ratings yet
kODING Perpustakaan
Document14 pages
kODING Perpustakaan
okta
No ratings yet
Codigo
Document7 pages
Codigo
JOSÉ EDUARDO GARRIDO GONZALEZ
No ratings yet
Lecture 23: Pig: Making Hadoop Easy (Slides Provided By: Alan Gates, Yahoo!Research)
Document22 pages
Lecture 23: Pig: Making Hadoop Easy (Slides Provided By: Alan Gates, Yahoo!Research)
kumar
No ratings yet
DBMS Mini Project Report
Document15 pages
DBMS Mini Project Report
Abhijeet
No ratings yet
50 Recipes for Programming Node.js
From Everand
50 Recipes for Programming Node.js
Jamie Munro
Rating: 3 out of 5 stars
3/5 (4)
MapReduce Word Count Program
Document6 pages
MapReduce Word Count Program
shaliniiii
No ratings yet
Apache Pig - Running Scripts - Tutorialspoint
Document3 pages
Apache Pig - Running Scripts - Tutorialspoint
shaliniiii
No ratings yet
BDF Lab2
Document1 page
BDF Lab2
shaliniiii
No ratings yet