Welcome to Scribd!

Supervised Learning: Naïve Bayes

Uploaded by

0% found this document useful (0 votes)

13 views15 pages

This document provides an overview of Naive Bayes classification using supervised machine learning. It discusses key concepts such as prior and posterior probabilities, likelihood, frequency tables, and the strengths and weaknesses of the Naive Bayes algorithm. An example is given showing how to calculate the probability that an email is spam or ham using Bayes' theorem and conditional independence assumptions. The document also describes the Laplace estimator technique for addressing cases where probabilities would otherwise be zero.

Original Description:

Original Title

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pptx, pdf, or txt

0% found this document useful (0 votes)

13 views15 pages

Supervised Learning: Naïve Bayes

Uploaded by

SatishKakarla

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pptx, pdf, or txt

Jump to Page

You are on page 1of 15

Search inside document

Supervised learning:

Naïve Bayes
• P(spam)
• P(¬spam) / P(ham)
•
Bayes Theorem

P(Spam/Sales) = posterior probability

P(Sales|spam) = likelihood
P(Spam) = prior probability
P(Sales) = marginal likelihood
Frequency Table
Sales
Frequency Yes No Total

Spam 4 16 20

Ham 1 79 80

Total 5 95 100
Likelihood Table
Sales
Likelihood Yes No Total

Spam 4/20 16/20 20/100

Ham 1/80 79/80 80/100

Total 5/100 95/100 100

The Naive Bayes Algorithm
Strengths Weaknesses
Simple, fast, and very effective Relies on an often-faulty assumption
of equally important and
independent features
Does well with noisy and Not ideal for datasets with many
missing Data numeric features
Requires few examples for
training, but also works well
with very large numbers of
examples
Easy to obtain the estimated
probability for a prediction
Classification with Naive Bayes
Algorithm

Sales (W1) Money (W2) Groceries (W3) Unsubscribe

(W4)
Likeli- Yes No Yes No Yes No Yes No Total
hood
Spam 4/20 16/20 10/20 10/20 0/20 20/20 12/20 8/20 20/100

Ham 1/80 79/80 14/80 66/80 8/80 72/80 23/80 57/80 80/100

Total 5/100 95/100 24/100 76/100 8/100 92/100 35/100 65/100 100
As new message is received, we need to calculate the posterior
probability to determine whether they are more likely to be
spam or ham, given the likelihood of the words found in the
message text.

For example, suppose that a message contains the terms Sales

and Unsubscribe, but does not contain either Money or
Groceries.

Using Bayes' theorem, we can define the problem as shown in

the following formula.
It captures the probability that a message is spam, given that
Sales = Yes, Money = No, Groceries = No, and Unsubscribe = Yes:
Assuming conditional independence, the conditional probability of
spam can be expressed as:

Assuming conditional independence, the conditional probability of

ham can be expressed as:
The Laplace Estimator
Suppose that we received another message, this time containing
all four terms: Sales, Groceries, Money, and Unsubscribe. Using
the Naive Bayes algorithm as before, we can compute the
likelihood of spam.
These results suggest that the message is spam with 0 percent
probability and ham with 100 percent probability. Does this
prediction make sense? Probably not.

The message contains several words usually associated with spam,

including Sales, which is rarely used in legitimate messages. It is
therefore very likely that the message has been incorrectly
classified. This problem might arise if an event never occurs for
one or more levels of the class. For instance, the term Groceries
had never previously appeared in a spam message.
Consequently, P(spam|groceries) = 0%.
The Laplace Estimator
A solution to this problem involves using something called the
Laplace estimator, which is named after the French mathematician
Pierre-Simon Laplace.

The Laplace estimator essentially adds a small number to each of

the counts in the frequency table, which ensures that each feature
has a nonzero probability of occurring with each class. Typically,
the Laplace estimator is set to 1, which ensures that each
class-feature combination is found in the data at least once.

Athletic Coping Skills Inventory Athletic Management PDF
Document3 pages
Athletic Coping Skills Inventory Athletic Management PDF
Luciana Alessandrini
100% (1)
2013 Spyder ST Owners Manual
Document171 pages
2013 Spyder ST Owners Manual
Melvin Quezada
67% (6)
Essentials of Business Statistics Communicating With Numbers 1st Edition Jaggia Solutions Manual Download
Document27 pages
Essentials of Business Statistics Communicating With Numbers 1st Edition Jaggia Solutions Manual Download
Alonzo Oliver
100% (30)
How to Measure Anything: Finding the Value of Intangibles in Business
From Everand
How to Measure Anything: Finding the Value of Intangibles in Business
Douglas W. Hubbard
Rating: 3.5 out of 5 stars
3.5/5 (4)
Bayesian Statistics For Dummies
Document5 pages
Bayesian Statistics For Dummies
julianaruiz06
No ratings yet
Amazon FBA For Beginners
From Everand
Amazon FBA For Beginners
Mark Nathan
No ratings yet
ProbabilisticLearning Bayesian
Document11 pages
ProbabilisticLearning Bayesian
suryansh
No ratings yet
Chapter1 - Probabilistic Learning - Classification Using Naive Bayes
Document17 pages
Chapter1 - Probabilistic Learning - Classification Using Naive Bayes
Rania Saoud
No ratings yet
Behavioral Finance - Tutorial 1 With Solutions
Document6 pages
Behavioral Finance - Tutorial 1 With Solutions
imran_omi
No ratings yet
Assinment #1
Document2 pages
Assinment #1
Muhammad Mustafa
No ratings yet
Bayes' Rule
Document2 pages
Bayes' Rule
Muhammad Mustafa
No ratings yet
The Bayes Rule - Elements of AI 3-2
Document11 pages
The Bayes Rule - Elements of AI 3-2
Mubasher Hussain
No ratings yet
Bayesian Filtering: Beyond Binary Classification
Document8 pages
Bayesian Filtering: Beyond Binary Classification
maizesmagikarp
No ratings yet
The Normal Distribution
Document94 pages
The Normal Distribution
wexoutletbrand
No ratings yet
Application of Naïve Bayes Classification in Fraud Detection
Document30 pages
Application of Naïve Bayes Classification in Fraud Detection
neha doshi
No ratings yet
II. The Bayes Rule
Document6 pages
II. The Bayes Rule
Welluzani Manda
No ratings yet
Detecting spam mail with Naive Bayes
Document5 pages
Detecting spam mail with Naive Bayes
rekelemen
No ratings yet
Bayesrule Stats
Document4 pages
Bayesrule Stats
Poonam Naidu
No ratings yet
Conditional Probability Report
Document45 pages
Conditional Probability Report
Glenn Michael Pascua
No ratings yet
Bayesian Statistics Homework
Document7 pages
Bayesian Statistics Homework
erdqfsze
100% (1)
Applying Machine Learning
Document13 pages
Applying Machine Learning
Julia
No ratings yet
11 Machine Learning System Design PDF
Document7 pages
11 Machine Learning System Design PDF
marc
No ratings yet
ML Unit No.4 Naïve Bayes Classifiers PPT Notes
Document47 pages
ML Unit No.4 Naïve Bayes Classifiers PPT Notes
sourabhmurarka187
No ratings yet
7.Email Spam Filtering Using Naive Bayes Classifier
Document14 pages
7.Email Spam Filtering Using Naive Bayes Classifier
nanipavan830
No ratings yet
Spam Filtering Using Bayesian Approach: Presented By: Nitin Kumar
Document11 pages
Spam Filtering Using Bayesian Approach: Presented By: Nitin Kumar
anon_413898370
No ratings yet
Lecture 7
Document51 pages
Lecture 7
ROHIT ARORA
No ratings yet
Naive Bayes
Document36 pages
Naive Bayes
Aniket Manna
No ratings yet
Subtitle 223
Document2 pages
Subtitle 223
ysfmertyldzz
No ratings yet
Continuous Improvement Toolkit: Probability Distributions
Document25 pages
Continuous Improvement Toolkit: Probability Distributions
amrita
No ratings yet
09 Anomaly Detection - Contd
Document3 pages
09 Anomaly Detection - Contd
Matix
No ratings yet
Lecture10 - Bayesian Classifier
Document40 pages
Lecture10 - Bayesian Classifier
Fasih Ullah
No ratings yet
Revision: High Variance
Document8 pages
Revision: High Variance
Kailash A
No ratings yet
Assignment 3 28855
Document3 pages
Assignment 3 28855
abbiha.mustafamalik
No ratings yet
Naive Bayes Algorithm
Document11 pages
Naive Bayes Algorithm
Sreshta Tric
No ratings yet
11 Machine Learning System Design
Document8 pages
11 Machine Learning System Design
swetha sastry
No ratings yet
Zero-Inflated Data
Document4 pages
Zero-Inflated Data
Michael
No ratings yet
Option Risk Management - Case Study 1 - Option Greeks - Question
Document3 pages
Option Risk Management - Case Study 1 - Option Greeks - Question
arath reyes
No ratings yet
Notes AdvanceBAwithR
Document1 page
Notes AdvanceBAwithR
Shruti Mathur
No ratings yet
Ch.5_Association rule mining (1)
Document29 pages
Ch.5_Association rule mining (1)
Yash Mehrotra
No ratings yet
120 Guide To Greedy Algorithms
Document4 pages
120 Guide To Greedy Algorithms
Gaurav Tripathi
No ratings yet
Q. 16 Lefties A Website Claims That 10... (FREE S
Document1 page
Q. 16 Lefties A Website Claims That 10... (FREE S
paola.hipolito.con2007
No ratings yet
Lecture 4 - Hypothesis Testing
Document23 pages
Lecture 4 - Hypothesis Testing
Ayodele Ogundipe
No ratings yet
Flaw Types 2
Document16 pages
Flaw Types 2
Bill Clawges
100% (3)
Decision Making Under Risk Continued: Bayes'Theorem and Posterior Probabilities
Document21 pages
Decision Making Under Risk Continued: Bayes'Theorem and Posterior Probabilities
mariush
No ratings yet
Bayes Analysis
Document9 pages
Bayes Analysis
harshit rathore
No ratings yet
Implementation of Naïve Bayesian Spam Filter Algorithm
Document16 pages
Implementation of Naïve Bayesian Spam Filter Algorithm
Alok Nandan Jha
No ratings yet
What Is The Bayes' Theorem?
Document12 pages
What Is The Bayes' Theorem?
Aryaman Tiwari
No ratings yet
Exercise 1. Laplace, Wald or Pessimistic, Optimistic, Hurwicz and Savage Criteria (Profit Matrix)
Document13 pages
Exercise 1. Laplace, Wald or Pessimistic, Optimistic, Hurwicz and Savage Criteria (Profit Matrix)
Pallares Estrd Miguel
No ratings yet
LT Module 8
Document18 pages
LT Module 8
igus696
No ratings yet
Bayes Theorem For Data Science Professionals 1598272603
Document5 pages
Bayes Theorem For Data Science Professionals 1598272603
「瞳」你分享
No ratings yet
Lab Record 10-15
Document17 pages
Lab Record 10-15
Animesh Singh
No ratings yet
Ba Yes I An Filtering
Document8 pages
Ba Yes I An Filtering
er2rule
No ratings yet
Impact On Student Learning
Document9 pages
Impact On Student Learning
api-533495856
0% (1)
Module 2 - Bayesian Learning
Document7 pages
Module 2 - Bayesian Learning
himanshurautela87
No ratings yet
Pareto Analysis
Document2 pages
Pareto Analysis
Nat Tikus
No ratings yet
Mostwinningabtestresultsareillusory 0
Document16 pages
Mostwinningabtestresultsareillusory 0
Ajeet_1991
No ratings yet
Ebay Madness Autopilot
Document20 pages
Ebay Madness Autopilot
Abdullah Yusuf
No ratings yet
Arima Modelling and Diagnostic Test
Document2 pages
Arima Modelling and Diagnostic Test
sitaramr54
No ratings yet
What Is The Difference Between Alpha and
Document3 pages
What Is The Difference Between Alpha and
Catherine Cheah Ming Ming
No ratings yet
Baye's Theorem - Example
Document7 pages
Baye's Theorem - Example
Vinay Yadav
No ratings yet
Binomial Distribution
Document12 pages
Binomial Distribution
Harika Kalluri
No ratings yet
6 Easy Steps To Learn Naive Bayes Algorithm With Codes in Python and R
Document6 pages
6 Easy Steps To Learn Naive Bayes Algorithm With Codes in Python and R
Zahid Dar
No ratings yet
GeM Bidding 2454218
Document6 pages
GeM Bidding 2454218
SatishKakarla
No ratings yet
Neural Net - Modi
Document16 pages
Neural Net - Modi
SatishKakarla
No ratings yet
GeM Bidding 2502553
Document7 pages
GeM Bidding 2502553
SatishKakarla
No ratings yet
GeM Bidding 2511500
Document6 pages
GeM Bidding 2511500
SatishKakarla
No ratings yet
Introduction To Kmeans
Document4 pages
Introduction To Kmeans
SatishKakarla
No ratings yet
Invest in Omnichannel Retail Strategies: 2. Provide A Personalized Retail Experience
Document4 pages
Invest in Omnichannel Retail Strategies: 2. Provide A Personalized Retail Experience
SatishKakarla
No ratings yet
Probabilistic Learning - NB
Document10 pages
Probabilistic Learning - NB
SatishKakarla
No ratings yet
Unsupervised Learning Modi
Document16 pages
Unsupervised Learning Modi
SatishKakarla
No ratings yet
Pharmaceutical Detailers: Missionary Selling/ Order Creators
Document4 pages
Pharmaceutical Detailers: Missionary Selling/ Order Creators
SatishKakarla
No ratings yet
Sales Approach
Document2 pages
Sales Approach
SatishKakarla
No ratings yet
Analysis of Facebook Page of Infosys
Document2 pages
Analysis of Facebook Page of Infosys
SatishKakarla
No ratings yet
Questionnaire
Document72 pages
Questionnaire
SatishKakarla
No ratings yet
"Why Should We Hire You?": Demonstrate Confidence
Document2 pages
"Why Should We Hire You?": Demonstrate Confidence
SatishKakarla
No ratings yet
Nissan Sentra ECM
Document11 pages
Nissan Sentra ECM
Salvador Manuel Rocha Castillo
No ratings yet
Papper Referensi 2 - Using Warmth As The Visual Design of A Store - Intimacy, Relational Needs, and Approach Intentions
Document11 pages
Papper Referensi 2 - Using Warmth As The Visual Design of A Store - Intimacy, Relational Needs, and Approach Intentions
Bergodo Prajurit
No ratings yet
Rikki Tikki Tavi Story Lesson Plan
Document3 pages
Rikki Tikki Tavi Story Lesson Plan
api-248341220
No ratings yet
StatementOfAccount 6316692309 21072023 222045
Document17 pages
StatementOfAccount 6316692309 21072023 222045
Asekar Alagarsamy
No ratings yet
044.QTRE409 - International Human Resource Management
Document11 pages
044.QTRE409 - International Human Resource Management
Do Minh Gia An
No ratings yet
Comunica Cao
Document5 pages
Comunica Cao
sh3ll.sh4d0w
No ratings yet
Name:: Nyoman Gede Abhyasa Class: X Mipa 2 Absent: 25 Answers
Document2 pages
Name:: Nyoman Gede Abhyasa Class: X Mipa 2 Absent: 25 Answers
Retrify - Random Content
No ratings yet
Thou Hast Made Me
Document3 pages
Thou Hast Made Me
your dady
0% (1)
Dance As A Competition
Document3 pages
Dance As A Competition
Jaymie Neri
No ratings yet
MAD Practical 6
Document15 pages
MAD Practical 6
DIVYESH PATEL
No ratings yet
L550 19MY MB XC-EN V1j DX PDF
Document88 pages
L550 19MY MB XC-EN V1j DX PDF
Anonymous gMgeQl1Snd
No ratings yet
Catalog de Produse - BTR
Document62 pages
Catalog de Produse - BTR
daliproiectare
No ratings yet
Alarm Security Pic - Google Shopping
Document1 page
Alarm Security Pic - Google Shopping
leeleeleebc123
No ratings yet
The Amphibian Decline Crisis: A Watershed For Conservation Biology?
Document15 pages
The Amphibian Decline Crisis: A Watershed For Conservation Biology?
Eka Ayu Ningtyas
No ratings yet
Admin,+56 Ism.v11i1.557
Document5 pages
Admin,+56 Ism.v11i1.557
Reni Tri Astuti
No ratings yet
Empower B2 Unit 10 Quiz
Document2 pages
Empower B2 Unit 10 Quiz
Guidance Teuku Nyak Arif Fatih Bilingual School
No ratings yet
Understanding Organizational Behavior: de Castro, Donna Amor Decretales, Thea Marie Estimo, Adrian Maca-Alin, Sahara
Document41 pages
Understanding Organizational Behavior: de Castro, Donna Amor Decretales, Thea Marie Estimo, Adrian Maca-Alin, Sahara
Anna Marie Revisado
No ratings yet
Eastron Electronic Co., LTD
Document2 pages
Eastron Electronic Co., LTD
asd qwe
No ratings yet
15p3 Fourier Integral
Document7 pages
15p3 Fourier Integral
Bhargav Bhalara
No ratings yet
Forms Pensioners
Document15 pages
Forms Pensioners
Animesh Das
No ratings yet
Jadwal Pertandingan Liga Inggris 2009-2010
Document11 pages
Jadwal Pertandingan Liga Inggris 2009-2010
Adjie Satryo
No ratings yet
HUAWEI - SUN2000-20-40KTL-M3-UserManual GCA
Document102 pages
HUAWEI - SUN2000-20-40KTL-M3-UserManual GCA
Reardon Metals
No ratings yet
PAYROLLMANAGEMENT
Document5 pages
PAYROLLMANAGEMENT
Sai Prabhav (Sai Prabhav)
No ratings yet
Sustainable Consumption Production in India - Analysis
Document8 pages
Sustainable Consumption Production in India - Analysis
anon_794541559
No ratings yet
Thermal Energy Storage System Using Phase Change Materials - Constant Heat Source
Document8 pages
Thermal Energy Storage System Using Phase Change Materials - Constant Heat Source
Lue ni
No ratings yet
Building 7
Document1 page
Building 7
Arshad Alam
No ratings yet
Crossing The Bar Critique Paper
Document2 pages
Crossing The Bar Critique Paper
maieunice
No ratings yet
Partho
Document2 pages
Partho
Dhiraj Sherlliya
No ratings yet