Estimating The Predictive Accuracy of A

Uploaded by

Miguel pilamunga

0% found this document useful (0 votes)

5 views10 pages

Original Title

Estimating the Predictive Accuracy of a

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

0% found this document useful (0 votes)

5 views10 pages

Estimating The Predictive Accuracy of A

Uploaded by

Miguel pilamunga

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

Jump to Page

You are on page 1of 10

Search inside document

Estimating the Predictive

Accuracy of a
Classifier
Bramer, Principles of Datamining, Chap 7
Predictive accuracy
• Is the most obvious criterion to use for estimating the performance of
a classifier is predictive accuracy, i.e. the proportion of a set of
unseen instances that it correctly classifies.
• Instead, it is usual to estimate the predictive accuracy of aclassifier by
measuring its accuracy for a sample of data not used when it was
generated. There are three main strategies commonly used for this:
dividing the data into a training set and a test set, k-fold cross-
validation and N-fold (or leave-one-out) cross-validation.
Method 1: Separate Training and Test Sets
Method 1: Separate Training and Test Sets

First, the training set is used to construct a classifier (decision tree,

neural net etc.). The classifier is then used to predict the classification
for the instances in the test set. If the test set contains N instances of
which C are correctly classified the predictive accuracy of the classifier
for the test set is p = C/N. This can be used as an estimate of its
performance on any unseen dataset.
Method 2: k-fold Cross-validation
• The dataset is divided in k parts
• Each of the k parts in turn is used as a test set and the other k − 1
parts are used as a training set.
• The total number of instances correctly classified (in all k runs
combined) is divided by the total number of instances N to give an
overall level of predictive accuracy p, with standard error p(1 − p)/N.
Method 2: k-fold Cross-validation
Method 3: N-fold Cross-validation
• N classifiers are generated, each from N − 1 instances, and each is
used to classify a single test instance. The predictive accuracy p is the
total number correctly classified divided by the total number of
instances. The standard error is p(1 − p)/N.
• The large amount of computation involved makes N-fold cross-
validation unsuitable for use with large datasets. For other datasets, it
is not clear whether any gain in the accuracy of the estimates
produced by using N-fold crossvalidation justifies the additional
computation involved
Confusion Matrix
A confusion matrix (Kohavi and Provost, 1998) contains information about actual and predicted
classifications done by a classification system. Performance of such systems is commonly evaluated
using the data in the matrix.
• .a is the number of correct predictions that an instance is negative,
• b is the number of incorrect predictions that an instance is positive,
• c is the number of incorrect of predictions that an instance negative, and
• d is the number of correct predictions that an instance is positive.

Predicted

Negative Positive

Negative a b
Actual
Positive c d
True Positives-True negatives
Question
• Accuracy ??
• Precision ??

PyCDS 15 MachineLearning
Document38 pages
PyCDS 15 MachineLearning
Kanu Babu
No ratings yet
Asme PTC 19.1
Document2 pages
Asme PTC 19.1
Francis Dela Torre
0% (1)
Coincent - Data Science With Python Assignment
Document23 pages
Coincent - Data Science With Python Assignment
Sai Nikhil Nellore
100% (2)
Titanic Survival Analysis
Document61 pages
Titanic Survival Analysis
doosa
No ratings yet
Accuracy Measures
Document61 pages
Accuracy Measures
Sanoop Mallissery
No ratings yet
Classification
Document58 pages
Classification
lekha
No ratings yet
K Nearest Neighbors
Document19 pages
K Nearest Neighbors
CSSCTube FCITube
No ratings yet
Module 5 Advanced Classification Techniques
Document40 pages
Module 5 Advanced Classification Techniques
Saurabh Jagtap
No ratings yet
Lecture 2 Classifier Performance Metrics
Document60 pages
Lecture 2 Classifier Performance Metrics
iamboss086
No ratings yet
Advance Cluster - Classification: Ha Le Hoai Trung
Document50 pages
Advance Cluster - Classification: Ha Le Hoai Trung
Phuong Nguyen Thi Bich
No ratings yet
CST 42315 Dam - L9 1
Document15 pages
CST 42315 Dam - L9 1
Kay Khine
No ratings yet
Evaluation Method Holdout
Document14 pages
Evaluation Method Holdout
jemal yahyaa
No ratings yet
2 Supervised Learning
Document52 pages
2 Supervised Learning
Ahlam Azam
No ratings yet
P-2.1.2 Cross Validation and Regularization
Document37 pages
P-2.1.2 Cross Validation and Regularization
Puneet Parihar
No ratings yet
Data Mining Models and Evaluation Techniques
Document59 pages
Data Mining Models and Evaluation Techniques
spsberry8
No ratings yet
DM - Ch4 - Classification (Part1)
Document20 pages
DM - Ch4 - Classification (Part1)
C.RadhiyaDevi
No ratings yet
Data Mining: Practical Machine Learning Tools and Techniques
Document73 pages
Data Mining: Practical Machine Learning Tools and Techniques
Arvind
No ratings yet
Lecture 16
Document36 pages
Lecture 16
Abood Fazil
No ratings yet
Classification - Performance Evlaution
Document13 pages
Classification - Performance Evlaution
Mhd Aslam
No ratings yet
Sensitivity Analysis
Document64 pages
Sensitivity Analysis
Vinoth Kumar
No ratings yet
Article - Calculation For Chi-Square Tests
Document3 pages
Article - Calculation For Chi-Square Tests
Kantri Yantri
No ratings yet
Steps in Logistic Regression
Document5 pages
Steps in Logistic Regression
silencebrown
No ratings yet
Presentation On Classification
Document18 pages
Presentation On Classification
sree vishnupriyq
No ratings yet
L04 The Classification Pipeline
Document46 pages
L04 The Classification Pipeline
YONG LONG KHAW
No ratings yet
Lecture Testmodels
Document31 pages
Lecture Testmodels
sowmyasanthavel
No ratings yet
Kami Export - 13. Model Evaluation
Document25 pages
Kami Export - 13. Model Evaluation
YENI SRI MAHARANI -
100% (1)
Data Analysis From Theoretical To Implementation: Lecture #7/8 Inference Normal Distribution &
Document21 pages
Data Analysis From Theoretical To Implementation: Lecture #7/8 Inference Normal Distribution &
mohamed
No ratings yet
Estimation of Parameters PDF
Document14 pages
Estimation of Parameters PDF
S Adia
No ratings yet
Nixon, Measuring Calibration in Deep Learning
Document14 pages
Nixon, Measuring Calibration in Deep Learning
José-Manuel Martin Coronado
No ratings yet
ML Model Evaluation
Document17 pages
ML Model Evaluation
STYX
No ratings yet
Statistics
Document37 pages
Statistics
Dishank Upadhyay
No ratings yet
Eba3e PPT ch07
Document62 pages
Eba3e PPT ch07
Nazia Enayet
0% (1)
Lecture3 Eval Metric
Document26 pages
Lecture3 Eval Metric
Yasir Butt
No ratings yet
Module 4
Document12 pages
Module 4
PRINCE CARL AJOC
No ratings yet
Model Evaluation and Selection
Document37 pages
Model Evaluation and Selection
Smit
No ratings yet
Class X - Artificial Intelligence - Evaluation - Question Bank
Document8 pages
Class X - Artificial Intelligence - Evaluation - Question Bank
renudevi198725
No ratings yet
Noc17-Mg24 Week 08 Assignment 01
Document4 pages
Noc17-Mg24 Week 08 Assignment 01
Amarendra Pattanayak
No ratings yet
Data Mining Final Exam Future University 2018
Document3 pages
Data Mining Final Exam Future University 2018
Omer Husham
No ratings yet
Chap3 Part1 Classification
Document38 pages
Chap3 Part1 Classification
houcem.swissi
No ratings yet
Predictive Accuracy Evaluation
Document13 pages
Predictive Accuracy Evaluation
SarFaraz Ali Memon
No ratings yet
Exam2004 2 3
Document22 pages
Exam2004 2 3
JoHn Scofield
No ratings yet
Unit 2
Document18 pages
Unit 2
rk73462002
No ratings yet
Face Recognition, Experiments With Random Projection
Document27 pages
Face Recognition, Experiments With Random Projection
ARAVIND
No ratings yet
CSO504 Machine Learning: Evaluation and Error Analysis Validation and Regularization Koustav Rudra 22/08/2022
Document28 pages
CSO504 Machine Learning: Evaluation and Error Analysis Validation and Regularization Koustav Rudra 22/08/2022
Being IITian
No ratings yet
A Practical Guide To Support Vector Classi Cation - Chih-Wei Hsu, Chih-Chung Chang and Chih-Jen Lin
Document12 pages
A Practical Guide To Support Vector Classi Cation - Chih-Wei Hsu, Chih-Chung Chang and Chih-Jen Lin
Vítor Mangaravite
No ratings yet
Types of Machine Learning Algorithms
Document14 pages
Types of Machine Learning Algorithms
Vipin Rajput
No ratings yet
Data Mining - Weka 3.6.0
Document5 pages
Data Mining - Weka 3.6.0
Navee Jayakody
No ratings yet
Model Evaluation and Selection
Document41 pages
Model Evaluation and Selection
Dev kartik Agarwal
No ratings yet
Stats-Proj Group 2
Document53 pages
Stats-Proj Group 2
princess theaa
0% (1)
Lecture 01-Model Selection and Evaluation
Document29 pages
Lecture 01-Model Selection and Evaluation
mah dlt
No ratings yet
QB - Data Science
Document7 pages
QB - Data Science
svaishnavi112003
No ratings yet
Ell409 Aq
Document8 pages
Ell409 Aq
lovlesh roy
No ratings yet
w5 Classification
Document34 pages
w5 Classification
Swastik Sindhani
No ratings yet
Ds Module 4
Document73 pages
Ds Module 4
Prathik Srinivas
No ratings yet
Unit 2
Document37 pages
Unit 2
Poorna
No ratings yet
Accuracy and Error Measures
Document46 pages
Accuracy and Error Measures
biswanath dehuri
No ratings yet
Chapter 5 Evaluation Metrics
Document18 pages
Chapter 5 Evaluation Metrics
liyu agye
No ratings yet
Combine PT - MU
Document2 pages
Combine PT - MU
Anonymous f8P42082U
No ratings yet
Data Science Q&A - Latest Ed (2020) - 5 - 1
Document2 pages
Data Science Q&A - Latest Ed (2020) - 5 - 1
M K
No ratings yet
Lecture Slides-Week15,16
Document50 pages
Lecture Slides-Week15,16
moazzam kiani
No ratings yet
Acceptance Sampling For Attributes
Document9 pages
Acceptance Sampling For Attributes
henok birhanu
No ratings yet
Mistakes in Quality Statistics: and How to Fix Them
From Everand
Mistakes in Quality Statistics: and How to Fix Them
Donald W. Benbow
No ratings yet
Confusion Matrix - Wikipedia
Document4 pages
Confusion Matrix - Wikipedia
Fia Putri
No ratings yet
Deep RNN Learning For EEG Based Functional Brain State Inference
Document6 pages
Deep RNN Learning For EEG Based Functional Brain State Inference
Suprava Patnaik
No ratings yet
ML3 - Evaluation
Document65 pages
ML3 - Evaluation
param_email
100% (1)
Accuracy, Recall, Precision, F-Score & Specificity, Which To Optimize On
Document10 pages
Accuracy, Recall, Precision, F-Score & Specificity, Which To Optimize On
cidsant
No ratings yet
ISIM
Document14 pages
ISIM
Fibonnaci Backtrack
No ratings yet
Obfuscated Malware Detection Using Dilated Convolutional Network
Document6 pages
Obfuscated Malware Detection Using Dilated Convolutional Network
Nicolas Pineda
No ratings yet
Enhancing Industrial IoT Security: A Comprehensive Approach To Intrusion Detection Using PCA-Driven Decision Trees
Document11 pages
Enhancing Industrial IoT Security: A Comprehensive Approach To Intrusion Detection Using PCA-Driven Decision Trees
Ahmad Omar Houkan
No ratings yet
Lab Record DEV
Document28 pages
Lab Record DEV
Tharun Kumar
100% (1)
Machine Learning and Iot For Prediction and Detection of Stress
Document5 pages
Machine Learning and Iot For Prediction and Detection of Stress
Ajj Patel
No ratings yet
MG1016 Coursework Brief 2020.21 PDF
Document5 pages
MG1016 Coursework Brief 2020.21 PDF
Shruthi Sathyanarayanan
No ratings yet
MLT Unit-1
Document19 pages
MLT Unit-1
Son Ish
No ratings yet
Plant Disease Detection and Classification Using Deep Learning
Document8 pages
Plant Disease Detection and Classification Using Deep Learning
IJRASETPublications
No ratings yet
Lectura 1
Document13 pages
Lectura 1
maria isabel Vidal
No ratings yet
ML Manual
Document42 pages
ML Manual
Rafa Anan
No ratings yet
Automatic Classification of Cast Iron Grades Using Support Vector Machine
Document19 pages
Automatic Classification of Cast Iron Grades Using Support Vector Machine
Miguel Briones
No ratings yet
Tactile Object Recognition in Early Phases of Grasping Using Underactuated Robotic Hands
Document13 pages
Tactile Object Recognition in Early Phases of Grasping Using Underactuated Robotic Hands
xingjqixh
No ratings yet
Teltek Project Submission
Document14 pages
Teltek Project Submission
mona
No ratings yet
20CB913 Machine Learning Module 2
Document52 pages
20CB913 Machine Learning Module 2
anant
No ratings yet
Data Analytics and Model Evaluation
Document55 pages
Data Analytics and Model Evaluation
toon town
No ratings yet
Titanic Survival Prediction 1692609491
Document15 pages
Titanic Survival Prediction 1692609491
Tirthankar Ghosh
No ratings yet
EvaluationQuestions Class 10 Ai
Document6 pages
EvaluationQuestions Class 10 Ai
kritavearn
No ratings yet
Object Detection and Ship Classification Using YOLOv5
Document10 pages
Object Detection and Ship Classification Using YOLOv5
BOHR International Journal of Computer Science (BIJCS)
No ratings yet
A Hyperparameter Optimization For Galaxy Classification
Document14 pages
A Hyperparameter Optimization For Galaxy Classification
胡浩
No ratings yet
Fake News Detection Using Machine Learning
Document6 pages
Fake News Detection Using Machine Learning
Prasad N. Kumbhar
No ratings yet
2021-SPE-208657-Successful Application of ML To Improve Dynamic Modeling HM For Complex Gas Condensate Reservoirs in Hai Thach Field, Nam Con Son Basin, Offshore Vietnam
Document14 pages
2021-SPE-208657-Successful Application of ML To Improve Dynamic Modeling HM For Complex Gas Condensate Reservoirs in Hai Thach Field, Nam Con Son Basin, Offshore Vietnam
haimuoi
No ratings yet
Asar Project
Document14 pages
Asar Project
techusama4
No ratings yet
Compendium Iim Shillong Analytics and Prod Man
Document68 pages
Compendium Iim Shillong Analytics and Prod Man
fossil.tractor0s
No ratings yet
Step-By-Step-Diabetes-Classification-Knn-Detailed-Copy1 - Jupyter Notebook
Document12 pages
Step-By-Step-Diabetes-Classification-Knn-Detailed-Copy1 - Jupyter Notebook
Elyza
No ratings yet