Welcome to Scribd!

Assignment - #4 - Decision Tree and Ensemble - Final

Uploaded by

0% found this document useful (0 votes)

31 views2 pages

This document outlines an assignment to classify heart disease using machine learning models. Students must load and analyze a dataset containing medical features and a target variable indicating heart disease risk. Tasks include exploratory data analysis, feature selection, training decision trees, random forests, and other classifiers on a training set and evaluating their performance on a test set. An ensemble model must also be created and evaluated. Results must be documented in a Jupyter notebook and report analyzing model performance, feature importance, and providing recommendations. The assignment is due October 31st, 2023 and will be evaluated based on code quality, analysis depth, model evaluation, and report quality.

Original Description:

Original Title

Assignment_#4_Decision Tree and Ensemble_final

Copyright

Available Formats

DOCX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as docx, pdf, or txt

0% found this document useful (0 votes)

31 views2 pages

Assignment - #4 - Decision Tree and Ensemble - Final

Uploaded by

Chakri Chakradhar

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as docx, pdf, or txt

Jump to Page

You are on page 1of 2

Search inside document

Assignment #4 Possible Points: 100

CS-770 ML Due date: 31st October 2023

Name:
_______________________________________________________________________________

Email id:
_____________________________________________________________________________

Assignment: Heart Disease Classification using Machine Learning (Decision tree and Ensemble
methods).

Objective:

Your task is to implement, evaluate, and compare various machine learning classifiers for predicting heart
disease. Employ advanced techniques for a thorough analysis of the data and classifiers’ performance.

Dataset Description: This dataset consists of 11 features and a target variable. It has 6 nominal variables
and 5 numeric variables. The target variable which we must predict 1 means patient is suffering from
heart risk and 0 means patient is normal.

Tasks:

1. Exploratory Data Analysis (EDA)

Load and inspect the dataset’s structure, summary statistics, and data types.

Visualize distributions of numerical and categorical features.

Identify and handle missing values appropriately.

Analyze correlations between features and the target variable.

2. Data Pre-processing & Splitting

Feature Selection: Decide which features are relevant for the classification task.

Data Splitting: Partition the dataset into training and testing sets (80-20 split).

3. Model Development, Training, and Evaluation

Define parameters for SVM, Logistic Regression, Decision Tree, and Random Forest classifiers.

Implement GridSearchCV for hyperparameter tuning and model selection.

For each model:

Initialize and train using a pipeline comprising StandardScaler and the model.

Compute and report accuracy, classification report, and confusion matrix on the testing set.
Visualize and interpret the confusion matrix.

4. Ensemble Learning:

Construct a Voting Classifier using the classifiers trained above. Experiment with both ‘hard’ and ‘soft’
voting strategies.

Evaluate and visualize its performance, drawing comparisons with the individual models.

5. Conclusion & Recommendations

Summarize the key findings regarding model performances.

Offer insights into which model(s) performed best and hypothesize why.

Suggest improvements or alternative approaches for future experimentation.

Deliverables:

Code Notebook: Well-commented Jupiter Notebook with sections corresponding to the tasks outlined.
Ensure your code is clean, readable, and well-documented.

Report: Concise report presenting your approach, findings, visualizations, and recommendations. The
report should be structured, coherent, and professionally formatted.

Evaluation Criteria:

Code Quality: Readability, structure, and documentation.

Analysis Depth: Extent of EDA, feature selection rationale, and hyperparameter tuning.

Model Evaluation: Appropriateness of metrics used, depth of evaluation, and clarity in visualizations.

Report Quality: Clarity, structure, depth of insight, and quality of writing in the report.

Deadline:

Submission is due by 10/31/2023.

Machine Learning Assignment
Document55 pages
Machine Learning Assignment
Akash
No ratings yet
Project On Data Mining: Prepared by Ashish Pavan Kumar K PGP-DSBA at Great Learning
Document50 pages
Project On Data Mining: Prepared by Ashish Pavan Kumar K PGP-DSBA at Great Learning
Ashish Pavan Kumar K
No ratings yet
Project Questions
Document4 pages
Project Questions
vansh gupta
No ratings yet
Lesson 1: Communication Processes, Principles, and Ethics Learning Outcomes
Document8 pages
Lesson 1: Communication Processes, Principles, and Ethics Learning Outcomes
Gladys Campos
0% (1)
Unit 7 ML
Document33 pages
Unit 7 ML
Yuvraj Chauhan
No ratings yet
Untitled Document
Document5 pages
Untitled Document
Sahil Rajput
No ratings yet
Unit 5
Document11 pages
Unit 5
Md. Sunmun
No ratings yet
ml_unit_2
Document33 pages
ml_unit_2
016-Triveni
No ratings yet
Unit 1 AAM
Document16 pages
Unit 1 AAM
giramashish5
No ratings yet
Survey of Classification Techniques in Data Mining: Open Access
Document10 pages
Survey of Classification Techniques in Data Mining: Open Access
Fahri Alfiandi Stsetia
No ratings yet
Data Mining UNIT-2 Notes
Document91 pages
Data Mining UNIT-2 Notes
padma
No ratings yet
Asynchronous Claisfication Basic Conceps
Document2 pages
Asynchronous Claisfication Basic Conceps
Linda Amunyela
No ratings yet
MACHINE LEARNING 1-5 (Ai &DS)
Document60 pages
MACHINE LEARNING 1-5 (Ai &DS)
Amani yar Khan
100% (1)
20CB913 Machine Learning Module 2
Document52 pages
20CB913 Machine Learning Module 2
anant
No ratings yet
Current Trends in Software
Document26 pages
Current Trends in Software
Dinesh Saman
No ratings yet
Unit 8 Classification and Prediction: Structure
Document16 pages
Unit 8 Classification and Prediction: Structure
Kamal Kant
No ratings yet
Lecture Notes 4
Document6 pages
Lecture Notes 4
vivek gupta
No ratings yet
Ba Unit 4 - Part1
Document7 pages
Ba Unit 4 - Part1
Arunim Yadav
No ratings yet
Data Mining-2-1
Document12 pages
Data Mining-2-1
SOORAJ CHANDRAN
No ratings yet
Week 3
Document3 pages
Week 3
MANISH P
No ratings yet
Fundamentals of Data Science Unit 4
Document31 pages
Fundamentals of Data Science Unit 4
rakshithadahnu
100% (1)
Machine Learning Notes
Document112 pages
Machine Learning Notes
mubin.pathan765
No ratings yet
ML Question Answer
Document4 pages
ML Question Answer
manoj15gowda
No ratings yet
1.0 - Laying The Foundation of Business Analytics
Document33 pages
1.0 - Laying The Foundation of Business Analytics
Umama Farooq Khalidi
No ratings yet
DM Notes - UNIT 3
Document24 pages
DM Notes - UNIT 3
Raparthi Jaychandra
No ratings yet
Data Mining University Answer
Document10 pages
Data Mining University Answer
oozed12
No ratings yet
Assignment Solution 074
Document8 pages
Assignment Solution 074
Atharv Sharma
No ratings yet
DSF Unit 4
Document12 pages
DSF Unit 4
Hitarth Chugh
No ratings yet
DATA MINING and MACHINE LEARNING. CLASSIFICATION PREDICTIVE TECHNIQUES: SUPPORT VECTOR MACHINE, LOGISTIC REGRESSION, DISCRIMINANT ANALYSIS and DECISION TREES: Examples with MATLAB
From Everand
DATA MINING and MACHINE LEARNING. CLASSIFICATION PREDICTIVE TECHNIQUES: SUPPORT VECTOR MACHINE, LOGISTIC REGRESSION, DISCRIMINANT ANALYSIS and DECISION TREES: Examples with MATLAB
César Pérez López
No ratings yet
Title Predicting House Pricing Using AIML (KASHISH)
Document2 pages
Title Predicting House Pricing Using AIML (KASHISH)
Jay Vardhan
No ratings yet
Unit - 1 1.introduction To ML
Document74 pages
Unit - 1 1.introduction To ML
MAKIREDDI KIRAN BABU
No ratings yet
Unit 3
Document41 pages
Unit 3
Venkatesh Sharma
No ratings yet
Group 5 - Smsma
Document17 pages
Group 5 - Smsma
abhilashmba22
No ratings yet
Business Report Data Mining
Document29 pages
Business Report Data Mining
hepzi selvam
No ratings yet
Aadarsh Chauhan - ML - New
Document7 pages
Aadarsh Chauhan - ML - New
Aadarsh
No ratings yet
ITP4-Lesson 4-Week 7-8
Document18 pages
ITP4-Lesson 4-Week 7-8
Jamaica Mercolita
No ratings yet
DA (All CHP.)
Document14 pages
DA (All CHP.)
Sushant Thite
No ratings yet
Loan Default Classification Problem
Document1 page
Loan Default Classification Problem
sunil.claycapital
No ratings yet
Description: Bank - Marketing - Part1 - Data - CSV
Document4 pages
Description: Bank - Marketing - Part1 - Data - CSV
ravikgovindu
No ratings yet
Aids QB2
Document13 pages
Aids QB2
Maqsood Shaikh
No ratings yet
Data Mining Unit2
Document9 pages
Data Mining Unit2
Rupesh Prajapat
No ratings yet
Query Extraction Using Filtering Technique Over The Stored Data in The Database
Document5 pages
Query Extraction Using Filtering Technique Over The Stored Data in The Database
Rahul Sharma
No ratings yet
FAI Lecture - 23-10-2023 PDF
Document12 pages
FAI Lecture - 23-10-2023 PDF
Weixin07
No ratings yet
DMWH M3
Document21 pages
DMWH M3
BINESH
No ratings yet
DM - MOD - 1 Part II
Document14 pages
DM - MOD - 1 Part II
sandrarajuofficial
No ratings yet
Combined PDF
Document62 pages
Combined PDF
Siwalik Mishra
No ratings yet
Green Minimalist Professional Business Proposal Presentation
Document20 pages
Green Minimalist Professional Business Proposal Presentation
nikhil.lahane
No ratings yet
CH 4
Document106 pages
CH 4
Abebe Bekele
No ratings yet
Module 3
Document13 pages
Module 3
aiswaryaprathapan22
No ratings yet
Scikit - Notes ML
Document12 pages
Scikit - Notes ML
Vulli Leela Venkata Phanindra
100% (1)
PYA2 L 1705999484
Document34 pages
PYA2 L 1705999484
Noor Azlina Sharif
No ratings yet
For More Visit WWW - Ktunotes.in
Document21 pages
For More Visit WWW - Ktunotes.in
Archa Rajan
No ratings yet
206 Data Mining
Document28 pages
206 Data Mining
Premraj Pardeshi
No ratings yet
DataScience Week3
Document2 pages
DataScience Week3
Ajitha Aji
No ratings yet
INNOVATION - PDF Phrase 2
Document9 pages
INNOVATION - PDF Phrase 2
hemapardeep8
No ratings yet
Project Data Mining Tanaya Lokhande
Document58 pages
Project Data Mining Tanaya Lokhande
tanaya lokhande
No ratings yet
Asign-3 DWDM
Document27 pages
Asign-3 DWDM
Rohilla Jatin
No ratings yet
FDS For Sem
Document11 pages
FDS For Sem
samkiki019
No ratings yet
Down 4
Document83 pages
Down 4
pavunkumar
No ratings yet
About Classificatio1
Document5 pages
About Classificatio1
ariful
No ratings yet
DATA MINING and MACHINE LEARNING: CLUSTER ANALYSIS and kNN CLASSIFIERS. Examples with MATLAB
From Everand
DATA MINING and MACHINE LEARNING: CLUSTER ANALYSIS and kNN CLASSIFIERS. Examples with MATLAB
César Pérez López
No ratings yet
Assignment 1: Q1. Task Description
Document12 pages
Assignment 1: Q1. Task Description
Chakri Chakradhar
No ratings yet
Lec01introF23 PDF
Document45 pages
Lec01introF23 PDF
Chakri Chakradhar
No ratings yet
Net 2018 07 026
Document29 pages
Net 2018 07 026
Chakri Chakradhar
No ratings yet
J Adhoc 2018 05 008
Document16 pages
J Adhoc 2018 05 008
Chakri Chakradhar
No ratings yet
A Survey of Deep Learning Techniques For Autonomous Driving
Document28 pages
A Survey of Deep Learning Techniques For Autonomous Driving
tilahun
No ratings yet
Fifth Generation - Present and Beyond:Artificial Intelligence Advance Version
Document14 pages
Fifth Generation - Present and Beyond:Artificial Intelligence Advance Version
Yasir Ahmed
0% (1)
Optimizing Dialog LLM Chatbot Retrieval Augmented Generation With A Swarm Architecture - by Anthony Alcaraz - Aug, 2023 - Medium
Document16 pages
Optimizing Dialog LLM Chatbot Retrieval Augmented Generation With A Swarm Architecture - by Anthony Alcaraz - Aug, 2023 - Medium
Sergio Martínez
No ratings yet
[Studies in Computational Intelligence 740] Khaled Shaalan,Aboul Ella Hassanien,Fahmy Tolba (eds.) - Intelligent Natural Language Processing_ Trends and Applications (2018, Springer International Publishing).pdf
Document763 pages
[Studies in Computational Intelligence 740] Khaled Shaalan,Aboul Ella Hassanien,Fahmy Tolba (eds.) - Intelligent Natural Language Processing_ Trends and Applications (2018, Springer International Publishing).pdf
diana
No ratings yet
TOP 21 DATA SCIENCE PROJECTS - Part 1
Document6 pages
TOP 21 DATA SCIENCE PROJECTS - Part 1
reecoindiaco
No ratings yet
Noi Dung
Document82 pages
Noi Dung
dj772073
No ratings yet
AICh 6
Document44 pages
AICh 6
derbew2112
No ratings yet
Attendance Monitoring Using Face Recognition and Machine Learning
Document9 pages
Attendance Monitoring Using Face Recognition and Machine Learning
Rsyed
No ratings yet
Daftar Pustaka
Document3 pages
Daftar Pustaka
nakata_uuk
No ratings yet
01 Python 03 SQL Basics
Document8 pages
01 Python 03 SQL Basics
AyoubENSAT
No ratings yet
The Cricket Winner Prediction With Applications of ML and Data Analytics
Document18 pages
The Cricket Winner Prediction With Applications of ML and Data Analytics
Muhammad Swalih
No ratings yet
Day6 Assignment Solution
Document2 pages
Day6 Assignment Solution
Aditya Singh
No ratings yet
Human Activity Recognition: A Review
Document8 pages
Human Activity Recognition: A Review
DEEPTI RANA
No ratings yet
Types of Corporate Communications by Menna Amer
Document9 pages
Types of Corporate Communications by Menna Amer
mfrahmat2
100% (1)
Dimension Reduction: P Adraig Cunningham University College Dublin
Document24 pages
Dimension Reduction: P Adraig Cunningham University College Dublin
Ram Vivek
No ratings yet
A Deep Learning Approach For State-Of-Health Estimation of Lithium-Ion Batteries Based On Defferential Thermal Voltammetery and Attention Mechanism
Document14 pages
A Deep Learning Approach For State-Of-Health Estimation of Lithium-Ion Batteries Based On Defferential Thermal Voltammetery and Attention Mechanism
Sarmad Al-Abbad
No ratings yet
1803.04311 - Transaction Survey
Document53 pages
1803.04311 - Transaction Survey
solarisan6
No ratings yet
Brain Heaters Questions and Answers
Document15 pages
Brain Heaters Questions and Answers
Junaid Khan
No ratings yet
Software Design
Document12 pages
Software Design
ak
No ratings yet
Chapter 9. Classification: Advanced Methods
Document39 pages
Chapter 9. Classification: Advanced Methods
saideepak2010
No ratings yet
On Design and Applications of Digital Differentiators
Document7 pages
On Design and Applications of Digital Differentiators
tkbattula
No ratings yet
Customers Satisfaction Based On Zomato Ratings and Reviews Using Machine Learning
Document5 pages
Customers Satisfaction Based On Zomato Ratings and Reviews Using Machine Learning
International Journal of Innovative Science and Research Technology
No ratings yet
Top 6 Best SQL Database For Web Applications To Use in 2022
Document2 pages
Top 6 Best SQL Database For Web Applications To Use in 2022
edm21221
No ratings yet
Deep Learning
Document3 pages
Deep Learning
Anu M
100% (1)
NN Theory
Document138 pages
NN Theory
Gunjan Khut
No ratings yet
Medical Image Processing Parasitology Brief
Document17 pages
Medical Image Processing Parasitology Brief
EE 503 AnAs
No ratings yet
AI in Automotive Industry
Document1 page
AI in Automotive Industry
Ashim Ranabhat
No ratings yet
TS DatabaseChangeScripts 140223 1318 108
Document10 pages
TS DatabaseChangeScripts 140223 1318 108
ioriyagami8409
No ratings yet
1.5 Literature Review
Document4 pages
1.5 Literature Review
Chethan B Raj
No ratings yet