Welcome to Scribd!

0% found this document useful (0 votes)

11 views

Q1 Statistics

Uploaded by

1) The document applies one-hot encoding to categorical columns in an automotive dataset and saves it as a new CSV file. 2) It then manually calculates the mean and variance of numeric columns without using inbuilt functions. 3) Finally, it normalizes the numeric data, calculates the mean and variance of the normalized data, and prints the results.

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Chat GPT With Data Science
Document36 pages
Chat GPT With Data Science
Arockiaraj J
No ratings yet
TS Arima
Document2 pages
TS Arima
1DS21AI055
No ratings yet
Linear Regression
Document16 pages
Linear Regression
api-446917114
100% (1)
Linear Regression PT
Document16 pages
Linear Regression PT
api-540907926
100% (1)
Assignment No 2 CS101
Document2 pages
Assignment No 2 CS101
Reddit and Twitter
No ratings yet
From Scratch: Writing Your Own Functions
Document15 pages
From Scratch: Writing Your Own Functions
Anas Jamshed
No ratings yet
Exer 2
Document2 pages
Exer 2
Mir Aadil
No ratings yet
Laboratoire D'intelligence Artificielle: ESIEA 3A 2019-2020 Mihir Sarkar Mihir@media - Mit.edu
Document22 pages
Laboratoire D'intelligence Artificielle: ESIEA 3A 2019-2020 Mihir Sarkar Mihir@media - Mit.edu
Slal Opza
No ratings yet
21sc1101 Test 1 Key
Document12 pages
21sc1101 Test 1 Key
unique engineer
No ratings yet
Imports
Document3 pages
Imports
mans_1201
No ratings yet
Lab 3
Document23 pages
Lab 3
RAMESH KUMAR
No ratings yet
CODE Lab06
Document7 pages
CODE Lab06
Asiley Ramirez
No ratings yet
Formation Angular Lab 2 More Components: Lab 2.1: Data Flowing Downwards
Document5 pages
Formation Angular Lab 2 More Components: Lab 2.1: Data Flowing Downwards
Sana Bargaoui
No ratings yet
Formation Angular Lab 2 More Components: Lab 2.1: Data Flowing Downwards
Document5 pages
Formation Angular Lab 2 More Components: Lab 2.1: Data Flowing Downwards
Sana Bargaoui
No ratings yet
String & Character Based Solved Program
Document6 pages
String & Character Based Solved Program
vickroid007
No ratings yet
Random Forest 1 Image
Document5 pages
Random Forest 1 Image
Spruzume
No ratings yet
Programming Questions
Document7 pages
Programming Questions
RALPH LAURENCE VISAYA
No ratings yet
Linear Regression
Document2 pages
Linear Regression
Raghupal reddy Gangula
No ratings yet
Python Pandas Hands-On CID 55937
Document10 pages
Python Pandas Hands-On CID 55937
Stark
No ratings yet
Parallel and Distributed Computing CSE4001 Lab - 4
Document5 pages
Parallel and Distributed Computing CSE4001 Lab - 4
Sasank Chunduri
No ratings yet
CSE4001 Parallel and Distributed Computing: Lab Assignment 6
Document8 pages
CSE4001 Parallel and Distributed Computing: Lab Assignment 6
Sukriti Jaitly
No ratings yet
Unit Testing in Angular
Document3 pages
Unit Testing in Angular
mahi
No ratings yet
Image Processing Lab Work
Document24 pages
Image Processing Lab Work
Elite Gammer 03
No ratings yet
2nd Year Subir Das 3rd Assignment
Document3 pages
2nd Year Subir Das 3rd Assignment
Lovekush Kumar
No ratings yet
Engo 645
Document9 pages
Engo 645
sree vishnupriyq
No ratings yet
Python Numpy 8 Nov
Document69 pages
Python Numpy 8 Nov
Jettastic Music
No ratings yet
Training Code
Document27 pages
Training Code
The Mind
No ratings yet
Experiment 8
Document3 pages
Experiment 8
Jeevika D.k
No ratings yet
CSC 185-Seventh Lab
Document9 pages
CSC 185-Seventh Lab
pavanil
No ratings yet
Breast Cancer Upload1
Document3 pages
Breast Cancer Upload1
Arpita
No ratings yet
Problem 1: Clustering: #Load The Required Packages
Document43 pages
Problem 1: Clustering: #Load The Required Packages
ravikgovindu
No ratings yet
Documento Sin Título
Document1 page
Documento Sin Título
『Tc』 BRYANXDツ
No ratings yet
Table Creation
Document10 pages
Table Creation
Vijaya Prabakaran
No ratings yet
Sample
Document11 pages
Sample
Jayaraj Alagarsamy
No ratings yet
C Programs
Document55 pages
C Programs
muthaliff
No ratings yet
Logistic Regression
Document2 pages
Logistic Regression
Raghupal reddy Gangula
No ratings yet
Unit V
Document59 pages
Unit V
abimaya006
No ratings yet
Descending
Document3 pages
Descending
nkwentiak
No ratings yet
Salida
Document2 pages
Salida
Merced
No ratings yet
Programs For Printing Pyramid Patterns in C++ - GeeksforGeeks
Document12 pages
Programs For Printing Pyramid Patterns in C++ - GeeksforGeeks
Hassan
No ratings yet
20BCE260
Document13 pages
20BCE260
Mansi Singh
No ratings yet
Shubham Image File
Document14 pages
Shubham Image File
Shubham Mishra Ji
No ratings yet
Odoocms - Class.material 8016 Material File
Document8 pages
Odoocms - Class.material 8016 Material File
Zeeshan Afzal
No ratings yet
Machine Learning With Python - Part-3
Document19 pages
Machine Learning With Python - Part-3
Musto
No ratings yet
Pip
Document379 pages
Pip
Gabriela
No ratings yet
D20160808 Marker Search With Image Correlation
Document2 pages
D20160808 Marker Search With Image Correlation
Ambar Shukla
No ratings yet
Mean
Document7 pages
Mean
tony stark
No ratings yet
Terminal Lab Fa19-Epe-028-1
Document10 pages
Terminal Lab Fa19-Epe-028-1
Zabeehullahmiakhail
No ratings yet
Old Computing Lab 2 Test
Document2 pages
Old Computing Lab 2 Test
Lim Zhe Xian
No ratings yet
60 ChatGPT Prompts For Data Science 2023
Document67 pages
60 ChatGPT Prompts For Data Science 2023
T L
100% (2)
Cannonball Implicit Duration - Dymos
Document7 pages
Cannonball Implicit Duration - Dymos
michael.sielemann
No ratings yet
Reporte
Document12 pages
Reporte
Renato Sebastian Rodriguez Llanos
No ratings yet
Fed 2 CH 6 Notes
Document11 pages
Fed 2 CH 6 Notes
Muhammad
No ratings yet
Cse 4001-Parallel and Distributed Computing Lab Digital Assessment-1 Name: Avulapati Anusha REG - NO: 17BCE0435
Document5 pages
Cse 4001-Parallel and Distributed Computing Lab Digital Assessment-1 Name: Avulapati Anusha REG - NO: 17BCE0435
Asrith Kakumanu
No ratings yet
p5 - Lap, Grad
Document1 page
p5 - Lap, Grad
4832550
No ratings yet
Tree
Document7 pages
Tree
indigalakishore
No ratings yet
Xii Project PDF
Document19 pages
Xii Project PDF
poonamkhera100
No ratings yet
Getpip 27
Document407 pages
Getpip 27
POPBO
No ratings yet
CD 601 Lab Manual
Document61 pages
CD 601 Lab Manual
Satya Prakash Soni
No ratings yet
C Language Programming Codes
From Everand
C Language Programming Codes
Durgesh
No ratings yet
MT2
Document10 pages
MT2
Rijit
No ratings yet
DPGA
Document1 page
DPGA
Rijit
No ratings yet
1 s2.0 S0957417421004899 Main
Document21 pages
1 s2.0 S0957417421004899 Main
Rijit
No ratings yet
Full Length Research Article: ISSN: 2230-9926
Document4 pages
Full Length Research Article: ISSN: 2230-9926
Rijit
No ratings yet
Rainfall Prediction Using Machine Learning and Neural Network
Document8 pages
Rainfall Prediction Using Machine Learning and Neural Network
Rijit
No ratings yet

Q1 Statistics

Uploaded by

Rijit

0% found this document useful (0 votes)

11 views1 page

Original Description:

Original Title

Q1statistics

Copyright

Available Formats

DOCX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as docx, pdf, or txt

0% found this document useful (0 votes)

11 views1 page

Q1 Statistics

Uploaded by

Rijit

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as docx, pdf, or txt

Jump to Page

You are on page 1of 1

Search inside document

import numpy as np

import pandas as pd

# a)
autoMPG = pd.read_csv("autoMPG.csv")
discreteColumns = ["cylinders", "model year", "origin"]
autoMPG = pd.get_dummies(autoMPG, columns=['cylinders', 'model year', 'origin'])
autoMPG.to_csv('autoMPGmodified.csv', index=False)
print("Applied one hot encoding and saved in a new file!")

# One hot encoding has been applied on discrete attributes

# Since there are no non-numeric ordinal attributes I haven't applied integer mapping

# b) Calculating mean and variance manually without inbuilt functions

columns = ['mpg', 'displacement', 'horsepower', 'weight', 'acceleration'] # Choosing only the
numerical attributes
autoMPG = autoMPG[autoMPG['horsepower'] != '?'] # A few entries in the column
horsepower are '?' and need to be removed
autoMPG['horsepower'] = autoMPG['horsepower'].astype(float) # Converting object type to
float type
data = autoMPG[columns].values
n, d = data.shape

meanVector = np.sum(data, axis=0) / n # Calculating mean

varianceVector = np.sum(np.square(data - meanVector), axis=0) / n # Calculating variance

for i in range(d):
print(f"Feature {i + 1} - Mean (x̄): {meanVector[i]}, Variance (σ^2): {varianceVector[i]}")

# c) Normalizing the data and calculating mean and variance again for the normalized data
normalizedData = data - meanVector / varianceVector ** 0.5 # Calculating normalized
values
print(f'\nNormalized data:\n {normalizedData}')
n, d = normalizedData.shape
varianceVectorNorm = np.zeros(d)

for j in range(d):
squared_diff = (normalizedData[:, j] - np.mean(normalizedData[:, j])) ** 2
varianceVectorNorm[j] = np.sum(squared_diff) / (n - 1) # Calculating variance

print(f'\nNormalized data variance:\n {varianceVectorNorm}')

Chat GPT With Data Science
Document36 pages
Chat GPT With Data Science
Arockiaraj J
No ratings yet
TS Arima
Document2 pages
TS Arima
1DS21AI055
No ratings yet
Linear Regression
Document16 pages
Linear Regression
api-446917114
100% (1)
Linear Regression PT
Document16 pages
Linear Regression PT
api-540907926
100% (1)
Assignment No 2 CS101
Document2 pages
Assignment No 2 CS101
Reddit and Twitter
No ratings yet
From Scratch: Writing Your Own Functions
Document15 pages
From Scratch: Writing Your Own Functions
Anas Jamshed
No ratings yet
Exer 2
Document2 pages
Exer 2
Mir Aadil
No ratings yet
Laboratoire D'intelligence Artificielle: ESIEA 3A 2019-2020 Mihir Sarkar Mihir@media - Mit.edu
Document22 pages
Laboratoire D'intelligence Artificielle: ESIEA 3A 2019-2020 Mihir Sarkar Mihir@media - Mit.edu
Slal Opza
No ratings yet
21sc1101 Test 1 Key
Document12 pages
21sc1101 Test 1 Key
unique engineer
No ratings yet
Imports
Document3 pages
Imports
mans_1201
No ratings yet
Lab 3
Document23 pages
Lab 3
RAMESH KUMAR
No ratings yet
CODE Lab06
Document7 pages
CODE Lab06
Asiley Ramirez
No ratings yet
Formation Angular Lab 2 More Components: Lab 2.1: Data Flowing Downwards
Document5 pages
Formation Angular Lab 2 More Components: Lab 2.1: Data Flowing Downwards
Sana Bargaoui
No ratings yet
Formation Angular Lab 2 More Components: Lab 2.1: Data Flowing Downwards
Document5 pages
Formation Angular Lab 2 More Components: Lab 2.1: Data Flowing Downwards
Sana Bargaoui
No ratings yet
String & Character Based Solved Program
Document6 pages
String & Character Based Solved Program
vickroid007
No ratings yet
Random Forest 1 Image
Document5 pages
Random Forest 1 Image
Spruzume
No ratings yet
Programming Questions
Document7 pages
Programming Questions
RALPH LAURENCE VISAYA
No ratings yet
Linear Regression
Document2 pages
Linear Regression
Raghupal reddy Gangula
No ratings yet
Python Pandas Hands-On CID 55937
Document10 pages
Python Pandas Hands-On CID 55937
Stark
No ratings yet
Parallel and Distributed Computing CSE4001 Lab - 4
Document5 pages
Parallel and Distributed Computing CSE4001 Lab - 4
Sasank Chunduri
No ratings yet
CSE4001 Parallel and Distributed Computing: Lab Assignment 6
Document8 pages
CSE4001 Parallel and Distributed Computing: Lab Assignment 6
Sukriti Jaitly
No ratings yet
Unit Testing in Angular
Document3 pages
Unit Testing in Angular
mahi
No ratings yet
Image Processing Lab Work
Document24 pages
Image Processing Lab Work
Elite Gammer 03
No ratings yet
2nd Year Subir Das 3rd Assignment
Document3 pages
2nd Year Subir Das 3rd Assignment
Lovekush Kumar
No ratings yet
Engo 645
Document9 pages
Engo 645
sree vishnupriyq
No ratings yet
Python Numpy 8 Nov
Document69 pages
Python Numpy 8 Nov
Jettastic Music
No ratings yet
Training Code
Document27 pages
Training Code
The Mind
No ratings yet
Experiment 8
Document3 pages
Experiment 8
Jeevika D.k
No ratings yet
CSC 185-Seventh Lab
Document9 pages
CSC 185-Seventh Lab
pavanil
No ratings yet
Breast Cancer Upload1
Document3 pages
Breast Cancer Upload1
Arpita
No ratings yet
Problem 1: Clustering: #Load The Required Packages
Document43 pages
Problem 1: Clustering: #Load The Required Packages
ravikgovindu
No ratings yet
Documento Sin Título
Document1 page
Documento Sin Título
『Tc』 BRYANXDツ
No ratings yet
Table Creation
Document10 pages
Table Creation
Vijaya Prabakaran
No ratings yet
Sample
Document11 pages
Sample
Jayaraj Alagarsamy
No ratings yet
C Programs
Document55 pages
C Programs
muthaliff
No ratings yet
Logistic Regression
Document2 pages
Logistic Regression
Raghupal reddy Gangula
No ratings yet
Unit V
Document59 pages
Unit V
abimaya006
No ratings yet
Descending
Document3 pages
Descending
nkwentiak
No ratings yet
Salida
Document2 pages
Salida
Merced
No ratings yet
Programs For Printing Pyramid Patterns in C++ - GeeksforGeeks
Document12 pages
Programs For Printing Pyramid Patterns in C++ - GeeksforGeeks
Hassan
No ratings yet
20BCE260
Document13 pages
20BCE260
Mansi Singh
No ratings yet
Shubham Image File
Document14 pages
Shubham Image File
Shubham Mishra Ji
No ratings yet
Odoocms - Class.material 8016 Material File
Document8 pages
Odoocms - Class.material 8016 Material File
Zeeshan Afzal
No ratings yet
Machine Learning With Python - Part-3
Document19 pages
Machine Learning With Python - Part-3
Musto
No ratings yet
Pip
Document379 pages
Pip
Gabriela
No ratings yet
D20160808 Marker Search With Image Correlation
Document2 pages
D20160808 Marker Search With Image Correlation
Ambar Shukla
No ratings yet
Mean
Document7 pages
Mean
tony stark
No ratings yet
Terminal Lab Fa19-Epe-028-1
Document10 pages
Terminal Lab Fa19-Epe-028-1
Zabeehullahmiakhail
No ratings yet
Old Computing Lab 2 Test
Document2 pages
Old Computing Lab 2 Test
Lim Zhe Xian
No ratings yet
60 ChatGPT Prompts For Data Science 2023
Document67 pages
60 ChatGPT Prompts For Data Science 2023
T L
100% (2)
Cannonball Implicit Duration - Dymos
Document7 pages
Cannonball Implicit Duration - Dymos
michael.sielemann
No ratings yet
Reporte
Document12 pages
Reporte
Renato Sebastian Rodriguez Llanos
No ratings yet
Fed 2 CH 6 Notes
Document11 pages
Fed 2 CH 6 Notes
Muhammad
No ratings yet
Cse 4001-Parallel and Distributed Computing Lab Digital Assessment-1 Name: Avulapati Anusha REG - NO: 17BCE0435
Document5 pages
Cse 4001-Parallel and Distributed Computing Lab Digital Assessment-1 Name: Avulapati Anusha REG - NO: 17BCE0435
Asrith Kakumanu
No ratings yet
p5 - Lap, Grad
Document1 page
p5 - Lap, Grad
4832550
No ratings yet
Tree
Document7 pages
Tree
indigalakishore
No ratings yet
Xii Project PDF
Document19 pages
Xii Project PDF
poonamkhera100
No ratings yet
Getpip 27
Document407 pages
Getpip 27
POPBO
No ratings yet
CD 601 Lab Manual
Document61 pages
CD 601 Lab Manual
Satya Prakash Soni
No ratings yet
C Language Programming Codes
From Everand
C Language Programming Codes
Durgesh
No ratings yet
MT2
Document10 pages
MT2
Rijit
No ratings yet
DPGA
Document1 page
DPGA
Rijit
No ratings yet
1 s2.0 S0957417421004899 Main
Document21 pages
1 s2.0 S0957417421004899 Main
Rijit
No ratings yet
Full Length Research Article: ISSN: 2230-9926
Document4 pages
Full Length Research Article: ISSN: 2230-9926
Rijit
No ratings yet
Rainfall Prediction Using Machine Learning and Neural Network
Document8 pages
Rainfall Prediction Using Machine Learning and Neural Network
Rijit
No ratings yet

Q1 Statistics

Uploaded by

Copyright:

Available Formats

You might also like

Q1 Statistics

Uploaded by

Document Information

Original Description:

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Q1 Statistics

Uploaded by

Copyright:

Available Formats

import numpy as np

# One hot encoding has been applied on discrete attributes

# b) Calculating mean and variance manually without inbuilt functions

meanVector = np.sum(data, axis=0) / n # Calculating mean

print(f'\nNormalized data variance:\n {varianceVectorNorm}')

You might also like