Welcome to Scribd!

Unsupervised Learning: Harsha Vardhan Reddy Burri

Uploaded by

0% found this document useful (0 votes)

15 views10 pages

Unsupervised learning involves identifying hidden patterns in data without labeled outputs or targets. The main goals are to prepare clusters of similar data points and estimate the density of data distribution in the feature space. Common unsupervised learning techniques include k-means clustering, which groups data points into k clusters based on minimizing distances to centroid points, and hierarchical clustering, which builds nested clusters based on similarity. Unsupervised learning has applications in areas like market analysis, biology, and web mining.

Original Description:

Original Title

Unsupervised Learning

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

0% found this document useful (0 votes)

15 views10 pages

Unsupervised Learning: Harsha Vardhan Reddy Burri

Uploaded by

T R

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

Jump to Page

You are on page 1of 10

Search inside document

Unsupervised Learning

Harsha Vardhan Reddy Burri

Unsupervised Learning
• There is no output or response or target
variable, only having input variable(X)
• The major goal is to identify the hidden
patterns and relationships in data
• Preparing clusters and finding data
distribution in the space (density estimation).
• Examples: grouping fruits
Grouping :
• Green color – bananas and grapes
• Physical characters
• Green color and big size – banana
• Like shape, color, odor,
• Green color and small size‐ grapes
• Ex: Red color – apples and cherrys
• Redcolor and bigsize‐ apples
• Redcolor and small size‐ cherrys
Real Life examples
• You meet strangers in party , then you need to
classify them without prior knowldge. How to
do? – Basis on gender, age, habits and other
behavioural
• You found a new instance that differ from
others, how to find or classify? ‐
Challenges
• Harder as compared to Supervised Learning tasks..
• Dealing with large number of dimensions and large number of
data items can be problematic because of time complexity;
• The effectiveness of the method depends on the definition of
“distance” (for distance‐based clustering).
• The result of the clustering algorithm (that in many cases can
be arbitrary itself) can be interpreted in different ways.
• How do we know if results are meaningful since no answer
labels are available?
• Let the expert look at the results (external evaluation)
• Define an objective function on clustering (internal
evaluation)
Applications
• Can be applied in many fields
• Market Analysis :
Grouping customers
• Biology:
Classification of plants and animals given their features
Analysis genes and genomes
• Insurance:
Identifying groups of motor insurance policy holders
with a high average claim cost; identifying frauds;
• Earthquake studies:
– Clustering observed earthquake epicenters to identify
dangerous zones;
• World Wide Web:
– Document classification; clustering weblog data to discover
groups of similar access patterns.
Types of Unsupervised algorithms
• K‐means clustering

• Hierarchial clustering

• Principle Component Analysis
K‐means Clustering
• Unsupervised learning algoritm
• Unleabelled data or no target label
• Goal is to find patterns and making clusters
Stpes in K‐means:
• 1: Pick random points as cluster centers (also called as
centroids). cluster centroids – c1, c2, c3….ck
• 2: Assign each data point to nearest cluster by calculating
its distance to each centroid
• 3. find new cluster center by taking the averages of
assigned points
• 4. Repeat step 2 and 3 untill none of the cluster
assignments change
Dataset= [2,3,4,10,11,12,20,25,30] #monthly expenditure (in 1000) of customers

10,11,12,20,25,30
2,3,4
Mean =3
Mean =18

11,12,20,25,30
2,3,4,10

Mean =5
Mean =20

12,20,25,30
2,3,4,10,11

Mean =6
Mean =22
2,3,4,10,11,12 20,25,30

Mean =7
Mean =25

Applications:
1. Image segmentation
2. Clustering genome data – gene segments
3. Data mining segmentation
4. Anomly detection
5. Instance classification
6. Customer classification

Excel Power Pivot and Power Query For Dummies
Document58 pages
Excel Power Pivot and Power Query For Dummies
Dario Alvarezd
83% (6)
Statistics A. Introduction
Document24 pages
Statistics A. Introduction
Bianca Trish Manlangit
0% (1)
SUMI-Software Usability Measurement Inventory Qestionnaire
Document4 pages
SUMI-Software Usability Measurement Inventory Qestionnaire
sus023
No ratings yet
Ericsson Mini Link TN MGMT Operation and Maintenance
Document28 pages
Ericsson Mini Link TN MGMT Operation and Maintenance
saidbitar
100% (13)
Data Analysis. Data Management
Document23 pages
Data Analysis. Data Management
Teacher NNN
No ratings yet
Understanding Data Mining
Document21 pages
Understanding Data Mining
Yah yah yahhhhh
No ratings yet
Classification Ppts 2021
Document80 pages
Classification Ppts 2021
PRIYA RATHORE
No ratings yet
Introduction To Statistics
Document44 pages
Introduction To Statistics
Resapu Gnana Sree
No ratings yet
Exploring Data - Sessions 2,3,4
Document49 pages
Exploring Data - Sessions 2,3,4
Tapaswini Satapathy
No ratings yet
BStats 1
Document66 pages
BStats 1
Agam Prakash
No ratings yet
Data Mining
Document18 pages
Data Mining
Nelson Raja
No ratings yet
Presentation For Follow Up
Document23 pages
Presentation For Follow Up
Neoaz Mahfuz
No ratings yet
Data Preparation and Analysis 3
Document182 pages
Data Preparation and Analysis 3
Karishma Akhtar
No ratings yet
Lesson4 Data
Document31 pages
Lesson4 Data
Halah Aftab
No ratings yet
4 - Data Analytics Using DM and ML Algorithms - 1
Document71 pages
4 - Data Analytics Using DM and ML Algorithms - 1
Tariku Wodajo
No ratings yet
Data Clustering For Forecasting: James B. Orlin MIT Sloan School and OR Center
Document71 pages
Data Clustering For Forecasting: James B. Orlin MIT Sloan School and OR Center
hello7686
No ratings yet
Data Science and Data Analytics: Part B
Document42 pages
Data Science and Data Analytics: Part B
jackson foo
No ratings yet
Presentation Fbook Version
Document22 pages
Presentation Fbook Version
mgmt6008
No ratings yet
Section 1
Document49 pages
Section 1
HuanYu
No ratings yet
Research Methodology - Tools and Technique - Magister Farmasi Unjani 2022 - DR - Dr.lulu
Document36 pages
Research Methodology - Tools and Technique - Magister Farmasi Unjani 2022 - DR - Dr.lulu
Erwin Ekadharma
No ratings yet
Jalali@mshdiua - Ac.ir Jalali - Mshdiau.ac - Ir: Data Mining
Document50 pages
Jalali@mshdiua - Ac.ir Jalali - Mshdiau.ac - Ir: Data Mining
Mostafa Heidary
No ratings yet
Teit Cbgs Dmbi Lab Manual FH 2015
Document60 pages
Teit Cbgs Dmbi Lab Manual FH 2015
Soumya Pandey
No ratings yet
Lecture 2
Document18 pages
Lecture 2
bida22-016
No ratings yet
Introduction Unit - Summary: Data Mining
Document62 pages
Introduction Unit - Summary: Data Mining
Meet
No ratings yet
Module 3. - Measures of Central Tendency
Document21 pages
Module 3. - Measures of Central Tendency
Marvin Yebes Arce
No ratings yet
Chapter 4 Classification
Document78 pages
Chapter 4 Classification
Mohamedsultan Awol
No ratings yet
Chapter - 6: Concepts of Classification and Prediction
Document28 pages
Chapter - 6: Concepts of Classification and Prediction
Mfleh Mfleh
No ratings yet
Marketing Management
Document23 pages
Marketing Management
cecdevera
No ratings yet
Practical Research 2
Document113 pages
Practical Research 2
Hershey Magsayo
No ratings yet
Nature of Statistics Part 2
Document48 pages
Nature of Statistics Part 2
ROYYETTE F. FERNANDEZ
No ratings yet
Business Research
Document33 pages
Business Research
Mohammad Ali
No ratings yet
L11 - Exploring Assumptions of Parametric
Document19 pages
L11 - Exploring Assumptions of Parametric
Ramesh G
No ratings yet
Applied Statistical Methods (ASM) : "The True Logic of This World Is in The Calculus of Probabilities"
Document90 pages
Applied Statistical Methods (ASM) : "The True Logic of This World Is in The Calculus of Probabilities"
Tushar Shrimali
No ratings yet
Marketing Research Process
Document58 pages
Marketing Research Process
Abhishek Agarwal
No ratings yet
INF30036 Lecture4
Document47 pages
INF30036 Lecture4
Yehan Abayasinghe
No ratings yet
Data Mining (Viva)
Document18 pages
Data Mining (Viva)
Anubhav Shrivastava
No ratings yet
Data Preparation and Analysis
Document11 pages
Data Preparation and Analysis
ainasafia
No ratings yet
P Veerabathiran Computerscience
Document48 pages
P Veerabathiran Computerscience
Dhilsanth SL
No ratings yet
Data Mining
Document135 pages
Data Mining
Dewsun Riseon
No ratings yet
Data Mining Course Overview
Document38 pages
Data Mining Course Overview
harishkode
No ratings yet
Chapter 21: Multidimensional Scaling and Conjoint Analysis: Advance Marketing Research
Document58 pages
Chapter 21: Multidimensional Scaling and Conjoint Analysis: Advance Marketing Research
Shachi Desai
No ratings yet
III CS Datamining - Unlocked
Document68 pages
III CS Datamining - Unlocked
Jana Jana
No ratings yet
HaftamuA ArticleReview
Document39 pages
HaftamuA ArticleReview
znabugrmay20adi
No ratings yet
Business Decision Making
Document18 pages
Business Decision Making
Nokib
No ratings yet
Overview of Clustering:: UNIT-5
Document27 pages
Overview of Clustering:: UNIT-5
Kalyan Varma
No ratings yet
Statistics II
Document7 pages
Statistics II
MURALEE A/L VEERAMALAI Moe
No ratings yet
Unit-IV Classification Part 1
Document38 pages
Unit-IV Classification Part 1
gayathriande20
No ratings yet
Data Mining
Document32 pages
Data Mining
David Lukman
No ratings yet
Lecture 7 - Data Collection & Measurement
Document36 pages
Lecture 7 - Data Collection & Measurement
Wycliff Oteng
No ratings yet
ML Lect1
Document51 pages
ML Lect1
physics lover
100% (1)
Business Stat-1
Document58 pages
Business Stat-1
Alina
No ratings yet
Measures of Central Tendency
Document34 pages
Measures of Central Tendency
Armin Arlet
No ratings yet
Caribbean Advanced Proficiency Examination Integrated Mathematics
Document28 pages
Caribbean Advanced Proficiency Examination Integrated Mathematics
alisha khan
No ratings yet
Iv Ii Da PPT 1
Document30 pages
Iv Ii Da PPT 1
vijay kumar
No ratings yet
03 - Data & Learning
Document53 pages
03 - Data & Learning
Soma Fadi
No ratings yet
Fuzzy Decision Tree Model For Prediction
Document18 pages
Fuzzy Decision Tree Model For Prediction
Mohit Sharma
No ratings yet
CH01 - Introduction To Statistics 2
Document52 pages
CH01 - Introduction To Statistics 2
mk.foo123
No ratings yet
Chap 5 Learning
Document56 pages
Chap 5 Learning
asnake ketema
No ratings yet
Lesson Plan Masonmannixmorgankirkpatrick
Document18 pages
Lesson Plan Masonmannixmorgankirkpatrick
api-585574749
No ratings yet
Data2 PDF
Document48 pages
Data2 PDF
Yao magao
No ratings yet
Lecture 2-Introduction To Satistics
Document43 pages
Lecture 2-Introduction To Satistics
Ekta Agrawal
No ratings yet
2 - Preprocessing
Document74 pages
2 - Preprocessing
Shivam Verma
No ratings yet
Reading Well - Grades 4-5
From Everand
Reading Well - Grades 4-5
Cindy Barden
Rating: 4 out of 5 stars
4/5 (1)
Notes Module2
Document130 pages
Notes Module2
T R
No ratings yet
Object Oriented Programming
Document26 pages
Object Oriented Programming
T R
No ratings yet
Notes Module3
Document49 pages
Notes Module3
T R
No ratings yet
Q1 Why Should You Learn To Write Programs ?
Document30 pages
Q1 Why Should You Learn To Write Programs ?
T R
No ratings yet
Functions
Document28 pages
Functions
T R
No ratings yet
Exception Handling: 1. Syntax Errors
Document28 pages
Exception Handling: 1. Syntax Errors
T R
No ratings yet
Lect 00
Document11 pages
Lect 00
Wang
No ratings yet
Ss 10
Document2 pages
Ss 10
moez ben youssef
No ratings yet
Atx2 1 PDF
Document24 pages
Atx2 1 PDF
trinus18
No ratings yet
Installations Us Prog 3 D
Document5 pages
Installations Us Prog 3 D
Aman
No ratings yet
Cisco Mobility Express User Guide For Release 8.2: Americas Headquarters
Document72 pages
Cisco Mobility Express User Guide For Release 8.2: Americas Headquarters
aung myo tun
No ratings yet
IMS-DC Presentacion
Document37 pages
IMS-DC Presentacion
Jose Ricardo Andrade Cortes
No ratings yet
Computer-Assembly-And-Repair-Lab-Manual 2023 - 202 - 231209 - 093922
Document63 pages
Computer-Assembly-And-Repair-Lab-Manual 2023 - 202 - 231209 - 093922
Rashmi Sameer
No ratings yet
23-24 EoT2 Coverage Mathematics G10 Gen Reveal
Document1 page
23-24 EoT2 Coverage Mathematics G10 Gen Reveal
wadima
No ratings yet
EXA Data-Integrations-Datasheet L1R2
Document17 pages
EXA Data-Integrations-Datasheet L1R2
Abraham Morales Pablo
No ratings yet
Ps 2
Document2 pages
Ps 2
Asishsai
No ratings yet
Basic Grammar Starter With Answers
Document1 page
Basic Grammar Starter With Answers
Camila Aguilera
No ratings yet
LNK LMS SophisticatedGuideToContentMarketing
Document108 pages
LNK LMS SophisticatedGuideToContentMarketing
neilscaife
No ratings yet
HTML Forms
Document1 page
HTML Forms
Yaashin Zeelan
No ratings yet
NOC Services and Applications: Sunday Folayan Nishal Goburdhan Isatou Jah
Document48 pages
NOC Services and Applications: Sunday Folayan Nishal Goburdhan Isatou Jah
ghassan
No ratings yet
UTStudio Public Manifest Release 3.8.2
Document17 pages
UTStudio Public Manifest Release 3.8.2
JR MP
No ratings yet
Lab 4 Working With Arrays
Document8 pages
Lab 4 Working With Arrays
Lê Bảo Hiếu
No ratings yet
Abdul Mateen Hashmi Roll #54
Document4 pages
Abdul Mateen Hashmi Roll #54
Abdul Mateen Hashmi
No ratings yet
Agravat, Jha - 2015 - Review of Various Clustering Methods Used To Categorize Seismic Data Into Earthquake and Mining Blast
Document4 pages
Agravat, Jha - 2015 - Review of Various Clustering Methods Used To Categorize Seismic Data Into Earthquake and Mining Blast
Lucas Aguiar Vita
No ratings yet
Frequency Distributions and Their Graphs
Document20 pages
Frequency Distributions and Their Graphs
Rogie Mae Quinanahan
No ratings yet
DSE91xx DSE92xx DSE94xx Series Operators Manual
Document77 pages
DSE91xx DSE92xx DSE94xx Series Operators Manual
Leopoldo Godinez Hernandez
No ratings yet
PB Scs4 en Eu Original 75260
Document12 pages
PB Scs4 en Eu Original 75260
Mansiafai Oswald Franck Koffi
No ratings yet
IT Security and Cyber Security Policy
Document27 pages
IT Security and Cyber Security Policy
PA2 kspl
100% (1)
English For IT
Document187 pages
English For IT
Nicolas Cadena
No ratings yet
Itt Project by Krishan
Document31 pages
Itt Project by Krishan
Siddhartha Bindal
No ratings yet
Shanthi Pavan - CT DSM, Design Considerations - 2016
Document6 pages
Shanthi Pavan - CT DSM, Design Considerations - 2016
Saleh Heidary Shalmany
No ratings yet
MLT Unit-1
Document19 pages
MLT Unit-1
Son Ish
No ratings yet
Prosk
Document9 pages
Prosk
Abdulla Sayah
No ratings yet