Welcome to Scribd!

Introml 02 Regression Annotated PDF

Uploaded by

0% found this document useful (0 votes)

38 views26 pages

This document introduces linear regression for machine learning. It discusses: 1) The basic supervised learning pipeline for regression problems, which involves training and test data, a learning method, classifier/model, and predictions. 2) Linear regression as an example of regression, which aims to predict real-valued labels. It discusses choosing a function class and measuring goodness of fit. 3) Least-squares linear regression which finds the optimal weight vector by minimizing the squared errors between predictions and true values on the training data. Gradient descent and closed-form solutions are introduced for solving this optimization problem.

Original Description:

Original Title

introml-02-regression-annotated.pdf

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

0% found this document useful (0 votes)

38 views26 pages

Introml 02 Regression Annotated PDF

Uploaded by

Mark Nam

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

Jump to Page

You are on page 1of 26

Search inside document

Introduction to

Machine Learning

Linear Regression

Prof. Andreas Krause

Learning and Adaptive Systems (las.ethz.ch)
Announcements
First recordings online:
https://www.video.ethz.ch/lectures/d-
infk/2019/spring/252-0220-00L.html

Waitlist updates

2
Basic Supervised Learning Pipeline

Training Data Test Data

“spam” ?

“ham”
Learning Classi- Predic-
method tion ?
fier
“spam” ?

f : :XX !
!YY f :X !Y
Prediction/
Model fitting Generalization
3
Regression
Instance of supervised learning
Goal: Predict real valued labels (possibly vectors)
Examples:
X Y
Flight route Delay (minutes)
Real estate objects Price
Customer & ad features Click-through probability

4
Running example: Diabetes
[Efron et al ‘04]
Features X:
Age
Sex
Body mass index
Average blood pressure
Six blood serum measurements (S1-S6)
Label (target) Y: quantitative measure of disease
progression

5
Regression
y
+
+ +
+ + +
+
+
+

Goal: learn real valued mapping f : Rd ! R

6
Important choices in regression
What types of functions f should we consider? Examples
f(x) f(x)
+
+ + ++
+ + + + + +
+ + + ++
+ + ++ ++
+ + +

x x
How should we measure goodness of fit?

7
Example: linear regression
y
+
+ +
+ + +
+
+
+

8
Homogeneous representation

9
Quantifying goodness of fit
D = {(x1 , y1 ), . . . , (xn , yn )} x i 2 Rd yi 2 R

y +
+ +
+ ++ + +
+
x

10
Least-squares linear regression optimization
[Legendre 1805, Gauss 1809]
Given data set D = {(x1 , y1 ), . . . , (xn , yn )}

How do we find the optimal weight vector?

n
X
w⇤ = arg min (yi w T xi )2
w
i=1

11
How to solve? Example: Scikit Learn

12
Demo
Disease progression

Body mass index

13
Method 1: Closed form solution
n
X
The problem w⇤ = arg min (yi w T xi )2
w
i=1

can be solved in closed form:

w⇤ = (XT X) 1
XT y

Hereby:

14
Method 2: Optimization
X
The objective function R̂(w) = (yi w T xi )2
i

is convex!

15
Gradient Descent
Start at an arbitrary w0 2 Rd
For t=1,2,... do wt+1 = wt ⌘t rR̂(wt )

Hereby, ⌘t is called learning rate

16
Convergence of gradient descent
Under mild assumptions, if step size sufficiently small,
gradient descent converges to a stationary point
(gradient = 0)
For convex objectives, it therefore finds the
optimal solution!

In the case of the squared loss, constant stepsize ½

converges linearly

17
Computing the gradient

18
Demo: Gradient descent

19
Choosing a stepsize
What happens if we choose a poor stepsize?

20
Adaptive step size
Can update the step size adaptively. Examples:
1) Via line search (optimizing step size every step)

2) „Bold driver“ heuristic

If function decreases, increase step size:

If function increases, decrease step size:

21
Demo: Gradient Descent for Linear Regression

22
Gradient descent vs closed form
Why would one ever consider performing gradient
descent, when it is possible to find closed form solution?

Computational complexity
May not need an optimal solution
Many problems don‘t admit closed form solution

23
Other loss functions
So far: Measure goodness of fit via squared error
Many other loss functions possible (and sensible!)

24
Fitting nonlinear functions
How about functions like this:

+ +
+ +
++ + ++
+ + +
+
++ +

25
Linear regression for polynomials
We can fit non-linear functions via linear regression,
using nonlinear features of our data (basis functions)
d
X
f (x) = wi i (x)
i=1

Introduction To Matlab Tutorial 11
Document37 pages
Introduction To Matlab Tutorial 11
Syarif Hidayat
No ratings yet
Due: 11:59 PM, May 18, 2020 Submit On LEARN
Document1 page
Due: 11:59 PM, May 18, 2020 Submit On LEARN
Ajay Patel
No ratings yet
CS480 6 Linear Models
Document68 pages
CS480 6 Linear Models
Ankit Shukla
No ratings yet
Applied Machine Learning: One Variable (Simple) Linear Regression
Document38 pages
Applied Machine Learning: One Variable (Simple) Linear Regression
Wanida Kratae
No ratings yet
A Robust Real Time Face Detection
Document55 pages
A Robust Real Time Face Detection
Gaurav Veer Singh
No ratings yet
05 1 Optimization Methods NDP
Document85 pages
05 1 Optimization Methods NDP
Sebastian Lorca
No ratings yet
Lecture 9 - SVM
Document42 pages
Lecture 9 - SVM
Husein Yusuf
No ratings yet
Lecture14 Logistic
Document25 pages
Lecture14 Logistic
mohammed.elbakkalielammari
No ratings yet
Today: - Calculus
Document61 pages
Today: - Calculus
Jose Ramon Villatuya
No ratings yet
Learning 2
Document104 pages
Learning 2
Noel Roy Denja
No ratings yet
Edgar Osuna Robert Freund Federico Girosi Center For Biological and Computational Learning and Operations Research Center Massachusetts Institute of Technology Cambridge, MA, 02139, U.S.A
Document8 pages
Edgar Osuna Robert Freund Federico Girosi Center For Biological and Computational Learning and Operations Research Center Massachusetts Institute of Technology Cambridge, MA, 02139, U.S.A
RanaBilalShahid
No ratings yet
1 Lecture 5b: Probabilistic Perspectives On ML Algorithms
Document6 pages
1 Lecture 5b: Probabilistic Perspectives On ML Algorithms
Jeremy Wang
No ratings yet
DM - Lecture 4
Document65 pages
DM - Lecture 4
Maa See
No ratings yet
HW1
Document4 pages
HW1
sun_917443954
No ratings yet
CG Ex6
Document53 pages
CG Ex6
Yasir Butt
No ratings yet
Numerical Optimization: Basic Concepts and Algorithms: R. Duvigneau
Document34 pages
Numerical Optimization: Basic Concepts and Algorithms: R. Duvigneau
Kadz Corp
No ratings yet
Regularization
Document22 pages
Regularization
Đức Lại Anh
No ratings yet
04 Logistic Regression
Document46 pages
04 Logistic Regression
KHUSHI JAIN
No ratings yet
Linear Regression and Classification: Lectures 3-4
Document41 pages
Linear Regression and Classification: Lectures 3-4
Val
No ratings yet
Support Vector Machines: Logisic Regression
Document10 pages
Support Vector Machines: Logisic Regression
ahmadmanhal673
No ratings yet
An Introduction To Support Vector Machines: Biplab Banerjee
Document31 pages
An Introduction To Support Vector Machines: Biplab Banerjee
Akshat sharma
No ratings yet
Lecture 4-Logistic-Regression
Document50 pages
Lecture 4-Logistic-Regression
Nada Shaaban
No ratings yet
Lecture 2 - LP Basics1
Document33 pages
Lecture 2 - LP Basics1
TarekYehia
No ratings yet
Mathematical Foundations of Computational Linguistics: Manfred Klenner and Jannis Vamvas
Document32 pages
Mathematical Foundations of Computational Linguistics: Manfred Klenner and Jannis Vamvas
Richard Salnikov
No ratings yet
Linear Regression: Presented By: Mohamed Naas
Document20 pages
Linear Regression: Presented By: Mohamed Naas
محمد نعاس
No ratings yet
Lec12 Logreg
Document41 pages
Lec12 Logreg
Yasmine A. Sabry
No ratings yet
ECS171: Machine Learning: Lecture 1: Overview of Class, LFD 1.1, 1.2
Document29 pages
ECS171: Machine Learning: Lecture 1: Overview of Class, LFD 1.1, 1.2
svwnerlgwr
No ratings yet
Introduction To Optimization: Anjela Govan North Carolina State University SAMSI NDHS Undergraduate Workshop 2006
Document29 pages
Introduction To Optimization: Anjela Govan North Carolina State University SAMSI NDHS Undergraduate Workshop 2006
Teferi Lemma
No ratings yet
Lec. 03 - An Introduction To Support Vector Machines - Giorgio Valentini U. Milano
Document42 pages
Lec. 03 - An Introduction To Support Vector Machines - Giorgio Valentini U. Milano
Alejandro Vasquez
No ratings yet
Classical Optimization
Document36 pages
Classical Optimization
nitishhgaming
No ratings yet
Mathematics: Vibrant Academy
Document41 pages
Mathematics: Vibrant Academy
Gimy International
No ratings yet
Lec 1
Document26 pages
Lec 1
Abdalrhman Mahmoud
No ratings yet
Admm Homework
Document5 pages
Admm Homework
Nurul Hidayanti Anggraini
No ratings yet
Theory For Regression and Linear Models (I)
Document21 pages
Theory For Regression and Linear Models (I)
Charlie
No ratings yet
Lec2 Linear Regression With One Variable
Document48 pages
Lec2 Linear Regression With One Variable
Zakaria Allito
No ratings yet
Introduction To Linear Programming
Document20 pages
Introduction To Linear Programming
Gibbs Ambion
No ratings yet
Unit 4 - Linear Regression
Document52 pages
Unit 4 - Linear Regression
shinjo
No ratings yet
Logistic Regression
Document34 pages
Logistic Regression
Đức Lại Anh
No ratings yet
Unit 4 - Logistic Regression
Document26 pages
Unit 4 - Logistic Regression
shinjo
No ratings yet
Cheatsheet Supervised Learning
Document4 pages
Cheatsheet Supervised Learning
an7l7a
No ratings yet
Simplex Method: SIDDHANT SINGH, 2018101089
Document6 pages
Simplex Method: SIDDHANT SINGH, 2018101089
Siddhant K.Singh
No ratings yet
Logistic Regression
Document10 pages
Logistic Regression
tsilavinarakotomavo2002
No ratings yet
Numerical Integration
Document112 pages
Numerical Integration
PRASAD RAVICHANDRAN
No ratings yet
11 Ethem Linear SVM 2015
Document66 pages
11 Ethem Linear SVM 2015
aycaize
No ratings yet
Graphic Function
Document55 pages
Graphic Function
Gio Vanni
No ratings yet
ML Logistic Regression
Document19 pages
ML Logistic Regression
Zarfa Masood
No ratings yet
Support Vector Machine in R Paper
Document28 pages
Support Vector Machine in R Paper
zhaozilong
No ratings yet
Chapter 7
Document37 pages
Chapter 7
Hoang Quoc Trung
No ratings yet
coursSVM Versionlongue 20
Document70 pages
coursSVM Versionlongue 20
dorian
No ratings yet
Machine Learning - Home - Week 2 - Notes - Coursera
Document10 pages
Machine Learning - Home - Week 2 - Notes - Coursera
copsamosto
No ratings yet
Week 04
Document101 pages
Week 04
Osii C
No ratings yet
Deep Learning: Models and Optimization: Marco Cuturi
Document272 pages
Deep Learning: Models and Optimization: Marco Cuturi
Bojan Bankovic
No ratings yet
Introduction To Kernels: Max Welling
Document16 pages
Introduction To Kernels: Max Welling
Kamesh Reddi
No ratings yet
Linear Programming Duality
Document17 pages
Linear Programming Duality
Dr-Junaid Shaju
No ratings yet
DNN - M2 - Deep Feedforward NN 23dec
Document97 pages
DNN - M2 - Deep Feedforward NN 23dec
Manju Prasad N
No ratings yet
Gradinet
Document51 pages
Gradinet
nabin Paudel
No ratings yet
Geometric functions in computer aided geometric design
From Everand
Geometric functions in computer aided geometric design
Oscar Ruiz
No ratings yet
Generalized Fermat Equation
From Everand
Generalized Fermat Equation
Ran Van Vo
No ratings yet
A-level Maths Revision: Cheeky Revision Shortcuts
From Everand
A-level Maths Revision: Cheeky Revision Shortcuts
Scool Revision
Rating: 3.5 out of 5 stars
3.5/5 (8)
Hyperbolic Functions (Trigonometry) Mathematics E-Book For Public Exams
From Everand
Hyperbolic Functions (Trigonometry) Mathematics E-Book For Public Exams
Mohmmad Khaja Shareef
No ratings yet
Unit 7 - Week 6: Assignment 6
Document4 pages
Unit 7 - Week 6: Assignment 6
Raushan Kashyap
No ratings yet
Module 6 - RELATIONAL NETWORK
Document5 pages
Module 6 - RELATIONAL NETWORK
afifa
No ratings yet
DSP Lab Record Exp-1
Document19 pages
DSP Lab Record Exp-1
Prabhu Ch
No ratings yet
Assignment 1
Document24 pages
Assignment 1
mohamedmariam490
No ratings yet
Awoke2021 Chapter BitcoinPricePredictionAndAnaly
Document11 pages
Awoke2021 Chapter BitcoinPricePredictionAndAnaly
Chess Online
No ratings yet
Gaussian Process Approximations of Stochastic Differential Equation
Document16 pages
Gaussian Process Approximations of Stochastic Differential Equation
aa
No ratings yet
EC360 Soft Computing S5-EC-Syllabus
Document2 pages
EC360 Soft Computing S5-EC-Syllabus
Rensi
No ratings yet
Matrices - Introduction and Operations
Document299 pages
Matrices - Introduction and Operations
Saeed Vadiee
No ratings yet
Optimization Algorithms For Ultrasonic Array Imaging in Homogeneous Anisotropic Steel Components With Unknown Properties
Document14 pages
Optimization Algorithms For Ultrasonic Array Imaging in Homogeneous Anisotropic Steel Components With Unknown Properties
pjhollow
No ratings yet
A Deterministic Annealing Neural Network For Convex Programming
Document13 pages
A Deterministic Annealing Neural Network For Convex Programming
Harsh Chittora
No ratings yet
Find Repeat, Space Edition BEAST MODE (Practice Interview Question) - Interview Cake
Document2 pages
Find Repeat, Space Edition BEAST MODE (Practice Interview Question) - Interview Cake
phanindra
No ratings yet
Matched Filtering and Digital Pulse Amplitude Modulation (PAM)
Document32 pages
Matched Filtering and Digital Pulse Amplitude Modulation (PAM)
mumamadurai
No ratings yet
Ai 1
Document2 pages
Ai 1
Abokhaled AL-ashmawi
No ratings yet
Bode Plot Examples: Lathi Example 4.25: Ss Hs S S
Document13 pages
Bode Plot Examples: Lathi Example 4.25: Ss Hs S S
prabhat_7891
No ratings yet
Lahore University of Management Sciences DISC 420 - Business Analytics Fall Semester 2015
Document5 pages
Lahore University of Management Sciences DISC 420 - Business Analytics Fall Semester 2015
usama
No ratings yet
Coding Theory Linear Cyclic Codes: 0 1 N 1 N 1 N N
Document19 pages
Coding Theory Linear Cyclic Codes: 0 1 N 1 N 1 N N
vijaykannamalla
No ratings yet
DSPDF Formulae
Document3 pages
DSPDF Formulae
Lulzim Lumi
No ratings yet
Chapter 2-Simple Searching and Sorting Algorithms
Document21 pages
Chapter 2-Simple Searching and Sorting Algorithms
world channel
No ratings yet
Signal and Systems Analysis Worksheet 2: 1. Obtain The Fourier Series Expansion For Signal Shown in Figures Below
Document7 pages
Signal and Systems Analysis Worksheet 2: 1. Obtain The Fourier Series Expansion For Signal Shown in Figures Below
ewnetu kassa
No ratings yet
Bidirectional LSTM Networks For Poetry Generation in Hindi
Document4 pages
Bidirectional LSTM Networks For Poetry Generation in Hindi
International Journal of Innovative Science and Research Technology
No ratings yet
CHAPTER 4 Simplex Method
Document26 pages
CHAPTER 4 Simplex Method
Agat
No ratings yet
16 0004
Document276 pages
16 0004
Ampuli
No ratings yet
Data Science - Decision Tree - Random Forest
Document15 pages
Data Science - Decision Tree - Random Forest
Mahesh Pokhrel
No ratings yet
Value at Risk and Expected Shortfall: Risk Management and Financial Institutions 4e by John C. Hull
Document23 pages
Value at Risk and Expected Shortfall: Risk Management and Financial Institutions 4e by John C. Hull
Phương Kiều
No ratings yet
2-3 Tree PDF
Document8 pages
2-3 Tree PDF
Hitesh Gupta
No ratings yet
Steps in The PERT Planning Process
Document3 pages
Steps in The PERT Planning Process
rohit madhok
80% (5)
Unit 1
Document144 pages
Unit 1
Akila
No ratings yet
SAP HANA Cloud - Foundation - Unit 4
Document19 pages
SAP HANA Cloud - Foundation - Unit 4
ahyuliyanov
No ratings yet
Ekonomi Teknik
Document4 pages
Ekonomi Teknik
Ryan Tito
No ratings yet
Euler Bernoulli Beam Theory Using The Finite Difference Method
Document33 pages
Euler Bernoulli Beam Theory Using The Finite Difference Method
Лейсан Миннахметова
No ratings yet