Professional Documents
Culture Documents
UPC Beamer Template
UPC Beamer Template
UPC Beamer Template
Adrian Siwak
Politechnika Wrocławska
Promotor: dr Alicja Jokiel - Rokita
17 kwietnia 2023
1 / 28
Plan prezentacji
Krzywa ROC
Wprowadzenie
Definicja
Estymacja krzywej ROC
porównywanie klasyfikatorów
AUC i pAUC
definicja AUC
estymacja AUC
definicja pAUC
kombinacje liniowe predyktorów
Maksymalizacja AUC - Idea problemu
Przypadek wielowymiarowy
wprowadzenie
Algorytm 1 -Sprawdzian krzyżowy
Algorytm 2 - Metoda Bootstrap
Maksymalizacja pAUC
założenia (Wenbao Yu, Taesung Park)
Algorytm iteracyjny 2 / 28
Krzywa ROC - Wstęp
3 / 28
Krzywa ROC - Wstęp
3 / 28
Krzywa ROC - Wstęp
3 / 28
Krzywa ROC - Wstęp
3 / 28
Krzywa ROC - Wstęp
3 / 28
Wstęp
4 / 28
Wstęp
Uwaga
Często zmienną U traktujemy jako wyniki pewnego testu
diagnostycznego, dla którego im większa zaobserwowana wartość u
tym większe prawdopodobieństwo zakwalifikowania obserwacji do
grupy o etykiecie L = 1.
4 / 28
Wstęp
5 / 28
Wstęp
6 / 28
Wstęp
Oznaczenia
6 / 28
Wstęp
Oznaczenia
X := (U|L = 0)
6 / 28
Wstęp
Oznaczenia
X := (U|L = 0)
Y := (U|L = 1)
6 / 28
Wstęp
Oznaczenia
X := (U|L = 0)
Y := (U|L = 1)
F - dystrubuanta X , f - gęstość X
6 / 28
Wstęp
Oznaczenia
X := (U|L = 0)
Y := (U|L = 1)
F - dystrubuanta X , f - gęstość X
G - dystrybuanta Y , g - gęstość Y
6 / 28
Wstęp
Oznaczenia
X := (U|L = 0)
Y := (U|L = 1)
F - dystrubuanta X , f - gęstość X
G - dystrybuanta Y , g - gęstość Y
6 / 28
Czułość
Definicja
Czułość (ang. sensitivity) określamy jako prawdopodobieństwo, że
przypadek o etykiecie 1 zostanie zakwalifikowany do grupy o
etykiecie 1.
7 / 28
Czułość
Definicja
Czułość (ang. sensitivity) określamy jako prawdopodobieństwo, że
przypadek o etykiecie 1 zostanie zakwalifikowany do grupy o
etykiecie 1.
SE (c) = P(dc (U) = 1|L = 1)
7 / 28
Czułość
Definicja
Czułość (ang. sensitivity) określamy jako prawdopodobieństwo, że
przypadek o etykiecie 1 zostanie zakwalifikowany do grupy o
etykiecie 1.
SE (c) = P(dc (U) = 1|L = 1) = P(U > c|L = 1)
7 / 28
Czułość
Definicja
Czułość (ang. sensitivity) określamy jako prawdopodobieństwo, że
przypadek o etykiecie 1 zostanie zakwalifikowany do grupy o
etykiecie 1.
SE (c) = P(dc (U) = 1|L = 1) = P(U > c|L = 1) = 1 − G (c)
7 / 28
Czułość
Definicja
Czułość (ang. sensitivity) określamy jako prawdopodobieństwo, że
przypadek o etykiecie 1 zostanie zakwalifikowany do grupy o
etykiecie 1.
SE (c) = P(dc (U) = 1|L = 1) = P(U > c|L = 1) = 1 − G (c)
Przypomnienie definicji
G - dystrybuanta Y
Y := (U|L = 1)
7 / 28
Specyficzność
Definicja
Specyficzność (ang. specifity) określamy jako prawdopodobieństwo,
że przypadek o etykiecie 0 zostanie zakwalifikowany do grupy o
etykiecie 0.
8 / 28
Specyficzność
Definicja
Specyficzność (ang. specifity) określamy jako prawdopodobieństwo,
że przypadek o etykiecie 0 zostanie zakwalifikowany do grupy o
etykiecie 0.
SP(c) = P(dc (U) = 0|L = 0)
8 / 28
Specyficzność
Definicja
Specyficzność (ang. specifity) określamy jako prawdopodobieństwo,
że przypadek o etykiecie 0 zostanie zakwalifikowany do grupy o
etykiecie 0.
SP(c) = P(dc (U) = 0|L = 0) = P(U ¬ c|L = 0)
8 / 28
Specyficzność
Definicja
Specyficzność (ang. specifity) określamy jako prawdopodobieństwo,
że przypadek o etykiecie 0 zostanie zakwalifikowany do grupy o
etykiecie 0.
SP(c) = P(dc (U) = 0|L = 0) = P(U ¬ c|L = 0) = F (c)
8 / 28
Specyficzność
Definicja
Specyficzność (ang. specifity) określamy jako prawdopodobieństwo,
że przypadek o etykiecie 0 zostanie zakwalifikowany do grupy o
etykiecie 0.
SP(c) = P(dc (U) = 0|L = 0) = P(U ¬ c|L = 0) = F (c)
Przypomnienie definicji
F - dystrybuanta X
X := (U|L = 0)
8 / 28
Krzywa ROC
9 / 28
Krzywa ROC
Definicja
Krzywą ROC nazywamy zbiór punktów w kwadracie jednostkowym
[0, 1] × [0, 1] spełniających równanie
9 / 28
Krzywa ROC
Definicja
Krzywą ROC nazywamy zbiór punktów w kwadracie jednostkowym
[0, 1] × [0, 1] spełniających równanie
9 / 28
Krzywa ROC
Definicja
Krzywą ROC nazywamy zbiór punktów w kwadracie jednostkowym
[0, 1] × [0, 1] spełniających równanie
Alternatywny zapis
9 / 28
Estymacja krzywej ROC
Dystrybuanta empiryczna
Niech (X1 , · · · , Xn ) będą iid o dystybuancie F (t)
10 / 28
Estymacja krzywej ROC
Dystrybuanta empiryczna
Niech (X1 , · · · , Xn ) będą iid o dystybuancie F (t)
Wtedy dystrybuantę empiryczną definiujemy jako
n
1X
F̂n (t) = IX ¬t
n i=1 i
10 / 28
Estymacja krzywej ROC
Przypomnienie
11 / 28
Estymacja krzywej ROC
Przypomnienie
11 / 28
Estymacja krzywej ROC
ROC - estymacja
Stąd estymatorem krzywej ROC typu plug-in jest
ˆ (t) = 1 − Ĝ (F̂ −1 (1 − t)), t ∈ [0, 1]
ROC
12 / 28
Macierz pomyłek
13 / 28
ROC wykres
14 / 28
ROCCH - ROC convex hull
15 / 28
AUC - AREA UNDER THE ROC CURVE
Definicja
AUC jestR polem pod krzywą ROC
AUC = 01 ROC (t) dt
16 / 28
AUC - AREA UNDER THE ROC CURVE
Definicja
AUC jestR polem pod krzywą ROC
AUC = 01 ROC (t) dt
AUC = P(Y > X )
16 / 28
AUC - AREA UNDER THE ROC CURVE
Definicja
AUC jestR polem pod krzywą ROC
AUC = 01 ROC (t) dt
AUC = P(Y > X )
X := (U|L = 0)
16 / 28
AUC - AREA UNDER THE ROC CURVE
Definicja
AUC jestR polem pod krzywą ROC
AUC = 01 ROC (t) dt
AUC = P(Y > X )
X := (U|L = 0)
Y := (U|L = 1)
16 / 28
AUC
Założenia
Niech X = (X1 , . . . , Xn ),
Y = (Y1 , . . . , Ym ),
X = (U|L = 0) ∼ F ,
Y = (U|L = 1) ∼ G ,
Zakładamy że próby są niezależne.
17 / 28
pAUC
Definicja
Powierzchnię częściowego pola pod krzywą ROC, oznaczamy jako
pAUC (ang. partial Area Under ROC Curve)
Z b
pAUC := ROC (t) dt
a
dla a, b ∈ [0, 1]
18 / 28
pAUC
Definicja
Powierzchnię częściowego pola pod krzywą ROC, oznaczamy jako
pAUC (ang. partial Area Under ROC Curve)
Z b
pAUC := ROC (t) dt
a
dla a, b ∈ [0, 1]
18 / 28
Idea problemu
19 / 28
Idea problemu
19 / 28
Przypadek wielowymiarowy
Wstęp
Niech U = (U1 , . . . , Up )T będzie p testami diagnostycznymi
dającymi ciągłe wyniki.
20 / 28
Przypadek wielowymiarowy
Wstęp
Niech U = (U1 , . . . , Up )T będzie p testami diagnostycznymi
dającymi ciągłe wyniki.Przeprowadzamy je na m zdrowych
pacjentach dostając
Xi = (Xi1 , . . . , Xip )T , i = 1, . . . , m i.i.d. X ∼ F (X ) wyników,
i n chorych pacjentach dostając
Yi = (Yj1 , . . . , Yjp )T , j = 1, . . . , n i.i.d. Y ∼ G (Y ) wyników.
20 / 28
Przypadek wielowymiarowy
Maksymalizacja
Szukamy wektora
gdzie B = {β ∈ R : ||β|| = 1}
21 / 28
Przypadek wielowymiarowy
Maksymalizacja
Szukamy wektora
gdzie B = {β ∈ R : ||β|| = 1}
Jego estymatorem jest
m X n
1 X
β̂ = argmax I (β T Yj > β T Xi )
β∈B nm i=1 j=1
21 / 28
[ (β̂)
Najprostrza estymacja AUC
1 Pm Pn TY
[ (β̂) =
AUC nm i=1 j=1 I (β̂ i > β̂ T Xj )
22 / 28
leave-one-pair-out cross-validation
m X n
1 X
AUC CV = I (β̂ (−ij)T Yj > β̂ (−ij)T Xi )
nm i=1 j=1
23 / 28
leave-one-pair-out cross-validation
m X n
1 X
AUC CV = I (β̂ (−ij)T Yj > β̂ (−ij)T Xi )
nm i=1 j=1
23 / 28
leave-one-pair-out cross-validation
m X n
1 X
AUC CV = I (β̂ (−ij)T Yj > β̂ (−ij)T Xi )
nm i=1 j=1
23 / 28
leave-one-pair-out bootstrap cross-validation Efron (1983)
24 / 28
Maksymalizacja pAUC - założenia (Wenbao Yu, Taesung
Park, 2014)
X ∼ N(µx , Σx )
Y ∼ N(µy , Σy )
25 / 28
Maksymalizacja pAUC - założenia (Wenbao Yu, Taesung
Park, 2014)
X ∼ N(µx , Σx )
Y ∼ N(µy , Σy )
wtedy
C D = β T Y ∼ N(β T µy , β T Σy β),
C N = β T X ∼ N(β T µx , β T Σx β).
Krzywa ROC dla C D i C N jest postaci (po przekształceniach):
25 / 28
26 / 28
Maksymalizacja pAUC - Algorytm
27 / 28
Bibliografia
28 / 28