Download as pdf or txt
Download as pdf or txt
You are on page 1of 52

Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Ekonometria Przestrzenna
Wykład 2: Macierz wag przestrzennych W

Andrzej Torój

Instytut Ekonometrii |
Zakład Ekonometrii Stosowanej

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 1 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Plan wykładu

1 Macierz wag przestrzennych


2 Podstawowe metody konstrukcji macierzy W
Na podstawie macierzy sąsiedztwa
Macierz oparta na odległości
3 Inne metody konstrukcji macierzy W
Alternatywne metody wyboru sąsiadów
Umowne miary odległości
4 Normalizacja macierzy W
Normalizacja
Wnioski końcowe

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 2 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Plan prezentacji

1 Macierz wag przestrzennych

2 Podstawowe metody konstrukcji macierzy W

3 Inne metody konstrukcji macierzy W

4 Normalizacja macierzy W

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 3 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Macierz wag przestrzennych

Problem identyfikacji w modelach przestrzennych (1)

Rozważamy wektor y = (y1 , ..., yN ) przestrzennie powiązanych obserwacji.


Hipotetycznie mapę
 wszystkich powiązań moglibyśmy przedstawić jako:

 y1 = c1,1 + (0y1 +)α1,2 y2 + α1,3 y3 + ... + α1,N yN

y = c + α y + (0y +)α y + ... + α y
2 2,1 2,1 1 2 2,3 3 2,N N
y = c + αy + ε

 ...

yN = cN,1 + αN,1 y1 + αN,2 y2 + ... + αN,N−1 yN−1 (+0yN )

Nie licząc stałych, każde z N równań ma N − 1 parametrów do


oszacowania na podstawie 1 obserwacji. To oczywiście niewykonalne.
Założenie identyfikujące: siła wpływu szacowana jako jeden parametr, dla
każdej pary połączonych jednostek.

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 4 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Macierz wag przestrzennych

Problem identyfikacji w modelach przestrzennych (1)

Rozważamy wektor y = (y1 , ..., yN ) przestrzennie powiązanych obserwacji.


Hipotetycznie mapę
 wszystkich powiązań moglibyśmy przedstawić jako:

 y1 = c1,1 + (0y1 +)α1,2 y2 + α1,3 y3 + ... + α1,N yN

y = c + α y + (0y +)α y + ... + α y
2 2,1 2,1 1 2 2,3 3 2,N N
y = c + αy + ε

 ...

yN = cN,1 + αN,1 y1 + αN,2 y2 + ... + αN,N−1 yN−1 (+0yN )

Nie licząc stałych, każde z N równań ma N − 1 parametrów do


oszacowania na podstawie 1 obserwacji. To oczywiście niewykonalne.
Założenie identyfikujące: siła wpływu szacowana jako jeden parametr, dla
każdej pary połączonych jednostek.

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 4 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Macierz wag przestrzennych

Problem identyfikacji w modelach przestrzennych (1)

Rozważamy wektor y = (y1 , ..., yN ) przestrzennie powiązanych obserwacji.


Hipotetycznie mapę
 wszystkich powiązań moglibyśmy przedstawić jako:

 y1 = c1,1 + (0y1 +)α1,2 y2 + α1,3 y3 + ... + α1,N yN

y = c + α y + (0y +)α y + ... + α y
2 2,1 2,1 1 2 2,3 3 2,N N
y = c + αy + ε

 ...

yN = cN,1 + αN,1 y1 + αN,2 y2 + ... + αN,N−1 yN−1 (+0yN )

Nie licząc stałych, każde z N równań ma N − 1 parametrów do


oszacowania na podstawie 1 obserwacji. To oczywiście niewykonalne.
Założenie identyfikujące: siła wpływu szacowana jako jeden parametr, dla
każdej pary połączonych jednostek.

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 4 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Macierz wag przestrzennych

Problem identyfikacji w modelach przestrzennych (1)

Rozważamy wektor y = (y1 , ..., yN ) przestrzennie powiązanych obserwacji.


Hipotetycznie mapę
 wszystkich powiązań moglibyśmy przedstawić jako:

 y1 = c1,1 + (0y1 +)α1,2 y2 + α1,3 y3 + ... + α1,N yN

y = c + α y + (0y +)α y + ... + α y
2 2,1 2,1 1 2 2,3 3 2,N N
y = c + αy + ε

 ...

yN = cN,1 + αN,1 y1 + αN,2 y2 + ... + αN,N−1 yN−1 (+0yN )

Nie licząc stałych, każde z N równań ma N − 1 parametrów do


oszacowania na podstawie 1 obserwacji. To oczywiście niewykonalne.
Założenie identyfikujące: siła wpływu szacowana jako jeden parametr, dla
każdej pary połączonych jednostek.

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 4 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Macierz wag przestrzennych

Problem identyfikacji w modelach przestrzennych (2)

W praktyce posługujemy się więc następującym


uproszczeniem: kwadratową macierz α ≡ [αi,j ] (z zerowymi
elementami diagonalnymi) traktujemy jako iloczyn:
α=ρ·W
nieznanego parametru ρ
znanej i egzogenicznej macierzy W
Interpretacja:
Niezerowe elementy i-tego wiersza wskazują regiony powiązane z
i-tym regionem, a proporcje między dodatnimi wartościami
odpowiadają względnej sile tego powiązania.
ρ podlega estymacji. Dokładna interpretacja jest uzależniona od
szczegółowej konstrukcji macierzy W (zob. dalej), ale jeżeli ρ nie
różni się istotnie od zera, to nie ma efektów przestrzennych (i
można np. stosować klasyczny model regresji liniowej).

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 5 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Macierz wag przestrzennych

Problem identyfikacji w modelach przestrzennych (2)

W praktyce posługujemy się więc następującym


uproszczeniem: kwadratową macierz α ≡ [αi,j ] (z zerowymi
elementami diagonalnymi) traktujemy jako iloczyn:
α=ρ·W
nieznanego parametru ρ
znanej i egzogenicznej macierzy W
Interpretacja:
Niezerowe elementy i-tego wiersza wskazują regiony powiązane z
i-tym regionem, a proporcje między dodatnimi wartościami
odpowiadają względnej sile tego powiązania.
ρ podlega estymacji. Dokładna interpretacja jest uzależniona od
szczegółowej konstrukcji macierzy W (zob. dalej), ale jeżeli ρ nie
różni się istotnie od zera, to nie ma efektów przestrzennych (i
można np. stosować klasyczny model regresji liniowej).

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 5 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Macierz wag przestrzennych

Macierz wag przestrzennych

W jest centralnym pojęciem ekonometrii przestrzennej. Opisuje


ona schemat wzajemnego powiązania jednostek (np.
regionów).
Każdy element opisuje relację między parą regionów.
W jest macierzą kwadratową o wymiarze równym liczbie
regionów. Jej i-ty wiersz interpretujemy jako wektor wag, które
określają wpływ innych regionów na i-ty region.
Macierz W ma zerową diagonalę. Region nie wpływa
bezpośrednio na siebie sam.
Ale pośrednio już tak: skoro wpływamy na sąsiada, to sąsiad
wpływa na nas.

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 6 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Macierz wag przestrzennych

Macierz wag przestrzennych

W jest centralnym pojęciem ekonometrii przestrzennej. Opisuje


ona schemat wzajemnego powiązania jednostek (np.
regionów).
Każdy element opisuje relację między parą regionów.
W jest macierzą kwadratową o wymiarze równym liczbie
regionów. Jej i-ty wiersz interpretujemy jako wektor wag, które
określają wpływ innych regionów na i-ty region.
Macierz W ma zerową diagonalę. Region nie wpływa
bezpośrednio na siebie sam.
Ale pośrednio już tak: skoro wpływamy na sąsiada, to sąsiad
wpływa na nas.

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 6 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Macierz wag przestrzennych

Macierz wag przestrzennych

W jest centralnym pojęciem ekonometrii przestrzennej. Opisuje


ona schemat wzajemnego powiązania jednostek (np.
regionów).
Każdy element opisuje relację między parą regionów.
W jest macierzą kwadratową o wymiarze równym liczbie
regionów. Jej i-ty wiersz interpretujemy jako wektor wag, które
określają wpływ innych regionów na i-ty region.
Macierz W ma zerową diagonalę. Region nie wpływa
bezpośrednio na siebie sam.
Ale pośrednio już tak: skoro wpływamy na sąsiada, to sąsiad
wpływa na nas.

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 6 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Macierz wag przestrzennych

Przykładowa macierz W

 
0 0.33 0.33 0.33 0 0

 0.5 0 0.5 0 0 0 

 0.5 0.5 0 0 0 0 
W= 

 0.5 0 0 0 0.5 0 

 0 0 0 1 0 0 
0 0 0 0 0 0

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 7 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Macierz wag przestrzennych

Jak skonstruować macierz W?

1 Zdefiniuj ”przestrzeń” w sposób adekwatny do problemu.


1 geografia?
2 a może coś innego? (bliskość / odległość funkcją czynników
ekonomicznych, społecznych, kulturowych...)
2 Zastosuj odpowiednią miarę do tej definicji.
1 miara binarna: sąsiedztwo / przynależność do grupy
2 miara ciągła: funkcja odległości / ”odległości”
3 miara hybrydowa: wybór k najbliższych / ”najbliższych”
sąsiadów
3 Dokonaj normalizacji macierzy W.

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 8 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Macierz wag przestrzennych

Jak skonstruować macierz W?

1 Zdefiniuj ”przestrzeń” w sposób adekwatny do problemu.


1 geografia?
2 a może coś innego? (bliskość / odległość funkcją czynników
ekonomicznych, społecznych, kulturowych...)
2 Zastosuj odpowiednią miarę do tej definicji.
1 miara binarna: sąsiedztwo / przynależność do grupy
2 miara ciągła: funkcja odległości / ”odległości”
3 miara hybrydowa: wybór k najbliższych / ”najbliższych”
sąsiadów
3 Dokonaj normalizacji macierzy W.

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 8 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Macierz wag przestrzennych

Jak skonstruować macierz W?

1 Zdefiniuj ”przestrzeń” w sposób adekwatny do problemu.


1 geografia?
2 a może coś innego? (bliskość / odległość funkcją czynników
ekonomicznych, społecznych, kulturowych...)
2 Zastosuj odpowiednią miarę do tej definicji.
1 miara binarna: sąsiedztwo / przynależność do grupy
2 miara ciągła: funkcja odległości / ”odległości”
3 miara hybrydowa: wybór k najbliższych / ”najbliższych”
sąsiadów
3 Dokonaj normalizacji macierzy W.

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 8 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Plan prezentacji

1 Macierz wag przestrzennych

2 Podstawowe metody konstrukcji macierzy W

3 Inne metody konstrukcji macierzy W

4 Normalizacja macierzy W

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 9 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Na podstawie macierzy sąsiedztwa

Macierz sąsiedztwa

Macierz sąsiedztwa to szczególny, najpowszechniej stosowany


przypadek macierzy wag.
Regiony (kolumny) sąsiadujące z i-tym regionem są wskazane
są jako 1 w i-tym wierszu.
Problematyczny może być przypadek, gdy istnieją regiony
niesąsiadujące z żadnym innym (Irlandia Północna w UK,
Sycylia w IT, itp.). Można próbować tego uniknąć, wskazując
mimo wszystko np. najbliżej położony region jako jedynego
sąsiada, lub odpowiednio korygować istniejące metody.
Metoda adekwatna wyłącznie do zbioru regionów (ale nie do
zbioru punktów).

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 10 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Na podstawie macierzy sąsiedztwa

Macierz sąsiedztwa

Macierz sąsiedztwa to szczególny, najpowszechniej stosowany


przypadek macierzy wag.
Regiony (kolumny) sąsiadujące z i-tym regionem są wskazane
są jako 1 w i-tym wierszu.
Problematyczny może być przypadek, gdy istnieją regiony
niesąsiadujące z żadnym innym (Irlandia Północna w UK,
Sycylia w IT, itp.). Można próbować tego uniknąć, wskazując
mimo wszystko np. najbliżej położony region jako jedynego
sąsiada, lub odpowiednio korygować istniejące metody.
Metoda adekwatna wyłącznie do zbioru regionów (ale nie do
zbioru punktów).

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 10 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Na podstawie macierzy sąsiedztwa

Macierz sąsiedztwa

Macierz sąsiedztwa to szczególny, najpowszechniej stosowany


przypadek macierzy wag.
Regiony (kolumny) sąsiadujące z i-tym regionem są wskazane
są jako 1 w i-tym wierszu.
Problematyczny może być przypadek, gdy istnieją regiony
niesąsiadujące z żadnym innym (Irlandia Północna w UK,
Sycylia w IT, itp.). Można próbować tego uniknąć, wskazując
mimo wszystko np. najbliżej położony region jako jedynego
sąsiada, lub odpowiednio korygować istniejące metody.
Metoda adekwatna wyłącznie do zbioru regionów (ale nie do
zbioru punktów).

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 10 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Na podstawie macierzy sąsiedztwa

Macierz sąsiedztwa

Macierz sąsiedztwa to szczególny, najpowszechniej stosowany


przypadek macierzy wag.
Regiony (kolumny) sąsiadujące z i-tym regionem są wskazane
są jako 1 w i-tym wierszu.
Problematyczny może być przypadek, gdy istnieją regiony
niesąsiadujące z żadnym innym (Irlandia Północna w UK,
Sycylia w IT, itp.). Można próbować tego uniknąć, wskazując
mimo wszystko np. najbliżej położony region jako jedynego
sąsiada, lub odpowiednio korygować istniejące metody.
Metoda adekwatna wyłącznie do zbioru regionów (ale nie do
zbioru punktów).

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 10 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Na podstawie macierzy sąsiedztwa

Macierz sąsiedztwa: przykład

Czy... ...sąsiaduje z... ...?


USA Kanada TAK
Kanada USA TAK
USA Meksyk TAK
Meksyk USA TAK
Kanada Meksyk NIE
Meksyk Kanada NIE
   
US CA MX US CA MX
 0 1 1  0 0.5 0.5 
WS = 1 W =

0 0  1 0 0 
1 0 0 1 0 0

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 11 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Na podstawie macierzy sąsiedztwa

Konstrukcja macierzy W na podstawie sąsiedztwa w R

1 Wczytujemy obiekt typu SF (patrz: wykład 1). Mapa będzie


źródłem informacji, które regiony mają wspólne granice.
2 Tworzymy obiekt będący listami sąsiadów – nb.
contnb <- poly2nb(spatial_data, queen = T)
queen = T – traktujemy jako sąsiadów te regiony, które
graniczą jednym punktem (szachiści wiedzą skąd ta nazwa...)
3 Normalizujemy wierszami, tworząc obiekt typu listw.
W_list <- nb2listw(contnb, style = "W")
Jeżeli mamy (i chcemy pozostawić) regiony izolowane,
wówczas do polecenia nb2listw musimy dodawać argument
zero.policy = TRUE.
listw to efektywna forma przechowywania (zwykle rzadkiej)
macierzy W.

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 12 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Na podstawie macierzy sąsiedztwa

Konstrukcja macierzy W na podstawie sąsiedztwa w R

1 Wczytujemy obiekt typu SF (patrz: wykład 1). Mapa będzie


źródłem informacji, które regiony mają wspólne granice.
2 Tworzymy obiekt będący listami sąsiadów – nb.
contnb <- poly2nb(spatial_data, queen = T)
queen = T – traktujemy jako sąsiadów te regiony, które
graniczą jednym punktem (szachiści wiedzą skąd ta nazwa...)
3 Normalizujemy wierszami, tworząc obiekt typu listw.
W_list <- nb2listw(contnb, style = "W")
Jeżeli mamy (i chcemy pozostawić) regiony izolowane,
wówczas do polecenia nb2listw musimy dodawać argument
zero.policy = TRUE.
listw to efektywna forma przechowywania (zwykle rzadkiej)
macierzy W.

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 12 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Na podstawie macierzy sąsiedztwa

Konstrukcja macierzy W na podstawie sąsiedztwa w R

1 Wczytujemy obiekt typu SF (patrz: wykład 1). Mapa będzie


źródłem informacji, które regiony mają wspólne granice.
2 Tworzymy obiekt będący listami sąsiadów – nb.
contnb <- poly2nb(spatial_data, queen = T)
queen = T – traktujemy jako sąsiadów te regiony, które
graniczą jednym punktem (szachiści wiedzą skąd ta nazwa...)
3 Normalizujemy wierszami, tworząc obiekt typu listw.
W_list <- nb2listw(contnb, style = "W")
Jeżeli mamy (i chcemy pozostawić) regiony izolowane,
wówczas do polecenia nb2listw musimy dodawać argument
zero.policy = TRUE.
listw to efektywna forma przechowywania (zwykle rzadkiej)
macierzy W.

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 12 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Na podstawie macierzy sąsiedztwa

Kryterium królowej (queen = T) (1)

Źródło: Arbia (2014).


Andrzej Torój SGH
(2) Ekonometria Przestrzenna 13 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Na podstawie macierzy sąsiedztwa

Kryterium królowej (queen = T) (2)


Wydaje się nienaturalnym problemem, gdy myślimy o powiatach w
Polsce. Jednak ważne przy analizie takich obszarów jak np.
hrabstwa (counties) w Teksasie lub przy analizie danych
punktowych, które samodzielnie agregujemy za pomocą
kwadratowej ”siatki”:

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 14 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Na podstawie macierzy sąsiedztwa

Relacje sąsiedztwa 1 rzędu dla polskich powiatów


Funkcja: plot.nb

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 15 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Na podstawie macierzy sąsiedztwa

Relacje sąsiedztwa 1 i 2 rzędu dla polskich powiatów


Sąsiad mojego sąsiada też jest też moim sąsiadem (nblag i nblag_cumul)

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 16 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Macierz oparta na odległości

Konstrukcja macierzy opartej na odległości

Alternatywnym sposobem konstrukcji W jest dopuszczenie do


bezpośredniej interakcji między wszystkimi regionami. Jej siła
zależy wówczas od odległości.
Niech di,j oznacza odległość między i oraz j. Wówczas:
 1 1 
0 (d1,2 )γ
··· γ
(d1,N ) 
 (d 1 )γ 0 ··· 1

γ 
 1,2 (d2,N ) 
W= .. .. .. 

 . . . 

1 1
γ γ 0
(d1,N ) (d2,N )
γ to ustalony przez badacza parametr wygasania. Przy braku
wyraźnych przesłanek do przyjęcia konkretnej wartości można
np. założyć, że γ = 1.
Andrzej Torój SGH
(2) Ekonometria Przestrzenna 17 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Macierz oparta na odległości

Konstrukcja macierzy opartej na odległości

Alternatywnym sposobem konstrukcji W jest dopuszczenie do


bezpośredniej interakcji między wszystkimi regionami. Jej siła
zależy wówczas od odległości.
Niech di,j oznacza odległość między i oraz j. Wówczas:
 1 1 
0 (d1,2 )γ
··· γ
(d1,N ) 
 (d 1 )γ 0 ··· 1

γ 
 1,2 (d2,N ) 
W= .. .. .. 

 . . . 

1 1
γ γ 0
(d1,N ) (d2,N )
γ to ustalony przez badacza parametr wygasania. Przy braku
wyraźnych przesłanek do przyjęcia konkretnej wartości można
np. założyć, że γ = 1.
Andrzej Torój SGH
(2) Ekonometria Przestrzenna 17 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Macierz oparta na odległości

Konstrukcja macierzy opartej na odległości

Alternatywnym sposobem konstrukcji W jest dopuszczenie do


bezpośredniej interakcji między wszystkimi regionami. Jej siła
zależy wówczas od odległości.
Niech di,j oznacza odległość między i oraz j. Wówczas:
 1 1 
0 (d1,2 )γ
··· γ
(d1,N ) 
 (d 1 )γ 0 ··· 1

γ 
 1,2 (d2,N ) 
W= .. .. .. 

 . . . 

1 1
γ γ 0
(d1,N ) (d2,N )
γ to ustalony przez badacza parametr wygasania. Przy braku
wyraźnych przesłanek do przyjęcia konkretnej wartości można
np. założyć, że γ = 1.
Andrzej Torój SGH
(2) Ekonometria Przestrzenna 17 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Macierz oparta na odległości

Konstrukcja macierzy opartej na odległości w R


Wymagana jest funkcja st_distance.
Jej argumentem jest lista centroidów uzyskana poleceniem
st_centroid z kolumny SF$geometry obiektu klasy SF.
Współrzędne wierzchołków powinny być zadane jako stopnie
długości i szerokości geograficznej.
W niektórych plikach map tak nie jest (np. przy metodzie
projekcji UTM).
Dlatego potrzebowaliśmy wcześniej polecenia zamiany projekcji
st_transform.
Przy pracy z własnymi zbiorami danych należy zawsze upewnić
się co do rzędu wielkości lub, o ile taka informacja jest
dostępna, kodowania współrzędnych.
Odległości są wyznaczane między centroidami regionów lub między
punktami (w zależności od tego, czy pracujemy ze zbiorem
punktów, czy z regionami).
Andrzej Torój SGH
(2) Ekonometria Przestrzenna 18 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Macierz oparta na odległości

Centroidy – geometryczne środki ciężkości (1)

Mianownikiem w każdym przypadku jest pole figury.


Jako że granice regionów zwykle nie są zadane postaciami funkcyjnymi :-) (Teksas
wyjątkiem...), to R korzysta z numerycznego przybliżenia powyższych całek.
Andrzej Torój SGH
(2) Ekonometria Przestrzenna 19 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Macierz oparta na odległości

Centroidy (2)

Paradoks – zwróćmy uwagę na lokalizację centroidu powiatu


poznańskiego (nie mylić z powiatem m. Poznań!).
Andrzej Torój SGH
(2) Ekonometria Przestrzenna 20 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Macierz oparta na odległości

Centroidy (3)

Paradoks – zwróćmy uwagę na lokalizację centroidu powiatu


poznańskiego (nie mylić z powiatem m. Poznań!).
Andrzej Torój SGH
(2) Ekonometria Przestrzenna 21 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Plan prezentacji

1 Macierz wag przestrzennych

2 Podstawowe metody konstrukcji macierzy W

3 Inne metody konstrukcji macierzy W

4 Normalizacja macierzy W

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 22 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Alternatywne metody wyboru sąsiadów

Wybór sąsiadów według kryterium odległości

Elementom macierzy W przypisujemy wartość 1, jeżeli dwa


regiony znajdują się nie dalej niż w zadanej odległości, albo 0
w przeciwnym przypadku.
Metoda sprawdzi się dobrze w sytuacji, gdy:
Nasze dane przestrzenne to nie regiony, tylko punkty w
przestrzeni (trudno wtedy mówić o sąsiedztwie na podstawie
kryterium wspólnej granicy).
Mamy w naszej próbie regiony izolowane i chcemy tego
uniknąć.
Zamiast poly2nb używamy funkcji dnearneigh (po
wcześniejszym uzyskaniu centroidów).

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 23 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Alternatywne metody wyboru sąsiadów

Metoda k najbliższych sąsiadów


Elementom macierzy W = [wi,j ] przypisujemy wartość 1, jeżeli
region j należy do grona k najbliższych geograficznie regionów
dla i.
Badania numeryczne pokazują, że dokładny wybór k ma
zwykle ograniczone znaczenie dla wyników (LeSage i Pace,
2014).
Metoda sprawdzi się dobrze w sytuacji, gdy:
Nasze dane przestrzenne to nie regiony, tylko punkty w
przestrzeni (trudno wtedy mówić o sąsiedztwie na podstawie
kryterium wspólnej granicy).
Mamy w naszej próbie regiony izolowane i chcemy tego
uniknąć.
Zamiast poly2nb używamy knearneigh (znów dla
centroidów).
Andrzej Torój SGH
(2) Ekonometria Przestrzenna 24 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Umowne miary odległości

Umowne miary odległości


Czasami decydujemy o wykorzystaniu niegeograficznych,
umownych miar odległości (Corrado, Fingleton, 2012).
Sprawdzamy stopień podobieństwa kulturowego, społecznego,
ekonomicznego regionów – niekoniecznie sąsiadujących czy
pobliskich. Np. pod pewnymi względami Warszawa może być
bardziej połączona z Poznaniem niż z Otwockiem.
Wówczas macierz W musimy skonstruować sami (przykład w
pliku .R).
Uważajmy jednak!
Stosowanie takiego podejścia oznacza podwyższoną ekspozycję na ryzyko
złamania podstawowego założenia: o egzogeniczności W . Skutkiem
będzie niezgodna estymacja modeli przestrzennych.
Rozwiązanie: modele ko-ewolucji sieci (ang. network co-evolution models;
zob. Franzese, Hays, Kachi 2012).
Andrzej Torój SGH
(2) Ekonometria Przestrzenna 25 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Umowne miary odległości

Macierze sąsiedztwa zadane przez użytkownika

Na przykład: sąsiedztwo tylko wewnątrz jednego województwa


albo sąsiadami tylko własne miasta wojewódzkie.

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 26 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Plan prezentacji

1 Macierz wag przestrzennych

2 Podstawowe metody konstrukcji macierzy W

3 Inne metody konstrukcji macierzy W

4 Normalizacja macierzy W

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 27 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Normalizacja

Po co normalizacja macierzy W?

Aby uzyskać intuicyjną interpretację parametru ρ: wpływ


średniej ważonej sąsiadów.
Aby uniknąć ryzyka próby odwrócenia osobliwej macierzy w
procesie estymacji / komplikacji numerycznych związanych ze
skalowaniem różnych zmiennych.
Aby parametr ρ nie implikował ”eksplodujących” mnożników
przestrzennych (przez analogię do szregów czasowych, gdzie
oczekiwaliśmy parametru autoregresji co do modułu < 1).

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 28 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Normalizacja

Po co normalizacja macierzy W?

Aby uzyskać intuicyjną interpretację parametru ρ: wpływ


średniej ważonej sąsiadów.
Aby uniknąć ryzyka próby odwrócenia osobliwej macierzy w
procesie estymacji / komplikacji numerycznych związanych ze
skalowaniem różnych zmiennych.
Aby parametr ρ nie implikował ”eksplodujących” mnożników
przestrzennych (przez analogię do szregów czasowych, gdzie
oczekiwaliśmy parametru autoregresji co do modułu < 1).

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 28 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Normalizacja

Po co normalizacja macierzy W?

Aby uzyskać intuicyjną interpretację parametru ρ: wpływ


średniej ważonej sąsiadów.
Aby uniknąć ryzyka próby odwrócenia osobliwej macierzy w
procesie estymacji / komplikacji numerycznych związanych ze
skalowaniem różnych zmiennych.
Aby parametr ρ nie implikował ”eksplodujących” mnożników
przestrzennych (przez analogię do szregów czasowych, gdzie
oczekiwaliśmy parametru autoregresji co do modułu < 1).

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 28 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Normalizacja

Po co normalizacja macierzy W?

Aby uzyskać intuicyjną interpretację parametru ρ: wpływ


średniej ważonej sąsiadów.
Aby uniknąć ryzyka próby odwrócenia osobliwej macierzy w
procesie estymacji / komplikacji numerycznych związanych ze
skalowaniem różnych zmiennych.
Aby parametr ρ nie implikował ”eksplodujących” mnożników
przestrzennych (przez analogię do szregów czasowych, gdzie
oczekiwaliśmy parametru autoregresji co do modułu < 1).

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 28 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Normalizacja

Techniki normalizacji (1)

Najczęściej normalizuje się W wiersz po wierszu, w taki


sposób, by każdy z nich sumował się do 1 (row-stochastic,
row-standardized).
nb2listw(..., style = "W")
niepożądany skutek: asymetria przekształconego W (wbrew
postulatom teoretycznym: Vega i Elhorst, 2014)
Zamiast ”W” możemy użyć też:
”B”: brak normalizacji
”C”: normalizacja skalarem (wszystkie elementy sumują się do
N, choć niekoniecznie wiersze do 1)
”N”: normalizacja skalarem (wszystkie elementy sumują się do
1)
”S”: Tiefelsdorf, Griffith, Boots (1999)
”minmax”: Kelejian, Prucha (2010)

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 29 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Normalizacja

Normalizacja wierszami – czy zawsze dobra?


Zaleta: wektor typu Wx (opóźnienie przestrzenne – więcej na jego temat
następnym razem) możemy interpretować jako wektor zawierający średnią
ważoną zjawiska w jednostkach powiązanych z pierwszą, drugą, trzecią
itd. jednostką (np. u sąsiadów).

Wada: kto ma głośniej w mieszkaniu? czy ?

0 dB 150 dB
0 dB 0 dB 0 dB 0 dB
0 dB 0 dB 0 dB 0 dB
Przy elementach macierzy sąsiedztwaW normalizowanych wierszami:

1
: 5
(0 + 0 + 0 + 0 + 150) = 30dB (czyli ciszej niż obok...)

1
: 3
(0 + 0 + 150) = 50dB (czy na pewno tak powinno być...?)
Andrzej Torój SGH
(2) Ekonometria Przestrzenna 30 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Normalizacja

Techniki normalizacji (2)


Alternatywny sposób: normalizacja skalarem – najwyższą
wartością własną W :
W∗ = λW max

Fakt (z algebry macierzy):


Symetryczna macierz W ma wyłącznie rzeczywiste wartości
własne. Dotyczy to również macierzy, która nie jest symetryczna
wyłącznie na skutek normalizacji wierszami (a jej nienormalizowana
wersja była symetryczna).
Najpopularniejsza strategia wśród normalizacji skalarem.
1
Zaleta: λmin < ρ < 1 to dopuszczalny zbiór wartości w przypadku
procesu przestrzennie stacjonarnego (o tym na późniejszych
wykładach).
Wada: ρ nie podlega standardowej interpretacji.
Andrzej Torój SGH
(2) Ekonometria Przestrzenna 31 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Wnioski końcowe

Jak R przechowuje macierze W?

W zależności od rodzaju informacji wejściowych oraz celu analizy


musimy wykorzystywać różne obiekty, przekształcając je wzajemnie.

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 32 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Wnioski końcowe

Jak wybrać najlepsze W?


Zwykle mamy niewiele przesłanek do takiego wyboru (Anselin, 2002).
Best guess.
Neumayer, Plumper (2016) każą kierować się teorią (łatwo powiedzieć...).
Można jednak po oszacowaniu modelu porównać logarytm wartości
funkcji wiarygodności (log-likelihood) lub bayesowskie
prawdopodobieństwa modeli a posteriori dla różnych W .

Zasadnicze pytanie, na które musimy sobie odpowiedzieć:


Czy W adekwatnie obrazuje sieć bezpośrednich zależności między jednostkami
w kontekście analizowanej zmiennej objaśniającej?

Konsekwencje pomyłki:
niska moc testów diagnostycznych;
niezgodność i obciążenie estymatorów;
słaba statystyczna identyfikowalność modeli.

Andrzej Torój SGH


(2) Ekonometria Przestrzenna 33 / 34
Macierz W Podstawowe metody konstrukcji Inne metody Normalizacja

Wnioski końcowe

Zadanie domowe 2
Dla zbioru danych przestrzennych, który był przedmiotem pierwszej pracy
domowej, zbuduj trzy dodatkowe macierze W:
1 sąsiedztwa pierwszego rzędu, ale jako kryterium normalizacji zastosuj

najwyższą wartość własną (wskazówka: można to zrobić bezpośrednio na


macierzy, a potem przekształcić ją w listw bez normalizacji).
2 Macierz opartą na odwróconych kwadratach odległości, ale tylko do

progu 200 km (powyżej tego progu – brak połączenia).


3 Macierz opartą na euklidesowej odległości między trzema

wystandaryzowanymi
q zmiennymi dla par regionów  i, j
2 2 2
(x1,i − x1,j ) + (x2,i − x2,j ) + (x3,i − x3,j ) , o których sądzimy, że
prawidłowo obrazują sieć połączeń w kontekście zmiennej obrazowanej w
poprzedniej pracy.
W pliku PDF proszę o wklejenie fragmentu kodu bezpośrednio generującego
trzy macierze (z pominięciem kodu importującego pakiety, dane, mapy,
wykonującego łączenia itd.) – max. 1. strona. W dalszych pracach domowych
nie trzeba ograniczać się do trzech powyższych macierzy.
Andrzej Torój SGH
(2) Ekonometria Przestrzenna 34 / 34

You might also like