Download as pptx, pdf, or txt
Download as pptx, pdf, or txt
You are on page 1of 20

Dobór próby

Wprowadzenie
• Niemożność obserwowania wszystkiego, co jest
przedmiotem zainteresowania  wybór
obserwacji, na podstawie których będą
dokonywane uogólnienia na ludzi i wydarzenia.
Proces doboru obserwacji – DOBÓR PRÓBY.
• Zagadnienie z dziedziny bardziej nauk ścisłych.
• Rozwój równolegle z badaniami zachowań i
preferencji politycznych ( możliwość
przekonania się o trafności szacunków).
• Przykłady z USA: sondaż „Literary Digest” w 1936 roku
(prezydent Alf Landon, w rzeczywistości Franklin Roosevelt).
Operat losowania: abonenci telefonów i właściciele
samochodów (nadreprezentacja zamożnych wyborców).
• Sondaż Gallupa w 1948, porażka przewidywań (Dewey, w
rzeczywistości Truman); próba kwotowa (udziałowa),
wcześniej się sprawdzała, w 1948 podstawą był spis z roku
1940, po którym masowe migracje do miast 
nadreprezentacja wiejskich wyborców  niedoszacowanie
głosów oddanych na Demokratów (mieszkańcy miast skłaniali
się ku demokratom).­­
Dwa typy doboru próby

NIEPROBABILISTYCZ PROBABILISTYCZNY
NY (LOSOWY)
1) Oparty na dostępności 1) Prosty dobór losowy
badanych 2) Systematyczny
2) Celowy/arbitralny 3) Warstwowanie
3) Metoda kuli śnieżnej 4) Wielostopniowy dobór
4) Kwotowy grupowy
5) Wybór informatorów
1. Dobór nieprobabilistyczny oparty na
dostępności badanych
• Np. zatrzymywanie na ulicy; studenci zapisani
na wykłady w dużych grupach.
• Brak kontroli nad reprezentatywnością,
• potrzebna duża ostrożność przy uogólnianiu
wyników.
2. Dobór nieprobabilistyczny celowy lub
arbitralny
• Np. dobór przypadków odbiegających od
normy, dających się łatwo rozpoznać
(przywódcy studenckiego ruchu protestu);
• chęć doboru jak najbardziej zróżnicowanych
osób na etapie pilotażu kwestionariusza.
3. Dobór nieprobabilistyczny – metoda kuli
śnieżnej
• Umożliwia docieranie do trudno dostępnych
członków populacji (bezdomni, nielegalni
imigranci, itp.).
• Głównie cele eksploracyjne.
4. Dobór nieprobabilistyczny - kwotowy

• Uwzględnia kwestię reprezentatywności, choć inaczej niż


próba losowa.
• Punkt wyjścia: macierz lub tabela, opisująca cechy
populacji  zebranie danych od osób mających wszystkie
cechy określone w komórce tabeli  wszystkim osobom w
danej komórce przypisane wagi odpowiednio do ich udziału
w populacji.
• czasem trudno znaleźć aktualne informacje pozwalające na
oddanie struktury kwot (zob. Gallup)
• odchylenia w próbach w ramach poszczególnych komórek
tabeli
5. Dobór nieprobabilistyczny – wybór
informatorów
respondent – osoba, która dostarcza informacji o
sobie  obraz grupy jako całości; informator –
dostarcza informacji o grupie jako takiej;
powinien być w jakiś sposób typowy dla badanej
grupy
Próby nieprobabilistyczne stosowane są głównie w
badaniach jakościowych.
• Badania jakościowe koncentrują się na znaczeniach
różnych zjawisk i mechanizmach ich powstawania.
• Wnioski nie podlegają uogólnieniom.
• Jednostki analizy dobierane są celowo ze względu
na to, że są z jakiegoś powodu interesujące dla
badacza, nie ze względu na swoją
reprezentatywność.
W badaniach ilościowych kładzie się nacisk na
możliwość uogólnienia wyników na szerszą
zbiorowość, z której pochodzą badani.
• Badane próby powinny odzwierciedlać główne
cechy populacji, z której pochodzą.
• Dobór próby opiera się na matematycznych
regułach teorii prawdopodobieństwa.
Dobór probabilistyczny (losowy)

• losowość – termin matematyczny, oznaczający, że żaden element w


danym zbiorze nie jest powiązany z innymi. Aby móc zapewnić
możliwość uogólniania należy zapewnić, aby każdy element w
populacji miał jednakowe (lub znane) szanse na znalezienie się w
próbie  próba stanowi niejako miniaturę populacji, z której
pochodzi.
• Osiągnięcie tego celu jest możliwe pod warunkiem, że istnieje
OPERAT – lista wszystkich członków danej populacji, z której
chcemy dobrać próbę. Operat powinien być dokładny, aktualny,
kompletny oraz powinien odpowiadać naszym celom (warunków tych
nie spełnia np. aktualizowana co dwa lata książka telefoniczna).
Trudno uzyskać dobre operaty do badań społecznych. Trudność
badania zwłaszcza tzw. populacji ukrytych – osób, których nie ma na
żadnych listach (nielegalnych imigrantów, przestępców, bezdomnych).
Dobór probabilistyczny (losowy)

• zapobiega problemowi świadomego lub nieświadomego


obciążenia próby  każdy element w populacji ma znane
(niezerowe) prawdopodobieństwo znalezienia się w próbie
• nigdy nie jest doskonałą reprezentacją populacji, z której
została dobrana – zawsze jakiś margines błędu z próby
• za pomocą przewidywania rozkładu z prób ze względu na
dany parametr metody probabilistycznego doboru próby
umożliwiają dla danej próby oszacowanie oczekiwanego
błędu z próby
• jest on określany w kategoriach poziomów ufności i
przedziałów ufności
Populacje i operaty losowania
• Operat = lista lub quasi-lista elementów, z których losuje się
próbę. Reprezentatywność próby zależy bezpośrednio od tego, w
jakim stopniu operat losowania uwzględnia wszystkich członków
populacji generalnej, których próba ma reprezentować. Wyniki
badań opartych na próbie można uznać za reprezentatywne tylko w
odniesieniu do elementów tworzących operat losowania.
• W praktyce raczej dostępne operaty losowania definiują badaną
populację, niż na odwrót (mamy pewne wyobrażenie populacji, którą
chcemy się zająć, a następnie szukamy możliwych operatów).
• Dobre listy – np. badania różnych organizacji (jeśli lista wszystkich
członków), uczniowie i nauczyciele szkół, studenci i pracownicy
uniwersytetów, załogi fabryk itp.; listy właścicieli samochodów,
korzystających z pomocy społecznej, osób prowadzących
działalność gospodarczą.
Schematy losowania próby
• PROSTY DOBÓR LOSOWY (w praktyce rzadko stosowany)

• SYSTEMATYCZNY: wybieranie co k-tego członka z operatu


losowania

• WARSTWOWANIE: proces grupowania członków populacji we


względnie homogeniczne warstwy przed losowaniem, poprawia
reprezentatywność próby, redukując wielkość błędu z próby

• WIELOSTOPNIOWY DOBÓR GRUPOWY : gdy nie istnieje


lista wszystkich członków populacji; aby uzyskać potrzebną
wielkość próby należy określić równowagę między liczbą grup, a
ich liczebnością. Aby zrównoważyć błąd z próby związany z
procedurą wielostopniową można zastosować podział na warstwy.
Ważenie danych

Gdy występują różnice w prawdopodobieństwie


znalezienia się w próbie między poszczególnymi
członkami populacji – dla zapewnienia
reprezentatywnego obrazu całej populacji trzeba
nadać poszczególnym obserwacjom wagi.
Generalnie waga przypisana do konkretnego
członka populacji powinna być odwrotnością
prawdopodobieństwa jego znalezienia się w
próbie.
Aby badania były reprezentatywne (wyniki można
uogólnić na całą populację, z której wylosowana była
próba) często konieczne jest utworzenie wagi
analitycznej, która (w zależności od typu) może
rekompensować:
• nierówne prawdopodobieństwo dostania się jednostek
do próby (waga inkluzji);
• skutki nieuzyskania danych o części osób
wylosowanych do próby (waga non-response rate);
• różnice pomiędzy strukturą zrealizowanej próby, a
strukturą populacji (waga poststratyfikacyjna)
Ćwiczenia
1. Respondentami w pewnym badaniu są cudzoziemcy pracujący
nielegalnie na budowach w Polsce. Celem badania jest m.in.
poznanie przyczyn i okoliczności ich przyjazdu, warunków życia
w Polsce oraz doświadczeń w pracy i poza nią. Zaproponuj
sposób doboru próby do tego badania.
2. Celem pewnego badania jest poznanie opinii mieszkańców
kilku osiedli w Krakowie na temat planowanej w pobliżu
inwestycji. Zaproponuj sposób doboru próby do tego badania.
1. Celem pewnego badania jest porównanie szans edukacyjnych dzieci
zamieszkujących miasta i wsie w Polsce. Zaproponuj sposób doboru próby
do tego badania. 

2. W jaki sposób można dobrać reprezentatywną próbę wszystkich właścicieli


samochodów w Krakowie?

3. Zaproponuj sposób doboru reprezentatywnej próby studentów


Uniwersytetu Pedagogicznego. Wskaż zalety i ograniczenia swojej
propozycji.

You might also like