Download as pdf or txt
Download as pdf or txt
You are on page 1of 6

Statystyka BS/BO-DU Materiały do ćwiczeń Estymacja

PRZYKŁADY ZMIENNYCH LOSOWYCH:


W statystyce matematycznej najczęściej wykorzystywane są rozkłady:

1) Dla zmiennych losowych skokowych: rozkład dwumianowany (Bernoulliego); rozkład


Poissona
2) Dla zmiennych losowych ciągłych: rozkład normalny i jego transformacje: rozkład
chi-kwadrat; rozkład t-studenta; rozkład Fishera-Snedecora

ROZKŁAD NORMALNY
Odgrywa kluczową rolę w statystyce matematycznej. Jego znaczenie wynika stąd, że przy
nieograniczonym wzroście liczby niezależnych doświadczeń wszystkie rozkłady teoretyczne
sa szybko zbieżne do rozkładu normalnego. Rozkład normalny charakteryzują dwa parametry:
µ i σ:

µ – wartość oczekiwana;

σ - odchylenie standardowe.

Im mniejsza wartość σ tym bardziej rozkład jest skupiony wokół wartości oczekiwanej.

Krzywa Gaussa: Krzywa Gaussa jest krzywą prezentującą rozkład


prawdopodobieństwa rozkładu N(μ,σ)

Rozkład normalny swoją nazwę zawdzięcza temu, że jest to typ rozkładu częstości, który jest
charakterystyczny dla szeregu wskaźników społecznych w populacji ludzkiej: wzrost, waga,
współczynnik inteligencji.

Do wnioskowania statystycznego w populacjach o rozkładzie normalnym często


wykorzystuje się przekształconą statystykę. Przekształcenie to zwane standaryzacją określa
wzór:
Statystyka BS/BO-DU Materiały do ćwiczeń Estymacja

̅ µ

Statystyka U ma unormowany rozkład normlany N(0;1).

ROZKŁAD T-STUDENTA
Rozkład t-studenta w odróżnieniu do normalnego stosujemy dla grup małych, z reguły dla
n<30.

Statystyka jest niezależna od σ i ma rozkład t-studenta o (n-1) stopniach swobody. Rozkład t-


studenta charakteryzuje się większą niepewnością w porównaniu z testem U. Odchylenie
standardowe z próby znacznie odbiega od odchylenia standardowego z populacji generalnej.

Liczba stopni swobody jest to ilość elementów, które mogą się swobodnie zmieniać. Można ją
utożsamić z liczbą niezależnych zmiennych losowych, które wpływają na wynik.

Jeżeli liczba stopni swobody rozkładu t-studenta zmierza do nieskończoności to rozkład ten
zmierza do standaryzowanego rozkładu normalnego.

Przedstawienie rozkładu t studenta dla 1, 5 i 30 stopni swobody


Statystyka BS/BO-DU Materiały do ćwiczeń Estymacja

ROZKŁAD CHI-KWADRAT
Rozkład chi-kwadrat wykorzystywany jest przy analizie wariancji (m.in.) do wyliczenia
prawdopodobieństwa, że wariancja spełnia jakiś warunek.

Rozkład chi-kwadrat jest rozkładem nieujemnym o asymetrii prawostronnej.

Wykres rozkładu chi kwadrat

ROZKŁAD F-SNEDECORA (FISHERA)


Przy porównaniu wariancji dwóch prób wylosowanych niezależnie z dwóch populacji
normalnych o jednakowych wariancjach i dowolnych średnich posługujemy się ilorazem
wariancji obliczonych z tych prób.

W praktyce często mamy do czynienia z kilkoma niezależnymi testami, służącymi do


weryfikacji tej samej hipotezy, prowadzącymi do odrzucenia lub przyjęcia hipotezy zerowej
na różnych poziomach istotności. Na przykład, aby odpowiedzieć na pytanie, czy związki
zawodowe mają wpływ na wysokość wynagrodzenia można przeprowadzić badania w
różnych gałęziach gospodarki, w jednych przypadkach stwierdzając istnienie takiego wpływu
a w innych nie stwierdzając. W dalszym rozumowaniu polega to na połączeniu wyników
uzyskanych z każdego z przeprowadzonych testów.

Statystyka F jest rozkładem ilorazu dwóch niezależnych zmiennych losowych chi-kwadrat, z


których każda podzielona jest przez właściwą dla niej liczbę stopni swobody.
Statystyka BS/BO-DU Materiały do ćwiczeń Estymacja

ESTYMACJA – polega na oszacowaniu przy wykorzystaniu danych z próbki


parametrów ogólnych rozkładu cechy w całej populacji generalnej

ESTYMACJA

ESTYMACJA PUNKTOWA ESTYMACJA PRZEDZIAŁOWA

• za ocenę wartości parametru • wyznacza się odpowiednio pewien


przyjmuje się jedną konkretną przedział liczbowy, w którym z
wartość otrzymaną na podstawie określonym prawdopodobieństwem
wyników w próbce przy zachowaniu zawiera się wartość oszacowanego
odpowiednich reguł wyznaczania tej parametru
wartości

JEDNA KONKRETNA WARTOŚĆ PRZEDZIAŁ LICZBOWY

Populacją jest całą zbiorowością, a próba jest wybraną częścią populacji:

• populacją jest ludność zamieszkująca Polskę, a próbą z tej populacji jest ludność
wybranego województwa,
• populację stanowią drzewa na danym obszarze, a próbą z tej populacji jest np. 30
wybranych drzew, itd.

1. ESTYMACJA PUNKTOWA

• estymacja średniej w populacji:

≈ ̅±

• estymacja odchylenia standardowego w populacji:
≈ ±
√2

2. ESTYMACJA PRZEDZIAŁOWA

Niech x1,...,xn będzie próbą z rozkładu P należącego do pewnej rodziny rozkładów

Definicja. Jeżeli [T1(X1,...,Xn),T2(X1,...,Xn)], gdzie P(T1 <T2)=1, jest przedziałem losowym


takim, że

P(T1 ≤ θ ≤ T2 ) = 1 − α
Statystyka BS/BO-DU Materiały do ćwiczeń Estymacja

dla każdego θ i zadanego 0<α<1. To [T1,T2] nazywa się 100(1- α)% przedziałem ufności dla
parametru θ. Wartość współczynnika 1- α nazywa się poziomem ufności.

Ogólne zasady konstruowania przedziałów ufności:

1) Ustalamy α (tzw. poziom istotności „zakładany błąd”)

2) Znajdujemy T1,T2 wykorzystując przy ich znajdowaniu kwantyle odpowiedniego


rzędu dla danego rozkładu

Poziom istotności α - jest to maksymalne prawdopodobieństwo, że popełnimy błąd pierwszego


rodzaju; jest to prawdopodobieństwo, że stwierdzimy, ze nasz przedział nie zawiera
szacowanego parametru mimo, że go zawierał

Poziom (współczynnik) ufności (1-α) - jest to prawdopodobieństwo, z jakim przedział ufności


pokrywa szacowany parametr

Najczęściej spotykanymi poziomami ufności są: 99%, 98%, 95% oraz 90%. Im większy
poziom ufności tym szerszy przedział – skoro chcemy mieć większą pewność, że wartość
parametru leży w naszym przedziale to musimy go zwiększyć!

Pojęcie przydatne przy konstruowaniu przedziałów ufności: DYSTRYBUANTA

Definicja. Kwantylem rzędu p (0<p<1) cechy x nazywamy taką wartość x(p) dla której
F(x(p))=p; gdzie F jest dystrybuantą rozkładu X.

Czasem nie interesuje nas konkretne zdarzenie, a grupa zdarzeń, np. nie interesuje nas, jaka
jest szansa, że na zakupach wydamy dokładnie 200zł, ale będzie nas interesowało jaka jest
szansa, że wydamy mniej niż 200zł, inaczej byśmy weszli na debet a tego nie chcemy. Do
wyliczenia takiego prawdopodobieństwa posłużmy się dystrybuantą, czyli
prawdopodobieństwem, że zajdzie zdarzenie nie większe od ustalonej wartości (w
powyższym przykładzie od 200zł).
Statystyka BS/BO-DU Materiały do ćwiczeń Estymacja

Dystrybuanta zmiennej losowej ciągłej jest funkcją ciągłą, rosnącą, przyjmującą wartości od 0 do 1.

Po co nam przedział ufności?

Przedział ufności informuje nas na ile możemy ufać naszym wyliczeniom, np. dotyczącymi
średniej. Załóżmy, że chcemy wyliczyć średnią wagę studentów w Polsce. Jeżeli
chcielibyśmy wyliczyć dokładną wartość musielibyśmy przebadać wszystkich studentów w
Polsce. Oczywiście dałoby się to zrobić ale badania byłyby kosztowne i czasochłonne.
Dlatego chcemy wybrać reprezentatywną grupę studentów i estymować (oszacować) wartość
średniej. Jednak wybierając grupę, może się zdarzyć, że trafiliśmy lepiej lub gorzej. Z tego
powodu zamiast podawać dokładną wartość możemy podać przedział i powiedzieć, że na
99% średnia jest w tym przedziale a to już daje nam obraz wagi całej populacji studentów

You might also like