Professional Documents
Culture Documents
Estymacja - Materiały Do Ćwiczeń
Estymacja - Materiały Do Ćwiczeń
ROZKŁAD NORMALNY
Odgrywa kluczową rolę w statystyce matematycznej. Jego znaczenie wynika stąd, że przy
nieograniczonym wzroście liczby niezależnych doświadczeń wszystkie rozkłady teoretyczne
sa szybko zbieżne do rozkładu normalnego. Rozkład normalny charakteryzują dwa parametry:
µ i σ:
µ – wartość oczekiwana;
σ - odchylenie standardowe.
Im mniejsza wartość σ tym bardziej rozkład jest skupiony wokół wartości oczekiwanej.
Rozkład normalny swoją nazwę zawdzięcza temu, że jest to typ rozkładu częstości, który jest
charakterystyczny dla szeregu wskaźników społecznych w populacji ludzkiej: wzrost, waga,
współczynnik inteligencji.
̅ µ
√
ROZKŁAD T-STUDENTA
Rozkład t-studenta w odróżnieniu do normalnego stosujemy dla grup małych, z reguły dla
n<30.
Liczba stopni swobody jest to ilość elementów, które mogą się swobodnie zmieniać. Można ją
utożsamić z liczbą niezależnych zmiennych losowych, które wpływają na wynik.
Jeżeli liczba stopni swobody rozkładu t-studenta zmierza do nieskończoności to rozkład ten
zmierza do standaryzowanego rozkładu normalnego.
ROZKŁAD CHI-KWADRAT
Rozkład chi-kwadrat wykorzystywany jest przy analizie wariancji (m.in.) do wyliczenia
prawdopodobieństwa, że wariancja spełnia jakiś warunek.
ESTYMACJA
• populacją jest ludność zamieszkująca Polskę, a próbą z tej populacji jest ludność
wybranego województwa,
• populację stanowią drzewa na danym obszarze, a próbą z tej populacji jest np. 30
wybranych drzew, itd.
1. ESTYMACJA PUNKTOWA
≈ ̅±
√
• estymacja odchylenia standardowego w populacji:
≈ ±
√2
2. ESTYMACJA PRZEDZIAŁOWA
P(T1 ≤ θ ≤ T2 ) = 1 − α
Statystyka BS/BO-DU Materiały do ćwiczeń Estymacja
dla każdego θ i zadanego 0<α<1. To [T1,T2] nazywa się 100(1- α)% przedziałem ufności dla
parametru θ. Wartość współczynnika 1- α nazywa się poziomem ufności.
Najczęściej spotykanymi poziomami ufności są: 99%, 98%, 95% oraz 90%. Im większy
poziom ufności tym szerszy przedział – skoro chcemy mieć większą pewność, że wartość
parametru leży w naszym przedziale to musimy go zwiększyć!
Definicja. Kwantylem rzędu p (0<p<1) cechy x nazywamy taką wartość x(p) dla której
F(x(p))=p; gdzie F jest dystrybuantą rozkładu X.
Czasem nie interesuje nas konkretne zdarzenie, a grupa zdarzeń, np. nie interesuje nas, jaka
jest szansa, że na zakupach wydamy dokładnie 200zł, ale będzie nas interesowało jaka jest
szansa, że wydamy mniej niż 200zł, inaczej byśmy weszli na debet a tego nie chcemy. Do
wyliczenia takiego prawdopodobieństwa posłużmy się dystrybuantą, czyli
prawdopodobieństwem, że zajdzie zdarzenie nie większe od ustalonej wartości (w
powyższym przykładzie od 200zł).
Statystyka BS/BO-DU Materiały do ćwiczeń Estymacja
Dystrybuanta zmiennej losowej ciągłej jest funkcją ciągłą, rosnącą, przyjmującą wartości od 0 do 1.
Przedział ufności informuje nas na ile możemy ufać naszym wyliczeniom, np. dotyczącymi
średniej. Załóżmy, że chcemy wyliczyć średnią wagę studentów w Polsce. Jeżeli
chcielibyśmy wyliczyć dokładną wartość musielibyśmy przebadać wszystkich studentów w
Polsce. Oczywiście dałoby się to zrobić ale badania byłyby kosztowne i czasochłonne.
Dlatego chcemy wybrać reprezentatywną grupę studentów i estymować (oszacować) wartość
średniej. Jednak wybierając grupę, może się zdarzyć, że trafiliśmy lepiej lub gorzej. Z tego
powodu zamiast podawać dokładną wartość możemy podać przedział i powiedzieć, że na
99% średnia jest w tym przedziale a to już daje nam obraz wagi całej populacji studentów