Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 4

Michał Pietkiewicz, Ekobiznes

Statystyka
Podstawowe pojęcia:

 Czym jest statystyka?


Statystyka to nauka, która zajmuję się głównie gromadzeniem i opisywaniem informacji o
zjawiskach masowych i wraz z tym wyciąganie wniosków i wykrywanie prawidłowości
występujących w wspomnianych zjawiskach.

 Czym są zmienne?
Zmienne, czyli dane statystyczne, reprezentują wyniki dokonanych pomiarów (ciągłe
wartości) lub informacje wyrażające charakterystyki jakościowe (wartości nie ciągłe)

 Różnica między badaniami korelacyjnymi a eksperymentalnymi.


W badaniu korelacyjnym nie będziemy wpływać na żadną ze zmiennych a poświęcamy
uwagę na obserwacji ewentualnej korelacji między zmiennymi.
W badaniu eksperymentalnym, będziemy określać wartości niektórych zmiennych i mierzyć
wartości innych zmiennych, przy zadanych przez nas ustawieniach.

 Zmienne zależne a zmienne niezależne


Zmienna niezależna jest tą zmienną, którą w badaniu manipulujemy a niezależna jest tą którą
mierzymy.

 Skale pomiarowe

Zmienne dzieli się na: 1) nominalne (np. płeć, rasa, kolor, itp.)
2) porządkowe (np. status socjoekonomiczny rodziny)
3) przedziałowe (np. temperatura mierzona w stopniach Celsjusza)
4) ilorazowe (np. skale przestrzeni i czasu)

 Relacje między zmiennymi

Zmienne pozostają w relacji, jeśli ich odpowiadające sobie wartości są zależne od siebie.
(np. Wzrost jest w relacji z Ciężarem, ponieważ zazwyczaj wysocy osobnicy więcej ważą)

 Dlaczego zależności (relacje) między zmiennymi są ważne?

Wykrywania relacji pomiędzy zmiennymi jest podstawowym celem każdego badania


naukowego.
 Dwie podstawowe cechy każdej relacji pomiędzy zmiennymi.

Każdą relację między zmiennymi można scharakteryzować dwiema własnościami:


1) Siła (wielkość), która informuje nas o tym jaka część danych zachowuje się w sposób jaki
oczekujemy. Jeżeli można przewidzieć jedną zmienną na podstawie pomiaru drugiej siła
relacji pomiędzy dwiema zmiennymi jest duża w mierzonej próbie.
2) Wiarygodność (prawdziwość), która dotyczy reprezentatywności wyniku uzyskanego na
podstawie pobranej próbki w odniesieniu do całej badanej populacji.

 Co to jest poziom istotności (α)

Poziom istotności jest to próg, według którego oceniamy z jakim prawdopodobieństwem


różnice, które zaobserwowaliśmy są dziełem przypadku.

 Jak stwierdzić, czy rezultat jest rzeczywiście istotny?

Oznacza to, że wybór poziomu istotności, powyżej którego rezultat będzie odrzucany jako
nieistotny, jest wyborem umownym, ale zazwyczaj przyjmuje się jako wartość graniczną:
α=0,05.

 Istotność statystyczna a liczba przeprowadzonych analiz.

Trzeba liczyć się z tym, że im więcej analiz przeprowadzimy na określonym zbiorze danych,
tym większa liczba wyników ma szansę przekroczyć ustalony poziom istotności. Dla tego
niektóre procedury statystyczne, w których ma się do czynienia z wieloma porównaniami
przewidują specjalne poprawki lub korekty w zależności od liczby porównań.

 Siła a wiarygodność zależności między zmiennymi.

W próbce o określonej liczności, im większa siła zależności istnieje między zmiennymi, tym
bardziej istotna jest ta zależność.

 Dlaczego silniejsze relacje między zmiennymi są bardziej istotne?

„Im silniejsza relacja między zmiennymi została zmierzona w próbce, tym mniej
prawdopodobnym jest brak takiej relacji w populacji generalnej.” (Źródło: www.statsoft.pl)

 Dlaczego istotność relacji między zmiennymi zależy od wielkości próbki?

„Jeśli mamy do czynienia z małą liczbą obserwacji, wówczas istnieje też mała liczba
wszystkich możliwych kombinacji różnych wartości poszczególnych zmiennych, a co za tym
idzie, prawdopodobieństwo tego, że przez przypadek zdarzy się w pomiarze kombinacja
wskazująca na silną zależność jest relatywnie duże.” (Źródło: www.statsoft.pl)

 Jak można mierzyć siłę relacji między zmiennymi?

Istnieje wiele miar siły relacji między zmiennymi a wybór jednej z nich zależy od różnych
czynników jak np. jakie są skale pomiarowe, jaka jest natura badanych relacji itp. W prawie
wszystkich miarach dokonujemy porównania siły badanej relacji z największą siłą relacji
możliwą dla zmiennych.
 Jak ocenić wartość istotności.

Zależy to od ilości próbek. Aby więc ocenić wartość istotności będzie nam niezbędne
posiadania funkcji, która wyrażałaby związek pomiędzy siłą a istotnością relacji pomiędzy
zmiennymi w zależności od liczności próbki.

Analiza baz danych:

1) Śledzie:

 Liczba Zmiennych: 1 / masa ciała / zmienna zależna

 Liczba przypadków: 40

 Cel: Stwierdzić średnią masę ciała śledzi

2) Rozwody:

 Liczba Zmiennych: 8 / 4 zmienne zależne, czyli wykonane testy / 4 zmienne


niezależne, czyli identyfikator, płeć, data urodzenia i rozwiedzeni rodzice

 Liczba przypadków: 83

 Cel: Stwierdzić czy sytuacja dziecka z rozwiedzionymi rodzicami ma wpływ na jego


zachowanie. (niepokój, depresja, kompulsywne zachowanie)

3) Chipsy:

 Liczba Zmiennych: 5/ 4 niezależne (słoność, słodkość, kwaśność i chrupkość) /


1 zmienna zależna (wynik ogólny)

 Liczba przypadków: 100

 Cel: Stwierdzić jaka charakterystyka chipsa najkorzystniej wpływa na konsumowanie


go

4) Pietruszka:

 Liczba Zmiennych: 2 / 1 zmienna niezależna (nawóz) / 1 zmienna zależna (waga)

 Liczba przypadków: 90

 Cel: Stwierdzić jaka różnica wagowa pietruszki zachodzi przy sadzeniu trzema
różnymi nawozami
5) Daphnia Cucullata

 Liczba Zmiennych: 9 / 4 zmienne niezależne (jezioro, stan troficzny, warstwa wody,


głęboko czy płytko / 5 zmiennych zależnych (No., długość i szerokość ciała, długość
głowy, długość kręgosłupa)

 Liczba przypadków: 3189

 Cel: Stwierdzić wpływ środowiska wodnego na wielkość ciała Daphina Cuucullata

You might also like