Download as pdf or txt
Download as pdf or txt
You are on page 1of 45

Translated from English to Ukrainian - www.onlinedoctranslator.

com

Кафедра фізики, математики та біофізики

ЗАСТОСУВАННЯ МАТЕМАТИЧНОЇ СТАТИСТИКИ І


ШТУЧНІ
ІНТЕЛЕКТ У НАУЦІ ДАНИХ
Курс для студентів LUHS PhD

Тема: Аналіз номінальних змінних. Тести хі-квадрат

Викладач д-р. Рената Паукштайтеєне


-2тести. Вступ
• -2тести розроблено для аналізу відмінностей між очікуваною та
спостережуваною частотами значень, які може отримати змінна, що цікавить.

• -2тести можна застосовувати для аналізу будь-яких змінних; але перед


аналізом усі кількісні безперервні змінні мають бути перетворені в
категоричні (згруповані) змінні (або дискретні змінні).

• -2тести мають менше обмежень у застосуванні порівняно з параметричними


тестами, однак при визначенні значення тестової статистики вимагається, щоб
значення очікуваних частот були більшими за 5 принаймні в 75% категорій
таблиці частот.

PS У вікні SPSS Output під таблицею, що містить відповіді на тестову


статистику та p-value, завжди є відсотки, що вказують, яка частка клітинок
таблиці має очікувані частоти, менші за 5. Якщо ці відсотки більші за 25,
тоді для аналізу потрібно використовувати точні тести, оскільки вибірка
надто мала для застосування асимптотичних критеріїв хі-квадрат.
-2Тест на придатність
(Тест пропорції населення або -2Тест для однієї популяції)

Припустимо, що випадкова величина A може набувати значення A1, А2, …, Аk


значення з невідомими ймовірностями 1, 2, … , ( 1+ 2+ ⋯ + = 1)у кожному з n
незалежних експериментів.
Мета дослідження полягає в тому, щоб перевірити, чи ймовірності
категоричних значень дорівнюють гіпотетичним ймовірностям, відповідно
(тобто чи відповідає спостережуваний розподіл значень очікуваному
(гіпотетичному) розподілу).
З генеральної сукупності складається випадкова вибірка, в якій спостерігають,
скільки членів вибірки належать до категорії ( = 1, 2, … , )і скільки має
належати якщо 0була істинною (очікувана частота), тобто таблиця
отримані спостережувані та очікувані частоти (стор∗ i(i =1, ..., k) - ймовірності
які перевірені)
Аi– категорія змінної А А1 А2 … Аk
Оi– спостерігається частота Ai О1= n1 О 2= n 2 Оk= nk

Ei– очікувана частота Аi E1= n ∙ p∗ 1 E2= n ∙ p∗ 2 Ek= n ∙ pk ∗


-2Тест на придатність

Нульовими та альтернативними гіпотезами є:


* * *
Х0: стор
1= стор1,стор
2= стор2,...,сторk= сторk

Х1: інші ймовірності


З даних вибірки ми обчислюємо статистику тесту за такою формулою:
k
Оi− Е2 i
χ2=
Ei
i=1

Оi– спостережувані частоти ( = 1, 2, … , )у зразку; Ei–


очікувані частоти ( = 1, 2, … , )у зразку;
k – кількість різних категорій, які можуть отримати якісну змінну.

Статистика тесту -2є випадковою величиною, розподіленою за -2розподіл (якщо H істинне)


0
-2Тест на придатність

Якщо гіпотезу перевіряють на основі p-значення:

P-значення визначається в програмному забезпеченні IBM SPSS Statistics* (або іншому програмному забезпеченні).

*Спосіб SPSS: Аналіз→Непараметричні тести→Застарілі діалоги→Квадрат Чи


Правило:
Якщо p-value < -, то H0відхиляється; Якщо p-

значення - -, то H0не відхиляється.

Якщо перевірка гіпотези базується на критичному значенні тесту

Критичне значення 2= 2 ( )= 2 1− ( − 1)береться з таблиці квантилів χ2


розподіл:
правило: Якщо χ2≤ 2,Х0не відхиляється; Якщо χ2> 2 , Х0відхилено.

Нарешті, висновок будується за результатами перевірки гіпотези.


Приклад 1
У групі зі 100 туристів 25 осіб були молодше 30 років, 40 осіб –
30-55 років, 35 осіб – старше 55 років. Чи можна зробити
висновок, що 20% туристів завжди молодші 30 років, вік 50%
туристів завжди становить 30-55 років і 30% туристів завжди
старше 55 років. -=0,05
Рішення прикладу 1:
Аi <30 30-55 > 55
Х0: стор1= 0,2, с2= 0,5 і с3= 0,3 пi 25 40 35
Х1: інші ймовірності сторi 0,2 0,5 0,3

k
ni − np∗ i2
χ2=
npi∗
i=1

25 − 100 ⋅ 0,22 40 − 100 ⋅ 0,52 35 − 100 ⋅ 0,32


2= + + = 4,083
100 ⋅ 0,2 100 ⋅ 0,5 100 ⋅ 0,3

Визначте p-value у SPSS.


Способи:

Аналізуйте→Непараметричні тести→Один зразок...

Аналізуйте→Непараметричні тести→Застарілі діалоги→Чі квадрат...

Правило:
Якщо p-value < -, то H0відхиляється; Якщо
p-значення - -, то H0не відхиляється.
Рішення прикладу 1 у IBM SPSS Statistics

Х0: стор1= 0,2, с2= 0,5 і с3= 0,3


H1: інші ймовірності
Імовірності відХ0у вказаному
порядку мають бути записані в
полеОчікувані значення
Рішення прикладу 1 у IBM SPSS Statistics:

Оскільки p-значення тесту перевищує


рівень значущості тесту (p-значення >
- (0,130 > 0,05), H0не відхиляється.
Вибіркові дані не спростовують
гіпотезу про те, що 20% туристів
завжди молодші 30 років, вік 50%
туристів завжди становить 30-55 років,
а 30% туристів завжди старше 55 років.
( 2=4083; df = 2; p=0,130).
-2Тест на Незалежність

Припустимо, що дві номінальні змінні (A і B) спостерігаються випадково

вибірка, взята з однієї сукупності.

• Змінна А може вигратилрізні значення А1, А2, …, Ал

• Змінна B може вигратиkрізні значення В1, Б2, …, Бk.

Метою перевірки гіпотези є перевірка гіпотези, якщо змінні A і B

єнезалежнийу спостережуваній популяції.


-2Тест на Незалежність
Перед перевіркою гіпотези вибіркові дані зводяться до таблиці
спостережуваних частот відповідно до значень порівнюваних змінних A і B.
Таблиця, кількість рядків якої дорівнює кількості значень, отриманих змінною
A, а кількість стовпців дорівнює кількості значень, отриманих змінною B,
показує зв’язок між змінними A і B і називається таблиця непередбачених
обставин
-2тест на Незалежність

Нульова та альтернативна гіпотези:

Х0: Змінна A та змінна B є незалежними (не пов’язаними) H1:


Змінні A і B є залежними (пов’язаними).
Статистика тесту визначається з вибіркових даних за наступними формулами:

Загальне: 2
- м i- n j -
пij − --
- k-- п -
-2=--- мi - nj
i=1 j=1
Для столу 2х2 п

)2
-2= n- (п11 п22п12
- − - п21
п1-н2-м1-м2

Статистика тесту -2є випадковою величиною, розподіленою за -2розподіл (якщо H0правда)


-2Тест на Незалежність
Х0: Змінна A та змінна B є незалежними (не пов’язаними) H1
: Змінні A і B є залежними (пов’язаними).

Б Б1 Б2 -Аi
А
А1 п11 п12 -А1=м1
А2 п21 п22 -А2=м2
-Бj -Б1=n1 -Б2=n2 п

Якщо змінні A і B дихотомічні (кожна може отримати лише два значення) і

виходять малі очікувані частоти (принаймні одна менше 10, хоча деякі автори

п. менше 5), то тест χ2 за статистичні дані обчислюються з поправкою на безперервність Єйтса

формулою:
2 ∙ 22 − 12∙ 21− 0,5 ∙ 2
− − 0,5 2= ∙
11
2= 1∙ 2∙ 1∙ 2
=1 =1
або

13
Пarengė dr. Р. Паукштайтене
-2тест на Незалежність

Якщо гіпотезу перевіряють на основі p-значення:

P-значення визначається в програмному забезпеченні IBM SPSS Statistics* (або іншому програмному забезпеченні).

*Спосіб SPSS: Аналіз→Описова статистика→Перехресні таблиці


Правило:
Якщо p-value < -, то H0відхиляється; Якщо p-

значення - -, то H0не відхиляється.

Якщо перевірка гіпотези базується на критичному значенні тесту

Критичне значення 2 = 2( )= 2 1− ( − 1) ∙ − 1береться з таблиці квантилів


χ2розподіл:
правило: Якщо χ2≤ 2,Х0не відхиляється; Якщо χ2 > 2, Х0відхилено.

Нарешті, висновок будується за результатами перевірки гіпотези.


Міри асоціації номінальних змінних
Щоб оцінити силу зв'язку між двома номінальними величинами, розраховують
коефіцієнт кореляції (асоціації) r.
Коефіцієнт Крамера:
χ2
r=
n ∙ min( k − 1 , − 1 )

min k − 1 − 1мінімум між ступенями свободи


0 - ркр- 1
Джей ркр= 0, жодної асоціації немає;
0 < rкр- 0,3, слабка асоціація; 0,3 < rкр
- 0,5, середня асоціація 0,5 < rкр- 1,
сильна асоціація;

Для великих столів (5 х 5)Визначено коефіцієнт непередбачуваності Пірсона:

Однак важко пояснити міцність за цим коефіцієнтом, оскільки його максимумм


залежить від кількості рядків і стовпців таблиці непередбачуваності. Він змінюється від 0 до = −1, де

L = min(k; l)
15
Приклад 2

Мета дослідження – визначити, чи існує зв’язок між інфарктом міокарда


(ІМ так/ні) та місцем проживання (Місце місто/село). Зразкові дані
представлені в наступній таблиці непередбачених обставин.
Який висновок зробить дослідник, маючи такі вибіркові дані?
-=0,05
МІ М. І. так МІ № мj

Місце
місто 40 25 65
село 10 35 45
пi 50 60 110
Рішення прикладу 2 МІ М. І. так МІ № мj
Х0: Інфаркт міокарда не залежить від Місце
місце проживання
місто 40 25 65
Х1: Інфаркт міокарда залежить від життя село 10 35 45
місце пi 50 60 110

Усі очікувані частоти, розраховані за формулою є більшими за 10, таким чином

Корекція безперервності Єйтса не використовуватиметься. (Спостережувана частота→очікувано)

50 ⋅ 65 60 ⋅ 65 50 ⋅ 45 60 ⋅ 45
40 → = 29,5 ; 2 5 → = 35,5; 10 → = 20,5; 35 → = 24,5
110 110 110 110

Очікувані частоти в SPSS визначаються за допомогоюАналізуйте→Описова статистика→ Перехресні таблиці.В


польових умовахКлітини→Підрахунки виберіть Спостережувані та (Очікувані).
Рішення прикладу 2 МІ М. І. так МІ № мj

Х0: Інфаркт міокарда не залежить від Місце


місце проживання
місто 40 25 65
Х1: Інфаркт міокарда залежить від життя село 10 35 45
місце пi 50 60 110
Якщо ми використовуємо загальну формулу, статистика тесту буде:
2
- мi- n j - 50 ⋅ 652 60 ⋅ 652 50 ⋅ 452 60 ⋅ 452
--пij − -- 40 −
110
25 −
110
10 −
110
35 −
110
- k п - 2 = + + = 16,58
-2=--- мi- nj
50 ⋅ 65
110
60 ⋅ 65
110
50 ⋅ 45
110
60 ⋅ 45
110
i=1 j=1

п
або ми можемо використати формулу для таблиць 2x2, а потім тестову статистику:

2 (п11-n 22
− п12п21- )2 40 ⋅ 35 − 25 ⋅ 102
- =п- 2= 110 ⋅ = 16,58
п1-н2-м1-м2 50 ⋅ 60 ⋅ 65 ⋅ 45

Визначте p-value у SPSS. спосіб:

Аналізуйте→Описова статистика→Перехресні таблиці...

Ther ule:
Якщо p-value < -, то H0відхиляється; Якщо
p-значення - -, то H0не відхиляється.
Рішення прикладу 2 за допомогою IBM SPSS Statistics
Рішення прикладу 2 за допомогою IBM SPSS Statistics

Таблиця непередбачуваності

р-значення
тестова статистика

р-значення < α (<0,001 < 0,05), отже, нульова гіпотеза (H0: Інфаркт міокарда не залежить від місця
проживання) відхилено.
висновок:Інфаркт міокарда залежить від місця проживання (-2=16,578; df = 1; р <0,001)
Тест на однорідність

Тест на однорідність використовується, якщо розподіл значень однієї


номінальної змінної необхідно порівняти серед k (k - 2) різних сукупностей (те,
що представлено іншою номінальною змінною).
Припустимо, що змінна A може отримати k (k - 2) значень (що означає кількість
порівнюваних сукупностей), а змінна B може отриматил(л-2 ) значення (те, що
позначає номінальну змінну, яку потрібно порівняти між k сукупностями).
Метою перевірки гіпотези є перевіркаоднорідністьзмінної B для всіх
сукупностей, представлених змінною A (тобто якщо розподіл значень змінної B є
однаковим для порівнюваних груп, представлених значеннями змінної A).
0: 1= 2= ⋯ = , = 1, 2, … , ; 1:
принаймні дві ймовірності не рівні
Процедура перевірки сформульованої гіпотези така ж, як описана в тесті
на незалежність.
Приклад 3

Мета аналізу даних — перевірити гіпотезу, чи однаково (погано/

середньо/добре) оцінюють своє здоров’я люди з різними рівнями освіти

(середня/вища/вища). Дані опитування представлені у зведеній частотній

таблиці.

22
Рішення прикладу 3 за допомогою IBM SPSS Statistics

Х0: люди різного рівня освіти


однаково оцінюють своє здоров'я
Х1: люди різного рівня освіти по-
різному оцінюють своє здоров'я

23
Рішення прикладу 3 за допомогою IBM SPSS Statistics
Виходячи з даних дослідження, можна зробити
висновок, що люди з різною освітою по-різному
оцінюють здоров'я (-2=18,92,df.=4, p < 0,001)

Написано, що 1 клітина (11%) має очікувану частоту менше 5.


11% < 25%, отже, розмір вибірки не надто малий, щоб
застосувати хі-тест на однорідність

Після попарного порівняння було


виявлено, що серед людей із середньою
освітою статистично значно більше
людей, які погано оцінюють своє
здоров’я, порівняно з людьми з
професійною освітою та бакалаврською +
освітою, статистично значно більше
серед людей з професійною освітою
порівняно з людьми із середньою
освітою , тих, хто оцінює своє здоров’я як
середній, тоді як серед людей із вищою
Статистично значущі відмінності позначені освітою статистично значно більше
різними літерами (a, b) у клітинках людей, які оцінюють своє здоров’я як
добре, порівняно з людьми з вищою
освітою (p < 0,05 для всіх порівнянь). 24
Примітки до застосування для -2за Незалежність
(Однорідність) Тест
При застосуванні тесту -2незалежності (однорідність, у разі малих очікуваних частот слід вибрати
точний критерій і використовувати р-значення точного критерію Фішера для таблиці 2x2, а також
р-значення точного критерію Хі (двосторонній ) у випадку великих таблиць. Fisher Exact
автоматично застосовується до таблиці 2x2, тоді як для більшої таблиці потрібно вручну вибрати
точний тест Analyze→Описова статистика→Перехресні таблиці

25
Тест МакНемара
Припустимо, двійкова номінальна змінна вимірюється двічі (перед конкретним
процесом і після нього).

Мета перевірки гіпотези полягає в тому, щоб перевірити, чи конкретний процес мав
статистично значущий вплив на ймовірність значень двійкової змінної.

Наприклад, ту саму групу пацієнтів запитали двічі (до і після терапії),


чи була їхня думка про терапію поганою (-) чи хорошою (+).
Мета дослідження – визначити, чи є ймовірність тих людей/
респондентів, чия думка змінилася з (+) на (-), такою ж, як
ймовірність тих, чия думка змінилася з (-) на (+).
Таким чином, спочатку складається таблиця непередбачуваності:

Після
Раніше + - -
+ a b a+b
- в d c+d
- a+c b+d п
Тест МакНемара

Нульова та альтернативна гіпотези: H0:

сторb= сторв

Х1: сторb- шт

тут сb– ймовірність тих людей/респондентів, думка яких


змінилася з (+) на (-)
сторв– ймовірність тих людей/респондентів, думка яких змінилася з
(-) на (+).
Статистика тесту визначається з вибіркових даних за такою формулою:

2 (− −до) н.е. 12
- =(b + c)

b – кількість людей/респондентів, чия думка змінилася з (+) на (-) c –


кількість тих людей/респондентів, чия думка змінилася з (-) на (+).

Статистика тесту -2є випадковою величиною, розподіленою за -2розподіл (якщо H істинне)


Тест МакНемара

Якщо гіпотезу перевіряють на основі p-значення:

P-значення визначається в програмному забезпеченні IBM SPSS Statistics* (або іншому програмному забезпеченні).

*Спосіб SPSS: Аналіз→Непараметричні тести→Застарілі діалоги→2 пов’язані


зразки
Правило:
Якщо p-value < -, то H0відхиляється; Якщо p-

значення - -, то H0не відхиляється.

Якщо перевірка гіпотези базується на критичному значенні тесту

Критичне значення 2= 2 ( )= 2 1− ( − 1) ∙ − 1береться з таблиці квантилів


χ2розподіл:
правило: Якщо χ2≤ 2,Х0не відхиляється; Якщо χ2> 2 , Х0відхилено.

Нарешті, висновок будується за результатами перевірки гіпотези.


Приклад 4

Двічі (до і після реабілітації) опитали 100 осіб, як вони


себе почувають. До реабілітації 25 осіб сказали, що стан
здоров'я добрий, а 75 - поганий. Після реабілітації стан
здоров'я погіршився у 5 осіб, покращився у 50 осіб.

Чи можна зробити висновок, що реабілітація вплинула на стан


здоров'я людей? -=0,05
Після
Раніше + - -
+ 20 5 25
- 50 25 75
- 70 30 100
Рішення прикладу 4

Нульова та альтернативна гіпотези: H0:

сторb= сторв

Х1: сторb- шт

Статистика тесту з даних вибірки обчислюється за такою формулою:

b − c − 12 5 − 50 − 12
χ2= = = 35,2
b+c 5 + 50

Визначте p-value у SPSS. спосіб:


Аналізуйте→Непараметричні тести→Застарілі діалоги→2 пов'язані зразки...

Правило:
Якщо p-value < -, то H0відхиляється; Якщо
p-значення - -, то H0не відхиляється.
Рішення прикладу 4 за допомогою IBM SPSS Statistics

Аналізуйте→Непараметричні тести→Застарілі діалоги→2 пов'язані зразки...

На основі вибіркових даних можна зробити


висновок, що реабілітація мала вплив на стан
здоров’я людей (-2= 35,2, df = 1, p <0,001)
Інші способи використання тесту МакНемара

У програмі IBM SPSS Statistics тест МакНемара можна вибрати в кількох місцях. У всіх
він застосовується по-різному.
1 спосіб описано в Прикладі. Але якщо b + c - 25, то тестова статистика тесту не буде
представлена в таблиці відповідей, але буде написано, що був застосований точний
біноміальний тест, який обчислює p-значення точного тесту після застосування
формула ймовірності біноміального розподілу:
=+

− =2 ∙ 0,5 ∙ 1 − 0,5 −
=

Той самий біноміальний тест використовується, якщо критерій Макнемара буде обрано таким чином:Аналізуйте

→ Описова статистика→Перехресні таблиці→Статистика→Макнемар. Відповідь буде надано


лише як p-значення тесту

Аналізуйте→Непараметричні тести→Застарілі діалоги Аналізуйте→Описова статистика→Перехресні таблиці→


→ 2 Зв'язані зразки відповідей, якщо b + c - 25: Відповідь на тест МакНемара (завжди):

32
Інші способи використання тесту МакНемара

Третій спосіб дає можливість перевірити гіпотезу про те, що ймовірність


досліджуваної події однакова до і після застосування конкретної умови або
дія; Х0: сторраніше= сторпісля(Х1: сторраніше- сторпісля)

Аналізуйте→Порівняйте засоби→Парні зразки Пропорція→Тести→Макнемар


(безперервність виправлена)
У цьому місці тестова статистика тесту Мак-Немара визначається за допомогою формули:

− −1
=
+

33
Тест МакНемара - Боукера
Припустимо, що якісна змінна, яка може отримати k (k > 2) значень,
вимірюється двічі для тих самих суб’єктів у випадковій вибірці. Якщо якісна
змінна отримує однакову кількість значень в обох повторних вимірюваннях,
можна перевірити гіпотезу щодо того, чи однакові ймовірності отримати ці
значення в обох повторних вимірюваннях. Для такого випадку
застосовується МакНемар - Боукертест.

Раніше А1 А2 ... Аi .. Аk Всього

Після

А1 п11 п12 ... ... ... п1 тис м1


А2 п21 п22 ... ... ... п2 тис м2
... ... ... ... ... ... ... ...

Аj пj1 пj2 ... пджи ... пjk мj


... ... ... ... ... ... ... ...

Аk пk1 пk1 ... ... ... пkk мk


Всього п1 п2 ... пджи ... пk п

34
Тест МакНемара - Боукера

Х0: сторij= сторджидля всіх i≠j H1: сторij- стор

джипринаймні для одного i ≠ j

Статистика тесту:
2

2=
+
<

Якщо перевірка гіпотези базується на критичному значенні тесту

Критичне значення 21− ∙ −1 (k –2 кількість різних категорій в


змінна A) береться з таблиці квантилів q-го порядку розподілу хі-квадрат.
Нульова гіпотеза відхиляється, якщо тестова статистика перевищує критичне
значення.
Якщо перевірка гіпотези базується на р-значенні, p-значення визначається в програмному
забезпеченні IBM SPSS Statistics таким чином:

Аналізуйте→Описова статистика→Перехресні таблиці→Статистика→Макнемар Нульова

гіпотеза відхиляється, якщо p-значення < -. 35


Приклад 5
215 осіб попросили оцінити стан свого здоров'я (поганий/середній/
добрий) до і після реабілітації. Результати:

Чи можна зробити висновок, що реабілітація в санаторії


змінила оцінку людиною свого здоров'я? α=0,05

36
Рішення прикладу 5
Х0: стор12= стор21, стор13= стор31та стор23= стор32

Х1: сторij- сторджипринаймні для одного i ≠ j

Статистика тесту:
2

2=
+
<

До формули тестової статистики замість nijir nджизаписані значення в


клітинках таблиці, позначені одним кольором (вони симетричні відносно
«діагоналі»)

25 − 152 40 − 102 30 − 302


2= + + = 20,5
25 + 15 40 + 10 30 + 30

37
Рішення прикладу 5 у IBM SPSS Statistics
Х0: Х0: стор12= стор21, стор13= стор31та стор23= стор32

Х1: сторij- сторджипринаймні для одного i ≠ j

Також пропонується натиснути наСтільниковийдля вибору обчислення відсотківВсьогов таблиці

38
Рішення прикладу 5 у IBM SPSS Statistics
Х0: стор12= стор21, стор13= стор31та стор23= стор32
Дані дослідження свідчать, що у 25 осіб
Х1: сторij- сторджипринаймні для одного i ≠ j (11,6%) після реабілітації оцінка здоров'я
змінилася з поганої на середню, а у 40 осіб
(18,6%) - з поганої на хорошу. У той же час
15 (7%) від середнього до поганого, 10
(4,7%) від хорошого до поганого і 30 (14%)
від хорошого до середнього.
Підсумовуючи, можна сказати, що 65
(30,23%) реабілітація покращила оцінку
здоров’я, а 55 (25,58%) – погіршила.
Або ви можете прокоментувати так: до
реабілітації 80 (37,2%) людей оцінювали
своє здоров'я як погане, після реабілітації
40 (18,6%), до реабілітації 65 (30,2%)
оцінювали своє здоров'я як середнє, після
неї 75 (34,9%) .) та 70 (32,6%) і 100 (46,5%)
досліджуваних оцінили своє здоров'я як
добре до реабілітації та після реабілітації.

Висновок: на основі даних дослідження можна зробити висновок, що реабілітація


статистично значуще змінила оцінку пацієнтами свого здоров’я (-2=20,5,df=3, p < 0,001)

39
Критерій Q Кокрена для k пов’язаних зразків

Припустимо, що у випадковій вибірці та сама дихотомічна номінальна змінна X


спостерігається k (k > 2) разів для тих самих суб’єктів.

Мета дослідження − перевірити гіпотезу, якщо ймовірності конкретного значення X


однакові під час усіх повторних вимірювань.
Наприклад, суб’єктам тричі (до терапії, в середині терапії та після терапії) запитують, як
вони оцінюють своє самопочуття (погане/добре). Мета дослідження полягала в тому,
щоб перевірити, чи залишається ймовірність хорошого самопочуття однаковою на всіх
трьох етапах.

Немає А1 А2 ... Аk Всього

1 п11 п12 ... п1 тис м1


2 п21 п22 ... п2 тис м2
... ... ... ... ... ...

п пn1 пn2 ... пnk мk


Всього п1 п2 ... пk Л

40
Критерій Q Кокрена для k пов’язаних зразків
Х0: стор1= стор2= ... = сторk

Х1: принаймні дві ймовірності різні


Коди даних 0 і 1, де 1 означає «успіх»
2
σ =1 −
Статистика тесту: = ∙ ( − 1) ∙ σ =1 −
де k – кількість повторних тактів; пi– сума значення 1 у кожному з повторних тактів; мj–
сума «1» для j-го суб’єкта (особи) у вибірці (сума «1» у кожному рядку); L – загальна сума
«1» у всіх повторних тактах.

Якщо гіпотезу перевіряють на основі p-значення:

P-значення визначається в програмному забезпеченні IBM SPSS Statistics* (або іншому програмному
забезпеченні). *Спосіб SPSS: Аналіз→Непараметричні тести→Пов'язані зразки→Налаштування→Q-тест
Кокрена (k проб). Нульова гіпотеза відхиляється, якщо p-значення менше α

Якщо перевірка гіпотези базується на критичному значенні тесту

Критичне значення 2 = 2 ( )= 2 1− ( − 1)береться з таблиці квантилів χ2


розподіл:
правило: Якщо χ2≤ 2,Х0не відхиляється; Якщо χ2> 2 , Х0відхилено.

41
Приклад 6

30 суб’єктів у випадковій вибірці тричі (до терапії, в

середині терапії та після терапії) запитували, як вони

оцінюють своє самопочуття (погане/добре). Мета

дослідження полягала в тому, щоб перевірити гіпотезу,

чи залишалася ймовірність хорошого самопочуття

незмінною на всіх трьох етапах. Якщо нульову гіпотезу

відхилено, то визначте, між якими етапами ймовірності

благополуччя відрізнялися. - = 0,05

Parengė dr. Р. Паукштайтене 42


Приклад 6. Визначення тестової статистики

2
σ =1 −
= ∙ ( − 1) ∙
σ =1 −

Обчислення суми в чисельнику формули

2

=1

512 512 512


14 − + 13 − + 24 − = 74
3 3 3

Сума в дено мінатор формули є


розраховано в MS Excel (жовтий колір у рамці) і
дорівнює 46. k = 3, то критеріальна статистика
74
= 3 ∙ 2 ∙ = 9 652
46

43
Рішення прикладу 6 у IBM SPSS Statistics

44
Рішення прикладу 6 у IBM SPSS Statistics
На початку, як наведено в прикладі,
використовуючи спосіб Порівняйте засоби→
Пропорції одного зразкарекомендується визначити
числові характеристики
Дані досліджень показують, що до терапії 14 (46,7%),
Гіпотеза: під час терапії 13 (43,3%) і після терапії 24 (80%)
Х0: стор1= стор2= стор3 люди сказали, що почуваються добре.
Х1: принаймні два різні

Висновок: На основі даних дослідження можна зробити


висновок, що до терапії, під час терапії та після терапії
одні й ті ж люди не однаково почуваються добре. (Q =
9,652, df. = 2, p = 0,008)

Попарно порівняння виявлено a


статистично значуща різниця між
ймовірностями хорошого
самопочуття під час терапії та після
терапії (p = 0,015) і до терапії та після
терапії (p = 0,032).
45

You might also like