Professional Documents
Culture Documents
Тема9 Непараметричні методи
Тема9 Непараметричні методи
Порівняння часток
НЕПАРАМЕТРИЧНІ КРИТЕРІЇ ОЦІНКИ ВІРОГІДНОСТІ ОТРИМАНИХ
РЕЗУЛЬТАТІВ. ПОРІВНЯННЯ ЧАСТОК
1
Тема заняття: Непараметричні критерії оцінки вірогідності отриманих результатів. Порівняння часток
Повною мірою перевага непараметричної статистики розкривається тоді, коли результати,
отримані в експерименті, є представленими в слабшій неметричній шкалі, тобто в результаті
ранжування. Така шкала називається шкалою порядку. Тоді оптимальним варіантом у цій
ситуації є застосування саме непараметричних тестів, спеціально створених для їх
статистичного аналізу. Як правило, тести непараметричної статистики припускають
оцінювання наявних співвідношень рангових сум у двох або більше вибірках, і на підставі цього
формуються висновок про співвідношення цих вибірок.
У той же час, якщо результати вимірювання є представленими в сильнішій шкалі,
використання непараметричної статистики означає відмову від частини інформації, що
міститься в даних. Наслідком цього є небезпека допущення помилки другого роду, властивої
цим методам (наприклад, дослідник не може виявити відмінності двох вибірок, коли такі
відмінності насправді мають місце). Іншими словами, такі методи є менш потужними
порівняно з параметричними методами. Тому використання параметричної статистики в аналізі
експериментальних даних, які відрізняються від простого ранжування і мають нормальний
розподіл даних, як правило, має бути пріоритетним.
Важливим є питання нормальності розподілу досліджуваних сукупностей. Від цього
залежить, чи можна застосовувати методи параметричного аналізу або тільки
непараметричного. Умовами, які повинні дотримуватися в нормально розподілених сумах, є:
1) максимальна близькість або рівність значень середньої арифметичної, моди і медіани;
2) дотримання правила "трьох сигм" (в інтервалі М ± 1σ знаходяться не менше 68,3%
варіант, в інтервалі М ± 2σ - не менше 95,5% варіант, в інтервалі М ± 3σ знаходяться не менше
99,7% варіант);
3) показники виміряні в кількісній шкалі;
4) наявність позитивних результатів перевірки на нормальність розподілу за допомогою
спеціальних критеріїв: Колмогорова-Смірнова або Шапіро-Уілкі.
2
Тема заняття: Непараметричні критерії оцінки вірогідності отриманих результатів. Порівняння часток
Порівняння відносних величин
незалежні поєднані
2 групи Chi-square test McNemara’s chi-square test
(Ксі-квадрат) (Критерій Мак-Немара)
більше 2 груп Chi-square test Cochran's Q test
(Ксі-квадрат) (Критерій Кокрена)
мале число спостережень Fisher’s exact test McNemara’s exact test
(критерій Фішера) (Критерій Мак-Немара)
Для порівняння середніх величин потрібно визначити який вид розподілу, вид сукупності
і визначити групи спостереження.
U-КРИТЕРІЙ МАННА-УІТНІ
U-критерій Манна-Уітні (англ. Mann-Whitney U-test) - непараметричний статистичний
критерій, що використовується для оцінки різниці між двома вибірками за рівнем будь-якої
ознаки, виміряної якісно в порядковій або інтервальній шкалі. Дозволяє виявити відмінності в
значенні параметра між малими вибірками.
Інші назви: критерій Манна-Уітні-Вілкоксона (англ. Mann-Whitney-Wilcoxon, MWW),
критерій суми рангів Вілкоксона (англ. Wilcoxon rank-sum test) або критерій Вілкоксона-Манна-
Уітні (англ. Wilcoxon-Mann-Whitney test).
Історія розробки критерію Манна-Уітні
Цей метод виявлення відмінностей між вибірками був запропонований у 1945 році
Френком Вілкоксоном (F. Wilcoxon). У 1947 році він був істотно перероблений і розширений
Х. Б. Манном (H. B. Mann) і Д. Р. Уітні (D. R. Whitney), на честь яких сьогодні зазвичай і
називається.
Для чого використовується критерій Манна-Уітні?
Критерій призначений для оцінки розходжень між двома вибірками за рівнем якої-небудь
ознаки, кількісно виміряної. Цей метод визначає, чи досить мала зона значень, що
перехрещуються, між двома рядами (рангованим рядом значень параметра в першій вибірці і
таким же в другій вибірці). Емпіричне значення критерію U відображає те, наскільки велика
зона збігу між рядами. Тому, чим менше значення критерію, тим вірогідніше, що відмінності
між значеннями параметра у вибірках достовірні.
У яких випадках можна використовувати критерій Манна-Уітні?
У кожній з вибірок повинно бути не менше 3 значень ознаки. Допускається, щоб в одній
вибірці були два значення, але в другій тоді не менше п'ять. У вибіркових даних не повинно
бути збігів значень (усі числа - різні) або таких збігів повинно бути дуже мало. У кожній вибірці
повинно бути не більше 60 спостережень.
Аналогом U-критерію Манна-Уїтні для порівняння більше двох груп є Критерій Краскела-
Уолліса.
Як розрахувати критерій Манна-Уітні?
3
Тема заняття: Непараметричні критерії оцінки вірогідності отриманих результатів. Порівняння часток
1. Формуються статистичні гіпотези:
Н0: Рівні досліджуваної ознаки у вибірках статистично не відрізняються.
Н1: У одній з вибірок рівень досліджуваної ознаки вищий, ніж в іншій.
2. Із обох порівнюваних вибірок складається єдиний ранжований ряд, шляхом
розставляння одиниць спостереження за ступенем зростання ознаки і присвоєння меншому
значенню меншого рангу - порядкового номеру. У разі рівних значень ознаки у декількох
одиниць кожної з них присвоюється середнє арифметичне послідовних значень рангів
(наприклад, дві одиниці, що займають в єдиному ранжованому ряду 2 і 3 місце (ранг), мають
однакові значення. Отже, кожній з них присвоюється ранг рівний (3 + 2) / 2 = 2,5).
У складеному єдиному ранжованому ряду загальна кількість рангів вийде рівною: N = n1
+ n2, де n1 - кількість елементів в першій вибірці, а n2 - кількість елементів у другій вибірці.
3. Розділити єдиний ранжований ряд на два, що складаються відповідно з одиниць першої
і другої вибірок. Підрахувати окремо суму рангів, що припали на частку елементів першої
вибірки, і окремо - на частку елементів другої вибірки. Визначаємо більшу з двох рангових сум
(Tx) відповідну вибірці з nx елементами.
4. Знаходимо значення U-критерію Манна-Уїтні за формулою 1:
∗
= × + × ∗ + 1 − ∗, (1)
де n1, n2 - обсяги вибірок,
Т* - більша рангова сума,
n* - обсяг вибірки з більшою ранговою сумою.
Критерій має лівосторонню критичну область. Критичні значення для перших n=20
критерію U наведено в таблиці 2.
Зауважимо, що для n1>8, n2>8 статистика має розподіл, близький до стандартного
нормального.
5. За таблицею для обраного рівня статистичної значущості визначити критичне значення
U-критерію.
Як інтерпретувати значення критерію Манна-Уітні?
Якщо отримане значення U-критерію менше табличного або дорівнює йому, то визнається
наявність істотної відмінності між рівнем ознаки в даних вибірках (приймається альтернативна
гіпотеза). Якщо ж набуте значення U-критерію більше за табличне, тоді приймається нульова
гіпотеза. Достовірність відмінностей тим вища, чим менше значення U-критерію.
Методика розрахунку критерію Манна-Уітні
Вихідні дані (табл.1):
Серед студентів ІІІ курсу стоматологічного факультету проведено оцінювання
середнього рівня знань за підсумками навчального року. Рандомним способом відібрано для
обстеження 14 хлопців (вибірка Х) та 12 дівчат (вибірка Y) з цього факультету.
Стать Ряд Середній рівень знань, бали
Хлопці Х 135 130 131 128 127 137 126 137 131 137 137 127 133 125
Дівчата Y 130 129 121 129 119 124 125 129 129 130 131 123
Завдання:
Чи можна стверджувати, що хлопці ІІІ курсу стоматологічного факультету мають
вищі бали знань, ніж дівчата? Тобто, чи можна вважати наявну різницю між балами
суттєвою.
Рішення:
1. Порівняння результатів показує, що значення вибірки X вище, ніж вибірки Y, тому
першою вважаємо вибірку X.
2. Проранжуємо представлені дані, об'єднуючи дві вибірки в одну (n = 26), у порядку
зростання значення середніх балів. Переформування рангів представлено в табл. 2, де дані
групи хлопців виділено жирним курсивом для полегшення подальшої обробки.
4
Тема заняття: Непараметричні критерії оцінки вірогідності отриманих результатів. Порівняння часток
Таблиця 2 – Ранжування балів обох досліджуваних груп
Номера місць у впорядкованому ряді Розміщення балів у ряді Нові ранги
1 119 1
2 121 2
3 123 3
4 124 4
5 125 5,5
6 125 5,5
7 126 7
8 127 8,5
9 127 8,5
10 128 10
11 129 12,5
12 129 12,5
13 129 12,5
14 129 12,5
15 130 16
16 130 16
17 130 16
18 131 19
19 131 19
20 131 19
21 133 21
22 135 22
23 137 24,5
24 137 24,5
25 137 24,5
26 137 24,5
5
Тема заняття: Непараметричні критерії оцінки вірогідності отриманих результатів. Порівняння часток
значення критерію:
1
= 14 × 12 + 14 × 14 + 1 − 234,5 = 38,5
2
5. Знаходимо критичне табличне значення Ukp за таблицею 4 – Критичні значення
Манна-Уїтні, де n1=14, n2=12 - Ukp (0,05) = 45. Порівнюємо: Ukp > Uемп – 45 > 38,5.
Висновок:
Критерій Манна-Уітні U=38,5 не перевищує табличного значення Ukp=45. Отже,
приймаємо альтернативну гіпотезу H1; відмінності в рівнях вибірок є істотними. Можна
стверджувати, що хлопці ІІІ курсу стоматологічного факультету мають вищі бали знань, ніж
дівчата.
6
Тема заняття: Непараметричні критерії оцінки вірогідності отриманих результатів. Порівняння часток
Р Р′
=∑ Р′
,
(2)
де Р1 – абсолютний показник присутнього результату (того, що відбувся, напр. – пацієнт
захворів)
Р2 – абсолютний показник відсутнього результату (напр. – пацієнт не захворів)
Р'1, Р'2 – відповідні очікувані числа, які обраховується за формулою 3:
7
Тема заняття: Непараметричні критерії оцінки вірогідності отриманих результатів. Порівняння часток
свободи є на 1 меншим від кількості варіант (груп) за відповідним критерієм оцінки (формула
5):
n' = (S - 1) • (r - 1),
(5)
де S - кількість граф вихідної таблиці (без графи "Разом"),
r - кількість рядків (без рядка "Разом").
Метод Кількість не не
захворі захворі
профілакти піддослід захворі захворі не не
ли ють захворі
ки них ли ють захворі захворіли захво
ли
(Р) (Р’) ли ріли
Р1 Р2 Р1’ Р2’
1 2 3 4 5 6 7 8 9 10
38 * 38
І 140 80 60 42 98 38 - 38 = 34,4 14,7
42
10 * 10
ІІ 232 60 172 70 162 - 10 10 = 1,4 0,6
70
28 * 28
ІІІ 160 20 140 48 112 - 28 28 = 16,3 7,0
48
Абс.
532 160 372 160 372 0 0 52,12 22,3
Разо число
м ΣР1/2
100 30,0 70,0 Σ =74,4
%
8
Тема заняття: Непараметричні критерії оцінки вірогідності отриманих результатів. Порівняння часток
4. Обчислюється різниця між фактичними та "очікуваними" числами в кожній групі (Р -
Р') (графи 7, 8): для методу І: 80-42=38 та 60-98=-38 і т.д.
5. Визначений результат різниці (графи 7-8) підноситься до квадрату й ділиться на
"очікувані" числа по групах серед тих, що захворіли та не хворіли (графи 9-10):
Для методу І для захворілих: 382/42=34,4; для незахворілих: (-38)2/98=14,7;
Для методу ІІ для захворілих: (-10)2/70=1,4; для незахворілих: 102/162=0,6;
Для методу ІІІ для захворілих: (-28)2/48=16,3; для незахворілих: 282/112=7,0.
6. Додаються дані з усіх груп – отримуємо критерій відповідності = 74,4.
7. Оцінка отриманого Х2 проводиться за таблицею 6 для відповідної кількості "ступенів
свободи" (n'). Спочатку визначаємо n’. Для нашого прикладу n' визначається з кількості
досліджуваних методів (r = 3) та кількості груп результатів (S = 2): n' = (S - 1) * (r - 1) = (2 -
1) * (3 - 1) = 2.
Для кількості ступенів свободи n' = 2 значення Х2 0,05 = 6,0, Х2 0,001 = 12,4.
Одержаний результат X2 = 74,42, значно перевищує максимальне табличне значення Х2
0,001 = 12,4.
Висновок. «Нульова гіпотеза» не підтверджується, різниця поміж різними методами
профілактики грипу є суттєвою. Найбільш ефективним є третій метод профілактики.
9
Тема заняття: Непараметричні критерії оцінки вірогідності отриманих результатів. Порівняння часток
10. В яких випадках доцільно використовувати критерій Пірсона і які його переваги, а в
яких – Манна-Уїтні?
11. Вкажіть, як оцінити коефіцієнт Пірсона. Наведіть приклади.
12. Вкажіть, які критерії використовують для взаємозв’язаних та незалежних
сукупностей.
13. Дайте характеристику U-критерію Манна-Уітні, його практичне значення.
14. Наведіть методику розрахунку U-критерію Манна-Уітні.
15. У яких випадках можна використовувати критерій Манна-Уітні?
СИТУАЦІЙНЕ ЗАВДАННЯ № 1
Статистичні дані вмісту лімфоцитів (х109) у крові хворих на виразкову хворобу, які мали
ускладнення у вигляді пенетрації (група Х, n=8), і без ускладнень (група Y, n=8) у лікарні
міста Е. у Л-році
Група Вміст лімфоцитів, х109
Х 24 18 22 23 23 25 21 25
Y 17 18 14 14 18 21 23 20
У відповідності до даних ситуаційного завдання Вам необхідно:
а) використовуючи U-критерій Манна-Уітні, оцінити вірогідність різниці результатів
досліджень в групах спостережень пацієнтів із виразковою хворобою;
б) проаналізувати отримані показники та зробити висновок.
СИТУАЦІЙНЕ ЗАВДАННЯ № 2
Статистичні дані частоти недостатності кровообігу у вагітних та невагітних жінок міста
К. у Л-році (абсолютні дані)
Мітральна недостатність
Стан жінки
Наявна Відсутня
вагітні 10 55
невагітні 25 321
У відповідності до даних ситуаційного завдання Вам необхідно:
а) оцінити достовірність різниці наявності мітральної недостатності залежно від
стану жінки, використовуючи критерій Пірсона;
б) проаналізувати отримані показники та зробити висновок.
СИТУАЦІЙНЕ ЗАВДАННЯ № 3
Статистичні дані виміру діастолічного артеріального тиску (мм. рт. ст.) у хворих на
гіпертонічну хворобу (група А, n=10) та здорових (група Б, n=11) у лікарні № 11 міста В. у
К-році
Групи Діастолічний артеріальний тиск (мм.рт.ст.)
А 120 110 125 90 105 90 85 110 100 95
Б 80 85 90 85 90 80 80 75 75 90 80
У відповідності до даних ситуаційного завдання Вам необхідно:
а) використовуючи U-критерій Манна-Уітні, оцінити вірогідність різниці результатів
досліджень в групах спостережень пацієнтів із гіпертонічною хворобою та здорових;
б) проаналізувати отримані показники та зробити висновок.
10
Тема заняття: Непараметричні критерії оцінки вірогідності отриманих результатів. Порівняння часток
СИТУАЦІЙНЕ ЗАВДАННЯ № 4
Статистичні дані оцінки різниці виникнення рахіту у дітей при різних типах
вигодовування, що обслуговуються на педіатричній дільниці № 1 поліклініки № 2
області В. у А-році (абсолютні дані)
Тип вигодовування Наявність рахіту (n=39) Відсутність рахіту (n=118)
грудний (n=70) 13 57
штучний (n=32) 12 20
змішаний (n=55) 14 41
У відповідності до даних ситуаційного завдання Вам необхідно:
а) оцінити достовірність різниці наявності рахіту залежно від типу вигодовування,
використовуючи критерій Пірсона;
б) проаналізувати отримані показники та зробити висновок.
СИТУАЦІЙНЕ ЗАВДАННЯ № 5
Статистичні дані вмісту еритроцитів (х1012) у крові хворих із анемією, які проходили
лікування новим препаратом (група І, n=12) та традиційне лікування (група ІІ, n=10) у
лікарні № 12 міста З. у Т-році
Група Вміст еритроцитів, х1012
І 4 3,8 4,2 4,4 4,3 4,1 3,9 3,9 3,8 3,7 4,5 4,6
ІІ 3,2 3 3,7 3,9 3,4 3,8, 4 4,1 3,6 3,5
У відповідності до даних ситуаційного завдання Вам необхідно:
а) використовуючи U-критерій Манна-Уітні, оцінити вірогідність різниці результатів
досліджень в групах спостережень пацієнтів із анемією;
б) проаналізувати отримані показники та зробити висновок.
СИТУАЦІЙНЕ ЗАВДАННЯ № 6
Статистичні дані оцінки частоти стоматитів у дітей, які годували харчовою сумішшю,
підсиленою вітамінами та мікроелементами (1 група), у дітей, які годували харчовою
сумішшю, підсиленою тільки вітамінами (2 група) та у дітей, які годували харчовою
сумішшю, без додаткових добавок (3 група) у місті М. у К-році (абсолютні дані)
Групи Стоматит
присутній відсутній
1 11 147
2 17 151
3 23 144
У відповідності до даних ситуаційного завдання Вам необхідно:
а) оцінити достовірність різниці наявності стоматитів у дітей залежно від типу
харчових сумішей, використовуючи критерій Пірсона;
б) проаналізувати отримані показники та зробити висновок.
СИТУАЦІЙНЕ ЗАВДАННЯ № 7
Статистичні дані росту (см) хлопців 10 (n=13) і 11 (n=12) класів школи № 13 міста К. у С-році
Класи Ріст, см
10 165 178 190 185 174 164 170 163 169 172 173 177 175
11 168 169 185 190 188 184 172 174 178 177 176 187
У відповідності до даних ситуаційного завдання Вам необхідно:
а) використовуючи U-критерій Манна-Уітні, оцінити вірогідність різниці результатів
досліджень в групах спостережень хлопців залежно від росту;
б) проаналізувати отримані показники та зробити висновок.
11
Тема заняття: Непараметричні критерії оцінки вірогідності отриманих результатів. Порівняння часток
СИТУАЦІЙНЕ ЗАВДАННЯ № 8
Статистичні дані щодо виявлення кореневої кісти у групах чоловіків та жінок за даними
медичних оглядів на підприємстві № 2 міста К. у В-році (абсолютні дані)
Стать Діагностовано кісту Відсутня кіста
чоловіки 35 117
жінки 21 133
У відповідності до даних ситуаційного завдання Вам необхідно:
а) оцінити достовірність різниці наявності кореневої кісти залежно від статі,
використовуючи критерій Пірсона;
б) проаналізувати отримані показники та зробити висновок.
СИТУАЦІЙНЕ ЗАВДАННЯ № 9
Статистичні дані кількості каріозних зубів у дітей, яким проводили профілактику (група
1, n=15) та дітей, яким не проводили профілактики (група 2, n=12) у стоматологічній
поліклініці № 13 міста П. у Д-році
Група Кількість уражених карієсом зубів
1 2 3 4 5 6 4 5 1 2 5 7 5 4 3 2
2 3 4 5 6 7 5 4 8 5 6 9 3
У відповідності до даних ситуаційного завдання Вам необхідно:
а) використовуючи U-критерій Манна-Уітні, оцінити вірогідність різниці результатів
досліджень в групах спостережень пацієнтів із карієсом;
б) проаналізувати отримані показники та зробити висновок.
СИТУАЦІЙНЕ ЗАВДАННЯ № 10
Поділ чоловіків, що померли від раку легень, залежно від тютюнокуріння
Не курили Курили люльку Курили сигарети Разом
Кількість померлих 480 315 1290 2085
Померли від раку легень 40 55 380 475
У відповідності до даних ситуаційного завдання Вам необхідно:
а) оцінити достовірність різниці смертності від раку легень залежно від
тютюнопаління, використовуючи критерій Пірсона;
б) проаналізувати отримані показники та зробити висновок.
СИТУАЦІЙНЕ ЗАВДАННЯ № 11
Статистичні дані бактерицидної активності сироватки крові у хворих чоловіків та жінок
із важкою черепно-мозковою травмою у обласній лікарні міста К. у Д-році (%)
Стать Бактерицидна активність сироватки крові, %
чоловіки 96 93 95 93 93 94 94 96 90 93 95 95 90 95 94 90 89 89
жінки 86 90 96 95 87 96 86 90 91 93 84 88 83 89 89 83 92 87
У відповідності до даних ситуаційного завдання Вам необхідно:
а) використовуючи U-критерій Манна-Уітні, оцінити вірогідність різниці результатів
досліджень в групах спостережень лікування важкої черепно-мозкової травми;
б) проаналізувати отримані показники та зробити висновок.
СИТУАЦІЙНЕ ЗАВДАННЯ № 12
Поділ осіб, що хворіли на грип, залежно від застосованих методів профілактики
12
Тема заняття: Непараметричні критерії оцінки вірогідності отриманих результатів. Порівняння часток
У відповідності до даних ситуаційного завдання Вам необхідно:
а) оцінити достовірність різниці захворюваності на грип залежно від застосованих
методів профілактики, використовуючи критерій Пірсона;
б) проаналізувати отримані показники та зробити висновок.
СИТУАЦІЙНЕ ЗАВДАННЯ № 13
Статистичні дані діастолічного тиску (мм рт.ст.) у чоловіків та жінок міста К. у Д-році
Стать Діастолічний тиск (мм рт.ст.)
чоловіки 76 93 95 83 93 84 94 96 90 93 85 95 90 95 94 90 79 89
жінки 86 90 76 95 87 76 86 90 91 93 84 78 83 79 89 83 92 87
У відповідності до даних ситуаційного завдання Вам необхідно:
а) використовуючи U-критерій Манна-Уітні, оцінити вірогідність різниці результатів
досліджень в групах спостережень;
б) проаналізувати отримані показники та зробити висновок.
СИТУАЦІЙНЕ ЗАВДАННЯ № 14
Статистичні дані росту (см) дівчат 10 (n=12) і 11 (n=11) класів школи № 13 міста К. у С-році
Класи Ріст, см
10 155 168 180 175 164 154 160 153 159 162 163 167
11 158 159 175 180 178 174 162 164 168 167 166
У відповідності до даних ситуаційного завдання Вам необхідно:
а) використовуючи U-критерій Манна-Уітні, оцінити вірогідність різниці результатів
досліджень в групах спостережень дівчат залежно від росту;
б) проаналізувати отримані показники та зробити висновок.
СИТУАЦІЙНЕ ЗАВДАННЯ № 15
Статистичні дані оцінки різниці виникнення рахіту у дітей при різних типах
вигодовування, що обслуговуються на педіатричній дільниці № 1 поліклініки № 2
області В. у А-році (абсолютні дані)
Тип вигодовування Наявність рахіту (n=30) Відсутність рахіту (n=109)
грудний (n=64) 10 54
штучний (n=26) 9 17
змішаний (n=49) 11 38
У відповідності до даних ситуаційного завдання Вам необхідно:
а) оцінити достовірність різниці наявності рахіту залежно від типу вигодовування,
використовуючи критерій Пірсона;
б) проаналізувати отримані показники та зробити висновок.
13