Тема 2 Групиране На Данни

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 50

Групиране на данните

и графично представяне
Честотни таблици и вариационни редове. Графично изследване.
Видове графики – за качествени и количествени белези, за един
или два белега едновременно. Приложение и обратна връзка.
Групиране на първичните данни –
процес на систематизиране на данните и
обединяването им в относително еднородни групи,
които се наричат класове.

Начин на представяне на данните


Изясняване на природата на белезите
За по-нататъшни изчисления
Видове статистически редове

1
• Атрибутивни редове

2
• Вариационни редове

3
• Редове на натрупани честоти

Изборът на начина на групиране на данните зависи от


вида на белега и неговата вариация
• Атрибутивен ред
Атрибутивен ред

• Използва се при качествени ординални белези


(Белези, чийто състояния могат да се подредят
въз основа на някакъв принцип)
• Тези състояния на белега заемат положението
на класове
«Локо-регионална анестезия чрез ултразвуково
навигирано инжектиране на локален анестетик в
равнината между вътрешен кос коремен мускул и
трансверзален коремен мускул» М. Секуловски
Атрибутивен ред

Скала на Wong – Baker (WBF) за степен на болка

Първични данни Кодирани данни


№ болка по № болка по № болка по № болка по
пациент WBF пациент WBF пациент WBF пациент WBF
1 слаба 16 няма 1 2 16 0
2 слаба 17 няма 2 2 17 0
3 няма 18 слаба 3 0 18 2
4 няма 19 няма 4 0 19 0
5 средна 20 слаба 5 4 20 2
6 няма 21 слаба 6 0 21 2
7 няма 22 няма 7 0 22 0
8 няма 23 няма 8 0 23 0
9 средна 24 силна 9 4 24 6
10 няма 25 слаба 10 0 25 2
11 слаба 26 слаба 11 2 26 2
12 няма 27 няма 12 0 27 0
13 няма 28 няма 13 0 28 0
14 слаба 29 няма 14 2 29 0
15 средна 30 няма 15 4 30 0
«Локо-регионална анестезия чрез ултразвуково навигирано инжектиране на локален анестетик в равнината
между вътрешен кос коремен мускул и трансверзален коремен мускул» М. Секуловски
Скала на Wong – Baker (WBF) за степен на болка
Атрибутивен ред

Експериментална група Контролна група


Оценка на болката по WBF Оценка на болката по WBF
честота няма слаба средна силна мн.силна честота няма слаба средна силна мн.силна
брой 17 9 3 1 0 брой 2 10 12 6 0
% 56,7% 30,0% 10,0% 3,3% 0% % 6,7% 33,3% 40,0% 20,0% 0%
Зависимост между съдържанието на хемоглобин в кръвта
и нивото на организация на гръбначните животни
Атрибутивен ред

Риби Земноводни Влечуги Птици Бозайници


Hb г/кг маса 1,6 2,3 3,8 11,2 11,7

Hb г/кг маса
Разпределение на честотите
Стойностите на даден количествен белег в една
съвкупност се срещат не еднакъв брой пъти,
някои по-често, други по рядко. Това явление се
нарича разпределение на честотите.
Изразява се с вариационни редове.
2
• Вариационни редове
Вариационен ред

Двоен ред числа, включващ:


 Средните на класовете
 Честотата на всеки клас

Видове вариационни редове:


 Безинтервални
 Интервални
• Вариационни редове
Безинтервален вариационен ред

2 безинтервални

Подредените по ред на нарастване стойности на


белега заемат положението на средни на класовете.

 меристични белези, вариращи в тесни граници


Брой растения от вида Carex flacca на квадрат.
Безинтервален вариационен ред

n=500

бр.раст./кв. честота 181

0 181
1 118 ч
118
2 97 е

честота
97
3 54 с
4 32 т 54

5 9 о 32

6 5 т 9 5 3 1

7 3 а0 1 2 3 4 5 6 7 8
брой растения на квадрат
8 1
Интервален вариационен ред
Вариационен ред с еднакъв класов интервал

Диапазонът на вариране на белега се разбива на


интервали (класове) и за всеки клас се изчислява
неговата честота - броя на случаите, които се
отнасят към този клас.

 метрични белези
 меристични, вариращи в широки граници

 с еднакъв класов интервал


 с различен класов интервал
Вариационен ред с еднакъв класов интервал

Вариационен ред с
еднакъв класов интервал

Ширина (mm) на последния


горен молар на
класове честота
Acropithecus rigidus
5.4 - 5.6 1
6.1 5.7 6.0 6.5 6.0 5.7 5.6 - 5.8 5
6.1 5.8 5.9 6.1 6.2 6.0 5.8 - 6.0 7
6.3 6.2 6.1 6.2 6.0 5.7 6.0 - 6.2 12
6.2 5.8 5.7 6.3 6.2 5.7 6.2 - 6.4 8
6.2 6.1 5.9 6.5 5.4 6.7 6.4 - 6.6 2
5.9 6.1 5.9 5.9 6.1 6.1 6.6 - 6.8 1
Вариационен ред с еднакъв класов интервал

Вариационен ред с Ширина (mm) на последния


еднакъв класов интервал горен молар на
Acropithecus rigidus

14
средни честота
12
5,5 1 ч 10

честота в брой
5,7 5 е
8
с
5,9 7 6
т
6,1 12 о 4

6,3 8 т 2

6,5 2
а 0
5,5 5,7 5,9 6,1 6,3 6,5 6,7
ширина (mm)
6,7 1
Вариационен ред с еднакъв класов интервал
Вариационен ред с
различен класов интервал
Нарастваща логаритмична скала

Долна Горна Относително


Бал граница граница обилие

1 1 N0,2 Единични

2 N0,2 + 1 N0,4 Слабо

3 N0,4 + 1 N0,6 Средно

4 N0,6 + 1 N0,8 Голямо

5 N0,8 + 1 N1 = N Много голямо


Вариационен ред с
Вариационен ред с еднакъв класов интервал

различен класов интервал


Нарастваща логаритмична скала

Долна Горна Относител Долна Горна Относител


Бал граница граница но обилие Бал граница граница но обилие
1 1 4 Единични 1 1 6 Единични
2 5 17 Слабо 2 7 36 Слабо
3 18 72 Средно 3 37 217 Средно
4 73 300 Голямо 4 218 1307 Голямо
Много Много
5 301 1250 5 1308 7861
голямо голямо
Графично представяне на номинални белези

Представянето на номинални белези е


без групиране

Кръгова диаграма
Графика, изразяваща честотите на качествен белег с
две или повече състояния, с помощта на различни по
големина сектори
Графично представяне на номинални белези

С
пе
кт
ърн
ажи
зне
нит
еформи С
пе
кт
ърн
ажи
зн
енит
еформи
н
ави
до
ве
тео
тс
ем.C
ara
bi
dae н
ави
до
ве
тео
тс
ем.C
ara
bi
dae
впш
ен
ич
наа
гроц
ен
оза люц
ер
но
ваа
гр
оцен
оз
а

Зоф
аги
Зоф
аги
Calosoma inquisitor

Микс
Микс

офи
офи

тоф
тоф

аги
аги

е
пиг
еоб
ион
ти е
пиг
еоб
ион
ти
с
тра
тоб
ион
ти с
тра
тоб
ион
ти
с
тра
тох
орт
оби
онт
и с
тра
тох
орт
оби
онт
и
г
еох
орт
оби
онт
и г
еох
орт
оби
онт
и
Графично представяне на номинални белези

Процентно разпределение на установените


положителни реакции към анестетици

Ubi Ubistesin
UbiF Ubistesin forte
Mep Mepivastesin 3%
Lid Lidocain
Sca2 Scandonest 2%
Sca3 Scandonest 3%
Den Dentocain
Sep Septanest
Графично представяне на номинални белези

Честотата на срещане на аневризмите Оценка на диагностичната стойност на


по местонахождение компютъртомографска ангиография
при мозъчни аневризми
ACoA
31.1%
ACAd ACAs
ACMd
15.3% 3.8% 2.7%
16.9% ACMs
ACoA - a. communicans anterior
ACoP - a. communicans posterior
8.2% ACA - a. cerebry anterior
ACId 10.9% ACIs
ACM - a. cerebry media
3.3% 2.7% ACI - a. carotis interna
ACoPd ACoPs AB - a. basilaris

4.9%
AB
Разпространение на подвидовете на Trypanosoma brucei,
причинител на сънната болест – остра и хронична форма

T. b. gambiense T. b. rhodesiense

Glossina palpalis Glossina morsitans


Два качествени белега едновременно

Графично представяне на
два качествени белега

Графика, изразяваща честотите (в %) на качествени белези с


две или повече състояния, с еднакви по височина стълбчета,
разделени в съответствие с групирането
Два качествени белега едновременно

Честота на алелите Lm и Ln на кръвна група M – N при три


човешки популации

Lm Ln
честота на алели
(в %) 8,3

46,1
популации Lm Ln
82,2
австр. аборигени 17.8 82.2 91,7

53,9
бели американци 53.9 46.1
17,8

индианци 91.7 8.3 А В С Т Р . А Б О Р И Г ЕН И Б Е Л И А М Е Р И КА НЦ И ИНДИАНЦИ


Фаунистично проучване на семейство Formicidae в Странджа планина
чрез метода на почвените капани
публикувани
24 публикувани нови
Два качествени белега едновременно

Разпределение на броя видове 14


по трибуси и родове 10
13
1
7
4 5 5
2 10 12 3
1 2 1 1 2
5 1 5 5
1 2 3 1 1 1
1 3

Plagiolepidini
Camponotini
Attini

Formicini

Ponerini
Myrmicini

Lasiini
Solenopsidini
Tapinomini

Stenammini
Dolichoderini

Crematogastrini
Dolichoderinae Myrmicinae Formicinae Ponerinae

Lasius 11 1 12
родове брой видове
Temnothorax 5 7 12
Temnothorax 11
Camponotus 5 4 9 Lasius 9
Tetramorium 2 6 8 Camponotus 8
Tetramorium 8
Myrmica 3 1 4 Formica 3
Crematogaster 2
Formica 3 3
Myrmica 2
Messor 2 1 3 публикувани нови Plagiolepis 2

0 2 4 6 8 10 12
Два количествени белега едновременно

Графично представяне на два количествени белега

Точкова диаграма

Като точки в правоъгълна координатна система, с координати


по абцисата – стойностите на първия белег, а по ординатата –
стойностите на втория белег
Два количествени белега едновременно

Връзка между стойностите измерени директно


и тези, върху тримерните модели на черепите,
създадени чрез лазерно сканиране

46
Y = 2.4 + 0.94 X
44
Очничната ширина - линейното разстояние
Дигитални измервания

r = 0.95
42
между точките maxillofrontale и ektoconchion)
40

38
4

Дигитални
36 3

2 +1.96 SD
34
1

0 mean
32
34 36 38 40 42 44 46 -1

Директни
-1.96 SD
-2
Директни измервания
-3

-4
34 36 38 40 42 44
линеен регресионен анализ средни стойности

графика на Bland-Altman
Графично представяне на качествен и количествен белег
Качествен и количествени белег

Сравнение между възрастовите групи


по броя добити яйцеклетки
22
20

среден брой добити яйцеклетки


18
16
14
12
10
8
6 Box plot
4
2
0

под 30 г. 31 - 34 г. 35 - 39 г. над 40 г.
Други видове графики
за представяне на различни данни
Кръгова диаграма

 при белези, показващи посока в градуси - от 0 до 360


 циклични явления
в годината
в денонощието (от 0 до 24 часа)
Хоуминг при птиците

Hirundo rustica
https://doi.org/10.2217/fvl-2020-0012

Сезонна динамика
в разпространението на
варицелата в България

1 1
52
50 51 300
2 3
4 2014 52
50 51 300
2 3
4 2015
49 5 49 5
48 250 6 48 250 6
47 7 47 7
46 200 8 46 200 8
45 9 45 9
44 150 10 44 150 10
43 100 11 43 100 11
42 12 42 12
41 50 13 41 50 13
40 0 14 40 0 14
39 15 39 15
38 16 38 16
37 17 37 17
36 18 36 18
35 19 35 19
34 20 34 20
33 21 33 21
32 22 32 22
31 23 31 23
30 29 24 30 29 24
28 26 25 28 26 25
27 27
Проучване на черноморския муткур
(Phocoena phocoena relicta)
във Варненския залив

Дневна активност

двойки отделни индивиди


Времево разпределение на регистрациите в %
Проучване на черноморския муткур
(Phocoena phocoena relicta) Вертикално разпределение
0
във Варненския залив -1

-2
Kite graph
-3

дълбочина (m)
-4

-5

-6

-7

-8

-9

-10
60 40 20 0 20 40 60
Релеф на морското дъно и
център на активност на вида регистрации в %
Възрастова структура на популации

възрастови групи

растяща стабилна старееща


възраст в месеци

Относителна численост на
индивидите от различни
възрастови класове (в %)
Алгоритъм
за съставяне на вариационни редове с
еднакъв класов интервал
Графично представяне
Разпределение на честотите

честота

честота
стойности на белега стойности на белега

честота

стойности на белега
Разпределение на честотите

систола диастола
Систолно налягане (mmHg) при мъже
на възраст между 20 и 40 години

110 95 112 135 120 130

117 102 114 112 114 112

115 145 105 132 101 110

125 130 117 134 127 97

130 134 127 142 129 105


Разпределение на честотите
1. Определяне на големината на класовия
Алгоритъм за вариационен ред

интервал

xmax  xmin
i
1  3,32. lg n

i
 xmax  xmin . lg 2
lg n

i
 xmax  xmin 
n 1
Алгоритъм за вариационен ред

2. Определяне началната точка за построяване на


вариационния ред, която ще бъде долна граница
на първия клас
• Средните на първия и последния клас да бъдат близо до
минималната и максималната стойност на белега

3. Изчисляване на долните и горните граници на всички


класове на вариационния ред.
Алгоритъм за вариационен ред

4. Изчисляване на средните на всички класове


на вариационния ред
• желателно е, средните на класовете да са с толкова
значещи цифри, колкото и измеренията

• желателно е, средните на класовете да са кратни


на класовия интервал

4. Разпределяне на вариантите по класове и


намиране на честотата на всеки клас.
Формули за изчисления
Алгоритъм за вариационен ред

W долна граница
1
W  W  i
2 W средна на класа

1 W горна граница
W  W  i  
2
i класов интервал
W 1  W 2
W1 

точност на
2 измерването
Вариационен ред с еднакъв класов интервал

Систолно налягане (mmHg) при мъже систола диастола

на възраст между 20 и 40 години

110 95 112 135 120 130

117 102 114 112 114 112

115 145 105 132 101 110 n = 30


125 130 117 134 127 97 xmin = 95

130 134 127 142 129 105 xmax= 145


Вариационен ред с еднакъв класов интервал

xmax  xmin
i i = 8,469
1  3,32. lg n

i
 xmax  xmin . lg 2
i = 10,190 i = 10
lg n

i
 xmax  xmin 
i = 11,168
n 1
Вариационен ред с еднакъв класов интервал
№ на Долна Горна Средна на Абс. Отн.
класа граница граница класа честота честота %
1 90 99 95 2 6,7

2 100 109 105 6 20,0

3 110 119 115 9 30,0

4 120 129 125 7 23,3

5 130 139 135 4 13,3

6 140 149 145 2 6,7

Вариационен ред
средни на
95 105 115 125 135 145
класовете
честота на
2 6 9 7 4 2
класовете
Вариационен ред с еднакъв класов интервал

честота (брой пациенти)

0
2
4
6
8
10
12

95
105
115
125
Хистограма

систолно налягане (mmHg)


135
145
Вариационен ред с еднакъв класов интервал

Полигон на честотите
12

10

честота (брой пациенти)


8

0
95 105 115 125 135 145
систолно налягане (mmHg)
Вариационен ред с еднакъв класов интервал

Натрупана честота

Натрупаната честота на един клас


е равна на честотата на този клас плюс
честотите на всички предхождащи класове.

Вариационен ред
средни на
95 105 115 125 135 145
класовете
честота на
2 6 9 7 4 2
класовете
натрупана
честота
Вариационен ред с еднакъв класов интервал

• Редове на натрупани честоти


3

Кумулативна крива
35
средни 95 105 115 125 135 145

натрупана честота (брой пациенти)


30
натрупана
2 8 17 24 28 30
честота 25

20

15

10

5
систола диастола
0
95 105 115 125 135 145
систолно налягане (mmHg)
Натрупана честота и кумулативна крвиа

Публикувани за България видове от сем. Pyralidae


(Lepidoptera) в периода от 1862 до 2010 година.

400

350

комулативен брой видове


300

250

200

150

100 Общ брой видове - 379

50

0
1880 1900 1920 1940 1960 1980 2000

You might also like