Download as xlsx, pdf, or txt
Download as xlsx, pdf, or txt
You are on page 1of 34

Комп’ютерні практикуми з дисципліни «Статистика»

Комп’ютерний практикум 3
Укладач: Кузьмінська Н.Л., к.е.н., доц. каф. економіки і підприємництва, КПІ ім. Ігоря Сікорського

КОМП’ЮТЕРНИЙ ПРАКТИКУМ 3
Зведення і групування статистичних даних.
Статистичні ряди розподілу

Статистичне зведення (другий етап статистичного дослідження) – складна операція наукової обробки
первинних статистичних даних, яка включає групування даних (відбір групових ознак, визначення числа
груп і величини інтервалу, формування груп і підгруп), розробку системи показників для характеристики
типових груп і підгруп, підсумовування та розрахунок показників за окремими групами та за сукупністю в
цілому і оформлення результатів у вигляді таблиць або графічно.
 

Види
статистичного зведення

за складністю будови:
прості (полягає в отриманні зведеного підсумку по усім отриманим даним);
складні (передбачає попередню систематизацію даних і розподіл сукупності на
групи);
аналітичні (з їх допомогою виявляються і вивчаються зв’язки і
взаємообумовленості між явищами на основі факторних та результативних
ознак);
за способом розробки даних статистичного спостереження:
ручні (всі операції виконуються вручну);
машинні (виконується з використанням комп’ютера);
за місцем проведення:
централізовані (всі первинні дані зосереджені в одному місці (центрі), де й
розробляються);
децентралізовані (підсумкові дані отримуються на основі їх обробки
послідовними етапами).
 

Статистичне групування (другий етап статистичного дослідження) – процес роздроблення


досліджуваної сукупності на групи та підгрупи за визначеними суттєвими ознаками з метою
всебічного її вивчення.

 
Статистичне групування (другий етап статистичного дослідження) – процес роздроблення
досліджуваної сукупності на групи та підгрупи за визначеними суттєвими ознаками з метою
всебічного її вивчення.

Етапи
статистичного групування

- теоретичний аналіз досліджуваного явища чи процесу;


- виділення групувальної ознаки або ознак (при наявності декількох групувальних ознак – опис
того, як вони комбінуються);
- визначення кількості груп і величини інтервалів; побудова інтервального ряду розподілу
одиниць сукупності за групувальною ознакою (ознаками)
- визначення, обґрунтування та розрахунок показників, якими повинні характеризуватись групи;
- оформлення у табличному чи графічному вигляді результатів групування.
 
 

за типом розв’язуваних за допомогою групувань задач:


типологічні (виділяються якісно однорідні економічні групи або типи суспільних явищ із різнорідних
сукупностей);
структурні або варіаційні (визначаються структура та структурні зсуви в сукупності однорідних
одиниць, здійснюється роздроблення однорідної сукупності за величиною варіаційної ознаки);
аналітичні (виділяються та визначаються зв’язки та взаємообумовленості між явищами на основі
факторних ознак, які обумовлюють зміни явищ, і результативних ознак, які змінюються під впливом
факторів);
за кількістю покладених в основі групувань ознак:
прості (групування виконані за однією ознакою, наприклад, розподіл студентів за віковими групами);
складні або багатовимірні (групування проводиться за двома та більше ознаками);
за часовим критерієм:
статистичні (такі, що дають характеристику сукупності на певний момент часу або за визначений період);
динамічні (такі, що показують переходи одиниць із одних груп в інші);
за видами ознак:
атрибутивні (якісні);
кількісні;
ознаки простору;
ознаки часу;
за комбінаціями ознак:
прості (здійснюються за однією ознакою);
комбінаційні (для виділення груп беруть дві і більше ознак, тобто групи, утворені за однією ознакою,
поділяються на підгрупи – за іншою, а отримані у результаті підгрупи далі поділяються на підгрупи (кожна
окремо) і т.д.);
за вимогами аналізу:
первинні;
вторинні (групування, які здійснюються за допомогою перегрупування первинних групувань).
 
Положення відбору
групувальних ознак

1) у якості підстав групування потрібно брати типові, суттєві ознаки досліджуваного


явища у відповідності із метою статистичної роботи;
2) при виборі групувальних ознак повинні бути прий няті до уваги конкретні умови
місця і часу;
3) при вивченні складних явищ групування потрібно проводити за рядом суттєвих,
характерних ознак.

Стадії відбору
групувальних ознак

1) визначення мети та задачі групування;


2) встановлення числа груп та кількісних меж ознак.

Формули для визначення


кількості груп

xmax  xmin
h ,
k
xmax xmin

Види інтервалів групування

- рівні (інтервали, розміри яких мають у всіх групах однакову величину. Вони
застосовуються, коли групувальна ознака змінюється більш-менш рівномірно у
невеликих межах. Їх величина визначається за формулою:
де та – най більше та най менше значення ознаки у сукупності,
k – кількість груп);
- нерівні (інтервали, розміри яких змінюються за величиною від групи до групи.
Вони застосовуються для розмежування груп у випадках, коли групувальна ознака
змінюється нерівномірно або у великих межах);
- спеціалізовані (інтервали, різні для галузей і виробництв, що групуються за однією і
тією ж ознакою, з урахуванням особливостей кожної галузі);
- такі, що визначаються за принципом рівних частот (застосовуються при невеликій
кількості спостережень. Всі елементи сукупності рівномірно розподіляються у
порядку зростання ознаки таким чином, що у кожну групу входить однакова
кількість одиниць).
k – кількість груп);
- нерівні (інтервали, розміри яких змінюються за величиною від групи до групи.
Вони застосовуються для розмежування груп у випадках, коли групувальна ознака
змінюється нерівномірно або у великих межах);
- спеціалізовані (інтервали, різні для галузей і виробництв, що групуються за однією і
тією ж ознакою, з урахуванням особливостей кожної галузі);
- такі, що визначаються за принципом рівних частот (застосовуються при невеликій
кількості спостережень. Всі елементи сукупності рівномірно розподіляються у
порядку зростання ознаки таким чином, що у кожну групу входить однакова
кількість одиниць).
 

Статистичний ряд розподілу


(впорядкований розподіл
одиниць сукупності на групи за
варіативною ознакою)

Способи графічного
зображення рядів розподілу
для побудови гістограми частот необхідно вибрати пункт Данные/Анализ данных (якщо немає, то
можна активувати: Файл / Параметры / Надстройки (флажок Пакет анализа)), потім у запропонованому
переліку вибрати Гистограмма. У діалоговому вікні потрібно задати наступні параметри: Входной
інтервал – вводяться посилання на клітинку або діапазон, які містять вибіркові дані; Интервал карманов
(необов’язковий параметр) – вводяться посилання на клітинку або діапазон, які містять набір граничних
значень для визначення інтервалів (карманов). Ці значення повинні бути введені у порядку зростання.
Програма MS Excel обчислює кількість попадань даних у сформовані інтервали, причому межі інтервалів є
строгими зліва і нестрогими справа. Якщо діапазон інтервалів не ввести, то набір інтервалів створиться
автоматично (рівномірно розподілиться між мінімальними і максимальними значеннями даних); Метки –
встановлюється в активний режим, якщо перший рядок вхідних даних містить заголовки; Выходной
интервал – при встановленні в активний режим, вимагає ввода адреси верхньої клітинки, починаючи з
якої будуть розміщені обчислені автоматично відносні частоти / Новый рабочий лист / Новая рабочая
книга – встановлюється в активний режим для відкриття нового аркуша / нової книги, у яких будуть
розміщені обчислені автоматично відносні; Парето (отсортированная гистограмма) – встановлюється в
активний режим для представлення даних у порядку спадання частоти, інакше – дані будуть приведені у
порядку слідування інтервалів; Интегральный процент – встановлюється в активний режим для
розрахунку виражених у відсотках накопичених частот (накопленных частостей) і включення у гістограму
графіка кумуляти; Вывод графика – встановлюється в активний режим для автоматичного створення
вбудованої діаграми там, де міститься вихідний діапазон. Для побудови гістограми за допомогою
описаного шляху потрібно мати початкову вибірку даних, якщо дані задано у вигляді інтервального
статистичного розподілу необхідно вибрати пункт Вставка/Гистограмма. У діалоговому вікні задаються
вхідні параметри.
наукової обробки
визначення числа
для характеристики
та за сукупністю в

цес роздроблення
знаками з метою
цес роздроблення
знаками з метою

х ознак – опис

яду розподілу

уватись групи;

ищ із різнорідних

ності однорідних
йної ознаки);
ищами на основі
ються під впливом

и групами);

начений період);

однією ознакою,
а підгрупи (кожна

нь).
ування

величину. Вони
нш рівномірно у

упності,

групи до групи.
пувальна ознака

ються за однією і

ся при невеликій
озподіляються у
одить однакова
групи до групи.
пувальна ознака

ються за однією і

ся при невеликій
озподіляються у
одить однакова

поділу
поділ
групи за
ою)
ых (якщо немає, то
м у запропонованому
ри: Входной
Интервал карманов
ть набір граничних
орядку зростання.
ому межі інтервалів є
рвалів створиться
ями даних); Метки –
вки; Выходной
инки, починаючи з
/ Новая рабочая
, у яких будуть
а) – встановлюється в
будуть приведені у
й режим для
лючення у гістограму
ного створення
допомогою
інтервального
му вікні задаються
1. Необхідно згрупувати підприємства за обсягом інноваційних витрат. Мінімальне значення ознаки 50+100V тис. гр
максимальне – 150+100V тис. грн. Сукупність включає 45 підприємств, які потрібно розбити на 5 груп. Яким буде кр
інтервалу?

1.

2. На підприємстві, яке спеціалізується на оптовій реалізації овочів та фруктів, досліджувалась середньомісячна пот
у картоплі (у кг) серед основних споживачів. Було отримано такі результати: 200-10V, 150+10V, 250-10V, 100+10V, 150
200-10V, 200-10V, 300, 500, 300, 200-10V, 150+10V, 250-10V, 100+10V, 150+10V. Згрупувати дані, для визначення кільк
груп використати формулу Стерджеса. Результат подати у вигляді інтервального статистичного розподілу.

2.

3. У таблиці представлено дані дослідження річного обсягу споживання м’яса та м’ясних продуктів (у кг на одну ос
за двома регіонами, привести ряди інтервалів до порівнюваного вигляду (двома способами).

Перший регіон Другий регіон

Обсяг Обсяг Кіль-ть,


споживання, кг Кіль-ть, осіб споживання, кг осіб
на одну особу на одну особу

30 – 36 15-V 30 – 40 43-V
36 – 42 35 40 – 50 60+V
42 – 48 40 50 – 60 17
48 – 54 16+V – –
54 - 60 4 – –

3.
4. За заданим варіаційним рядом побудувати: 1) гістограму відносних частот; 2) полігон частот.

4.

5. За даними Держстату за 2018 рік побудувати криву Лоренса. Зробити висновки.

Вік Кількість,
економічноактивного
населення тис. осіб

15-70 років 17747.7


15-24 роки 1316.5
25-29 років 2211.2
30-34 роки 2714.5
35-39 років 2479.6
40-49 років 4608.8
50-59 років 3759.9
60-70 років 657.2
ознаки 50+100V тис. грн.,
на 5 груп. Яким буде крок

сь середньомісячна потреба
V, 250-10V, 100+10V, 150-10V,
і, для визначення кількості
го розподілу.

родуктів (у кг на одну особу)


ми).
стот.
1. Необхідно згрупувати підприємства за обсягом реалізованої продукції (тис. гр. од.). Мінімальне значення ознаки
100+10V, максимальне – 1500-10V. Сукупність включає 150 підприємств, які потрібно розбити на 7 груп. Яким буде к
інтервалу?

1.

2. На підприємстві було проведене підвищення кваліфікації працівників. Після чого було проаналізовано рівень зро
(у %) 16 показників роботи підприємства: 5; 7; 0; 2+V; 3; 8; 0; 1+V; 5; 0+V; 3; 2; 1+V; 0; 3; 2. Згрупувати дані, для визнач
кількості груп використати формулу Результат подати у вигляді інтервального статистичного розподілу.
k   N  .

2.

3. У таблиці представлено дані дослідження річного обсягу споживання молока та молочних продуктів (у л на одну
особу) за двома регіонами, привести ряди інтервалів до порівнюваного вигляду (двома способами).

Перший регіон Другий регіон

Обсяг Обсяг Кіль-ть,


споживання, л Кіль-ть, осіб споживання, л осіб
на одну особу на одну особу

190 – 200 14-V 190 – 197 13


200 – 210 25 197 – 204 70-V
210 – 220 50+V 204 – 211 17+V
220 – 230 16 211 – 218 10
– – 218 – 225 5

3.
4. За заданим варіаційним рядом побудувати: 1) гістограму відносних частот; 2) полігон частот.

4.

5. За даними Держстату за 2018 рік побудувати криву Лоренса. Зробити висновки.

Вік Кількість,
економічноактивного тис. осіб
населення (жінки)
15-70 років 602.5
15-24 роки 937.3
25-29 років 1190.4
30-34 роки 1140.3
35-39 років 2324.2
40-49 років 1944.9
50-59 років 346.5
60-70 років 602.5
альне значення ознаки
и на 7 груп. Яким буде крок

аналізовано рівень зростання


упувати дані, для визначення
атистичного розподілу.

их продуктів (у л на одну
особами).
стот.
1. Необхідно згрупувати інвесторів за обсягом інвестицій. Мінімальне значення ознаки 100+10V тис. ум. од., максим
160+10V тис. ум. од. Сукупність включає 10 інвесторів, яких потрібно розбити на 4 груп. Яким буде крок інтервалу?

1.

2. У колл-центрі інтернет-магазину досліджувалась кількість неправильних з’єднань за хвилину. Спостереження про


хвилин дали такі результати: 2+0,1V; 3; 0; 5; 2; 0+0,1V; 0; 1; 3; 2; 2+0,1V; 5; 3; 0+0,1V; 2; 3; 2; 3; 3; 4; 0+0,1V; 5; 3; 4; 3; 2;
4. Згрупувати дані, для визначення кількості груп використати формулу Стерджеса. Результат подати у вигляді інтерв
статистичного розподілу.

2.

3. У таблиці представлено дані дослідження річного обсягу споживання яєць (у шт. на одну особу) за двома регіон
привести ряди інтервалів до порівнюваного вигляду (двома способами).

Перший регіон Другий регіон

Обсяг Обсяг
споживання,
споживання, шт. Кіль-ть, осіб шт. на одну Кіль-ть, осіб
на одну особу
особу
150 – 200 7 150 – 190 10
200 – 250 45-V 190 – 230 55-V
250 – 300 60+V 230 – 270 43+V
300 – 350 3 270 – 310 17
– – 310 – 350 5

3.
4. За заданим варіаційним рядом побудувати: 1) гістограму відносних частот; 2) полігон частот.

4.

5. За даними Держстату за 2018 рік побудувати криву Лоренса. Зробити висновки.

Вік Кількість,
економічноактивного тис. осіб
населення (чоловіки)
15-70 років 714
15-24 роки 1273.9
25-29 років 1524.1
30-34 роки 1339.3
35-39 років 2284.6
40-49 років 1815
50-59 років 310.7
60-70 років 714
0+10V тис. ум. од., максимальне –
им буде крок інтервалу?

лину. Спостереження протягом 30


3; 3; 4; 0+0,1V; 5; 3; 4; 3; 2; 1+0,1V; 2; 2;
тат подати у вигляді інтервального

ну особу) за двома регіонами,


частот.
1. Необхідно згрупувати підприємства за обсягом інноваційних витрат. Мінімальне значення ознаки 10+10V тис.
130+10V тис. ум. од. Сукупність включає 75 підприємств, які треба розбити на 6 груп. Яким буде крок інтервалу?

1. 250 75 20
370 6

2. Обстеження величини рівня прибутковості (рентабельності, у %) підприємства протягом року дало результати
V, 80+V, 82, 80+V, 102, 101, 103. Згрупувати дані, для визначення кількості груп використати формулу Стерджеса.
інтервального статистичного розподілу.

2. 123 N= 12 log(12)=
101 k= 5
79 h= 10
97
99 [76;86) (86;96]
76 prub 76,79,82
104 n 3 0
82 w 0.25 0
104
102
101
103

3. У таблиці представлено дані дослідження річного обсягу споживання картоплі (у кг на одну особу) за двома
інтервалів до порівнюваного вигляду (двома способами).

Перший регіон Другий регіон

Обсяг Обсяг
споживання, кг Кіль-ть, осіб споживання, кг Кіль-ть, осіб
на одну особу на одну особу

100 – 115 8 90 – 112 11


115 – 130 63 112 – 124 59
130 – 145 47 124 – 136 54
145 – 160 2 136 – 148 12
– – 148 – 160 9

3. Кількість осіб Обсяг


Обсяг споживан
споживання, кг ня, кг на
на одну особу 1 регіон 2 регіон одну
особу
100 – 115 8 26 25.75 90 – 112
115 – 130 63 70 112 – 124
130 – 145 47 37 124 – 136
145 – 160 2 12 136 – 148
120 145 148 – 160

4. За заданим варіаційним рядом побудувати: 1) гістограму відносних частот; 2) полігон частот.

Відносна
[αi-1;α1) Довжина інтервала xi Частота
4. частота
[0;7) 7 3.5 3 0.08
[7;14) 7 10.5 25 0.64
[14;21) 7 17.5 10 0.26
[21;28) 7 24.5 1 0.03
Обсяг 39

5. За даними Держстату за 2018 рік побудувати криву Лоренса. Зробити висновки.

Вік
економічноактивного Кількість,
населення тис. осіб
(міське населення)
15-70 років 802.4
15-24 роки 1469.2
25-29 років 1989.1
30-34 роки 1811.6
35-39 років 3180.6
40-49 років 2581.8
50-59 років 432.3
60-70 років 802.4
імальне значення ознаки 10+10V тис. ум. од., максимальне –
на 6 груп. Яким буде крок інтервалу?

мства протягом року дало результати 99+V, 101, 103-V, 97, 99, 100-
руп використати формулу Стерджеса. Результат подати у вигляді

1.07918124604762

[96;106) (106;116] [116;126)


97,99,2*101,102,103,2*104 123
8 0 1 summa
0.67 0 0.08 1

картоплі (у кг на одну особу) за двома регіонами, привести ряди

Кількість осіб

1 регіон 2 регіон

6.4 11
39.4 59
44 54
28.6 12
1.6 9
120 145

стот; 2) полігон частот.

0.09

Щільність відн. Частоти

0.01
0.09 0.04
0.04
0.00
0.01
0.00

[0;7) [7;14) [14;21) [21;28)

гістограма відносних частот


висновки.
0.70

0.60

0.50

0.40

0.30

0.20

0.10
0.00
0.00
[21;28) 3.5 10.5 17.5 24.5

полігон відносних частот


1. Необхідно згрупувати підприємства за обсягом реалізованої продукції. Мінімальне значення ознаки 170+10V тис
максимальне – 410+10V тис. ум. од. Сукупність включає 50 підприємств, які треба розбити на 8 груп. Яким буде крок

1.

2. На підприємстві було проведене підвищення кваліфікації працівників. Після чого було проаналізовано рівень зро
16 показників роботи підприємства: 5; 7; 0; 2+V; 3; 8; 0; 1+V; 5; 0+V; 3; 2; 1+V; 0; 3; 2. Згрупувати дані, для визначення
груп використати формулу Результат подати у вигляді інтервального статистичного розподілу.
k   N .

2.

3. У таблиці представлено дані дослідження річного обсягу споживання риби та рибних продуктів (у кг на одну осо
регіонами, привести ряди інтервалів до порівнюваного вигляду (двома способами).

Перший регіон Другий регіон

Обсяг
споживання, кг Кіль-ть, осіб Обсяг споживання, Кіль-ть, осіб
на одну особу кг на одну особу

5 – 10 4 3–8 3
10 – 15 36+V 8 – 12 75-V
15 – 20 70-V 12 – 17 17+V
20 – 25 5 17 – 22 8
– – 22 – 27 2

3.
4. За заданим варіаційним рядом побудувати: 1) гістограму відносних частот; 2) полігон частот.

4.

5. За даними Держстату за 2018 рік побудувати криву Лоренса. Зробити висновки.

Вік
економічноактивного Кількість,
населення (сільське тис. осіб
населення)
15-70 років 514.1
15-24 роки 742
25-29 років 725.4
30-34 роки 668
35-39 років 1428.2
40-49 років 1178.1
50-59 років 224.9
60-70 років 514.1
чення ознаки 170+10V тис. ум. од.,
и на 8 груп. Яким буде крок інтервалу?

проаналізовано рівень зростання (у %)


увати дані, для визначення кількості
ичного розподілу.

продуктів (у кг на одну особу) за двома


частот.

You might also like