Professional Documents
Culture Documents
Descriptive Stats Ind2.0 Pikh
Descriptive Stats Ind2.0 Pikh
Descriptive Stats Ind2.0 Pikh
КВЕД-клас 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018
10.71 (В-цтво хліба та хлібобулочних виробів) 245 216 210 194 183 174 171 161 142 117
10.51 (Перероблення молока та в-цтво сиру) 216 187 175 154 144 135 132 130 129 120
11. 01 (Дистиляція, ректифікація та змішування
алкогольних напоїв)
215 213 200 168 48 42 40 35 34 31
10. 13 (В-цтво м'ясних продуктів) 116 113 116 110 104 88 78 75 71 64
10.61 (В-цтво продуктів борошномельно-круп'яної
промисловості)
111 88 92 87 81 68 65 70 75 63
10. 41 (В-цтво олії та тваринних жирів) 59 58 64 66 76 73 82 83 104 90
10. 39 (Інші види перероблення та консервування
фруктів і овочів)
79 75 73 65 44 45 44 40 40 36
10. 81 (В-цтво цукру) 78 54 56 63 56 54 40 36 34 35
11.07 (В-цтво безалкогольних напоїв) 73 69 63 56 59 48 45 45 39 36
10. 11 (В-цтво м'яса) 91 71 65 65 51 45 42 37 41 32
10.82 (В-цтво какао, шоколаду та цукрових
кондитерських виробів)
58 56 53 47 49 48 42 42 42 39
10.72 (В-цтво какао, шоколаду та цукрових
кондитерських виробів)
53 53 48 51 47 40 40 37 43 38
10.91 (В-цтво готових кормів для тварин, що
47 46 45 44 43 43 44 41 39 35
утримуються на фермах)
10.20 (Перероблення та консервування риби,
39 29 36 34 28 17 19 20 21 18
ракоподібних і молюсків)
11.02 (В-цтво виноградних вин) 39 36 34 29 28 21 20 19 18 17
10.85 (В-цтво готової їжі та страв) 23 19 24 30 11 9 8 7 9 11
10.89 (В-цтво інших харчових продуктів) - - - - 24 27 28 27 27 23
10.12 (В-цтво м'яса свійської птиці) - - - - 18 14 17 17 18 27
11.05 (В-цтво пива) 26 23 23 23 23 20 20 19 18 17
10.84 (В-цтво прянощів і приправ) 20 22 21 22 19 20 18 20 23 17
10.32 (В-цтво фруктових і овочевих соків) 20 20 19 16 16 16 14 14 15 13
10.52 (В-цтво морозива) - 18 19 17 17 14 15 16 12 10
10.73 (В-цтво макаронних виробів і подібних
23 19 18 15 9 8 8 7 10 7
борошняних виробів)
10.83 (В-цтво чаю та кави) 9 15 13 17 16 14 14 14 14 14
10.42 (В-цтво маргарину і подібних харчових жирів) 8 9 12 14 8 5 9 7 6 6
10.62 (В-цтво крохмалю і крохмальних продуктів) 10 9 7 8 9 6 7 7 4 4
11.06 (В-цтво солоду) 9 7 6 6 5 5 5 5 5 5
12.00 (В-цтво тютюнових виробів) 9 8 7 4 6 4 5 4 4 5
10.86 (В-цтво дитячого харчування та дієтичних
харчових продуктів)
6 3 3 4 4 4 6 4 4 4
10.31 (Перероблення та консервування картоплі) 5 4 4 4 3 3 3 3 2 2
11.03 (В-цтво сидру та плодово-ягідних вин) 5 1 - 1 1 1 2 2 1 1
10.92 (В-цтво кормів для домашніх тварин) 1 1 1 1 2 2 1 1 2 2
11.04 (В-цтво інших недистильованих напоїв із
зброджуваних продуктів)
- - 1 1 1 1 1 1 - -
1
Харчова промисловість
2. Підсумкова статистика
a. КВЕД 10.41 VS Решта класів
2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 Спостережень
10.41 (Олії та тваринні жири) 1 1 0 0 0 0 0 2 3 3 755
Решта класів 37 24 0 0 0 29 37 48 34 32 11 920
10 (Харчові продукти) без 10.41 29 18 0 0 0 16 22 36 29 27 9 754
11 (Напої) 9 5 0 0 0 13 15 12 5 5 2 110
12 (Тютюнові вироби) 0 1 0 0 0 0 0 0 0 0 56
Всього 39 25 0 0 0 29 37 50 37 35 12 675
10.41 10 (В-цтво харчових продуктів) без 10.41 11 (В-цтво напоїв) 12 (В-цтво тютюнових виробів)
76 976 211 6
iii. Дескриптивна статистика в тис. грн (включно з підприємствами, що реєстрували нульовий виторг і
собівартість в-цтва)
Для
Середнє Мінімальне 25 75 Максимальне Стандартне
КВЕД- Показник Медіана
значення значення персентиль персентиль значення відхиленя
класу
Revenue 2 073 556 226 192 0 65 310.5 1 114 977 100 227 770 7 075 796
10.41
COGS 1 683 689 192 650 0 54 444.5 883 902.5 87 041 660 5 758 026
Revenue 545 435.9 89 018.5 0 22 199.5 326 309 116 782 210 2 762 393
REST
COGS 351 224.3 68 483 0 16 778.2 245 347 48 473 620 1 272 391
-Медіанне значення виторгу та прибутку для 10.41 більш ніж удвічі перевищує аналогічне значення для решти класів галузі
загалом.
Для
Середнє Мінімальне 25 75 Максимальне Стандартне
КВЕД- Показник Медіана
значення значення персентиль персентиль значення відхиленя
класу
Profit 389 867.4 29 893 -53 35 5 882 161 338.5 79 854 734 1 560 751
10.41
Profit_infl_corrected 315 817.4 18 413 -24 136.84 3 255.5 99 072 17 104 260 1 452 968
Profit 194 211.7 16 590.5 -1 119 621 3 543.8 74 041 91 587 450 1 697 442
REST
Profit_infl_corrected 170 892.7 10 875.7 -486 792 2 247.4 56 544 84 025 183 1 605 969
*Прибуток скоригований на інфляцію позначає різницю між скоригованими значеннями виторгу та собівартості
реалізації, беручи за базовий 2009 рік і індекси інфляції з сайту ІндексМінфіну.
2
Харчова промисловість
Boxplot-аналіз показує наявність викидів для номінальних змінних виторгу, собівартості виробництва та прибутку.
REST
Виторг Собівартість Прибуток
Враховуючи, що РЕШТА враховує усі наявні в галузі класи, можна зробити висновок, що клас 10.41 має порівняно велику к-
сть викидів. З аналізу також видно, що існує група підприємств, що отримує надприбутки у порівнянні з основною масою
підприємств класу. Тим не менше, у загальному розподілі викидів, порівнюючи масштабування вертикальних осей обох
підгруп , викиди підприємств класу 10. 41 досягають значно менших значень.
3
Харчова промисловість
REST
З розподілів видно, що для класу 10.41 у порівнянні із загальним розподілом інших класів галузі, середнє значення виторгу
та прибутку зміщене праворуч, а отже є вищим. Розподіл 10.41 також характеризується незначною асиметрією у зв’язку з
тим, що є кілька десятків підприємств з виторгом/ прибутком непропорційно нижчим, аніж межі видимого нормального
розподілу.
4
Харчова промисловість
COGS 1 683 689 192 650 0 54 445 883 903 87 041 660 5 758 026
Revenue 426 167 83 466 0 21 170 296 138 80 433 290 1 755 308
10.41
без
10
COGS 313 677 66 128 0 16 227 233 707 48 473 620 1 128 859
Revenue 778 571 115 091 0 30 167 462 458 58 777 970 3 163 279
11
COGS 422 632 78 532 0 18 311 291 005 22 047 860 1 397 194
Revenue 12 535 372 4 857 381 0 468 088 7 762 054 116 782 210 23 929 579
12
COGS 4 200 618 1 854 399 0 280 291 4 945 613 27 140 940 5 872 470
Як видно з таблиці, для класу 10.41 медіанне значення виторгу, як і значення в межах 25-75 персентилів значно
перевищують аналогічні для інших класів групи 10 та 11, за винятком, очевидно, 12 групи. Для прибутку, поданого нижче,
спостерігається така ж динаміка у порівнянні з рештою класів 10 групи, проте 11. В-цтво напоїв випереджає 10, 10.41 за
прибутком через меншу собівартість реалізації.
Для
Середнє Мінімальне 25 75 Максимальне Стандартне
КВЕД- Показник Медіана
значення значення персентиль персентиль значення відхиленя
класу
Profit 389 867.4 29 893 -53 35 5 882 161 338.5 79 854 734 1 560 751
10.41
Profit_infl_corrected 315 817.4 18 413 -24 136.84 3 255.5 99 072 17 104 260 1 452 968
Profit 112 489.7 13 920 -1 119 621 3 182 62 317.2 31 959 670 675 447.6
10 без
10.41
Profit_infl_corrected 95 573.5 9 070 -486 792 1 978.3 45 693.9 29 320 798 632 338.4
Profit 355 939.5 34 487 -39 245 6 861.5 144 614 39 545 870 1 871 191
11
Profit_infl_corrected 320 619.4 25 598.2 -33 111 4 623.9 123 896.8 36 280 615 1 770 703
Profit 8 334 755 1 198 095 -917 801 175 414.5 4 429 138 91 587 450 18 427 736
12
Profit_infl_corrected 7 648 403 588 079 -399 044 121 814 3 622 756 84 25 183 17 78 213
*Прибуток скоригований на інфляцію позначає різницю між скоригованими значеннями виторгу та собівартості
реалізації, беручи за базовий 2009 рік і індекси інфляції з сайту ІндексМінфіну.
5
Харчова промисловість
Boxplot-аналіз показує наявність викидів для номінальних змінних виторгу, собівартості виробництва та прибутку.
10.41 Виробництво олії та жирів
Виторг Собівартість Прибуток
6
Харчова промисловість
7
Харчова промисловість
Прослідкувавши за значеннями на осях та формами розподілів для груп, можна зробити зробити, зокрема, і такі висновки:
- Більшість розподілів, окрім як для 12. Виробництво тютюнових виробів, є близькими до нормального, а, отже,
дають підстави для проведення подальшого аналізу;
- В розрізі класу 10.41 більш ніж половина підприємств має прибуток більший, аніж середній для інших класів 10
групи та середній для усіх інших груп вибірки;
- Наочно зображені менш рівномірні розподіли для круп 11 та 12 та значно більші середні значення прибутку для 11
у порівнянні з 10. Для 12, зокрема, притаманний значний розкид підприємств з прибутком від 1 000 тис. грн аж до
100 000 000 тис. грн. Беручи до уваги найменшу к-сть спостережень і п-ств, це свідчить про неоднорідність
результатів їх діяльності;
- Оскільки надані розподіли відображають різну кількість спостережень для кожної групи, вони радше представлені
для наочного зображення кожної групи зокрема.
З boxplot-аналізу видно:
Для дещо точнішої оцінки статистичних підсумків нижче в описі також представлені дані для вибірки без викидів та
підприємств з одночасними нульовими значеннями виторгу та собівартості реалізації продукції. Така підсумкова
інформація по кожній із груп точніше відображає медіану та величину розкиду значень за персентилями .
Тим не менше, кожна із груп має порівняно близький відсоток підприємств, що отримують надприбутки порівняно із
основною масою підприємств групи.
8
Харчова промисловість
212 143
COGS 184 123 1 240 57 437 637 192 5 691 229
Revenue 98 061 407 27 583 338 309 13 066 709
REST
COGS 1 488 054 5 340 120 490 2 349 764 4 950 423
ii. Прибуток
Profit 18 280 -1 119 621 4 396 78 264 10 702 784 9 049 755 1 % отримує 85%
REST
розподілу прибутку
Profit_infl_corr 12 175 -486 791 2 785 58 909 9 388 407 7 923 537 вибірки (?)
Profit 15 630 -1 119 621 3 940 65 477 4 916 220 3 616 259 1 % отримує 74%
10 без
10.41
розподілу прибутку
Profit_infl_corr 10 070 -486 792 2 463 48 623 4 510 294 3 344 777 вибірки
Profit 40 613 -39 245 9 469 150 112 7 071 140 4 350 395 1% отримує майже
вчетверо більше, ніж
11
рівномірний розподіл
Profit_infl_corr 314 379 -45 266 90 377 1 980 576 9 388 407 4 210 098 прибутку, менша к-сть
підприємств,
олігопольний ринок)
9
Харчова промисловість
*У цьому випадку «без викидів» означає без підприємств, для яких і виторг, і собівартість реалізації продукції є
нульовими, а також без викидів, які «спотворюють» логарифмований розподіл (без нижнього 1 і верхнього 5
персентилів); не для даних у простому номінальному виразі, адже
(і) для того, аби позбутися викидів для змінних у звичному виразі доведеться видалити близько 20-30% даних і
навіть тоді не буде впевненості у представлені не викривлених даних;
(іі) для подальшого аналізу лише розподіл логарифмованих змінних має значення, адже він норрмальний;
(iii) нас цікавить, тому, 25 персинтиль, медіана (50 персентиль), 75 персентиль, а також 95-99, щоб перевірити, яку
частину прибутку, наприклад, отримують «верхні» 5% вибірки
-Ні середнє значення, ні стандартне відхилення не мають сенсу в даному випадку, оскільки вони дуже чутливі до
кожного % даних, що упускають.
10