Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 9

Міністерство освіти і науки України

Тернопільський національний технічний університет імені Івана Пулюя

Кафедра комп’ютерних наук

Звіт
Про виконання лабораторної роботи №11
На тему: “Статистичний аналіз числа символів у sms-повідомленнях (ham і
spam)”.

Виконав:

Перевірив:
Фриз М.Є.

Тернопіль 2022
Тема: Статистичний аналіз числа символів у sms-повідомленнях (ham і
spam).
Завдання 1
Прочитати дані з файлу spam.csv, підрахувати число ham-повідомлень
і spam-повідомлень. Візуалізувати їх з використанням Pie-chart.
На рисунках 1-3 зображено програмний код, кількість spam та
ham повідомлень, а також їхня візуалізація у Pie-chart.

Рисунок 1 – Програмний код для 1 завдання

Рисунок 2 – Кількість spam та ham повідомлень


Рисунок 3 – Візуалізація кількості spam та ham повідомлень у Pie-chart

Завдання 2
Знайти і надрукувати ham-повідомлення з найбільшою кількістю
символів, надрукувати кількість символів у цьому повідомленні.
На рисунку 4 та 5 зображено програмний код для 2 та 4 завдання та ham-
повідомлення з найбільшою кількістю символів.

Рисунок 4 – Програмний код для 2 та 4 завдання


Рисунок 5 – ham-повідомлення з найбільшою кількістю символів

Завдання 3
Знайти і надрукувати ham-повідомлення з найменшою кількістю
символів, надрукувати кількість символів у цьому повідомленні.
На рисунку 6 та 7 зображено програмний код для 3 та 5 завдання та ham-
повідомлення з найменшою кількістю символів.

Рисунок 6 – Програмний код для 3 та 5 завдання

Рисунок 7 – ham-повідомлення з найменшою кількістю символів


Завдання 4
Знайти і надрукувати spam-повідомлення з найбільшою кількістю
символів, надрукувати кількість символів у цьому повідомленні.
На рисунку 8 зображено spam-повідомлення з найбільшою кількістю
символів.

Рисунок 8 – spam-повідомлення з найбільшою кількістю символів

Завдання 5
Знайти і надрукувати spam-повідомлення з найменшою кількістю
символів, надрукувати кількість символів у цьому повідомленні.
На рисунку 9 зображено spam-повідомлення з найменшою кількістю
символів.

Рисунок 9 – spam-повідомлення з найменшою кількістю символів

Завдання 6
Зобразити візуально вибірку кількостей символів у ham-повідомленнях,
вибірку кількостей символів у spam-повідомленнях. Порівняти ці вибірки з
використанням інструменту Box-Plot.
На рисунку 10-11 зображено програмний код та вибірка кількостей
символів та Box-Plot у spam та ham повідомленях.
Рисунок 10 – Програмний код для 6 завдання

Рисунок 11 – Вибірка кількостей символів та Box-Plot у spam та ham


повідомленях

Завдання 7
Зобразити гістограму розподілу кількостей символів у ham-
повідомленнях, гістограму розподілу кількостей символів у spam-
повідомленнях.
На рисунку 12-13 зображено програмний код та гістограми spam та ham
повідомленях.
Рисунок 12 – Програмний код для 7 завдання

Рисунок 13 – Гістограми spam та ham повідомлень

Завдання 8
Оцінити та порівняти числові характеристики (математичне сподівання,
медіана, дисперсія, середнє квадратичне відхилення, коефіцієнти асиметрії та
ексцесу) кількості символів у ham-повідомленнях та кількості символів у spam-
повідомленнях.
На рисунку 14-15 зображено програмний код та результат обчислення
числових характеристик.
Рисунок 14 – Програмний код для 8 завдання

Рисунок 15 – Числові характеристики


ВИСНОВОК
В даній лабораторній роботі було проведено статистичний аналіз числа
символів у sms-повідомленнях (ham і spam). Проводячи аналіз числових
характеристик, стало видно, що spam-повідомлення становлять малу кількість
від усіх повідомлень та її середня довжина(Медіана) дорівнює 149 символів, а
ham-повідомлення становлять більшу кількість від усіх повідомлень, але
середня довжина(Медіана) дорівнює 52 символи. На рисунку 11 можна
побачити, що spam-повідомлення мають менше розсіяння, тому кількість
символів у повідомленні слабше коливається, ніж у ham-повідомленнях.

You might also like