Professional Documents
Culture Documents
Lab 11
Lab 11
Звіт
Про виконання лабораторної роботи №11
На тему: “Статистичний аналіз числа символів у sms-повідомленнях (ham і
spam)”.
Виконав:
Перевірив:
Фриз М.Є.
Тернопіль 2022
Тема: Статистичний аналіз числа символів у sms-повідомленнях (ham і
spam).
Завдання 1
Прочитати дані з файлу spam.csv, підрахувати число ham-повідомлень
і spam-повідомлень. Візуалізувати їх з використанням Pie-chart.
На рисунках 1-3 зображено програмний код, кількість spam та
ham повідомлень, а також їхня візуалізація у Pie-chart.
Завдання 2
Знайти і надрукувати ham-повідомлення з найбільшою кількістю
символів, надрукувати кількість символів у цьому повідомленні.
На рисунку 4 та 5 зображено програмний код для 2 та 4 завдання та ham-
повідомлення з найбільшою кількістю символів.
Завдання 3
Знайти і надрукувати ham-повідомлення з найменшою кількістю
символів, надрукувати кількість символів у цьому повідомленні.
На рисунку 6 та 7 зображено програмний код для 3 та 5 завдання та ham-
повідомлення з найменшою кількістю символів.
Завдання 5
Знайти і надрукувати spam-повідомлення з найменшою кількістю
символів, надрукувати кількість символів у цьому повідомленні.
На рисунку 9 зображено spam-повідомлення з найменшою кількістю
символів.
Завдання 6
Зобразити візуально вибірку кількостей символів у ham-повідомленнях,
вибірку кількостей символів у spam-повідомленнях. Порівняти ці вибірки з
використанням інструменту Box-Plot.
На рисунку 10-11 зображено програмний код та вибірка кількостей
символів та Box-Plot у spam та ham повідомленях.
Рисунок 10 – Програмний код для 6 завдання
Завдання 7
Зобразити гістограму розподілу кількостей символів у ham-
повідомленнях, гістограму розподілу кількостей символів у spam-
повідомленнях.
На рисунку 12-13 зображено програмний код та гістограми spam та ham
повідомленях.
Рисунок 12 – Програмний код для 7 завдання
Завдання 8
Оцінити та порівняти числові характеристики (математичне сподівання,
медіана, дисперсія, середнє квадратичне відхилення, коефіцієнти асиметрії та
ексцесу) кількості символів у ham-повідомленнях та кількості символів у spam-
повідомленнях.
На рисунку 14-15 зображено програмний код та результат обчислення
числових характеристик.
Рисунок 14 – Програмний код для 8 завдання