S59326 77007426472 1 PB

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 4

UDC 681.5.001.63.519.

711

В.M. Синєглазов, д.т.н., проф., Д.В. Tаранов


(Національний авіаційний університет, Україна)

Використання методу максимальної маржі для інтелектуальної


класифікації даних

Робота присвячена застосуванню напівкерованого навчання в машинному


навчанні та його впливу на обробку великих обсягів даних. Досліджено
можливість зменшення витрат на навчання та енергії за рахунок використання
напівкерованого навчання. Описано приклади успішного використання методу
максимальної маржі в авіаційній галузі.

Необхідність використання ШІ на борту БПЛА.


У сучасному світі безпілотні літальні апарати (БПЛА) стали необхідними
для виконання різних завдань, таких як моніторинг довкілля, зйомка з висоти,
доставка товарів і багато іншого. Однак, для ефективної роботи БПЛА потрібна
обробка великого об'єму даних, яка забезпечується за допомогою штучного
інтелекту.
Класифікація даних є важливим етапом обробки даних у системах
штучного інтелекту, які використовуються в БПЛА. Цей процес полягає в
призначенні міток або категорій до вхідних даних. Зазвичай, ці мітки
використовуються для розподілу даних на класи або категорії для подальшого
аналізу та використання.
У БПЛА класифікація даних може використовуватися для багатьох
завдань, наприклад, для визначення типу наземного об'єкту на зображенні,
визначення виду рослинності на місцевості, визначення категорій дорожнього
руху на зображеннях доріг та інших.
Обробка великих об'ємів даних є важливою складовою у використанні
БПЛА, але її ефективність залежить від здатності алгоритмів обробки даних
працювати з великими об'ємами даних.
Постановка завдання.
Завдання полягає у дослідженні та покращенні алгоритмів машинного
навчання для обробки великих обсягів даних, отриманих від безпілотних
літальних апаратів (БПЛА), зокрема використання методу максимальної маржі
та напівкерованого навчання з метою підвищення точності та швидкості обробки
даних. Дослідження повинно зосередитися на можливості використання
нейронних мереж для класифікації даних БПЛА та розробці алгоритмів, що
враховують короткі марковані та довгі немарковані вибірки даних для
зменшення витрат енергії та ресурсів, а також забезпечення більш точної та
ефективної обробки даних БПЛА. Результатом роботи повинна бути розробка та
тестування нових алгоритмів машинного навчання для застосування у сфері
авіації та безпілотних систем.
Використання методів напівкерованого навчання.
Штучний інтелект, зокрема методи напівкерованого навчання, можуть
допомогти вирішити цю проблему.

9.29
Напівкероване навчання - це метод машинного навчання, який
використовує як позначені, так і непозначені дані для навчання моделі. Це
дозволяє побудувати модель, яка може працювати з великим об'ємом
непозначених даних. Наприклад, у випадку використання БПЛА для збору даних
з місцевості, значна частина зібраних даних може бути непозначеною.Це
дозволяє використовувати ШІ для аналізу великих об'ємів даних, зібраних
БПЛА, і отримання цінної інформації.
Напівкероване навчання дозволяє швидко аналізувати великі об'єми
даних та допомагає зменшити ресурси, необхідні для обробки великих об'ємів
даних у системах БПЛА.
Для класифікації даних у БПЛА використовуються різні методи. Один з
них – метод максимальної маржі. Цей метод використовується для розподілу
даних на категорії, розташовуючи категорії у просторі таким чином, щоб між
ними була максимальна можлива відстань.
Переваги напівкерованого навчання.
Напівкероване навчання - це метод машинного навчання, який поєднує в
собі елементи навчання з учителем та без учителя. Цей метод може бути
особливо корисним у випадку обробки великих обсягів даних в БПЛА. Однією з
переваг напівкерованого навчання є здатність використовувати короткі
марковані та довгі немарковані вибірки даних. Це зменшує витрати та енергію,
які необхідні для обробки великих обсягів даних. Короткі марковані вибірки
даних містять інформацію про попередні події, що дозволяє зробити прогноз на
основі цієї інформації. Довгі немарковані вибірки даних, з іншого боку, не
містять інформації про попередні події, але можуть бути використані для
виявлення закономірностей в даних та побудови моделей.
Напівкероване навчання є ефективним методом машинного навчання,
який може зменшити кількість даних, необхідних для навчання, що зменшує
витрати та енергію, тим самим роблячи його особливо корисним для
застосування у безпілотних літальних апаратах (БПЛА).Наприклад,
використання напівкерованого навчання може дозволити БПЛА отримувати
більш точні результати при обробці великих обсягів даних, зокрема зображень з
камер і сенсорів, та проводити більш ефективну обробку в режимі реального
часу. Крім того, напівкероване навчання може допомогти у покращенні точності
прогнозування погодних умов, що є важливим для безпеки авіаційних польотів.
Загалом, застосування напівкерованого навчання у БПЛА може знизити
витрати та покращити ефективність їх функціонування, зокрема за рахунок
зменшення витрат на збір та обробку даних, зменшення енергоспоживання та
поліпшення точності результатів.
Метод максимальної маржі є одним з найпопулярніших методів
машинного навчання, який використовується для розв'язування задач
класифікації, регресії та інших задач. Головна ідея методу полягає в пошуку
границі, яка найбільш ефективно розділяє дані на дві класи, з максимальною
можливою широкістю між ними.
Основна відмінність методу максимальної маржі від інших методів
полягає в тому, що він розглядає лише найбільш релевантні вибірки даних. Це

9.30
дозволяє отримати більш точний результат класифікації, зменшити кількість
помилок та зменшити витрати на навчання.
Наприклад, якщо ми маємо дві групи точок, сині та червоні, і ми хочемо
знайти лінію, яка розділяє їх, то метод максимальної маржі допоможе нам
знайти границю з максимальним зазором між класами, що буде найбільш точно
розділяти точки на дві групи.
Метод максимальної маржі (MaximumMargin) є одним з
найпоширеніших методів машинного навчання для бінарної класифікації даних.
Найбільш відомими прикладами таких алгоритмів є SVM та Logistic Regression.
SVM використовує максимально можливий зазор між класами, щоб знайти
найкращу границю, в той час як Logistic Regression використовує функцію
логістичної регресії для знаходження оптимальної границі.
Можливі шляхи розвитку цих методів полягають у вдосконаленні їхньої
точності та швидкості роботи, а також у розширенні для роботи з більш
складними наборами даних, такими як багатокласова класифікація або
класифікація з нерівномірним розподілом даних. Недоліками цих методів є
можливість перенавчання, особливо при використанні SVM, та чутливість до
шуму в даних, особливо при використанні Logistic Regression.
У SVM ми хочемо знайти оптимальну гіперплощину, яка максимально
відділяє два класи даних. Це означає, що для кожного класу ми хочемо мати
точки, які знаходяться на відповідній стороні гіперплощини. Це можна
сформулювати як задачу оптимізації з обмеженнями. Ми хочемо максимізувати
відстань між гіперплощиною та найближчими точками кожного класу, які
знаходяться поруч з гіперплощиною. Це називається шириною маржі.
Формально, якщо ми маємо набір даних для навчання (x_1, y_1), ..., (x_n,
y_n), де x_i – це вектор ознак, а y_i – це мітка класу (+1 або -1), то задача SVM
полягає у знаходженні параметрів w та b таких, що:
minimize 1/2 * ||w||^2
subjecttoy_i(w^Tx_i + b) >= 1 for i = 1, ..., n
де w - це вектор ваг, а b – це зсув (bias). Останнє обмеження вимагає, щоб
всі точки були правильно класифіковані, тобто для точок позитивного класу (y_i
= 1) w^Tx_i + b >= 1, а для точок негативного класу (y_i = -1) w^Tx_i + b <= -1.
Відстань між гіперплощиною та найближчими точками кожного класу є 2 / ||w||.
Однак, у SVM є кілька недоліків, серед яких найбільш відомі:
1. Недостатня ефективність при роботі з великими об'ємами даних,
оскільки алгоритм SVM має квадратичну складність відносно кількості даних;
2. Важка інтерпретація результатів, оскільки SVM використовує
векторну границю прийняття рішень;
3. Чутливість до шуму, що може призводити до поганої класифікації в
окремих випадках.
У той же час, Logistic Regression є простим та ефективним методом, який
часто використовується для бінарної класифікації. Однак, у нього також є свої
недоліки:
1. Залежність від якості вхідних даних, оскільки недостатня кількість
даних або шум може призводити до поганої якості класифікації;

9.31
2. Недостатня ефективність при роботі з великими об'ємами даних,
оскільки алгоритм має лінійну складність відносно кількості даних;
3. Не може працювати з незбалансованими даними без додаткової
настройки.
4. Отже, для поліпшення методів максимальної маржі можливе
поєднання їх з іншими методами, такими як нейронні мережі або глибинне
навчання.
Висновки.
Отже, можна зробити наступні висновки:
1. Застосування штучного інтелекту у БПЛА є дуже важливим для
покращення функціональності та забезпечення безпеки польотів.
2. Обробка великих об'ємів даних БПЛА є складною задачею, але
використання штучного інтелекту, зокрема методів напівкерованого навчання,
може допомогти зменшити кількість даних, необхідних для навчання, що
зменшує витрати та енергію, а також дозволяє отримувати більш точні
результати.
3. Використання нейронних мереж у БПЛА є ефективним засобом для
розв'язання багатьох завдань, зокрема для обробки великих обсягів даних та
класифікації об'єктів на зображеннях.
4. Метод максимальної маржі є ефективним алгоритмом машинного
навчання для класифікації об'єктів, і може бути успішно використаний у
задачах навігації та автопілотування БПЛА.
5. Застосування штучного інтелекту у БПЛА вимагає покращення
алгоритмів та їхню адаптацію до специфіки авіаційних задач, що вимагає
подальшої розробки та дослідження в цьому напрямку.

Список літератури
1. de Bie, T., & Cristianini, N. (2004). Convex methods for transduction. In
Advances in neural processing systems (Vol. 16, pp. 73-80). Vancouver, Canada: MIT
Press.
2. Xu, L., & Schuurmans, D. (2005). Unsupervised and semi-supervised multi-
class support vector machines. In Proceedings of the 20th National Conference on
Artificial Intelligence (pp. 1094-1099). Pittsburgh, PA: AAAI Press.
3. Chapelle, O., Chi, M., & Zien, A. (2006). A continuation method for semi-
supervised SVMs. In Proceedings of the 23rd International Conference on Machine
Learning (pp. 185-192). Pittsburgh, PA: ACM.
4. Chapelle, O., Sindhwani, V., & Keerthi, S. S. (2008). Optimization techniques
for semi-supervised support vector machines. Journal of Machine Learning Research,
9, 203-233.
5. Tarvainen, A., & Valpola, H. (2017). Mean teachers are better role models:
Weight-averaged consistency targets improve semi-supervised deep learning results. In
Proceedings of the 31st International Conference on Neural Information Processing
Systems (pp. 1195-1204). Long Beach.

9.32

You might also like