Агентно-орієнтований метод кластеризації даних оптового дистриб’ютора

  • Володимир Донець Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 6, Харків, Україна, 61022 https://orcid.org/0000-0002-5963-9998
  • Вікторія Стрілець Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 6, Харків, Україна, 61022 https://orcid.org/0000-0002-2475-1496
  • Дмитро Шевченко Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 6, Харків, Україна, 61022 https://orcid.org/0000-0002-7897-250X
  • Сергій Шматков Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 6, Харків, Україна, 61022 https://orcid.org/0000-0002-0298-7174
Ключові слова: нечітка кластеризація, мультиагентний підхід, обробка даних, перетворення Бокса-Кокса, метод PCA, метод t-SNE, автокодувальник, дивергенція Кульбака-Лейблера, відстань Махаланобіса, Мангеттенська відстань

Анотація

Мета роботи полягає в підвищенні точності кластеризації даних, та визначення цільової кількості кластерів даних, генерованих динамічними економічними системами, за допомогою використання агентно-орієнтованого методу кластеризації з впровадженням методів попередньої обробки даних.

Методи дослідження: в ході виконання досліджень були використані методи обробки та підготовки даних, міри елементної відстані та методи кластеризації. Програмне забезпечення розроблено за допомогою мови Python, були використані бібліотеки scikit-learn, NumPy, SciPy, Pandas, PyTorch й інші.

У результаті роботи дані оптового дистриб’ютора було оброблено методами попередньої обробки даних, такими як: визначення пропущених значень, визначення асиметрії та перетворення Бокса-Кокса, проведена нормалізація даних з методом мін-макс нормалізації та проведене зменшення розмірності з методам PCA та t-SNE. Був застосований агентно-орієнтований метод кластеризації з різними метриками (Мангеттенська відстань, відстань Махаланобіса з оберненим значення функції приналежності, дивергенція Кульбака-Лейблера та крос-ентропія). Дивергенція Кульбака-Лейблера показала найкращі результати точності й була обрана для подальшого тестування. Також була протестована спроможність агентно-орієнтованого методу визначати кількість кластерів. Використання методів попередньої обробки даних показало явну присутність 3-х цільових кластерів, що було підтверджено методом. Висновки: розроблений метод показав високі результати точності кластеризації за рахунок проведеної обробки даних, правильно обраної міри елементної відстані та використання агентно-орієнтованого підходу. Цей метод можна використовувати для покращення якості кластеризації даних динамічних економічних систем, але метод вимагає доопрацювання в збільшенні гнучкості щодо визначення розміру агентів-кластерів.

Завантаження

##plugins.generic.usageStats.noStats##

Біографії авторів

Володимир Донець, Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 6, Харків, Україна, 61022

аспірант

Вікторія Стрілець, Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 6, Харків, Україна, 61022

к.т.н., доцент кафедри теоретичної та прикладної системотехніки

Дмитро Шевченко, Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 6, Харків, Україна, 61022

аспірант

Сергій Шматков, Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 6, Харків, Україна, 61022

д.т.н., проф., завідувач кафедри теоретичної та прикладної системотехніки

Посилання

/

Посилання

Опубліковано
2022-10-31
Як цитувати
Донець, В., Стрілець, В., Шевченко, Д., & Шматков, С. (2022). Агентно-орієнтований метод кластеризації даних оптового дистриб’ютора. Вісник Харківського національного університету імені В.Н. Каразіна, серія «Математичне моделювання. Інформаційні технології. Автоматизовані системи управління», 55, 6-18. https://doi.org/10.26565/2304-6201-2022-55-01
Розділ
Статті