Аналіз сучасних нейромережевих методів обробки візуальної інформації в системах навігації високошвидкісних ПМР

  • Антоній Лупандін Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 4, Харків, 61022, Україна https://orcid.org/0009-0002-7591-5152
  • Ольга Мороз Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 4, Харків, 61022, Україна https://orcid.org/0000-0002-4920-4093
Ключові слова: ПМР, високошвидкісна навігація, CNN, Vision Transformer, SLAM, Reinforcement Learning, edge-обчислення, Jetson, TensorRT, квантування, проріджування, гібридні архітектури

Анотація

Актуальність. Стрімка еволюція безпілотних літальних апаратів (БПЛА) — від дистанційно керованих платформ до повністю автономних високошвидкісних повітряних мобільних роботів — зумовлює підвищений запит на вдосконалені методи бортового сприйняття та навігації. Потреба в таких підходах особливо відчутна в умовах, коли обчислювальна затримка, шум сенсорів та складність навколишнього середовища підривають надійність класичних комп’ютерно-зорових систем. Попри суттєвий прогрес у сфері глибокого навчання, наявні підходи до обробки візуальної інформації — зокрема CNN-детектори, семантичні моделі на основі Transformer-архітектур та SLAM-модулі з елементами навчання — залишаються фрагментованими та недостатньо адаптованими до жорстких обмежень за розміром, вагою та енергоспоживанням (SWaP), властивих вбудованим платформам на кшталт NVIDIA Jetson. Це актуалізує потребу в системному огляді сучасних нейроархітектур, придатних для роботи в режимі реального часу на високошвидкісних ПМР.

Мета. Метою дослідження є аналіз сучасних нейронних методів вторинної обробки візуальної інформації в навігаційних системах ПМР, порівняння сфер застосування Convolutional Neural Networks (CNNs) і Vision Transformers (ViTs), оцінювання їх інтеграції у SLAM-підсистеми та визначення вимог до гібридних архітектур, здатних забезпечити повністю автономний високошвидкісний політ.

Методи. У роботі використано порівняльний аналіз сучасних підходів глибокого навчання, включаючи CNN-детектори сімейства YOLO, візуальні моделі на основі Transformer-архітектур, SLAM-компоненти з нейронними модулями та методи управління на основі Deep Reinforcement Learning (DRL). Оцінювання здійснювалося за критеріями затримки, семантичної стійкості, роботи в динамічних сценах, сумісності з вбудованим обладнанням, ефективності квантування, потенціалу структурного проріджування та продуктивності оптимізації TensorRT на пристроях NVIDIA Jetson.

Результати. Дослідження встановило, що CNN-архітектури забезпечують найкращу продуктивність у режимі реального часу та залишаються незамінними для високочастотного рефлекторного сприйняття, тоді як Vision Transformers демонструють кращу здатність до глобального контекстного аналізу й стійкість до оклюзій, але зазнають значних обчислювальних витрат на вбудованих GPU. Нейронно підсилені SLAM-методи покращують стабільність ознак та відсіювання динамічних об’єктів, проте вимагають ретельної інтеграції для збереження роботи в реальному часі. Аналіз апаратної реалізації показав, що квантування, структурне проріджування та оптимізація TensorRT є критично важливими для розгортання глибоких моделей на платформах Jetson, хоча ViT-архітектури демонструють обмежену толерантність до INT8-квантування. На основі отриманих результатів сформульовано концепцію гібридної архітектури, що поєднує рефлекторну швидкодію CNN-модулів із когнітивними можливостями моделей Transformer-типу.

Висновки. Результати дослідження підтверджують необхідність розроблення гібридних нейроархітектур, які інтегрують швидкодію та апаратну ефективність CNN-мереж із семантичною глибиною Transformer-моделей. Такі системи становлять перспективний напрям розвитку надійної, повністю автономної високошвидкісної навігації ПМР. Запропоновані принципи акцентують на ієрархічному управлінні, асинхронних контурах сприйняття та апаратно орієнтованій оптимізації як ключових чинниках для створення ПМР нового покоління.

Завантаження

##plugins.generic.usageStats.noStats##

Біографії авторів

Антоній Лупандін, Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 4, Харків, 61022, Україна

аспірант кафедри комп'ютерних систем та робототехніки

Ольга Мороз, Харківський національний університет імені В.Н. Каразіна, майдан Свободи, 4, Харків, 61022, Україна

PhD комп’ютерних наук; доцент кафедри комп'ютерних систем та робототехніки

Посилання

/

Посилання

Опубліковано
2025-12-22
Як цитувати
Лупандін, А., & Мороз, О. (2025). Аналіз сучасних нейромережевих методів обробки візуальної інформації в системах навігації високошвидкісних ПМР. Вісник Харківського національного університету імені В.Н. Каразіна, серія «Математичне моделювання. Інформаційні технології. Автоматизовані системи управління», 68, 53-61. https://doi.org/10.26565/2304-6201-2025-68-05
Розділ
Статті