ІДЕНТИФІКАЦІЯ ПАРАМЕТРІВ ДИНАМІЧНИХ ОБ’ЄКТІВ З ВИКОРИСТАННЯМ ТРАНСФОРМЕРА З ОПТИЧНИМ ПОТОКОМ ТА АНСАМБЛЕВИХ МЕТОДІВ

У статті розглянуто підхід до ідентифікації параметрів динамічних об’єктів у відеопотоці з використанням трансформерної архітектури, моделі GeoNet та ансамблевих методів машинного навчання, зокрема бегінгу та бустінгу. Ідентифікація параметрів таких об’єктів, як положення, швидкість, напрям руху та...

Full description

Saved in:
Bibliographic Details
Main Authors: Oleksii Kondratov, Olena Nikulina
Format: Article
Language:English
Published: National Technical University Kharkiv Polytechnic Institute 2025-07-01
Series:Вісник Національного технічного університету "ХПÌ": Системний аналіз, управління та інформаційні технології
Subjects:
Online Access:http://samit.khpi.edu.ua/article/view/335107
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1849319830568566784
author Oleksii Kondratov
Olena Nikulina
author_facet Oleksii Kondratov
Olena Nikulina
author_sort Oleksii Kondratov
collection DOAJ
description У статті розглянуто підхід до ідентифікації параметрів динамічних об’єктів у відеопотоці з використанням трансформерної архітектури, моделі GeoNet та ансамблевих методів машинного навчання, зокрема бегінгу та бустінгу. Ідентифікація параметрів таких об’єктів, як положення, швидкість, напрям руху та глибина, має важливе значення для широкого спектра застосувань, включаючи автономне водіння, робототехніку та системи відеоспостереження. У роботі описано комплексну систему, яка забезпечує інтеграцію просторово-часових характеристик відеопотоку через обчислення оптичного потоку та карти глибини за допомогою GeoNet, їх подальший аналіз із застосуванням трансформера, а також підвищення точності завдяки ансамблюванню результатів. GeoNet, як глибока згорткова нейронна мережа, об’єднує завдання оцінки глибини та оптичного потоку в єдину архітектуру, що дозволяє точно реконструювати тривимірну сцену. Використання трансформера дозволяє моделювати глобальні залежності в кадрах відео та покращити точність класифікації та виявлення об’єктів. Водночас, бегінг зменшує дисперсію шляхом усереднення результатів кількох моделей, навчених на різних підвибірках, а бустінг дозволяє фокусуватися на складних прикладах для підвищення точності прогнозу. Запропонована система забезпечує високу точність в умовах динамічного фону, зміни освітлення, оклюзії та шумів, завдяки чому може бути адаптована для використання в реальному часі в складних сценах. Наведено детальний опис кожного з компонентів системи: архітектури GeoNet, модулів трансформера, реалізації бегінгу та бустінгу, а також алгоритму об’єднання результатів. Очікувані результати мають демонструвати ефективність інтеграції методів глибокого навчання з класичними ансамблевими підходами для задач високоточної ідентифікації динамічних об’єктів. Запропонована методологія відкриває перспективи для створення інтелектуальних систем комп’ютерного зору нового покоління.
format Article
id doaj-art-204f8b2c93e645ff97fc09644aaeb374
institution Kabale University
issn 2079-0023
2410-2857
language English
publishDate 2025-07-01
publisher National Technical University Kharkiv Polytechnic Institute
record_format Article
series Вісник Національного технічного університету "ХПÌ": Системний аналіз, управління та інформаційні технології
spelling doaj-art-204f8b2c93e645ff97fc09644aaeb3742025-08-20T03:50:17ZengNational Technical University Kharkiv Polytechnic InstituteВісник Національного технічного університету "ХПÌ": Системний аналіз, управління та інформаційні технології2079-00232410-28572025-07-011 (13)10611110.20998/2079-0023.2025.01.16373926ІДЕНТИФІКАЦІЯ ПАРАМЕТРІВ ДИНАМІЧНИХ ОБ’ЄКТІВ З ВИКОРИСТАННЯМ ТРАНСФОРМЕРА З ОПТИЧНИМ ПОТОКОМ ТА АНСАМБЛЕВИХ МЕТОДІВOleksii Kondratov0https://orcid.org/0000-0001-6367-9944Olena Nikulina1https://orcid.org/0000-0003-2938-4215Національний технічний університет «Харківський політехнічний інститут»Національний технічний університет «Харківський політехнічний інститут»У статті розглянуто підхід до ідентифікації параметрів динамічних об’єктів у відеопотоці з використанням трансформерної архітектури, моделі GeoNet та ансамблевих методів машинного навчання, зокрема бегінгу та бустінгу. Ідентифікація параметрів таких об’єктів, як положення, швидкість, напрям руху та глибина, має важливе значення для широкого спектра застосувань, включаючи автономне водіння, робототехніку та системи відеоспостереження. У роботі описано комплексну систему, яка забезпечує інтеграцію просторово-часових характеристик відеопотоку через обчислення оптичного потоку та карти глибини за допомогою GeoNet, їх подальший аналіз із застосуванням трансформера, а також підвищення точності завдяки ансамблюванню результатів. GeoNet, як глибока згорткова нейронна мережа, об’єднує завдання оцінки глибини та оптичного потоку в єдину архітектуру, що дозволяє точно реконструювати тривимірну сцену. Використання трансформера дозволяє моделювати глобальні залежності в кадрах відео та покращити точність класифікації та виявлення об’єктів. Водночас, бегінг зменшує дисперсію шляхом усереднення результатів кількох моделей, навчених на різних підвибірках, а бустінг дозволяє фокусуватися на складних прикладах для підвищення точності прогнозу. Запропонована система забезпечує високу точність в умовах динамічного фону, зміни освітлення, оклюзії та шумів, завдяки чому може бути адаптована для використання в реальному часі в складних сценах. Наведено детальний опис кожного з компонентів системи: архітектури GeoNet, модулів трансформера, реалізації бегінгу та бустінгу, а також алгоритму об’єднання результатів. Очікувані результати мають демонструвати ефективність інтеграції методів глибокого навчання з класичними ансамблевими підходами для задач високоточної ідентифікації динамічних об’єктів. Запропонована методологія відкриває перспективи для створення інтелектуальних систем комп’ютерного зору нового покоління.http://samit.khpi.edu.ua/article/view/335107дистанційна ідентифікація динамічних об’єктіввиявлення об’єктівкомп’ютерний зірансамблеві методиглибоке навчаннязгорткові нейронні мережіархітектура системипрограмне забезпеченнямашинне навчанняштучний інтелект
spellingShingle Oleksii Kondratov
Olena Nikulina
ІДЕНТИФІКАЦІЯ ПАРАМЕТРІВ ДИНАМІЧНИХ ОБ’ЄКТІВ З ВИКОРИСТАННЯМ ТРАНСФОРМЕРА З ОПТИЧНИМ ПОТОКОМ ТА АНСАМБЛЕВИХ МЕТОДІВ
Вісник Національного технічного університету "ХПÌ": Системний аналіз, управління та інформаційні технології
дистанційна ідентифікація динамічних об’єктів
виявлення об’єктів
комп’ютерний зір
ансамблеві методи
глибоке навчання
згорткові нейронні мережі
архітектура системи
програмне забезпечення
машинне навчання
штучний інтелект
title ІДЕНТИФІКАЦІЯ ПАРАМЕТРІВ ДИНАМІЧНИХ ОБ’ЄКТІВ З ВИКОРИСТАННЯМ ТРАНСФОРМЕРА З ОПТИЧНИМ ПОТОКОМ ТА АНСАМБЛЕВИХ МЕТОДІВ
title_full ІДЕНТИФІКАЦІЯ ПАРАМЕТРІВ ДИНАМІЧНИХ ОБ’ЄКТІВ З ВИКОРИСТАННЯМ ТРАНСФОРМЕРА З ОПТИЧНИМ ПОТОКОМ ТА АНСАМБЛЕВИХ МЕТОДІВ
title_fullStr ІДЕНТИФІКАЦІЯ ПАРАМЕТРІВ ДИНАМІЧНИХ ОБ’ЄКТІВ З ВИКОРИСТАННЯМ ТРАНСФОРМЕРА З ОПТИЧНИМ ПОТОКОМ ТА АНСАМБЛЕВИХ МЕТОДІВ
title_full_unstemmed ІДЕНТИФІКАЦІЯ ПАРАМЕТРІВ ДИНАМІЧНИХ ОБ’ЄКТІВ З ВИКОРИСТАННЯМ ТРАНСФОРМЕРА З ОПТИЧНИМ ПОТОКОМ ТА АНСАМБЛЕВИХ МЕТОДІВ
title_short ІДЕНТИФІКАЦІЯ ПАРАМЕТРІВ ДИНАМІЧНИХ ОБ’ЄКТІВ З ВИКОРИСТАННЯМ ТРАНСФОРМЕРА З ОПТИЧНИМ ПОТОКОМ ТА АНСАМБЛЕВИХ МЕТОДІВ
title_sort ідентифікація параметрів динамічних об єктів з використанням трансформера з оптичним потоком та ансамблевих методів
topic дистанційна ідентифікація динамічних об’єктів
виявлення об’єктів
комп’ютерний зір
ансамблеві методи
глибоке навчання
згорткові нейронні мережі
архітектура системи
програмне забезпечення
машинне навчання
штучний інтелект
url http://samit.khpi.edu.ua/article/view/335107
work_keys_str_mv AT oleksiikondratov ídentifíkacíâparametrívdinamíčnihobêktívzvikoristannâmtransformerazoptičnimpotokomtaansamblevihmetodív
AT olenanikulina ídentifíkacíâparametrívdinamíčnihobêktívzvikoristannâmtransformerazoptičnimpotokomtaansamblevihmetodív