ІДЕНТИФІКАЦІЯ ПАРАМЕТРІВ ДИНАМІЧНИХ ОБ’ЄКТІВ З ВИКОРИСТАННЯМ ТРАНСФОРМЕРА З ОПТИЧНИМ ПОТОКОМ ТА АНСАМБЛЕВИХ МЕТОДІВ
У статті розглянуто підхід до ідентифікації параметрів динамічних об’єктів у відеопотоці з використанням трансформерної архітектури, моделі GeoNet та ансамблевих методів машинного навчання, зокрема бегінгу та бустінгу. Ідентифікація параметрів таких об’єктів, як положення, швидкість, напрям руху та...
Saved in:
| Main Authors: | , |
|---|---|
| Format: | Article |
| Language: | English |
| Published: |
National Technical University Kharkiv Polytechnic Institute
2025-07-01
|
| Series: | Вісник Національного технічного університету "ХПÌ": Системний аналіз, управління та інформаційні технології |
| Subjects: | |
| Online Access: | http://samit.khpi.edu.ua/article/view/335107 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| _version_ | 1849319830568566784 |
|---|---|
| author | Oleksii Kondratov Olena Nikulina |
| author_facet | Oleksii Kondratov Olena Nikulina |
| author_sort | Oleksii Kondratov |
| collection | DOAJ |
| description | У статті розглянуто підхід до ідентифікації параметрів динамічних об’єктів у відеопотоці з використанням трансформерної архітектури, моделі GeoNet та ансамблевих методів машинного навчання, зокрема бегінгу та бустінгу. Ідентифікація параметрів таких об’єктів, як положення, швидкість, напрям руху та глибина, має важливе значення для широкого спектра застосувань, включаючи автономне водіння, робототехніку та системи відеоспостереження. У роботі описано комплексну систему, яка забезпечує інтеграцію просторово-часових характеристик відеопотоку через обчислення оптичного потоку та карти глибини за допомогою GeoNet, їх подальший аналіз із застосуванням трансформера, а також підвищення точності завдяки ансамблюванню результатів. GeoNet, як глибока згорткова нейронна мережа, об’єднує завдання оцінки глибини та оптичного потоку в єдину архітектуру, що дозволяє точно реконструювати тривимірну сцену. Використання трансформера дозволяє моделювати глобальні залежності в кадрах відео та покращити точність класифікації та виявлення об’єктів. Водночас, бегінг зменшує дисперсію шляхом усереднення результатів кількох моделей, навчених на різних підвибірках, а бустінг дозволяє фокусуватися на складних прикладах для підвищення точності прогнозу. Запропонована система забезпечує високу точність в умовах динамічного фону, зміни освітлення, оклюзії та шумів, завдяки чому може бути адаптована для використання в реальному часі в складних сценах. Наведено детальний опис кожного з компонентів системи: архітектури GeoNet, модулів трансформера, реалізації бегінгу та бустінгу, а також алгоритму об’єднання результатів. Очікувані результати мають демонструвати ефективність інтеграції методів глибокого навчання з класичними ансамблевими підходами для задач високоточної ідентифікації динамічних об’єктів. Запропонована методологія відкриває перспективи для створення інтелектуальних систем комп’ютерного зору нового покоління. |
| format | Article |
| id | doaj-art-204f8b2c93e645ff97fc09644aaeb374 |
| institution | Kabale University |
| issn | 2079-0023 2410-2857 |
| language | English |
| publishDate | 2025-07-01 |
| publisher | National Technical University Kharkiv Polytechnic Institute |
| record_format | Article |
| series | Вісник Національного технічного університету "ХПÌ": Системний аналіз, управління та інформаційні технології |
| spelling | doaj-art-204f8b2c93e645ff97fc09644aaeb3742025-08-20T03:50:17ZengNational Technical University Kharkiv Polytechnic InstituteВісник Національного технічного університету "ХПÌ": Системний аналіз, управління та інформаційні технології2079-00232410-28572025-07-011 (13)10611110.20998/2079-0023.2025.01.16373926ІДЕНТИФІКАЦІЯ ПАРАМЕТРІВ ДИНАМІЧНИХ ОБ’ЄКТІВ З ВИКОРИСТАННЯМ ТРАНСФОРМЕРА З ОПТИЧНИМ ПОТОКОМ ТА АНСАМБЛЕВИХ МЕТОДІВOleksii Kondratov0https://orcid.org/0000-0001-6367-9944Olena Nikulina1https://orcid.org/0000-0003-2938-4215Національний технічний університет «Харківський політехнічний інститут»Національний технічний університет «Харківський політехнічний інститут»У статті розглянуто підхід до ідентифікації параметрів динамічних об’єктів у відеопотоці з використанням трансформерної архітектури, моделі GeoNet та ансамблевих методів машинного навчання, зокрема бегінгу та бустінгу. Ідентифікація параметрів таких об’єктів, як положення, швидкість, напрям руху та глибина, має важливе значення для широкого спектра застосувань, включаючи автономне водіння, робототехніку та системи відеоспостереження. У роботі описано комплексну систему, яка забезпечує інтеграцію просторово-часових характеристик відеопотоку через обчислення оптичного потоку та карти глибини за допомогою GeoNet, їх подальший аналіз із застосуванням трансформера, а також підвищення точності завдяки ансамблюванню результатів. GeoNet, як глибока згорткова нейронна мережа, об’єднує завдання оцінки глибини та оптичного потоку в єдину архітектуру, що дозволяє точно реконструювати тривимірну сцену. Використання трансформера дозволяє моделювати глобальні залежності в кадрах відео та покращити точність класифікації та виявлення об’єктів. Водночас, бегінг зменшує дисперсію шляхом усереднення результатів кількох моделей, навчених на різних підвибірках, а бустінг дозволяє фокусуватися на складних прикладах для підвищення точності прогнозу. Запропонована система забезпечує високу точність в умовах динамічного фону, зміни освітлення, оклюзії та шумів, завдяки чому може бути адаптована для використання в реальному часі в складних сценах. Наведено детальний опис кожного з компонентів системи: архітектури GeoNet, модулів трансформера, реалізації бегінгу та бустінгу, а також алгоритму об’єднання результатів. Очікувані результати мають демонструвати ефективність інтеграції методів глибокого навчання з класичними ансамблевими підходами для задач високоточної ідентифікації динамічних об’єктів. Запропонована методологія відкриває перспективи для створення інтелектуальних систем комп’ютерного зору нового покоління.http://samit.khpi.edu.ua/article/view/335107дистанційна ідентифікація динамічних об’єктіввиявлення об’єктівкомп’ютерний зірансамблеві методиглибоке навчаннязгорткові нейронні мережіархітектура системипрограмне забезпеченнямашинне навчанняштучний інтелект |
| spellingShingle | Oleksii Kondratov Olena Nikulina ІДЕНТИФІКАЦІЯ ПАРАМЕТРІВ ДИНАМІЧНИХ ОБ’ЄКТІВ З ВИКОРИСТАННЯМ ТРАНСФОРМЕРА З ОПТИЧНИМ ПОТОКОМ ТА АНСАМБЛЕВИХ МЕТОДІВ Вісник Національного технічного університету "ХПÌ": Системний аналіз, управління та інформаційні технології дистанційна ідентифікація динамічних об’єктів виявлення об’єктів комп’ютерний зір ансамблеві методи глибоке навчання згорткові нейронні мережі архітектура системи програмне забезпечення машинне навчання штучний інтелект |
| title | ІДЕНТИФІКАЦІЯ ПАРАМЕТРІВ ДИНАМІЧНИХ ОБ’ЄКТІВ З ВИКОРИСТАННЯМ ТРАНСФОРМЕРА З ОПТИЧНИМ ПОТОКОМ ТА АНСАМБЛЕВИХ МЕТОДІВ |
| title_full | ІДЕНТИФІКАЦІЯ ПАРАМЕТРІВ ДИНАМІЧНИХ ОБ’ЄКТІВ З ВИКОРИСТАННЯМ ТРАНСФОРМЕРА З ОПТИЧНИМ ПОТОКОМ ТА АНСАМБЛЕВИХ МЕТОДІВ |
| title_fullStr | ІДЕНТИФІКАЦІЯ ПАРАМЕТРІВ ДИНАМІЧНИХ ОБ’ЄКТІВ З ВИКОРИСТАННЯМ ТРАНСФОРМЕРА З ОПТИЧНИМ ПОТОКОМ ТА АНСАМБЛЕВИХ МЕТОДІВ |
| title_full_unstemmed | ІДЕНТИФІКАЦІЯ ПАРАМЕТРІВ ДИНАМІЧНИХ ОБ’ЄКТІВ З ВИКОРИСТАННЯМ ТРАНСФОРМЕРА З ОПТИЧНИМ ПОТОКОМ ТА АНСАМБЛЕВИХ МЕТОДІВ |
| title_short | ІДЕНТИФІКАЦІЯ ПАРАМЕТРІВ ДИНАМІЧНИХ ОБ’ЄКТІВ З ВИКОРИСТАННЯМ ТРАНСФОРМЕРА З ОПТИЧНИМ ПОТОКОМ ТА АНСАМБЛЕВИХ МЕТОДІВ |
| title_sort | ідентифікація параметрів динамічних об єктів з використанням трансформера з оптичним потоком та ансамблевих методів |
| topic | дистанційна ідентифікація динамічних об’єктів виявлення об’єктів комп’ютерний зір ансамблеві методи глибоке навчання згорткові нейронні мережі архітектура системи програмне забезпечення машинне навчання штучний інтелект |
| url | http://samit.khpi.edu.ua/article/view/335107 |
| work_keys_str_mv | AT oleksiikondratov ídentifíkacíâparametrívdinamíčnihobêktívzvikoristannâmtransformerazoptičnimpotokomtaansamblevihmetodív AT olenanikulina ídentifíkacíâparametrívdinamíčnihobêktívzvikoristannâmtransformerazoptičnimpotokomtaansamblevihmetodív |