ВПЛИВ РОЗДІЛЬНОЇ ЗДАТНОСТІ ВХІДНИХ ЗОБРАЖЕНЬ НА ПАРАМЕТРИ МОДЕЛЕЙ YOLO ПРИ ДЕТЕКТУВАННІ ОБ’ЄКТІВ
У статті представлено результати дослідження впливу роздільної здатності вхідних зображень на ключові параметри моделей глибокого навчання YOLOv5 і YOLOv8 при виконанні завдань детектування об’єктів. З урахуванням широкого розповсюдження моделей YOLO у сфері комп’ютерного бачення та автоматизації, о...
Saved in:
| Main Author: | |
|---|---|
| Format: | Article |
| Language: | English |
| Published: |
Odessa National Academy of Food Technologies
2025-07-01
|
| Series: | Автоматизация технологических и бизнес-процессов |
| Subjects: | |
| Online Access: | https://journals.ontu.edu.ua/index.php/atbp/article/view/3115 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| Summary: | У статті представлено результати дослідження впливу роздільної здатності вхідних зображень на ключові параметри моделей глибокого навчання YOLOv5 і YOLOv8 при виконанні завдань детектування об’єктів. З урахуванням широкого розповсюдження моделей YOLO у сфері комп’ютерного бачення та автоматизації, особливо в системах реального часу, актуальним є питання визначення оптимальних параметрів їх застосування для забезпечення балансу між точністю виявлення об’єктів та продуктивністю систем. У дослідженні було проведено серію експериментів із використанням набору даних COCO128 та вхідних зображень з роздільною здатністю в межах від 256х256 до 1280х1280 пікселів. У процесі дослідження аналізувалися такі метрики, як точність (Precision), повнота (Recall), середня точність при порозі IoU=0.5 (mAP@0.5), середня точність при порогах IoU від 0.5 до 0.95 (mAP@0.5:0.95), час інференції (Inference Time) та частота обробки кадрів (FPS). За допомогою апроксимаційного моделювання було побудовано залежності між зазначеними параметрами та роздільною здатністю вхідних даних. Результати дослідження показали, що збільшення роздільної здатності позитивно впливає на якість виявлення об’єктів, однак суттєво знижує швидкодію моделей, що є критичним фактором для систем реального часу. Найбільш оптимальні параметри для використання моделей YOLOv5 досягаються при роздільній здатності вхідних зображень не вище 512 пікселів, що забезпечує прийнятний баланс між точністю та продуктивністю. Для моделі YOLOv8 рекомендовано використовувати роздільну здатність в діапазоні 640–800 пікселів, що дозволяє досягти високих показників точності при прийнятній продуктивності. Отримані результати можуть бути використані при проектуванні систем відеоспостереження, автономних роботизованих систем, інтелектуальних транспортних засобів та інших прикладних рішень, де важливо забезпечити оптимальне поєднання точності розпізнавання та обчислювальної ефективності. |
|---|---|
| ISSN: | 2312-3125 2312-931X |