ВПЛИВ РОЗДІЛЬНОЇ ЗДАТНОСТІ ВХІДНИХ ЗОБРАЖЕНЬ НА ПАРАМЕТРИ МОДЕЛЕЙ YOLO ПРИ ДЕТЕКТУВАННІ ОБ’ЄКТІВ

У статті представлено результати дослідження впливу роздільної здатності вхідних зображень на ключові параметри моделей глибокого навчання YOLOv5 і YOLOv8 при виконанні завдань детектування об’єктів. З урахуванням широкого розповсюдження моделей YOLO у сфері комп’ютерного бачення та автоматизації, о...

Full description

Saved in:
Bibliographic Details
Main Author: Юрій Романович Щебель
Format: Article
Language:English
Published: Odessa National Academy of Food Technologies 2025-07-01
Series:Автоматизация технологических и бизнес-процессов
Subjects:
Online Access:https://journals.ontu.edu.ua/index.php/atbp/article/view/3115
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:У статті представлено результати дослідження впливу роздільної здатності вхідних зображень на ключові параметри моделей глибокого навчання YOLOv5 і YOLOv8 при виконанні завдань детектування об’єктів. З урахуванням широкого розповсюдження моделей YOLO у сфері комп’ютерного бачення та автоматизації, особливо в системах реального часу, актуальним є питання визначення оптимальних параметрів їх застосування для забезпечення балансу між точністю виявлення об’єктів та продуктивністю систем. У дослідженні було проведено серію експериментів із використанням набору даних COCO128 та вхідних зображень з роздільною здатністю в межах від 256х256 до 1280х1280 пікселів. У процесі дослідження аналізувалися такі метрики, як точність (Precision), повнота (Recall), середня точність при порозі IoU=0.5 (mAP@0.5), середня точність при порогах IoU від 0.5 до 0.95 (mAP@0.5:0.95), час інференції (Inference Time) та частота обробки кадрів (FPS). За допомогою апроксимаційного моделювання було побудовано залежності між зазначеними параметрами та роздільною здатністю вхідних даних. Результати дослідження показали, що збільшення роздільної здатності позитивно впливає на якість виявлення об’єктів, однак суттєво знижує швидкодію моделей, що є критичним фактором для систем реального часу. Найбільш оптимальні параметри для використання моделей YOLOv5 досягаються при роздільній здатності вхідних зображень не вище 512 пікселів, що забезпечує прийнятний баланс між точністю та продуктивністю. Для моделі YOLOv8 рекомендовано використовувати роздільну здатність в діапазоні 640–800 пікселів, що дозволяє досягти високих показників точності при прийнятній продуктивності. Отримані результати можуть бути використані при проектуванні систем відеоспостереження, автономних роботизованих систем, інтелектуальних транспортних засобів та інших прикладних рішень, де важливо забезпечити оптимальне поєднання точності розпізнавання та обчислювальної ефективності.
ISSN:2312-3125
2312-931X