Визначення віку людини за фото на основі нейронних мереж
Метою цієї роботи було порівняти різні архітектури нейронних мереж для задачі оцінки віку за зображеннями облич. Оскільки вік є неперервною змінною, задачу визначення віку людини за зображеннями її обличчя розглядають як задачу регресії. У цій роботі використовувався набір даних UTKFaces. Цей набір...
Saved in:
| Main Authors: | , |
|---|---|
| Format: | Article |
| Language: | English |
| Published: |
Oles Honchar Dnipro National University
2024-06-01
|
| Series: | Challenges and Issues of Modern Science |
| Subjects: | |
| Online Access: | https://cims.fti.dp.ua/j/article/view/183 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| _version_ | 1850198894537867264 |
|---|---|
| author | Євгеній Вербенко Ольга Мацуга |
| author_facet | Євгеній Вербенко Ольга Мацуга |
| author_sort | Євгеній Вербенко |
| collection | DOAJ |
| description |
Метою цієї роботи було порівняти різні архітектури нейронних мереж для задачі оцінки віку за зображеннями облич. Оскільки вік є неперервною змінною, задачу визначення віку людини за зображеннями її обличчя розглядають як задачу регресії. У цій роботі використовувався набір даних UTKFaces. Цей набір містить 24 000 анотованих зображень, категоризованих за статтю, расою та віком. Для вирішення задачі було обрано чотири архітектури для навчання: AlexNet, VGG-19, ResNet-50 та Inception-v4. Ці архітектури згорткових нейронних мереж показали значні досягнення в класифікації зображень на наборі даних ImageNet. AlexNet впровадив використання ReLU-активації, dropout та max-pooling, тоді як VGG-19 підкреслив глибші архітектури з малими фільтрами. ResNet-50 вирішив проблему зникнення градієнта за допомогою залишкових зв'язків, а Inception-v4 покращив ефективність і потік градієнта за допомогою оптимізованих блоків та залишкових зв'язків. У всіх мережах останній шар був замінений на повнозв'язний шар з одним нейроном і лінійною активаційною функцією. Під час навчання як функцію втрат використовували середньоквадратичну помилку (MSE), а як метричну якості – середню абсолютну помилку (MAE). Дані були розділені на навчальний та тестовий набори у співвідношенні 90% до 10%. Перед навчанням зображення були нормалізовані та змінені до розмірів, що відповідають вимогам кожної нейронної мережі. AlexNet та VGG-19 навчалися з використанням оптимізатора SGD з коефіцієнтом навчання 0.2, ResNet-50 навчався з використанням оптимізатора Adam з коефіцієнтом навчання 0.02, а Inception-v4 навчався з використанням оптимізатора Adadelta з коефіцієнтом навчання 0.02. Ці методи та їхні параметри були обрані як найкращі після обчислювальних експериментів. Кожна мережа навчалася різну кількість епох, необхідних для збіжності. Після навчання VGG-19 та ResNet-50 досягли значень MAE 2.7 та 3.5 відповідно, тоді як Inception-v4 мала значення MAE 3.87. AlexNet продемонстрував значне перенавчання. ResNet-50 обробляв зображення найшвидше.
|
| format | Article |
| id | doaj-art-7fcc4f34494743adb7352969e8a358f2 |
| institution | OA Journals |
| issn | 3083-5704 |
| language | English |
| publishDate | 2024-06-01 |
| publisher | Oles Honchar Dnipro National University |
| record_format | Article |
| series | Challenges and Issues of Modern Science |
| spelling | doaj-art-7fcc4f34494743adb7352969e8a358f22025-08-20T02:12:45ZengOles Honchar Dnipro National UniversityChallenges and Issues of Modern Science3083-57042024-06-012Визначення віку людини за фото на основі нейронних мережЄвгеній Вербенко0https://orcid.org/0009-0001-8438-4990Ольга Мацуга1https://orcid.org/0000-0001-6444-8566Дніпровський національний університет імені Олеся ГончараДніпровський національний університет імені Олеся Гончара Метою цієї роботи було порівняти різні архітектури нейронних мереж для задачі оцінки віку за зображеннями облич. Оскільки вік є неперервною змінною, задачу визначення віку людини за зображеннями її обличчя розглядають як задачу регресії. У цій роботі використовувався набір даних UTKFaces. Цей набір містить 24 000 анотованих зображень, категоризованих за статтю, расою та віком. Для вирішення задачі було обрано чотири архітектури для навчання: AlexNet, VGG-19, ResNet-50 та Inception-v4. Ці архітектури згорткових нейронних мереж показали значні досягнення в класифікації зображень на наборі даних ImageNet. AlexNet впровадив використання ReLU-активації, dropout та max-pooling, тоді як VGG-19 підкреслив глибші архітектури з малими фільтрами. ResNet-50 вирішив проблему зникнення градієнта за допомогою залишкових зв'язків, а Inception-v4 покращив ефективність і потік градієнта за допомогою оптимізованих блоків та залишкових зв'язків. У всіх мережах останній шар був замінений на повнозв'язний шар з одним нейроном і лінійною активаційною функцією. Під час навчання як функцію втрат використовували середньоквадратичну помилку (MSE), а як метричну якості – середню абсолютну помилку (MAE). Дані були розділені на навчальний та тестовий набори у співвідношенні 90% до 10%. Перед навчанням зображення були нормалізовані та змінені до розмірів, що відповідають вимогам кожної нейронної мережі. AlexNet та VGG-19 навчалися з використанням оптимізатора SGD з коефіцієнтом навчання 0.2, ResNet-50 навчався з використанням оптимізатора Adam з коефіцієнтом навчання 0.02, а Inception-v4 навчався з використанням оптимізатора Adadelta з коефіцієнтом навчання 0.02. Ці методи та їхні параметри були обрані як найкращі після обчислювальних експериментів. Кожна мережа навчалася різну кількість епох, необхідних для збіжності. Після навчання VGG-19 та ResNet-50 досягли значень MAE 2.7 та 3.5 відповідно, тоді як Inception-v4 мала значення MAE 3.87. AlexNet продемонстрував значне перенавчання. ResNet-50 обробляв зображення найшвидше. https://cims.fti.dp.ua/j/article/view/183нейронні мережірегресіяUTKFacesоцінка віку |
| spellingShingle | Євгеній Вербенко Ольга Мацуга Визначення віку людини за фото на основі нейронних мереж Challenges and Issues of Modern Science нейронні мережі регресія UTKFaces оцінка віку |
| title | Визначення віку людини за фото на основі нейронних мереж |
| title_full | Визначення віку людини за фото на основі нейронних мереж |
| title_fullStr | Визначення віку людини за фото на основі нейронних мереж |
| title_full_unstemmed | Визначення віку людини за фото на основі нейронних мереж |
| title_short | Визначення віку людини за фото на основі нейронних мереж |
| title_sort | визначення віку людини за фото на основі нейронних мереж |
| topic | нейронні мережі регресія UTKFaces оцінка віку |
| url | https://cims.fti.dp.ua/j/article/view/183 |
| work_keys_str_mv | AT êvgeníjverbenko viznačennâvíkulûdinizafotonaosnovínejronnihmerež AT olʹgamacuga viznačennâvíkulûdinizafotonaosnovínejronnihmerež |