Enhanced Emotion Recognition Through Dynamic Restrained Adaptive Loss and Extended Multimodal Bottleneck Transformer

Emotion recognition in video aims to estimate human emotions using acoustic, visual, and linguistic information. This problem is considered multimodal and requires learning different modalities, such as visual, verbal, and vocal cues. Although previous studies have focused on developing sophisticate...

Full description

Saved in:

Bibliographic Details
Main Authors:	Dang-Khanh Nguyen, Eunchae Lim, Soo-Hyung Kim, Hyung-Jeong Yang, Seungwon Kim
Format:	Article
Language:	English
Published:	MDPI AG 2025-03-01
Series:	Applied Sciences
Subjects:	emotion recognition in video multimodal fusion multimodal representation learning multimodal transformer
Online Access:	https://www.mdpi.com/2076-3417/15/5/2862
Tags:	Add Tag No Tags, Be the first to tag this record!

Internet

https://www.mdpi.com/2076-3417/15/5/2862

Enhanced Emotion Recognition Through Dynamic Restrained Adaptive Loss and Extended Multimodal Bottleneck Transformer

Internet

Similar Items