Knowledge enhancement for speech emotion recognition via multi-level acoustic feature

Knowledge enhancement for speech emotion recognition via multi-level acoustic feature

Speech emotion recognition (SER) has become an increasingly attractive machine learning task for domain applications. It aims to improve the discriminative capacity of speech emotion utilising a certain type of features (e.g. MFCC, Spectrograms, Wav2vec2) or multi-type combination features. However,...

Full description

Saved in:

Bibliographic Details
Main Authors:	Huan Zhao, Nianxin Huang, Haijiao Chen
Format:	Article
Language:	English
Published:	Taylor & Francis Group 2024-12-01
Series:	Connection Science
Subjects:	Cross-fusion multi-level feature multi-task learning speech emotion recognition
Online Access:	https://www.tandfonline.com/doi/10.1080/09540091.2024.2312103
Tags:	Add Tag No Tags, Be the first to tag this record!

Similar Items

Enhancing Emotion Recognition in Speech Based on Self-Supervised Learning: Cross-Attention Fusion of Acoustic and Semantic Features
by: Bashar M. Deeb, et al.
Published: (2025-01-01)

Hierarchical Multi-Task Learning Based on Interactive Multi-Head Attention Feature Fusion for Speech Depression Recognition
by: Yujuan Xing, et al.
Published: (2025-01-01)

A Lightweight Forward–Backward Independent Temporal-Aware Causal Network for Speech Emotion Recognition
by: Sijia Fei, et al.
Published: (2025-01-01)

MemoCMT: multimodal emotion recognition using cross-modal transformer-based feature fusion
by: Mustaqeem Khan, et al.
Published: (2025-02-01)

Speech Emotion Recognition Using Multi-Scale Global–Local Representation Learning with Feature Pyramid Network
by: Yuhua Wang, et al.
Published: (2024-12-01)

Attention-based interactive multi-level feature fusion for named entity recognition
by: Yiwu Xu, et al.
Published: (2025-01-01)

Enhancing Embedded Space with Low–Level Features for Speech Emotion Recognition
by: Lukasz Smietanka, et al.
Published: (2025-02-01)

A Novel Multi-Task and Ensembled Optimized Parallel Convolutional Autoencoder and Transformer for Speech Emotion Recognition
by: Zahra Sharifzadeh Jafari, et al.
Published: (2024-03-01)

Optimizing Speech Emotion Recognition with Hilbert Curve and convolutional neural network
by: Zijun Yang, et al.
Published: (2024-01-01)

Speech Emotion Recognition Using a Multi-Time-Scale Approach to Feature Aggregation and an Ensemble of SVM Classifiers
by: Antonina STEFANOWSKA, et al.
Published: (2024-03-01)

Speech Emotion Recognition: Humans vs Machines
by: S. Werner, et al.
Published: (2019-12-01)

Deep Learning-Based Speech Emotion Recognition Using Multi-Level Fusion of Concurrent Features
by: Samuel, Kakuba, et al.
Published: (2023)

Modularized Learning for Hate Speech Detection in Korean: Integrating Emotions and Multi-Faceted Attributes
by: Hyeun Jeong Min
Published: (2025-01-01)

Speech Emotion Recognition under White Noise
by: Chengwei HUANG, et al.
Published: (2013-12-01)

Speech Emotion Recognition Using Two-Stage Multiple Instance Learning Networks
by: ZHANG Shiqing, CHEN Chen, ZHAO Xiaoming
Published: (2024-12-01)

Dual-feature speech emotion recognition fusion algorithm based on wavelet scattering transform and MFCC
by: YING Na, et al.
Published: (2024-05-01)

Exploration of Complementary Features for Speech Emotion Recognition Based on Kernel Extreme Learning Machine
by: Lili Guo, et al.
Published: (2019-01-01)

End-to-end feature fusion for jointly optimized speech enhancement and automatic speech recognition
by: Mohamed Medani, et al.
Published: (2025-07-01)

Applying a Convolutional Vision Transformer for Emotion Recognition in Children with Autism: Fusion of Facial Expressions and Speech Features
by: Yonggu Wang, et al.
Published: (2025-03-01)

Multi-branch feature learning based speech emotion recognition using SCAR-NET
by: Keji Mao, et al.
Published: (2023-12-01)

Modulation recognition method based on multimodal features
by: Hu Zhang, et al.
Published: (2025-03-01)

Speech Emotion Recognition Based on Sparse Representation
by: Jingjie YAN, et al.
Published: (2013-12-01)

Speech emotion recognition algorithm of intelligent robot based on ACO-SVM
by: Xueliang Kang
Published: (2025-12-01)

Preprocessing signal for Speech Emotion Recognition
by: Bashar M. Nema, et al.
Published: (2018-07-01)

Transformer-based multi-task learning for table tennis motion feature recognition
by: Tianfang Ma
Published: (2025-06-01)

Multimodal Emotion Recognition Based on Facial Expressions, Speech, and EEG
by: Jiahui Pan, et al.
Published: (2024-01-01)

Emotion Recognition from Speech in a Subject-Independent Approach
by: Andrzej Majkowski, et al.
Published: (2025-06-01)

An Mcformer encoder integrating Mamba and Cgmlp for improved acoustic feature extraction
by: Nurmemet Yolwas, et al.
Published: (2025-07-01)

Speech Emotion Recognition Based on Voice Fundamental Frequency
by: Teodora DIMITROVA-GREKOW, et al.
Published: (2019-04-01)

Multi-Level Feature Fusion in CNN-Based Human Action Recognition: A Case Study on EfficientNet-B7
by: Pitiwat Lueangwitchajaroen, et al.
Published: (2024-12-01)

DDFNet: A Dual-Domain Fusion Network for Robust Synthetic Speech Detection
by: Jing Lu, et al.
Published: (2025-03-01)

A multi-dilated convolution network for speech emotion recognition
by: Samaneh Madanian, et al.
Published: (2025-03-01)

HGF-MiLaG: Hierarchical Graph Fusion for Emotion Recognition in Conversation with Mid-Late Gender-Aware Strategy
by: Yihan Wang, et al.
Published: (2025-02-01)

A Comprehensive Analysis of Data Augmentation Methods for Speech Emotion Recognition
by: Umut Avci
Published: (2025-01-01)

Hybrid LSTM–Attention and CNN Model for Enhanced Speech Emotion Recognition
by: Fazliddin Makhmudov, et al.
Published: (2024-12-01)

A fine-grained human facial key feature extraction and fusion method for emotion recognition
by: Shiwei Li, et al.
Published: (2025-02-01)

Speech Databases, Speech Features, and Classifiers in Speech Emotion Recognition: A Review
by: G. H. Mohmad Dar, et al.
Published: (2024-01-01)

A Lightweight Multi-Scale Model for Speech Emotion Recognition
by: Haoming Li, et al.
Published: (2024-01-01)

Domain Adapting Deep Reinforcement Learning for Real-World Speech Emotion Recognition
by: Thejan Rajapakshe, et al.
Published: (2024-01-01)

Analysis and Research on Spectrogram-Based Emotional Speech Signal Augmentation Algorithm
by: Huawei Tao, et al.
Published: (2025-06-01)