Réhaussement de la parole
Tâche
Cette tâche est principalement orientée vers le débruitage et l’extension de la bande passante, également connue sous le nom de super-résolution audio, qui est nécessaire pour améliorer la qualité audio de la parole capturée par le corps. On présente au modèle une paire de clips audio (provenant d’une parole captée par le corps et d’une parole aérienne correspondante, propre et à bande passante complète), et on lui demande d’améliorer l’audio en débruitant et en régénérant les moyennes et les hautes fréquences à partir du contenu des basses fréquences uniquement.
Veuillez vous référer à l’article Vibravox pour plus d’informations.
Modèles pré-entrainés sur HuggingFace
Suivez ce lien pour utiliser nos modèles EBEN: https://huggingface.co/Cnam-LMSSC/vibravox_EBEN_models
Code d’entraînement
Veuillez suivre ce lien pour obtenir le code d’entraînement de nos modèles : https://github.com/jhauret/vibravox
Exemples audio
Frontal | Intra rigide | Intra souple | Tempe | Laryngophone | |
---|---|---|---|---|---|
Audio dégradé | |||||
Audio amélioré par EBEN | |||||
Audio de référence |
Vibravox amélioré par EBEN
Explorez l’ensemble du jeu de test amélioré par nos modèles EBEN :