VibraVox Dataset
Téléchargement
Le dataset a été publié en juillet 2024 et est disponible sur HuggingFace.
Des ressources complémentaires pour reproduire les expériences sont également disponibles sur GitHub.
L’article scientifique décrivant le corpus et les résultats obtenus pour différentes tâches de traitement de la parole est disponible sur arXiV (soumis au Journal Speech Communication, en cours de review).
Un Dataset à usage général de parole captée avec des transducteurs à conduction corporelle
Vibravox est un ensemble de données conforme au règlement général sur la protection des données (RGPD) qui contient des enregistrements audio réalisés à l’aide de cinq capteurs audio à conduction corporelle différents : deux microphones intra-auriculaires, deux capteurs de vibrations à conduction osseuse et un laryngophone.
Le corpus Vibravox contient 45.5 heures d’échantillons de parole et de sons physiologiques enregistrés par 188 participants dans différentes conditions acoustiques imposées par un spatialisateur 3D ambisonique à ordres élevés. Le corpus comprend également des annotations sur les conditions d’enregistrement et des transcriptions linguistiques.
Tâches
Nous avons mené une série d’expériences sur diverses tâches liées à la parole, notamment la reconnaissance vocale, l’amélioration de la parole et la vérification du locuteur. Ces expériences ont été réalisées à l’aide de modèles de l’état de l’art afin d’évaluer et de comparer leurs performances sur des signaux enregistrés par les différents capteurs audio proposés par l’ensemble de données Vibravox, dans le but d’obtenir une meilleure compréhension de leurs caractéristiques individuelles.
Citation
Si vous utilisez le dataset Vibravox pour des fins de recherche, merci de citer cet article :
@article{jhauret-et-al-2024-vibravox,
title={{Vibravox: A Dataset of French Speech Captured with Body-conduction Audio Sensors}},
author={Hauret, Julien and Olivier, Malo and Joubaud, Thomas and Langrenne, Christophe and
Poir{\'e}e, Sarah and Zimpfer, Véronique and Bavu, {\'E}ric},
year={2024},
eprint={2407.11828},
archivePrefix={arXiv},
primaryClass={eess.AS},
url={https://arxiv.org/abs/2407.11828},
}
et ce dépôt, qui est lié à un DOI :
@misc{cnamlmssc2024vibravoxdataset,
author={Hauret, Julien and Olivier, Malo and Langrenne, Christophe and
Poir{\'e}e, Sarah and Bavu, {\'E}ric},
title = { {Vibravox} (Revision 7990b7d) },
year = 2024,
url = { https://huggingface.co/datasets/Cnam-LMSSC/vibravox },
doi = { 10.57967/hf/2727 },
publisher = { Hugging Face }
}