Bob est un outil de traitement de signal et d’apprentissage automatique. Il est développé par le groupe Biometrics (http://www.idiap.ch/ marcel/professional/Welcome.html) de l’Idiap en Suisse.
Bob offre une implémentation efficace d’un grand nombre d’algorithmes d’apprentissage. Il constitue un environnement idéal aidant les chercheurs à publier leur recherche reproductible.
Bob est codé sous Github, et est distribué librement sous GPL. Il est disponible à (...)
SPPAS est un logiciel pour la segmentation automatique, à partir d’un enregistrement audio et de sa transcription.
En 2012, les langues traitées sont : français, italien, anglais, chinois simplifié, mais il est possible de rajouter facilement d’autres langues.
SPPAS est distribué sous licence GPL, et fonctionne sous Linux, MacOS et Windows.
Le logiciel ROCme ! permet une gestion rationalisée, autonome et dématérialisée de l’enregistrement de corpus lus.
Caractéristiques clés :
gratuit
compatible Windows et Mac
interface paramétrable pour le recueil de métadonnées sur les locuteurs
le locuteur fait défiler les phrases à l’écran et les enregistre de façon autonome
format audio paramétrable
Téléchargeable à cette adresse : (...)
PERCEVAL est une station automatisée de tests de perception auditive et visuelle développée au laboratoire "Parole et Langage". Elle fournit un environnement complet pour la préparation, la configuration, la passation et le recueil des données de l’expérience. Le dispositif est spécialement adapté pour l’étude de la perception de la parole et du langage. Il fonctionne dans l’environnement Windows sur micro-ordinateur PC uniquement. PERCEVAL est gratuit et téléchargeable (...)
Package description : This package contains a set of 6 multilingual phonetic decoders (English, German, Hindi, Japanese, Mandarin and Spanish). Each decoder was trained on the Oregon Graduate Institute-Multi Language Telephone Speech Corpus.
The models are based on Hidden Model Markov. 10 Gaussians were used for each state. 12 PLP, the energy and their derivative were used for parametrerization. The frequency bank is in the range of the telephone speech : 300-3400 Hz. The overall topology (...)
The Speech Signal Processing (SPro) toolkit provides the standard speech signal analysis routines. It is intended to be used as a front-end signal analysis to any automatic speech processing system and therefore work mostly in batch mode.
Informations et chargement : http://www.irisa.fr/metiss/gravier/...