Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Word Speech Recognition
Word Speech Recognition
• A. Dataset Description:
Es un conjunto de archivos de audio de un segundo (.wav), cada uno que contiene
una palabra hablada en inglés. Estas palabras son pronunciadas por una amplia
variedad de diferentes hablantes. Los archivos están organizados en carpetas,con
cada nombre de directorio etiquetando de la palabra hablada
El conjunto de datos contiene 64.727 Contiene un grupo de archivos
archivos de audio de 30 palabras cortas background noise, o ruido de fondo
que son un grupo de archivos de audio
como: largos que se pueden mezclar para
”yes”, ”no”,”up”, ”down”, ”left”, ”right”, ”on”, simular el ruido de fondo durante el
”off”, ”go”, ”stop”,etc entrenamiento.
Espectrograma Mel
magnitud
Frec
TIEMPO