Mostrar el registro sencillo del ítem

Evaluación del reconocimiento de voz de los niños costarricenses por humanos y máquinas

dc.creatorMorales-Rodríguez, Maribel
dc.creatorCoto-Jiménez, Marvin
dc.date2022-11-16
dc.date.accessioned2023-02-16T16:05:37Z
dc.date.available2023-02-16T16:05:37Z
dc.identifierhttps://revistas.tec.ac.cr/index.php/tec_marcha/article/view/6453
dc.identifier10.18845/tm.v35i8.6453
dc.identifier.urihttps://hdl.handle.net/2238/14150
dc.descriptionIn recent years, an increasing number of studies on human-computer interaction is taking place, due to the pervasive speech interfaces implemented in systems such as cell phones, personal and home automation assistants. These studies include automatic speech recognition (ASR) and speech synthesis, and are considering a wider variety of conditions of the signals, such as noise and reverberation, and accents and age-related effects as well. For example, one of the key challenges is the development of ASR for children’s speech. Since the current systems have a dependency on language and accents, thus, to improve it, the investigations of speech recognition technologies suitable for children are needed. In this paper, we assess commercial ASR systems for the recognition of Costa Rican children’s speech, for users with ages ranging between three and fourteen years old. To establish a comparison and numeric validation of the ASR systems in recognizing children’s isolated words, we conducted a large subjective listening test that computes the differences and challenges that remains for the state-of-the art ASR systems. The results provide evident numeric differences between ASR systems and human perceptions, especially for younger children. Additionally, we provide suggestions for future research directions in the field.en-US
dc.descriptionEn los últimos años, se está llevando a cabo un número creciente de estudios sobre la interacción persona-computadora, debido a las interfaces de habla generalizadas implementadas en sistemas como teléfonos celulares, asistentes personales y de automatización del hogar. Estos estudios incluyen el reconocimiento automático del habla (ASR) y la síntesis del habla, y están considerando una variedad más amplia de condiciones de las señales, como el ruido y la reverberación, y también los acentos y los efectos relacionados con la edad. Por ejemplo, uno de los desafíos clave es el desarrollo de ASR para el habla de los niños. Dado que los sistemas actuales tienen una dependencia del lenguaje y los acentos, por lo tanto, para mejorarlo, se necesitan las investigaciones de tecnologías de reconocimiento de voz adecuadas para los niños. En este trabajo evaluamos sistemas ASR comerciales para el reconocimiento del habla infantil costarricense, para usuarios con edades comprendidas entre los tres y los catorce años. Para establecer una comparación y validación numérica de los sistemas ASR para reconocer las palabras aisladas de los niños, realizamos una gran prueba de comprensión auditiva subjetiva que calcula las diferencias y desafíos que quedan para los sistemas ASR de última generación. Los resultados proporcionan diferencias numéricas evidentes entre los sistemas ASR y las percepciones humanas, especialmente para los niños más pequeños. Además, ofrecemos sugerencias para futuras direcciones de investigación en el campo.es-ES
dc.formatapplication/pdf
dc.languageeng
dc.publisherEditorial Tecnológica de Costa Rica (entidad editora)es-ES
dc.relationhttps://revistas.tec.ac.cr/index.php/tec_marcha/article/view/6453/6271
dc.rightshttps://creativecommons.org/licenses/by-nc-nd/4.0es-ES
dc.sourceTecnología en marcha Journal; 2022: Vol. 35 special issue, October. International Work Conference on Bioinspired Intelligence ; Pág. 74-82en-US
dc.sourceRevista Tecnología en Marcha; 2022: Vol. 35 special issue, October. International Work Conference on Bioinspired Intelligence ; Pág. 74-82es-ES
dc.source2215-3241
dc.source0379-3982
dc.subjectChildren speechen-US
dc.subjectspeech recognitionen-US
dc.subjectspeech technologiesen-US
dc.subjectWERen-US
dc.subjectHabla de niñoses-ES
dc.subjectreconocimiento de vozes-ES
dc.subjecttecnologías del hablaes-ES
dc.subjectWERes-ES
dc.titleAssessing costa rican children speech recognition by humans and machinesen-US
dc.titleEvaluación del reconocimiento de voz de los niños costarricenses por humanos y máquinases-ES
dc.typeartículo original
dc.type


Ficheros en el ítem

FicherosTamañoFormatoVer

No hay ficheros asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem