Mostrar el registro sencillo del ítem

Evaluación de la eficacia de las estrategias de aprendizaje por transferencia en las redes BLSTM para la reducción del ruido

dc.creatorCoto-Jiménez, Marvin
dc.creatorGonzález-Salazar, Astryd
dc.creatorGutiérrez-Muñoz, Michelle
dc.date2022-11-16
dc.date.accessioned2023-02-16T16:05:36Z
dc.date.available2023-02-16T16:05:36Z
dc.identifierhttps://revistas.tec.ac.cr/index.php/tec_marcha/article/view/6448
dc.identifier10.18845/tm.v35i8.6448
dc.identifier.urihttps://hdl.handle.net/2238/14146
dc.descriptionDenoising speech signals represent a challenging task due to the increasing number of applications and technologies currently implemented in communication and portable devices. In those applications, challenging environmental conditions such as background noise, reverberation, and other sound artifacts can affect the quality of the signals. As a result, it also impacts the systems for speech recognition, speaker identification, and sound source localization, among many others. For denoising the speech signals degraded with the many kinds and possibly different levels of noise, several algorithms have been proposed during the past decades, with recent proposals based on deep learning presented as state-of-the-art, in particular those based on Long Short-Term Memory Networks (LSTM and Bidirectional-LSMT). In this work, a comparative study on different transfer learning strategies for reducing training time and increase the effectiveness of this kind of network is presented. The reduction in training time is one of the most critical challenges due to the high computational cost of training LSTM and BLSTM. Those strategies arose from the different options to initialize the networks, using clean or noisy information of several types. Results show the convenience of transferring information from a single case of denoising network to the rest, with a significant reduction in training time and denoising capabilities of the BLSTM networks.en-US
dc.descriptionLa eliminación de ruido de las señales de voz representa una tarea desafiante debido al creciente número de aplicaciones y tecnologías implementadas actualmente en los dispositivos portátiles y de comunicación. En esas aplicaciones, las condiciones ambientales desafiantes como el ruido de fondo, la reverberación y otros artefactos de sonido pueden afectar la calidad de las señales. Como resultado, también afecta a los sistemas de reconocimiento de voz, identificación de hablantes y localización de fuentes de sonido, entre muchos otros. Para eliminar el ruido de las señales de voz degradadas con los muchos tipos y posiblemente diferentes niveles de ruido, se han propuesto varios algoritmos durante las últimas décadas, con propuestas recientes basadas en el aprendizaje profundo presentadas como vanguardistas, en particular las basadas en redes de memoria a corto plazo (LSTM y LSMT bidireccional). En este trabajo se presenta un estudio comparativo de diferentes estrategias de transferencia de aprendizaje para reducir el tiempo de formación y aumentar la efectividad de este tipo de redes. La reducción del tiempo de entrenamiento es uno de los desafíos más críticos debido al alto costo computacional de entrenar LSTM y BLSTM. Esas estrategias surgieron de las diferentes opciones para inicializar las redes, utilizando información limpia o ruidosa de varios tipos. Los resultados muestran la conveniencia de transferir información de un solo caso de eliminación de ruido de la red al resto, con una reducción significativa en el tiempo de entrenamiento y las capacidades de eliminación de ruido de las redes BLSTM.es-ES
dc.formatapplication/pdf
dc.languageeng
dc.publisherEditorial Tecnológica de Costa Rica (entidad editora)es-ES
dc.relationhttps://revistas.tec.ac.cr/index.php/tec_marcha/article/view/6448/6267
dc.rightshttps://creativecommons.org/licenses/by-nc-nd/4.0es-ES
dc.sourceTecnología en marcha Journal; 2022: Vol. 35 special issue, October. International Work Conference on Bioinspired Intelligence ; Pág. 42-49en-US
dc.sourceRevista Tecnología en Marcha; 2022: Vol. 35 special issue, October. International Work Conference on Bioinspired Intelligence ; Pág. 42-49es-ES
dc.source2215-3241
dc.source0379-3982
dc.subjectBLSTMen-US
dc.subjectdeep learningen-US
dc.subjecttransfer learningen-US
dc.subjectspeech processingen-US
dc.subjectBLSTMes-ES
dc.subjectaprendizaje profundoes-ES
dc.subjectprocesamiento del hablaes-ES
dc.subjectaprendizaje por transferenciaes-ES
dc.titleAssessing the effectiveness of transfer learning strategies in BLSTM networks for speech denoisingen-US
dc.titleEvaluación de la eficacia de las estrategias de aprendizaje por transferencia en las redes BLSTM para la reducción del ruidoes-ES
dc.typeinfo:eu-repo/semantics/article
dc.typeinfo:eu-repo/semantics/publishedVersion


Ficheros en el ítem

FicherosTamañoFormatoVer

No hay ficheros asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem