Mostrar el registro sencillo del ítem

Entendiendo el Desempeño Variable en el Marco de Trabajo MIL Profundo para la Detección Acústica de Aves Tropicales

dc.creatorCastro, Jorge
dc.creatorVargas-Masís, Roberto
dc.creatorAlfaro-Rojas, Danny
dc.date2020-03-27
dc.date.accessioned2020-09-25T23:12:52Z
dc.date.available2020-09-25T23:12:52Z
dc.identifierhttps://revistas.tec.ac.cr/index.php/tec_marcha/article/view/5075
dc.identifier10.18845/tm.v33i5.5075
dc.identifier.urihttps://hdl.handle.net/2238/12069
dc.descriptionMany audio detection algorithms have been proposed to monitor birds using their vocalizations. Among these algorithms deep learning based techniques have taken the lead in terms of performance at large scale. However, usually a lot of manual work has to be done to correctly label bird vocalizations in large datasets. One way to tackle this limitation is using the Multiple Instance Learning (MIL) framework, which models each recording as a bag of instances, i.e., a collection of audio segments that is associated with a positive label if a bird is present in the recording. In this work, we modified a previously proposed Deep MIL network to predict the presence or absence of birds in audio field recordings of one minute. We explore the behavior and performance of the network when using different number of Mel-Frequency Cepstral Coefficients (MFCC) to represent the recordings. The best configuration found achieved a 0.77 F-score over the validation dataset.en-US
dc.descriptionSe han propuesto muchos algoritmos de detección de audio para monitorear aves usando sus vocalizaciones. Entre estos algoritmos, las técnicas basadas en el aprendizaje profundo han tomado la delantera en términos de rendimiento a gran escala. Sin embargo, usualmente se requiere de mucho trabajo manual para etiquetar correctamente las vocalizaciones de aves en grandes conjuntos de datos. Una forma de abordar esta limitación es usar el marco de trabajo de aprendizaje de instancias múltiples (MIL), que modela cada grabación como una bolsa de instancias, es decir, una colección de segmentos de audio que se asocia con una etiqueta positiva si un pájaro está presente en la grabación. En este trabajo, modificamos una red profunda MIL propuesta previamente, para predecir la presencia o ausencia de aves en grabaciones de campo de un minuto. Exploramos el comportamiento y el rendimiento de la red cuando utilizamos un número diferente de coeficientes cepstrales de frecuencia de mel (MFCC) para representar las grabaciones. La mejor configuración encontrada logró un valor F de 0.77 sobre el conjunto de datos de validación.es-ES
dc.formatapplication/pdf
dc.languageeng
dc.publisherEditorial Tecnológica de Costa Rica (entidad editora)es-ES
dc.relationhttps://revistas.tec.ac.cr/index.php/tec_marcha/article/view/5075/4797
dc.sourceTecnología en marcha Journal; 2020: Vol. 33 especial. Contribuciones a la Conferencia 6th Latin America High Performance Computing Conference (CARLA); Pág. 49-54en-US
dc.sourceRevista Tecnología en Marcha; 2020: Vol. 33 especial. Contribuciones a la Conferencia 6th Latin America High Performance Computing Conference (CARLA); Pág. 49-54es-ES
dc.source2215-3241
dc.source0379-3982
dc.subjectDeep Learningen-US
dc.subjectMultiple Instance Learningen-US
dc.subjectBioacousticen-US
dc.subjectBird Detectionen-US
dc.subjectAprendizaje profundoes-ES
dc.subjectAprendizaje de instancias múltipleses-ES
dc.subjectBioacústicaes-ES
dc.subjectDetección de Aveses-ES
dc.titleUnderstanding Variable Performance on Deep MIL Framework for the Acoustic Detection of Tropical Birdsen-US
dc.titleEntendiendo el Desempeño Variable en el Marco de Trabajo MIL Profundo para la Detección Acústica de Aves Tropicaleses-ES
dc.typeinfo:eu-repo/semantics/article
dc.typeinfo:eu-repo/semantics/publishedVersion


Ficheros en el ítem

FicherosTamañoFormatoVer

No hay ficheros asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem