Understanding Variable Performance on Deep MIL Framework for the Acoustic Detection of Tropical Birds

Castro, Jorge; Vargas-Masís, Roberto; Alfaro-Rojas, Danny

Entendiendo el Desempeño Variable en el Marco de Trabajo MIL Profundo para la Detección Acústica de Aves Tropicales

dc.creator	Castro, Jorge
dc.creator	Vargas-Masís, Roberto
dc.creator	Alfaro-Rojas, Danny
dc.date	2020-03-27
dc.date.accessioned	2020-09-25T23:12:52Z
dc.date.available	2020-09-25T23:12:52Z
dc.identifier	https://revistas.tec.ac.cr/index.php/tec_marcha/article/view/5075
dc.identifier	10.18845/tm.v33i5.5075
dc.identifier.uri	https://hdl.handle.net/2238/12069
dc.description	Many audio detection algorithms have been proposed to monitor birds using their vocalizations. Among these algorithms deep learning based techniques have taken the lead in terms of performance at large scale. However, usually a lot of manual work has to be done to correctly label bird vocalizations in large datasets. One way to tackle this limitation is using the Multiple Instance Learning (MIL) framework, which models each recording as a bag of instances, i.e., a collection of audio segments that is associated with a positive label if a bird is present in the recording. In this work, we modified a previously proposed Deep MIL network to predict the presence or absence of birds in audio field recordings of one minute. We explore the behavior and performance of the network when using different number of Mel-Frequency Cepstral Coefficients (MFCC) to represent the recordings. The best configuration found achieved a 0.77 F-score over the validation dataset.	en-US
dc.description	Se han propuesto muchos algoritmos de detección de audio para monitorear aves usando sus vocalizaciones. Entre estos algoritmos, las técnicas basadas en el aprendizaje profundo han tomado la delantera en términos de rendimiento a gran escala. Sin embargo, usualmente se requiere de mucho trabajo manual para etiquetar correctamente las vocalizaciones de aves en grandes conjuntos de datos. Una forma de abordar esta limitación es usar el marco de trabajo de aprendizaje de instancias múltiples (MIL), que modela cada grabación como una bolsa de instancias, es decir, una colección de segmentos de audio que se asocia con una etiqueta positiva si un pájaro está presente en la grabación. En este trabajo, modificamos una red profunda MIL propuesta previamente, para predecir la presencia o ausencia de aves en grabaciones de campo de un minuto. Exploramos el comportamiento y el rendimiento de la red cuando utilizamos un número diferente de coeficientes cepstrales de frecuencia de mel (MFCC) para representar las grabaciones. La mejor configuración encontrada logró un valor F de 0.77 sobre el conjunto de datos de validación.	es-ES
dc.format	application/pdf
dc.language	eng
dc.publisher	Editorial Tecnológica de Costa Rica (entidad editora)	es-ES
dc.relation	https://revistas.tec.ac.cr/index.php/tec_marcha/article/view/5075/4797
dc.source	Tecnología en marcha Journal; 2020: Vol. 33 especial. Contribuciones a la Conferencia 6th Latin America High Performance Computing Conference (CARLA); Pág. 49-54	en-US
dc.source	Revista Tecnología en Marcha; 2020: Vol. 33 especial. Contribuciones a la Conferencia 6th Latin America High Performance Computing Conference (CARLA); Pág. 49-54	es-ES
dc.source	2215-3241
dc.source	0379-3982
dc.subject	Deep Learning	en-US
dc.subject	Multiple Instance Learning	en-US
dc.subject	Bioacoustic	en-US
dc.subject	Bird Detection	en-US
dc.subject	Aprendizaje profundo	es-ES
dc.subject	Aprendizaje de instancias múltiples	es-ES
dc.subject	Bioacústica	es-ES
dc.subject	Detección de Aves	es-ES
dc.title	Understanding Variable Performance on Deep MIL Framework for the Acoustic Detection of Tropical Birds	en-US
dc.title	Entendiendo el Desempeño Variable en el Marco de Trabajo MIL Profundo para la Detección Acústica de Aves Tropicales	es-ES
dc.type
dc.type	artículo original

Ficheros en el ítem

Ficheros	Tamaño	Formato	Ver
No hay ficheros asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)

Tecnología en Marcha [2043]
Es una revista que se publica por trimestres

Mostrar el registro sencillo del ítem