Tecnológico de Costa Rica
  • xmlui.mirage2.page-structure.upload_to_repository_title
  • xmlui.mirage2.page-structure.policies_title
  • xmlui.mirage2.page-structure.rea_title
  • Contact us
    • español
    • English
  • español 
    • español
    • English
  • Login
View Item 
  •   DSpace Home
  • Portal de Revistas del Instituto Tecnológico de Costa Rica
  • Tecnología en Marcha
  • View Item
  •   DSpace Home
  • Portal de Revistas del Instituto Tecnológico de Costa Rica
  • Tecnología en Marcha
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsxmlui.ArtifactBrowser.Navigation.browse_typexmlui.ArtifactBrowser.Navigation.browse_userThis CollectionBy Issue DateAuthorsTitlesSubjectsxmlui.ArtifactBrowser.Navigation.browse_typexmlui.ArtifactBrowser.Navigation.browse_user

My Account

LoginRegister

Statistics

View Usage Statistics

Comparison of four classifiers for speech-music discrimination: a first case study for costa rican radio broadcasting

Comparación de cuatro clasificadores para la discriminación de voz y música: un primer estudio de caso para la radiodifusión costarricense

Thumbnail
View/Open
https://revistas.tec.ac.cr/index.php/tec_marcha/article/view/646310.18845/tm.v35i8.6463
Author
Sánchez-Solís, Joseline
Coto-Jiménez, Marvin
Metadata
Show full item record
Description
 
During the past decades, a vast amount of audio data has be- come available in most languages and regions of the world. The efficient organization and manipulation of this data are important for tasks such as data classification, searching for information, diarization among many others, but also can be relevant for building corpora for training models for automatic speech recognition or building speech synthesis systems. Several of those tasks require extensive testing and data for specific languages and accents, especially when the development of communication systems with machines is a goal. In this work, we explore the application of several classifiers for the task of discriminating speech and music in Costa Rican radio broadcast. This discrimination is a first task in the exploration of a large corpus, to determine whether or not the available information is useful for particular research areas. The main contribution of this exploratory work is the general procedure and selection of algorithms for the Costa Rican radio corpus, which can lead to the extensive use of this source of data in many own applications and systems.
 
Durante las últimas décadas, una gran cantidad de datos de audio ha estado disponible en la mayoría de los idiomas y regiones del mundo. La organización y manipulación eficiente de estos datos son importantes para tareas como clasificación de datos, búsqueda de información, diarización entre muchas otras, pero también pueden ser relevantes para construir corpus para modelos de entrenamiento para reconocimiento automático de voz o construir sistemas de síntesis de voz. Varias de esas tareas requieren pruebas y datos exhaustivos para idiomas y acentos específicos, especialmente cuando el objetivo es el desarrollo de sistemas de comunicación con máquinas. En este trabajo, exploramos la aplicación de varios clasificadores para la tarea de discriminar el habla y la música en la radiodifusión costarricense. Esta discriminación es una primera tarea en la exploración de un gran corpus, para determinar si la información disponible es útil o no para áreas de investigación particulares. El principal aporte de este trabajo exploratorio es el procedimiento general y la selección de algoritmos para el corpus de radio costarricense, lo que puede llevar al uso extensivo de esta fuente de datos en muchas aplicaciones y sistemas propios.
 
xmlui.dri2xhtml.METS-1.0.magazine-source
Tecnología en marcha Journal; 2022: Vol. 35 special issue, October. International Work Conference on Bioinspired Intelligence ; Pág. 119-127 , Revista Tecnología en Marcha; 2022: Vol. 35 special issue, October. International Work Conference on Bioinspired Intelligence ; Pág. 119-127 , 2215-3241 , 0379-3982 .
URI
https://hdl.handle.net/2238/18138
xmlui.dri2xhtml.METS-1.0.share-button
       
xmlui.dri2xhtml.METS-1.0.metric
Collections
  • Tecnología en Marcha [1993]

|Contact us

Repositorio Institucional del Tecnológico de Costa Rica

Sistema de Bibliotecas del TEC | SIBITEC

© DERECHOS RESERVADOS. Un sitio soportado por DSpace(v. 6.3)

RT-1

 

 


|Contact us

Repositorio Institucional del Tecnológico de Costa Rica

Sistema de Bibliotecas del TEC | SIBITEC

© DERECHOS RESERVADOS. Un sitio soportado por DSpace(v. 6.3)

RT-1