Mostrar el registro sencillo del ítem
Assessing the effectiveness of diarization algorithms in costa rican children-adult speech according to age group and gender
Evaluación de la efectividad de los algoritmos de registro en el habla de niños y adultos costarricenses según grupo de edad y género
dc.creator | Chacón-Vargas, Alejandro | |
dc.creator | Pérez-Conejo, Daniel | |
dc.creator | Coto-Jiménez, Marvin | |
dc.date | 2022-11-16 | |
dc.date.accessioned | 2023-02-16T16:05:36Z | |
dc.date.available | 2023-02-16T16:05:36Z | |
dc.identifier | https://revistas.tec.ac.cr/index.php/tec_marcha/article/view/6443 | |
dc.identifier | 10.18845/tm.v35i8.6443 | |
dc.identifier.uri | https://hdl.handle.net/2238/14144 | |
dc.description | Speaker diarization is the task of automatically identifying speaker identities and detecting their speaking times in an audio recording. Several algorithms have shown improvements in the performance of this task during the past years. However, it still has performance challenges in interaction scenarios, such as between a child and adult, where interruptions, fillers, laughs and other elements may affect the detection and clustering of the segments. In this work, we perform an exploratory study with two diarization algorithms in children-adult interactions within a recording studio and assess the effectiveness of the algorithms in different age groups and genders. All participants are native Costa Rican Spanish speakers. The children have ages between 3 to 14 years, and the interaction combines guided repetition of words or short phrases, as well as natural speech. The results demonstrate how the age affects the diarization performance, both in cluster purity and speaker purity, in a direct but non-linear fashion. | en-US |
dc.description | El registro de los oradores es la tarea de identificar automáticamente las identidades de los oradores y detectar sus tiempos de conversación en una grabación de audio. Varios algoritmos han mostrado mejoras en el desempeño de esta tarea durante los últimos años. Sin embargo, todavía presenta desafíos de desempeño en escenarios de interacción, como entre un niño y un adulto, donde las interrupciones, los rellenos, las risas y otros elementos pueden afectar la detección y agrupamiento de los segmentos. En este trabajo, realizamos un estudio exploratorio con dos algoritmos de registro en interacciones niños-adultos dentro de un estudio de grabación y evaluamos la efectividad de los algoritmos en diferentes grupos de edad y géneros. Todos los participantes son hispanohablantes nativos de Costa Rica. Los niños tienen edades comprendidas entre los 3 y los 14 años, y la interacción combina la repetición guiada de palabras o frases cortas, así como el habla natural. Los resultados demuestran cómo la edad afecta el rendimiento del registro, tanto en la pureza del grupo como en la pureza del hablante, de forma directa pero no lineal. | es-ES |
dc.format | application/pdf | |
dc.language | eng | |
dc.publisher | Editorial Tecnológica de Costa Rica (entidad editora) | es-ES |
dc.relation | https://revistas.tec.ac.cr/index.php/tec_marcha/article/view/6443/6265 | |
dc.rights | https://creativecommons.org/licenses/by-nc-nd/4.0 | es-ES |
dc.source | Tecnología en marcha Journal; 2022: Vol. 35 special issue, October. International Work Conference on Bioinspired Intelligence ; Pág. 24-32 | en-US |
dc.source | Revista Tecnología en Marcha; 2022: Vol. 35 special issue, October. International Work Conference on Bioinspired Intelligence ; Pág. 24-32 | es-ES |
dc.source | 2215-3241 | |
dc.source | 0379-3982 | |
dc.subject | Children’s speech | en-US |
dc.subject | clustering | en-US |
dc.subject | speaker diarization | en-US |
dc.subject | speech processing | en-US |
dc.subject | Habla de los niños | es-ES |
dc.subject | agrupación | es-ES |
dc.subject | registro del hablante | es-ES |
dc.subject | procesamiento del habla | es-ES |
dc.title | Assessing the effectiveness of diarization algorithms in costa rican children-adult speech according to age group and gender | en-US |
dc.title | Evaluación de la efectividad de los algoritmos de registro en el habla de niños y adultos costarricenses según grupo de edad y género | es-ES |
dc.type | artículo original |
Ficheros en el ítem
Ficheros | Tamaño | Formato | Ver |
---|---|---|---|
No hay ficheros asociados a este ítem. |
Este ítem aparece en la(s) siguiente(s) colección(ones)
-
Tecnología en Marcha [2043]
Es una revista que se publica por trimestres