Mostrar el registro sencillo del ítem

Algoritmo semisupervisado de agrupamiento que combina SUBCLU y el agrupamiento basado en restricciones, para la detección de grupos en conjuntos de alta dimensionalidad

dc.creatorCalvo-Valverde, Luis Alexander
dc.creatorVallejos-Peña, Alonso
dc.date2018-07-11
dc.date.accessioned2020-09-25T23:12:03Z
dc.date.available2020-09-25T23:12:03Z
dc.identifierhttps://revistas.tec.ac.cr/index.php/tec_marcha/article/view/3904
dc.identifier10.18845/tm.v31i3.3904
dc.identifier.urihttps://hdl.handle.net/2238/11815
dc.descriptionHigh dimensional data poses a challenge to traditional clustering algorithms, where the similarity measures are not meaningful, affecting the quality of the groups. As a result, subspace clustering algorithms have been proposed as an alternative, aiming to find all groups in all spaces of the dataset.By detecting groups on lower dimensional spaces, each group may belong to different subspaces of the original dataset. Therefore, attributes the user considers of interest may be excluded in some or all groups, decreasing the value of the result for the data analysts.In this project, a new algorithm is proposed, that combines SUBCLU and the  clustering algorithms by constraint, which allows the users to identify variables as attributes of interest based on prior knowledge of domain, targeting direct group detection toward spaces that include user’s attributes of interest, and thereafter, generating more meaningful groups.en-US
dc.descriptionLos datos de alta dimensionalidad plantean un desafío para los algoritmos de agrupamiento tradicionales, ya que las medidas de similitud convencionales utilizadas por estos no son significativas cuando se aplican sobre el espacio completo de datos, por lo que afectan la calidad de los grupos. Ante esto, los algoritmos de agrupamiento de subespacios han sido propuestos como alternativa para encontrar todos los grupos en todos los espacios del conjunto de datos. Al detectar grupos en espacios de menor dimensionalidad, cada grupo detectado puede pertenecer a diferentes subespacios del conjunto de datos original. Consecuentemente, atributos que el usuario considere de interés pueden ser excluidos en algunos o todos los grupos, perdiendo información importante y reduciendo el valor del resultado para los analistas. En este proyecto, se propone un nuevo método que combina el algoritmo SUBCLU y el algoritmo de agrupamiento por restricciones, el cual permite al usuario identificar variables como atributos de interés con base en conocimiento previo del dominio, esto con el objeto de dirigir la detección de grupos hacia espacios que incluyan estos atributos y, por ende, generar grupos más significativos.es-ES
dc.formatapplication/pdf
dc.languagespa
dc.publisherEditorial Tecnológica de Costa Rica (entidad editora)es-ES
dc.relationhttps://revistas.tec.ac.cr/index.php/tec_marcha/article/view/3904/pdf
dc.sourceTecnología en marcha Journal; Vol. 31, Núm. 3: Julio-Setiembre 2018; pág. 74-85en-US
dc.sourceRevista Tecnología en Marcha; Vol. 31, Núm. 3: Julio-Setiembre 2018; pág. 74-85es-ES
dc.source2215-3241
dc.source0379-3982
dc.subjectData miningen-US
dc.subjectsubspacesen-US
dc.subjectSUBCLUen-US
dc.subjectclusteringen-US
dc.subjectclustering by constrainten-US
dc.subjectMinería de datoses-ES
dc.subjectsubespacioses-ES
dc.subjectSUBCLUes-ES
dc.subjectalgoritmo de agrupamientoes-ES
dc.subjectagrupamiento por restricciones.es-ES
dc.titleSemisupervised clustering algorithm combining SUBCLU and constrained clustering for detecting groups in high dimensional datasetsen-US
dc.titleAlgoritmo semisupervisado de agrupamiento que combina SUBCLU y el agrupamiento basado en restricciones, para la detección de grupos en conjuntos de alta dimensionalidades-ES
dc.typeinfo:eu-repo/semantics/article
dc.typeinfo:eu-repo/semantics/publishedVersion


Ficheros en el ítem

FicherosTamañoFormatoVer

No hay ficheros asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem