Estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados usando conjuntos aproximados y/o ganancia de información

Calvo-Valverde, Luis Alexánder

Strategy based on machine learning to deal with untagged data sets using rough sets and/or information gain

dc.contributor		es-ES
dc.contributor		en-US
dc.creator	Calvo-Valverde, Luis Alexánder
dc.date	2016-06-10
dc.date.accessioned	2017-09-19T20:37:48Z
dc.date.available	2017-09-19T20:37:48Z
dc.identifier	https://revistas.tec.ac.cr/index.php/tec_marcha/article/view/2581
dc.identifier	10.18845/tm.v29i5.2581
dc.identifier.uri	https://hdl.handle.net/2238/8810
dc.description	Hoy en día se recogen datos de muy diversa índole y a un bajo costo, como no se había visto antes en la historia de la humanidad; por ejemplo, sensores que registran datos a cada minuto, páginas web que almacenan todas las acciones que realiza el usuario, supermercados que guardan todo lo que sus clientes compran y en qué momento lo hacen. Pero estas grandes bases de datos presentan un gran reto a sus propietarios ¿Cómo sacarles provecho?, ¿cómo convertir datos en información para la toma de decisiones? Este artículo presenta una estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados utilizando conjuntos aproximados y/o ganancia de información. Se propone una estrategia para agrupar los datos utilizando k-means, considerando cuánta información aporta un atributo (ganancia de información), además de poder seleccionar cuáles atributos son realmente indispensables para clasificar nuevos datos y cuáles son dispensables (conjuntos aproximados), lo cual es muy beneficioso pues permite tomar decisiones en menor tiempo.	es-ES
dc.description	As had been seen in the history of humanity, today data of various kinds and cheaply collected, for example sensors that record information every minute, web pages that store all the actions performed by the user on the page supermarkets that keep everything their customers buy and when to do it and many more examples like these. But these large databases have presented a challenge to their owners How to take advantage of them? How to turn data into information for decision making? This paper presents a strategy based on machine learning to deal with unlabeled datasets using rough sets and/or information gain. A method is proposed to cluster the data using k-means considering how much information provides an attribute (information gain); besides being able to select which attributes are really essential to classify new data and which are dispensable (rough sets), which is very beneficial as it allows decisions in less time.	en-US
dc.format	application/pdf
dc.language	spa
dc.publisher	Editorial Tecnológica de Costa Rica	es-ES
dc.relation	https://revistas.tec.ac.cr/index.php/tec_marcha/article/view/2581/2366
dc.rights	Copyright (c) 2016 Revista Tecnología en Marcha	es-ES
dc.source	Revista Tecnología en Marcha; Revista Tecnología en Marcha. Número Especial Matemática Aplicada 2016; pág. 4-15	es-ES
dc.source	2215-3241
dc.source	0379-3982
dc.subject		es-ES
dc.subject	Aprendizaje de máquina; minería de datos; conjuntos aproximados; entropía; ganancia de información; reducción de atributos	es-ES
dc.subject		en-US
dc.subject	Machine Learning; Data Mining; Rough Sets; Entropy; Information Gain; Feature Reduction	en-US
dc.title	Estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados usando conjuntos aproximados y/o ganancia de información	es-ES
dc.title	Strategy based on machine learning to deal with untagged data sets using rough sets and/or information gain	en-US
dc.type	artículo original
dc.type
dc.type		es-ES
dc.type		es-ES
dc.type		en-US

Ficheros en el ítem

Ficheros	Tamaño	Formato	Ver
No hay ficheros asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)

Tecnología en Marcha [2043]
Es una revista que se publica por trimestres

Mostrar el registro sencillo del ítem