Estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados usando conjuntos aproximados y/o ganancia de información

Hoy en día se recogen datos de muy diversa índole y a un bajo costo, como no se había visto antes en la historia de la humanidad; por ejemplo, sensores que registran datos a cada minuto, páginas web que almacenan todas las acciones que realiza el usuario, supermercados que guardan todo lo que sus cl...

Full description

Saved in:
Bibliographic Details
Main Author: Luis Alexánder Calvo-Valverde
Format: Article
Language:English
Published: Instituto Tecnológico de Costa Rica 2016-06-01
Series:Tecnología en Marcha
Subjects:
Online Access:https://revistas.tec.ac.cr/index.php/tec_marcha/article/view/2581
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1850158259524075520
author Luis Alexánder Calvo-Valverde
author_facet Luis Alexánder Calvo-Valverde
author_sort Luis Alexánder Calvo-Valverde
collection DOAJ
description Hoy en día se recogen datos de muy diversa índole y a un bajo costo, como no se había visto antes en la historia de la humanidad; por ejemplo, sensores que registran datos a cada minuto, páginas web que almacenan todas las acciones que realiza el usuario, supermercados que guardan todo lo que sus clientes compran y en qué momento lo hacen. Pero estas grandes bases de datos presentan un gran reto a sus propietarios ¿Cómo sacarles provecho?, ¿cómo convertir datos en información para la toma de decisiones?  Este artículo presenta una estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados utilizando conjuntos aproximados y/o ganancia de información. Se propone una estrategia para agrupar los datos utilizando k-means, considerando cuánta información aporta un atributo (ganancia de información), además de poder seleccionar cuáles atributos son realmente indispensables para clasificar nuevos datos y cuáles son dispensables (conjuntos aproximados), lo cual es muy beneficioso pues permite tomar decisiones en menor tiempo. 
format Article
id doaj-art-69d8c5fcd2134fa4b9ae594ebc0e4224
institution OA Journals
issn 0379-3982
2215-3241
language English
publishDate 2016-06-01
publisher Instituto Tecnológico de Costa Rica
record_format Article
series Tecnología en Marcha
spelling doaj-art-69d8c5fcd2134fa4b9ae594ebc0e42242025-08-20T02:23:56ZengInstituto Tecnológico de Costa RicaTecnología en Marcha0379-39822215-32412016-06-0129510.18845/tm.v29i5.25812133Estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados usando conjuntos aproximados y/o ganancia de informaciónLuis Alexánder Calvo-ValverdeHoy en día se recogen datos de muy diversa índole y a un bajo costo, como no se había visto antes en la historia de la humanidad; por ejemplo, sensores que registran datos a cada minuto, páginas web que almacenan todas las acciones que realiza el usuario, supermercados que guardan todo lo que sus clientes compran y en qué momento lo hacen. Pero estas grandes bases de datos presentan un gran reto a sus propietarios ¿Cómo sacarles provecho?, ¿cómo convertir datos en información para la toma de decisiones?  Este artículo presenta una estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados utilizando conjuntos aproximados y/o ganancia de información. Se propone una estrategia para agrupar los datos utilizando k-means, considerando cuánta información aporta un atributo (ganancia de información), además de poder seleccionar cuáles atributos son realmente indispensables para clasificar nuevos datos y cuáles son dispensables (conjuntos aproximados), lo cual es muy beneficioso pues permite tomar decisiones en menor tiempo.  https://revistas.tec.ac.cr/index.php/tec_marcha/article/view/2581Aprendizaje de máquinaminería de datosconjuntos aproximadosentropíaganancia de informaciónreducción de atributos
spellingShingle Luis Alexánder Calvo-Valverde
Estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados usando conjuntos aproximados y/o ganancia de información
Tecnología en Marcha
Aprendizaje de máquina
minería de datos
conjuntos aproximados
entropía
ganancia de información
reducción de atributos
title Estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados usando conjuntos aproximados y/o ganancia de información
title_full Estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados usando conjuntos aproximados y/o ganancia de información
title_fullStr Estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados usando conjuntos aproximados y/o ganancia de información
title_full_unstemmed Estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados usando conjuntos aproximados y/o ganancia de información
title_short Estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados usando conjuntos aproximados y/o ganancia de información
title_sort estrategia basada en el aprendizaje de maquina para tratar con conjuntos de datos no etiquetados usando conjuntos aproximados y o ganancia de informacion
topic Aprendizaje de máquina
minería de datos
conjuntos aproximados
entropía
ganancia de información
reducción de atributos
url https://revistas.tec.ac.cr/index.php/tec_marcha/article/view/2581
work_keys_str_mv AT luisalexandercalvovalverde estrategiabasadaenelaprendizajedemaquinaparatratarconconjuntosdedatosnoetiquetadosusandoconjuntosaproximadosyogananciadeinformacion