Estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados usando conjuntos aproximados y/o ganancia de información
Hoy en día se recogen datos de muy diversa índole y a un bajo costo, como no se había visto antes en la historia de la humanidad; por ejemplo, sensores que registran datos a cada minuto, páginas web que almacenan todas las acciones que realiza el usuario, supermercados que guardan todo lo que sus cl...
Saved in:
| Main Author: | |
|---|---|
| Format: | Article |
| Language: | English |
| Published: |
Instituto Tecnológico de Costa Rica
2016-06-01
|
| Series: | Tecnología en Marcha |
| Subjects: | |
| Online Access: | https://revistas.tec.ac.cr/index.php/tec_marcha/article/view/2581 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| _version_ | 1850158259524075520 |
|---|---|
| author | Luis Alexánder Calvo-Valverde |
| author_facet | Luis Alexánder Calvo-Valverde |
| author_sort | Luis Alexánder Calvo-Valverde |
| collection | DOAJ |
| description | Hoy en día se recogen datos de muy diversa índole y a un bajo costo, como no se había visto antes en la historia de la humanidad; por ejemplo, sensores que registran datos a cada minuto, páginas web que almacenan todas las acciones que realiza el usuario, supermercados que guardan todo lo que sus clientes compran y en qué momento lo hacen. Pero estas grandes bases de datos presentan un gran reto a sus propietarios ¿Cómo sacarles provecho?, ¿cómo convertir datos en información para la toma de decisiones?
Este artículo presenta una estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados utilizando conjuntos aproximados y/o ganancia de información. Se propone una estrategia para agrupar los datos utilizando k-means, considerando cuánta información aporta un atributo (ganancia de información), además de poder seleccionar cuáles atributos son realmente indispensables para clasificar nuevos datos y cuáles son dispensables (conjuntos aproximados), lo cual es muy beneficioso pues permite tomar decisiones en menor tiempo.
|
| format | Article |
| id | doaj-art-69d8c5fcd2134fa4b9ae594ebc0e4224 |
| institution | OA Journals |
| issn | 0379-3982 2215-3241 |
| language | English |
| publishDate | 2016-06-01 |
| publisher | Instituto Tecnológico de Costa Rica |
| record_format | Article |
| series | Tecnología en Marcha |
| spelling | doaj-art-69d8c5fcd2134fa4b9ae594ebc0e42242025-08-20T02:23:56ZengInstituto Tecnológico de Costa RicaTecnología en Marcha0379-39822215-32412016-06-0129510.18845/tm.v29i5.25812133Estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados usando conjuntos aproximados y/o ganancia de informaciónLuis Alexánder Calvo-ValverdeHoy en día se recogen datos de muy diversa índole y a un bajo costo, como no se había visto antes en la historia de la humanidad; por ejemplo, sensores que registran datos a cada minuto, páginas web que almacenan todas las acciones que realiza el usuario, supermercados que guardan todo lo que sus clientes compran y en qué momento lo hacen. Pero estas grandes bases de datos presentan un gran reto a sus propietarios ¿Cómo sacarles provecho?, ¿cómo convertir datos en información para la toma de decisiones? Este artículo presenta una estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados utilizando conjuntos aproximados y/o ganancia de información. Se propone una estrategia para agrupar los datos utilizando k-means, considerando cuánta información aporta un atributo (ganancia de información), además de poder seleccionar cuáles atributos son realmente indispensables para clasificar nuevos datos y cuáles son dispensables (conjuntos aproximados), lo cual es muy beneficioso pues permite tomar decisiones en menor tiempo. https://revistas.tec.ac.cr/index.php/tec_marcha/article/view/2581Aprendizaje de máquinaminería de datosconjuntos aproximadosentropíaganancia de informaciónreducción de atributos |
| spellingShingle | Luis Alexánder Calvo-Valverde Estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados usando conjuntos aproximados y/o ganancia de información Tecnología en Marcha Aprendizaje de máquina minería de datos conjuntos aproximados entropía ganancia de información reducción de atributos |
| title | Estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados usando conjuntos aproximados y/o ganancia de información |
| title_full | Estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados usando conjuntos aproximados y/o ganancia de información |
| title_fullStr | Estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados usando conjuntos aproximados y/o ganancia de información |
| title_full_unstemmed | Estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados usando conjuntos aproximados y/o ganancia de información |
| title_short | Estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados usando conjuntos aproximados y/o ganancia de información |
| title_sort | estrategia basada en el aprendizaje de maquina para tratar con conjuntos de datos no etiquetados usando conjuntos aproximados y o ganancia de informacion |
| topic | Aprendizaje de máquina minería de datos conjuntos aproximados entropía ganancia de información reducción de atributos |
| url | https://revistas.tec.ac.cr/index.php/tec_marcha/article/view/2581 |
| work_keys_str_mv | AT luisalexandercalvovalverde estrategiabasadaenelaprendizajedemaquinaparatratarconconjuntosdedatosnoetiquetadosusandoconjuntosaproximadosyogananciadeinformacion |