Clasificación de cáncer de mama con técnicas de análisis de la componente principal-Kernel PCA, algoritmos de máquina de vectores de soporte y regresión logística
<p><strong>Fundamento:</strong> existen muchas herramientas computacionales para administrar imágenes y conjuntos de datos; reducir la dimensión de estos favorece el manejo de la información.<br /><strong>Objetivo:</strong> reducir la dimensión de un conjunto de d...
Saved in:
Main Author: | |
---|---|
Format: | Article |
Language: | Spanish |
Published: |
Centro Provincial de Información de Ciencias Médicas. Cienfuegos
2022-03-01
|
Series: | Medisur |
Subjects: | |
Online Access: | http://medisur.sld.cu/index.php/medisur/article/view/5370 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
_version_ | 1832576941769621504 |
---|---|
author | Rosana Pirchio |
author_facet | Rosana Pirchio |
author_sort | Rosana Pirchio |
collection | DOAJ |
description | <p><strong>Fundamento:</strong> existen muchas herramientas computacionales para administrar imágenes y conjuntos de datos; reducir la dimensión de estos favorece el manejo de la información.<br /><strong>Objetivo:</strong> reducir la dimensión de un conjunto de datos para un mejor manejo de la información.<br /><strong>Métodos:</strong> se utilizó el conjunto de datos de Breast Cancer Wisconsin (información de biopsias - células nucleares) y la plataforma Python Jupyter. Se implementaron técnicas de análisis de la componente principal (PCA) y Kernel PCA (kPCA) para reducir la dimensión a 2, 4, 6. Se hizo una validación cruzada para seleccionar los mejores hiperparámetros de los algoritmos de máquina de vectores de soporte y regresión logística. La clasificación se realizó con el training test original, training test (PCA y kPCA) y training test (datos transformados de PCA y kPCA). Se analizó la exactitud, precisión, exhaustividad, recuperación y el área bajo la curva.<br /><strong>Resultados:</strong> la PCA con seis componentes explicó la tasa de variación casi en 90 %. Los mejores hiperparámetros hallados para máquina de soporte de vectores: kernel lineal y C = 100, para regresión logística fueron C = 100, Newton-cg solución (solver) e I2. Los mejores resultados de las métricas fueron para PCA 2 y 4(0,99; 0,99; 1; 0,99; 0,99). Para el training set con datos originales fueron 0,96; 0,95; 0,99; 0,97; 0,95. Para regresión logística los mejores resultados fueron para kPCA con seis componentes. Los resultados estadísticos fueron iguales a 1. Para el training set con datos originales, esos valores fueron 0,96; 0,95; 0,99; 0,97; 0.95.<br /><strong>Conclusiones:</strong> los resultados de las métricas mejoraron utilizando PCA y kPCA.</p> |
format | Article |
id | doaj-art-fd24298896f34c16bb17470ea6351797 |
institution | Kabale University |
issn | 1727-897X |
language | Spanish |
publishDate | 2022-03-01 |
publisher | Centro Provincial de Información de Ciencias Médicas. Cienfuegos |
record_format | Article |
series | Medisur |
spelling | doaj-art-fd24298896f34c16bb17470ea63517972025-01-30T21:28:58ZspaCentro Provincial de Información de Ciencias Médicas. CienfuegosMedisur1727-897X2022-03-012021992092105Clasificación de cáncer de mama con técnicas de análisis de la componente principal-Kernel PCA, algoritmos de máquina de vectores de soporte y regresión logísticaRosana Pirchio0Universidad Tecnológica Nacional, Argentina.<p><strong>Fundamento:</strong> existen muchas herramientas computacionales para administrar imágenes y conjuntos de datos; reducir la dimensión de estos favorece el manejo de la información.<br /><strong>Objetivo:</strong> reducir la dimensión de un conjunto de datos para un mejor manejo de la información.<br /><strong>Métodos:</strong> se utilizó el conjunto de datos de Breast Cancer Wisconsin (información de biopsias - células nucleares) y la plataforma Python Jupyter. Se implementaron técnicas de análisis de la componente principal (PCA) y Kernel PCA (kPCA) para reducir la dimensión a 2, 4, 6. Se hizo una validación cruzada para seleccionar los mejores hiperparámetros de los algoritmos de máquina de vectores de soporte y regresión logística. La clasificación se realizó con el training test original, training test (PCA y kPCA) y training test (datos transformados de PCA y kPCA). Se analizó la exactitud, precisión, exhaustividad, recuperación y el área bajo la curva.<br /><strong>Resultados:</strong> la PCA con seis componentes explicó la tasa de variación casi en 90 %. Los mejores hiperparámetros hallados para máquina de soporte de vectores: kernel lineal y C = 100, para regresión logística fueron C = 100, Newton-cg solución (solver) e I2. Los mejores resultados de las métricas fueron para PCA 2 y 4(0,99; 0,99; 1; 0,99; 0,99). Para el training set con datos originales fueron 0,96; 0,95; 0,99; 0,97; 0,95. Para regresión logística los mejores resultados fueron para kPCA con seis componentes. Los resultados estadísticos fueron iguales a 1. Para el training set con datos originales, esos valores fueron 0,96; 0,95; 0,99; 0,97; 0.95.<br /><strong>Conclusiones:</strong> los resultados de las métricas mejoraron utilizando PCA y kPCA.</p>http://medisur.sld.cu/index.php/medisur/article/view/5370aprendizaje automáticointeligencia artificialmanejo de datos |
spellingShingle | Rosana Pirchio Clasificación de cáncer de mama con técnicas de análisis de la componente principal-Kernel PCA, algoritmos de máquina de vectores de soporte y regresión logística Medisur aprendizaje automático inteligencia artificial manejo de datos |
title | Clasificación de cáncer de mama con técnicas de análisis de la componente principal-Kernel PCA, algoritmos de máquina de vectores de soporte y regresión logística |
title_full | Clasificación de cáncer de mama con técnicas de análisis de la componente principal-Kernel PCA, algoritmos de máquina de vectores de soporte y regresión logística |
title_fullStr | Clasificación de cáncer de mama con técnicas de análisis de la componente principal-Kernel PCA, algoritmos de máquina de vectores de soporte y regresión logística |
title_full_unstemmed | Clasificación de cáncer de mama con técnicas de análisis de la componente principal-Kernel PCA, algoritmos de máquina de vectores de soporte y regresión logística |
title_short | Clasificación de cáncer de mama con técnicas de análisis de la componente principal-Kernel PCA, algoritmos de máquina de vectores de soporte y regresión logística |
title_sort | clasificacion de cancer de mama con tecnicas de analisis de la componente principal kernel pca algoritmos de maquina de vectores de soporte y regresion logistica |
topic | aprendizaje automático inteligencia artificial manejo de datos |
url | http://medisur.sld.cu/index.php/medisur/article/view/5370 |
work_keys_str_mv | AT rosanapirchio clasificaciondecancerdemamacontecnicasdeanalisisdelacomponenteprincipalkernelpcaalgoritmosdemaquinadevectoresdesoporteyregresionlogistica |