[DATA SCIENCE] Guion de formación en matemáticas y R sobre matrices de confusión, diagramas de mosaico, análisis de componentes principales y diagramas ROC.
Guion de Formación en Matemáticas y R
Este guion está diseñado para aprender y consolidar conocimientos sobre matrices de confusión, diagramas de mosaico, análisis de componentes principales (PCA) y diagramas ROC utilizando la plataforma R.
1. Matrices de Confusión
Teoría Matemática:
- Definición: Una matriz de confusión evalúa el rendimiento de un modelo de clasificación. Consiste en una tabla que compara las predicciones del modelo con los valores reales.
- Componentes:
- Verdaderos Positivos (TP)
- Falsos Positivos (FP)
- Verdaderos Negativos (TN)
- Falsos Negativos (FN)
- Métricas derivadas:
- Precisión:
Precision = TP / (TP + FP)
- Sensibilidad:
Recall = TP / (TP + FN)
- Especificidad:
Specificity = TN / (TN + FP)
- F1 Score:
F1 = 2 * (Precision * Recall) / (Precision + Recall)
- Precisión:
Práctica en R:
data(iris)
library(caret)
confusionMatrix(data = factor(c("setosa", "setosa", "versicolor")),
reference = factor(c("setosa", "versicolor", "versicolor")))
Videos Recomendados:
- Introducción a las Matrices de Confusión (StatQuest)
- Tutorial de Matriz de Confusión en R (en español)
2. Diagramas de Mosaico
Teoría Matemática:
- Definición: Representan datos categóricos en forma de rectángulos proporcionales a las frecuencias de las combinaciones de categorías.
Práctica en R:
data(Titanic)
mosaicplot(Titanic, main = "Diagrama de mosaico")
Videos Recomendados:
3. Análisis de Componentes Principales (PCA)
Teoría Matemática:
- Objetivo: Reducir la dimensionalidad de un conjunto de datos conservando la mayor varianza posible.
- Cálculos principales:
- Centrar y escalar los datos.
- Calcular la matriz de covarianza y obtener autovalores/autovectores.
- Proyectar los datos en el espacio de componentes principales.
Práctica en R:
data(mtcars)
pca <- prcomp(mtcars, scale = TRUE)
summary(pca)
plot(pca)
Videos Recomendados:
4. Diagramas ROC
Teoría Matemática:
- Definición: Evalúan la capacidad de un modelo de clasificación binaria para distinguir entre clases.
- Cálculos:
- Tasa de Verdaderos Positivos (TPR):
TPR = TP / (TP + FN)
- Tasa de Falsos Positivos (FPR):
FPR = FP / (FP + TN)
- Tasa de Verdaderos Positivos (TPR):
Práctica en R:
library(pROC)
data(aSAH)
roc_obj <- roc(aSAH$outcome, aSAH$s100b)
plot(roc_obj)
Videos Recomendados:
Orden Sugerido de Aprendizaje
- Matrices de Confusión
- Diagramas ROC
- Diagramas de Mosaico
- PCA
Espero que este guion te sea útil para aprender y dominar estos conceptos en matemáticas y R. ¡No dudes en comentar si tienes dudas o necesitas más recursos!
Comentarios
Publicar un comentario