Ir al contenido principal

[DATA SCIENCE][ESTADISTICA] Conceptos de Chi-Cuadrado y P-Value

Conceptos de Chi-Cuadrado y P-Value

Conceptos de Chi-Cuadrado y P-Value

Profundicemos en los conceptos matemáticos del estadístico chi-cuadrado (χ²) y del valor p (p-value).

Prueba de Chi-Cuadrado (χ²)

La prueba de chi-cuadrado es una prueba estadística que se utiliza para determinar si existe una asociación significativa entre dos variables categóricas. Esta prueba compara las frecuencias observadas con las frecuencias esperadas bajo la hipótesis de que no existe ninguna relación entre las variables (hipótesis nula).

Fórmula del Estadístico Chi-Cuadrado

χ² = ∑ ( (O_i - E_i)² / E_i )

Donde:

  • O_i es la frecuencia observada en la categoría i.
  • E_i es la frecuencia esperada en la categoría i.
  • ∑ es la suma de todas las categorías.

Procedimiento de la Prueba Chi-Cuadrado

  1. Calcular las Frecuencias Esperadas: Bajo la hipótesis nula, se calcula la frecuencia esperada para cada combinación de categorías.
  2. Calcular el Estadístico Chi-Cuadrado: Utilizando la fórmula anterior, se calcula el valor de χ².
  3. Determinar los Grados de Libertad: El número de grados de libertad (df) para la prueba de chi-cuadrado es:
    df = (r - 1) × (c - 1)
    Donde r es el número de filas y c es el número de columnas en la tabla de contingencia.
  4. Comparar con el Valor Crítico: Se compara el estadístico χ² calculado con el valor crítico de la distribución chi-cuadrado para los grados de libertad dados y un nivel de significancia específico (por ejemplo, 0.05).
  5. Interpretar el Resultado: Si el estadístico χ² calculado es mayor que el valor crítico, se rechaza la hipótesis nula, lo que indica una asociación significativa entre las variables.

Valor P (P-Value)

El valor p es la probabilidad de obtener un resultado tan extremo o más extremo que el observado, bajo la suposición de que la hipótesis nula es verdadera. En el contexto de la prueba de chi-cuadrado, el valor p se utiliza para determinar la significancia de la prueba.

Interpretación del Valor P

  • Valor p bajo (generalmente < 0.05): Indica que existe evidencia suficiente para rechazar la hipótesis nula. En otras palabras, hay una asociación significativa entre las variables.
  • Valor p alto (≥ 0.05): No se puede rechazar la hipótesis nula. Esto sugiere que no hay evidencia suficiente para afirmar que existe una asociación significativa entre las variables.

Ejemplo Práctico

Supongamos que tienes los siguientes datos observados en una tabla de contingencia:

Predicho: Bajo Predicho: Medio Predicho: Alto
Actual: Bajo 1150 84 98
Actual: Medio 166 1801 170
Actual: Alto 35 38 458

Queremos realizar una prueba de chi-cuadrado para determinar si existe una asociación significativa entre las clasificaciones reales y las predichas.

Pasos:

  1. Calcular las Frecuencias Esperadas: Utilizamos la fórmula para calcular las frecuencias esperadas basadas en las sumas marginales de la tabla.
  2. Calcular el Estadístico Chi-Cuadrado: Aplicamos la fórmula del estadístico chi-cuadrado utilizando las frecuencias observadas y esperadas.
  3. Determinar los Grados de Libertad: Número de grados de libertad (df) = (3 - 1) × (3 - 1) = 4.
  4. Obtener el Valor P: Utilizamos la distribución chi-cuadrado con 4 grados de libertad para obtener el valor p asociado al estadístico χ² calculado.

Por ejemplo, si el estadístico χ² calculado es 4449 y el valor p es 0, esto indica una asociación altamente significativa entre las clasificaciones reales y las predichas.

Conclusión

  • Prueba de Chi-Cuadrado: Compara frecuencias observadas y esperadas para determinar la asociación entre dos variables categóricas.
  • Valor P: Evalúa la significancia estadística de los resultados.

Espero que esta explicación haya sido clara. ¿Te gustaría profundizar en algún otro concepto o continuar con algún tema específico? 😊

Comentarios

Entradas populares de este blog

[CIVILIZACION][MODELOS] La Civilización Hiper-Avanzada y la Escala Kardashev

La Civilización Hiper-Avanzada y la Escala Kardashev ¿Qué es la Escala Kardashev? La Escala Kardashev es un marco propuesto en 1964 por el astrofísico Nikolai Kardashev para clasificar civilizaciones según su capacidad de aprovechar energía: Tipo I: Aprovecha toda la energía disponible en su planeta (~10¹⁶ watts). Nosotros estamos en ~0,72 según Carl Sagan. Tipo II: Captura toda la energía de su estrella (por ejemplo, con una esfera de Dyson). ~10²⁶ watts. Tipo III: Controla la energía de toda su galaxia (~10³⁶ watts). Carl Sagan propuso una fórmula para grados intermedios: K = [log10(Potencia en watts) - 6] / 10 La humanidad (~1,74 × 10¹³ watts) = ~0,72 en esta escala. ¿Cómo se podría acelerar la transición a Tipo II o III si obviamos la ética? Si ignoramos la moral, la estrategia sería pragmática y extrema: Centralización extrema del poder: Unificación bajo un mando único global tecnocrático. Explotación total de recursos: Minería planetaria masiva, co...

[Validación Cruzada] [Machine Learning] [Evaluación de Modelos] [Ciencia de Datos] [R Programming] [Resampling] Validación Cruzada: Concepto y Técnicas Principales

Validación Cruzada: Concepto y Técnicas Principales Validación Cruzada: Concepto y Técnicas Principales La validación cruzada es un conjunto de técnicas utilizadas para evaluar la capacidad de generalización de un modelo de machine learning. Su objetivo principal es determinar cómo de bien puede el modelo desempeñarse con datos no vistos, proporcionando una evaluación más robusta y fiable en comparación con dividir los datos en un simple conjunto de entrenamiento y prueba. Principales Técnicas de Validación Cruzada 1. K-Fold Cross Validation (Validación Cruzada K-Fold) El conjunto de datos se divide en \(k\) particiones o "pliegues" de igual tamaño. El modelo se entrena \(k\) veces: en cada iteración, un pliegue diferente se utiliza como conjunto de prueba y los \(k-1\) pliegues restantes como conjunto de entrenamiento. La métrica final (por ejemplo, precisión, F1, etc.) se c...

Encontré 42 GB de modelos de IA fosilizados en mi PC: una puesta al día honesta sobre IA local, conceptos y entornos Python en 2026

Hace tiempo que no tocaba nada de IA en mi PC, y al echar un ojo descubrí varios programas que no recordaba para qué eran y, sobre todo, modelos de hace año y medio acumulando polvo en el disco. Lo que empezó como una limpieza acabó siendo una puesta al día completa: Ollama, conceptos fundamentales, mapa del ecosistema, comparativas, y un setup de Python desde cero. Lo dejo aquí ordenado por si a alguien le sirve. 1. El punto de partida: 42 GB de modelos zombi Lo primero que encontré fue Ollama corriendo en segundo plano (ese icono pequeño en la barra de tareas que llevaba meses sin tocar). Un ollama list reveló cinco modelos descargados hacía 18 meses, ocupando casi 42 GB: llama-3-8B-programming-questions — 16 GB SuperNova-Medius-Q8_0 — 15 GB uncensored_wizard_7b — 4.1 GB llama3.2 — 2 GB llama3.1 — 4.7 GB En el mundo de la IA, 18 meses son una eternidad. Han salido Llama 3.3 y 4, Qwen 2.5 y 3, DeepSeek-V3 y R1, Gemma 3 y 4, gpt-oss... cualquiera de los nu...