¿Cómo pruebo la normalidad de mis datos?

¿Sabes qué tipo de pruebas de normalidad de datos hay que realizar antes de aplicar métodos estadísticos que asuman normalidad?

Las siguientes pruebas estadísticas, estadísticas o métodos asumen que los datos tienen una distribución normal:

  • Pruebas de hipótesis como pruebas t, pruebas de Chi-cuadrado, pruebas F
  • Análisis de varianza (ANOVA)
  • Regresión de mínimos cuadrados
  • Gráficos de control Individuales con límites 3 sigma
  • Fórmulas comunes para índices de capacidad de proceso como Cp y Cpk.

Figura 1: Histograma que representa una distribución normal (en forma de campana) en WinSPC

Antes de aplicar métodos estadísticos que asumen normalidad, es necesario realizar una prueba de normalidad en los datos (con algunos de los métodos anteriores verificamos la normalidad de los residuos). Suponemos que nuestros datos siguen una distribución normal y solo rechazamos esta hipótesis si tenemos pruebas sólidas de lo contrario.

Un software de control estadístico de procesos puede brindarte toda está información en tiempo real y sin necesidad de realizar ningún cálclulo. Conoce más

Si bien puede ser tentador juzgar la normalidad de los datos simplemente creando un histograma, este no es un método objetivo para probar la normalidad, especialmente con tamaños de muestra que no son muy grandes. Con tamaños de muestra pequeños, es difícil discernir la forma del histograma. Además, la forma del histograma puede cambiar significativamente simplemente cambiando el ancho del intervalo de las barras del histograma. La gráfica de probabilidad normal puede usarse para evaluar objetivamente si los datos provienen de una distribución normal, incluso con tamaños de muestra pequeños. En una gráfica de probabilidad normal, los datos que siguen una distribución normal aparecerán lineales (una línea recta). Por ejemplo, una muestra aleatoria de 30 puntos de datos de una distribución normal da como resultado la primera gráfica de probabilidad normal (Figura 2). Aquí, los puntos de datos caen cerca de la línea recta. La segunda gráfica de probabilidad normal (Figura 3) ilustra datos que no provienen de una distribución normal.

Figura 2: Gráfico de probabilidad normal que ilustra la distribución normal

Figura 3: Gráfico de probabilidad normal que ilustra la distribución no normal

Hay muchos métodos disponibles para manejar datos no normales y estos deberían utilizarse cuando sea necesario. La aplicación de métodos que asumen la distribución normal cuando esta suposición no es válida a menudo da como resultado conclusiones incorrectas.

Artículos Relacionados