¿Cómo pruebo la normalidad de mis datos?
¿Sabes qué tipo de pruebas de normalidad de datos hay que realizar antes de aplicar métodos estadísticos que asuman normalidad?
Las siguientes pruebas estadísticas, estadísticas o métodos asumen que los datos tienen una distribución normal:
- Pruebas de hipótesis como pruebas t, pruebas de Chi-cuadrado, pruebas F
- Análisis de varianza (ANOVA)
- Regresión de mínimos cuadrados
- Gráficos de control Individuales con límites 3 sigma
- Fórmulas comunes para índices de capacidad de proceso como Cp y Cpk.
Figura 1: Histograma que representa una distribución normal (en forma de campana) en WinSPC
Antes de aplicar métodos estadísticos que asumen normalidad, es necesario realizar una prueba de normalidad en los datos (con algunos de los métodos anteriores verificamos la normalidad de los residuos). Suponemos que nuestros datos siguen una distribución normal y solo rechazamos esta hipótesis si tenemos pruebas sólidas de lo contrario.
Un software de control estadístico de procesos puede brindarte toda está información en tiempo real y sin necesidad de realizar ningún cálclulo. Conoce más
Si bien puede ser tentador juzgar la normalidad de los datos simplemente creando un histograma, este no es un método objetivo para probar la normalidad, especialmente con tamaños de muestra que no son muy grandes. Con tamaños de muestra pequeños, es difícil discernir la forma del histograma. Además, la forma del histograma puede cambiar significativamente simplemente cambiando el ancho del intervalo de las barras del histograma. La gráfica de probabilidad normal puede usarse para evaluar objetivamente si los datos provienen de una distribución normal, incluso con tamaños de muestra pequeños. En una gráfica de probabilidad normal, los datos que siguen una distribución normal aparecerán lineales (una línea recta). Por ejemplo, una muestra aleatoria de 30 puntos de datos de una distribución normal da como resultado la primera gráfica de probabilidad normal (Figura 2). Aquí, los puntos de datos caen cerca de la línea recta. La segunda gráfica de probabilidad normal (Figura 3) ilustra datos que no provienen de una distribución normal.
Figura 2: Gráfico de probabilidad normal que ilustra la distribución normal
Figura 3: Gráfico de probabilidad normal que ilustra la distribución no normal
Hay muchos métodos disponibles para manejar datos no normales y estos deberían utilizarse cuando sea necesario. La aplicación de métodos que asumen la distribución normal cuando esta suposición no es válida a menudo da como resultado conclusiones incorrectas.
Escrito por Francisco Olano
Artículos Relacionados
FDA: ¿Qué es y cómo regula la seguridad de los productos?
Conoce qué es la FDA, su relevancia y funciones en la industria farmacéutica y alimentaria y como regula la seguridad de estos productos
Control Estadístico de Procesos (SPC): Todo lo que debes saber
Descubre cómo optimizar tu proceso industrial hoy mismo. Implementa SPC para mejorar calidad y eficiencia con software WinSPC de SPC Pro.
IATF 16949: Qué es y cuál es su importancia en la industria automotriz
Explora la importancia de la norma IATF 16949 en la industria automotriz. Garantiza calidad, eficiencia y ventaja competitiva con estándares internacionales.
Comentarios recientes