Definición y fórmula del análisis de la varianza (ANOVA)

Qué es el análisis de la varianza (ANOVA)?

El análisis de la varianza (ANOVA) es una herramienta de análisis utilizada en estadística que divide la variabilidad agregada observada dentro de un conjunto de datos en dos partes: factores sistemáticos y factores aleatorios. Los factores sistemáticos tienen una influencia estadística en el conjunto de datos dado, mientras que los factores aleatorios no. Los analistas utilizan la prueba ANOVA para determinar la influencia que tienen las variables independientes sobre la variable dependiente en un estudio de regresión.

Los métodos de prueba t y z desarrollados en el siglo XX se utilizaron para el análisis estadístico hasta 1918, cuando Ronald Fisher creó el método de análisis de la varianza. El ANOVA también se denomina análisis de varianza de Fisher, y es la extensión de las pruebas t y z. El término se hizo conocido en 1925, tras aparecer en el libro de Fisher, „Statistical Methods for Research Workers.” Se empleó en psicología experimental y posteriormente se amplió a temas más complejos.

Puntos clave

  • El análisis de la varianza, o ANOVA, es un método estadístico que separa los datos de la varianza observada en diferentes componentes para utilizarlos en pruebas adicionales.
  • Un ANOVA de una vía se utiliza para tres o más grupos de datos, para obtener información sobre la relación entre las variables dependientes e independientes.
  • Si no existe una varianza real entre los grupos, la razón F del ANOVA debería ser cercana a 1.

1:01

Qué es el análisis de la varianza (ANOVA)?

La fórmula del ANOVA es

F = MST MSE donde F = Coeficiente ANOVA MST = Suma media de cuadrados debida al tratamiento MSE = Suma media de los cuadrados debidos al error \N – Inicio {alineado} &\text{F} = \frac{ \text{MST} }{ \text{MSE} } \frac &\textbf{donde:} \\ &\text{F} = \text{coeficiente del ANOVA} \text &\text{MST} = \text{Suma media de cuadrados debida al tratamiento} \text &\text{MSE} = \text{Suma media de cuadrados debidos al error} \end{alineado} F=MSEMSTdonde:F=Coeficiente de ANOVAMST=Suma media de los cuadrados debidos al tratamientoMSE=Suma media de los cuadrados debidos al error

Qué revela el análisis de la varianza?

La prueba ANOVA es el paso inicial en el análisis de los factores que afectan a un conjunto de datos determinado. Una vez terminada la prueba, un analista realiza pruebas adicionales sobre los factores metódicos que contribuyen de forma medible a la inconsistencia del conjunto de datos. El analista utiliza los resultados de la prueba ANOVA en una prueba f para generar datos adicionales que se ajusten a los modelos de regresión propuestos.

La prueba ANOVA permite comparar más de dos grupos al mismo tiempo para determinar si existe una relación entre ellos. El resultado de la fórmula del ANOVA, el estadístico F (también llamado ratio F), permite el análisis de múltiples grupos de datos para determinar la variabilidad entre muestras y dentro de ellas.

Si no existe ninguna diferencia real entre los grupos analizados, lo que se denomina hipótesis nula, el resultado del estadístico F-ratio del ANOVA será cercano a 1. La distribución de todos los valores posibles del estadístico F es la distribución F. Se trata en realidad de un grupo de funciones de distribución, con dos números característicos, llamados grados de libertad del numerador y grados de libertad del denominador.

Ejemplo de cómo utilizar el ANOVA

Un investigador puede, por ejemplo, analizar a los estudiantes de varias universidades para ver si los estudiantes de una de las universidades superan sistemáticamente a los de las demás. En una aplicación empresarial, un R&D investigador podría probar dos procesos diferentes de creación de un producto para ver si un proceso es mejor que el otro en términos de eficiencia de costes.

El tipo de prueba de ANOVA que se utiliza depende de una serie de factores. Se aplica cuando los datos deben ser experimentales. El análisis de la varianza se emplea cuando no se tiene acceso a un software estadístico, por lo que hay que calcular el ANOVA a mano. Es sencillo de utilizar y es el más adecuado para muestras pequeñas. En muchos diseños experimentales, el tamaño de las muestras tiene que ser el mismo para las distintas combinaciones de niveles de factores.

El ANOVA es útil para probar tres o más variables. Es similar a las pruebas t de dos muestras múltiples. Sin embargo, da lugar a menos errores de tipo I y es apropiado para una serie de cuestiones. El ANOVA agrupa las diferencias comparando las medias de cada grupo e incluye la distribución de la varianza en diversas fuentes. Se emplea con sujetos, grupos de prueba, entre grupos y dentro de grupos.

ANOVA de una vía frente a ANOVA de dos vías

Existen dos tipos principales de ANOVA: de una vía (o unidireccional) y de dos vías. También hay variaciones de ANOVA. Por ejemplo, el MANOVA (ANOVA multivariante) se diferencia del ANOVA en que el primero examina múltiples variables dependientes simultáneamente, mientras que el segundo sólo evalúa una variable dependiente cada vez. Una vía o dos vías se refiere al número de variables independientes en su prueba de análisis de la varianza. Un ANOVA unidireccional evalúa el impacto de un único factor en una única variable de respuesta. Determina si todas las muestras son iguales. El ANOVA de una vía se utiliza para determinar si hay diferencias estadísticamente significativas entre las medias de tres o más grupos independientes (no relacionados).

Un ANOVA de dos vías es una extensión del ANOVA de una vía. Con una sola vía, se tiene una variable independiente que afecta a una variable dependiente. Con un ANOVA de dos vías, hay dos independientes. Por ejemplo, un ANOVA de dos vías permite a una empresa comparar la productividad de los trabajadores en función de dos variables independientes, como el salario y el conjunto de habilidades. Se utiliza para observar la interacción entre los dos factores y prueba el efecto de dos factores al mismo tiempo.

Nuestro equipo requiere que los escritores utilicen fuentes primarias para apoyar su trabajo. Se trata de libros blancos, datos gubernamentales, informes originales y entrevistas con expertos del sector. También hacemos referencia a investigaciones originales de otras editoriales de renombre cuando es necesario. Puede obtener más información sobre las normas que seguimos para producir contenidos precisos e imparciales en nuestro
política editorial.

  1. Ronald Fisher. "La Correlación entre Parientes en el Supuesto de la Herencia Mendeliana." Transacciones de la Real Sociedad de Edimburgo, 52(2), 1918. Páginas 399-433.

  2. Enciclopedia Británica. "Sir Ronald Aylmer Fisher." Accedido en agosto. 10, 2020.

  3. Ronald Fisher. "Métodos estadísticos para investigadores." Springer-Verlag New York, 1992.

Dodaj komentarz