ANOVA
ANOVA es el acrónimo en inglés de Analysis of Variance. Es una colección de modelos y procedimientos estadísticos para comparar medias mediante fragmentación de la varianza. El análisis de varianza sirve para comparar si los valores de un conjunto de datos numéricos son significativamente distintos a los valores de otro u otros conjuntos de datos. El procedimiento para comparar estos valores está basado en la varianza global observada en los grupos de datos numéricos a comparar. Típicamente, el análisis de varianza se utiliza para asociar una probabilidad a la conclusión de que la media de un grupo de puntuaciones es distinta de la media de otro grupo de puntuaciones.
Supuestos previos de ANOVA
- la variable dependiente debe medirse al menos a nivel de intervalo
- las observaciones son independientes
- las de la variable dependiente tienen una distribución normal
- homocedasticidad = homogeneidad de las varianzas
Síntesis
Existen tres tipos de modelos:
- El modelo de efectos fijos asume que el experimentador ha considerado para el factor todos los posibles valores que éste puede tomar. Ejemplo: Si el género del individuo es un factor y el experimentador ha incluido tantos individuos masculinos como femeninos, el género es un factor fijo en el experimento.
- Los modelos de efectos aleatorios asumen que en un factor se ha considerado tan sólo una muestra de los posibles valores que éste puede tomar. Ejemplo: Si el método de enseñanza es analizado como un factor que puede influir sobre el nivel de aprendizaje y se ha considerado en el experimento sólo tres de los muchos más métodos posibles, el método de enseñanza es un factor aleatorio en el experimento.
- Los modelos mixtos describen situaciones donde están presentes ambos tipos de factores: fijos y aleatorios.
La técnica fundamental consiste en la separación de la suma de cuadrados (SS, sum of squares) en componentes relativos a los factores contemplados en el modelo. Como ejemplo, se muestra el modelo para un ANOVA simplificado con un tipo de factores en diferentes niveles. (Si los niveles son cuantitativos y los efectos son lineales, puede resultar apropiado un análisis de regresión lineal)
- SStotal = SSerror + SSfactores
El número de grados de libertad (gl) puede separarse de forma similar y se corresponde con la forma en que la distribución chi-cuadrado describe la suma de cuadrados asociada.
- gltotal = glerror + glfactores