Una de las herramientas estadísticas más famosas es el Análisis de Varianza ANOVA.
En este artículo te voy a explicar cómo entender este tipo de análisis y cómo aplicarlo en tus propios datos.
El objetivo es que consigas ver cuál es la lógica de aplicación de la tabla y a qué se parece este tipo de análisis.
¡Al final te lo cuento todo!
(Te aviso que el detalle matemático de la tabla ANOVA no te lo voy a desvelar. Eso será en otro artículo)
¿Qué utilidad tiene la tabla ANOVA?
Vamos a empezar por lo más importante. Dejamos la matemática a un lado.
¿Para qué sirve? ¿Cuándo la utilizo?
Sencillo.
Imagínate que estás colaborando con el área de sports analytics de un equipo de la NBA. (molaría ehhh). Y estás analizando si el salario es sinónimo de buen rendimiento.
Puedes plantear el problema de esta forma.
Si pudiéramos hacer tres grupos de jugadores de baloncesto según el salario lo podrías pensar de esta forma:
- Grupo 1 – Salario bajo
- Grupo 2 – Salario medio
- Grupo 3 – Salario alto
¿Cómo sé si estos grupos tienen mayor rendimiento en la pista?
El rendimiento lo puedes medir con la valoración, que es una variable cuantitativa.
Necesitamos una herramienta que nos compare estos tres grupos. Y nos diga si estadísticamente estos grupos son distintos o no.
Esta herramienta puede ser la tabla ANOVA. (También podrías utilizar los intervalos de confianza para hacerlo)
Si el resultado de la ANOVA es significativo entonces habrá diferencias en el rendimiento según el grupo de salario.
Otro ejemplo (muy típico) pero muy ilustrativo es:
Eres biólogo y necesitas comparar estadísticamente si tres especies de flores son estadísticamente diferentes en relación a lo largo o ancho del pétalo.
Fíjate que pasa como el anterior caso.
Comparas una variable cuantitativa (ancho del pétalo) en función de los grupos de especies.
Repasamos los dos ejemplos:
- Ejemplo 1: Comparas la valoración de los jugadores en función de los grupos de salario
- Ejemplo 2: Comparas el ancho del pétalo en función de grupos de especies
- …
- Ejemplo Genérico: Comparas una variable cuantitativa en función de grupos (variable cualitativa)
¿Se va viendo la idea?
Espero que ahora sepas para qué sirve.
Ahora que tienes la foto práctica te cuento más detalles con un ejemplo.
¿El proceso de la comparación de medias con la tabla ANOVA? (con un ejemplo paso a paso)
A continuación te muestro un ejemplo paso a paso resuelto en R para que entiendas cómo aplicar esta tabla y cómo hacer todo el proceso paso a paso.
Te recomiendo que utilices este ejemplo y lo ejecutes. (Si no tienes R y RStudio instalado en tu PC te lo cuento aquí)
>>TE PUEDES DESCARGAR EL CÓDIGO R AQUÍ<<
Aquí tienes el ejemplo en vídeo:
¡Vamos a por más!
Descubre la verdadera esencia del ANálisis de VArianza
En el vídeo anterior te he explicado algo más de información sobre la tabla ANOVA. Si no lo has visto, ¡míralo! (y sigue leyendo 🙂 )
Déjame repetir una cosa:
- Ejemplo 1: Comparas la valoración de los jugadores en función de los grupos de salario. VALORACIÓN = f(Grupos de Jugadores)
- Ejemplo 2: Comparas el largo del pétalo en función de grupos de especies. LONG. PÉTALO = f(Grupos de Especies)
- …
- Ejemplo Genérico: Comparas una variable cuantitativa en función de grupos (variable cualitativa) VARIABLE CUANTITATIVA = f(VARIABLE CUALITATIVA)
Fíjate lo que te he resaltado en negrita.
Variable Respuesta en función de una Variable de Estudio.
O dicho de otro modo.
Variable Dependiente en función de una Variable Independiente.
Añado una imagen para que me entiendas:
¿Esto es un modelo estadístico? Es decir, ¿no te parece similar a una regresión lineal por ejemplo?
En el fondo una tabla ANOVA es un modelo estadístico. Es un modelo de causalidad.
Si quieres saber más, aquí te he resumido artículos sobre modelos estadísticos y lo verás mucho más claro:
…
Otro día te contaré el detalle matemático de la tabla ANOVA. De momento ahora ya conoces su aplicación.
¡Ahora te toca poner en práctica esta técnica!