¿Has oído hablar del contraste de hipótesis?
Si estás investigando seguro que sí.
Pero sinceramente creo que no lo entiendes del todo.
Porque muchos de los errores en publicaciones científicas provienen del contraste de hipótesis
Hoy te quiero explicar (a mi manera) que es un contraste de hipótesis y para qué se utiliza. ¿Vamos?
# No sé si tengo fiebre o no
Seguro que te ha pasado que te sientes la cabeza como un bombo, sensación extraña en la piel, algún escalofrío y ganas de nada. Estar en el sofá. Claros indicios que tienes fiebre, ¿verdad?
Entonces piensas. Voy a comprobarlo. Te pones el termómetro y efectivamente marca 38ºC. Ya sabes lo que toca. Antitérmico y sofá.
Esto es precisamente un contraste de hipótesis. Tan sencillo cómo esto.
Tu tienes una intuición y quieres investigar si esta intuición es cierta. Tu hipótesis de investigación es que “tengo fiebre”. También llamada hipótesis del investigador o alternativa (H1).
Es la que quieres corroborar. La que no es habitual. Es un estado raro. Curioso. Nuevo.
Por el contrario tienes la hipótesis nula. ¿Por que nula?. Es la contraria. “NO tengo fiebre”
Es la que no te gustaría aceptar si eres un investigador.
Por ejemplo. Quieres ver si el tratamiento de una lesión de rodilla es más efectivo que otro. La hipótesis de investigación es que este nuevo tratamiento es mejor que el convencional.
La hipótesis nula es que el nuevo tratamiento NO es mejor que el convencional.
¿Se entiende la idea?
Bien pues cuando te pones el termómetro estás haciendo un test estadístico.
Además utilizas un criterio para decidir sin la hipótesis de investigación “tengo fiebre” es cierta.
- Si el valor es más alto que 37ºC tienes fiebre.
- Por lo contrario no tienes fiebre
Si el termómetro te ha marcado 38ºC. Puedes afirmar que tienes fiebre. La hipótesis del investigador es cierta. Te toca descansar…
# ¿Cómo puedes comprobar un contraste de hipótesis? ¿Te suena el p-valor?
Cuando miras el termómetro estás mirando si supera 37ºC. Inconscientemente estás utilizando un valor de contraste. ¿Y eso que es? El valor que vas a mirar para decidir si tu hipótesis de investigación es cierta o no.
Algo parecido es el p-valor. Un número que te va a dar el test estadístico para ver si te puedes quedar con la hipótesis de investigación o no.
Pero necesitas un criterio. En el caso de la temperatura tienes el criterio de 37ºC. En estadística normalmente se utiliza el 0.05 (o el 5%)
Sigue esta receta:
- Si el pvalor es más grande que 0.05 NO puedes rechazar la hipótesis nula (“NO tengo fiebre”)
- Si el pvalor es más pequeño que 0.05 rechazas la hipótesis nula (“NO tiengo fiebre”) y te quedas con la hipótesis de investigación (“tengo fiebre”)
Este es el criterio que vas a utilizar.
# La guía del contraste de hipótesis
Para que no te pierdas te he creado una plantilla muy sencilla que te puede ir muy bien.
# Un ejemplo: comparar dos grupos
Creo que es mejor que veas con un ejemplo como funciona la metodología del contraste de hipótesis y enseguida vas a entender para qué sirve. ¡A por ello!
Puedes descargarte el ejemplo aquí 😉
Vamos a comparar el peso entre dos grupos para ver si hay diferencias entre sexos.
Para comparar dos grupos puedes utilizar el test de t-student para grupos independientes.
Los grupos dependientes normalmente se utilizan cuando quieres comparar la evolución de una variable en el tiempo. El peso de una mujer antes de estar embarazada y después de tener el hijo por ejemplo. Entonces utilizarás una prueba para grupos dependientes.
Nuestro caso es independiente. Bien.
¿Qué suposiciones tiene el test de t-student?
- Las poblaciones de los grupos son normales.
- Y los dos grupos tienen las mismas varianzas.
¡Bien!
Si miras el vídeo te demuestro que efectivamente las dos poblaciones son normales pero las varianzas son diferentes.
[sourcecode lang=»r»]
#********************************************************************
# 1.1 INSTALAR PAQUETES DE FUNCIONES
#********************************************************************
# Lista de paquetes de funciones a instalar
.packages = c(«car»)
# Instala los paquetes sinó los tienes instalados
.inst <- .packages %in% installed.packages() if(length(.packages[!.inst]) > 0) install.packages(.packages[!.inst])
#********************************************************************
# 1.2 CARGAR PAQUETES O CREAR FUNCIONES
#********************************************************************
# Carga los paquetes sinó los tienes cargados
lapply(.packages, require, character.only=TRUE)
#********************************************************************
# 2. IMPORTAR/CREAR DATOS
#********************************************************************
data <- read.csv(«data.csv»,sep = «;»)
HOMBRES <- data[data[,1]==»HOMBRE»,2]
MUJERES <- data[data[,1]==»MUJER»,2]
[/sourcecode]
Una vez hayas cargado los datos ya puedes verificar las suposiciones que requieren el test estadístico. La prueba de hipótesis t-student para grupos independientes requiere dos cosillas:
- Los grupos provienen de distribuciones normales
- Las varianzas de los dos grupos son iguales
[sourcecode lang=»r»]
#********************************************************************
# 3.1 ¿LAS POBLACIONES SON NORMALES?
#********************************************************************
# HOMBRES
#*******************************************************************
# >> 1. QQPLOT
qqnorm(HOMBRES, pch = 1, frame = FALSE)
qqline(HOMBRES, col = «steelblue», lwd = 2)
library(«car»)
qqPlot(HOMBRES)
# >> 2. HISTOGRAMA para ver la forma de la Distribución
hist(HOMBRES,breaks = 15)
# >> 3. SHAPIRO WILK TEST p-valor -> 0.05 >> es NORMAL
x.test <- shapiro.test(HOMBRES) print(x.test) # MUJERES #******************************************************************* # >> 1. QQPLOT
qqnorm(MUJERES, pch = 1, frame = FALSE)
qqline(MUJERES, col = «steelblue», lwd = 2)
library(«car»)
qqPlot(MUJERES)
# >> 2. HISTOGRAMA para ver la forma de la Distribución
hist(MUJERES,breaks = 15)
# >> 3. SHAPIRO WILK TEST p-valor>0.05 >> es NORMAL
y.test <- shapiro.test(MUJERES) print(y.test) # CONCLUSIÓN: POBLACIONES HOMBRES y MUJERES SON NORMALES #******************************************************************** # 3.1 ¿LAS VARIANZAS SON IGUALES? #******************************************************************** # >> TEST F para VARIANZAS iguales p-valor>0.05 >> SON IGUALES
var.test(HOMBRES,MUJERES, alternative = «two.sided»)
# CONCLUSIÓN: TIENES VARIANZAS DIFERENTES. NO PUEDES APLICAR T-TEST CONVENCIONAL
#********************************************************************
# 3.1 APLICAMOS EL T-TEST MODIFICADO CON VARIANZAS DIFERENTES
#********************************************************************
t.test(HOMBRES,MUJERES, var.equal=FALSE, paired=FALSE)
# CONCLUSIÓN: LOS GRUPOS SON DIFERENTES
[/sourcecode]
Cuando tienes varianzas diferentes puedes utilizar un test t-student modificado. Específico para muestras con varianzas diferentes. En R sería esto:
[sourcecode lang=»r»]
#********************************************************************
# 3.1 APLICAMOS EL T-TEST MODIFICADO CON VARIANZAS DIFERENTES
#********************************************************************
t.test(HOMBRES,MUJERES, var.equal=FALSE, paired=FALSE)
# CONCLUSIÓN: LOS GRUPOS SON DIFERENTES
[/sourcecode]
El resultado que aparece en RStudio es:
Ya puedes rellenar la plantilla de tu estudio.
…
Hoy has aprendido un montón sobre pruebas de hipótesis. Te he enseñado un símil para que entiendas qué es una prueba de hipótesis y además te enseñado un ejemplo R paso a paso.
¿Te gustaría que te explicará cómo asegurarte si una distribución es normal o no?
Excelente material de estudio y trabajo. Muchas gracias por aportes tan importantes para todos los que accesamos al mismo.
Es un placer María!
Tendrás muchos más! Saludos!
Excelente aportación!! yo tengo un proyecto de diseño pero no se como aplicar el análisis estadístico, osea, entendí que puedo aplicar la estadística descriptiva… pero ¿Cómo aplicar la estadística inferencial? trato de guiarme con los ejemplos, pero siento que no tienen relación con mi proyecto… si pudiera ayudarme estaré agradecida..
Muchas gracias Jordi! Me ayudaste a entender por fin! 🙂
Es una de las explicaciones más comprensibles que he tenido la oportinidad de consultar. Gracias por el trabajo realizado con esta redacción y felitaciones en próximas aprotaciones que tanto bien hacen.