contraste hipotesis

Para qué se utiliza el contraste de hipotesis. La técnica más utilizada en investigaciones científicas

contraste hipotesis

¿Has oído hablar del contraste de hipótesis?

Si estás investigando seguro que sí.

Pero sinceramente creo que no lo entiendes del todo.

Porque muchos de los errores en publicaciones científicas provienen del contraste de hipótesis

Hoy te quiero explicar (a mi manera) que es un contraste de hipótesis y para qué se utiliza. ¿Vamos?

# No sé si tengo fiebre o no

Seguro que te ha pasado que te sientes la cabeza como un bombo, sensación extraña en la piel, algún escalofrío y ganas de nada. Estar en el sofá. Claros indicios que tienes fiebre, ¿verdad?

Entonces piensas. Voy a comprobarlo. Te pones el termómetro y efectivamente marca 38ºC. Ya sabes lo que toca. Antitérmico y sofá.

Esto es precisamente un contraste de hipótesis. Tan sencillo cómo esto.

Tu tienes una intuición y quieres investigar si esta intuición es cierta. Tu hipótesis de investigación es que “tengo fiebre”. También llamada hipótesis del investigador o alternativa (H1).

Es la que quieres corroborar. La que no es habitual. Es un estado raro. Curioso. Nuevo.

Por el contrario tienes la hipótesis nula. ¿Por que nula?. Es la contraria. “NO tengo fiebre”

Es la que no te gustaría aceptar si eres un investigador.

Por ejemplo. Quieres ver si el tratamiento de una lesión de rodilla es más efectivo que otro. La hipótesis de investigación es que este nuevo tratamiento es mejor que el convencional.

La hipótesis nula es que el nuevo tratamiento NO es mejor que el convencional.

¿Se entiende la idea?

Bien pues cuando te pones el termómetro estás haciendo un test estadístico.

Además utilizas un criterio para decidir sin la hipótesis de investigación “tengo fiebre” es cierta.

  • Si el valor es más alto que 37ºC tienes fiebre.
  • Por lo contrario no tienes fiebre

Si el termómetro te ha marcado 38ºC. Puedes afirmar que tienes fiebre. La hipótesis del investigador es cierta. Te toca descansar…

# ¿Cómo puedes comprobar un contraste de hipótesis? ¿Te suena el p-valor?

Cuando miras el termómetro estás mirando si supera 37ºC. Inconscientemente estás utilizando un valor de contraste. ¿Y eso que es? El valor que vas a mirar para decidir si tu hipótesis de investigación es cierta o no.

Algo parecido es el p-valor. Un número que te va a dar el test estadístico para ver si te puedes quedar con la hipótesis de investigación o no.

Pero necesitas un criterio. En el caso de la temperatura tienes el criterio de 37ºC. En estadística normalmente se utiliza el 0.05 (o el 5%)

Sigue esta receta:

  1. Si el pvalor es más grande que 0.05 NO puedes rechazar la hipótesis nula (“NO tengo fiebre”)
  2. Si el pvalor es más pequeño que 0.05 rechazas la hipótesis nula (“NO tiengo fiebre”) y te quedas con la hipótesis de investigación (“tengo fiebre”)

Este es el criterio que vas a utilizar.

# La guía del contraste de hipótesis

Para que no te pierdas te he creado una plantilla muy sencilla que te puede ir muy bien.

Estos son los puntos que tienes que tener en cuenta:

A. Formular las hipótesis de investigación

  1. H1 o hipótesis del investigador (la que quieres justificar que es cierta con datos reales)
  2. H0 o hipótesis nula (contraria que la H1)

B. Decidir el criterio de significación

El criterio más típico es 0.05 (5%)

C. Elección de la prueba estadística

¿Qué test estadístico es el que vas a aplicar? Mirar libros o apuntes de estadística. Por ejemplo el test t-student para dos grupos independientes.

D. Calcular el p-valor

Se trata de calcular el valor de la prueba estadística que has decidido. Con herramientas como SPSS, R, Excel… el que quieras utilizar

E. Conclusión | decisión

  1. p<0.05 Rechazas la hipótesis nula y te quedas con la hipótesis del investigador. Tienes fiebre.
  2. p>0.05 NO puedes rechazar la hipótesis nula y NO puedes demostrar que la hipótesis del investigador sea cierta. (NUNCA decir que la H0 es cierta, sino que no la podemos rechazar)

 

# Un ejemplo: comparar dos grupos

Creo que es mejor que veas con un ejemplo como funciona la metodología del contraste de hipótesis y enseguida vas a entender para qué sirve. ¡A por ello!

Puedes descargarte el ejemplo aquí 😉

 

Vamos a comparar el peso entre dos grupos para ver si hay diferencias entre sexos.

Para comparar dos grupos puedes utilizar el test de t-student para grupos independientes.

Los grupos dependientes normalmente se utilizan cuando quieres comparar la evolución de una variable en el tiempo. El peso de una mujer antes de estar embarazada y después de tener el hijo por ejemplo. Entonces utilizarás una prueba para grupos dependientes.

Nuestro caso es independiente. Bien.

¿Qué suposiciones tiene el test de t-student?

  • Las poblaciones de los grupos son normales.
  • Y los dos grupos tienen las mismas varianzas.

¡Bien!

Si miras el vídeo te demuestro que efectivamente las dos poblaciones son normales pero las varianzas son diferentes.

#********************************************************************
# 1.1 INSTALAR PAQUETES DE FUNCIONES
#********************************************************************
# Lista de paquetes de funciones a instalar
.packages = c("car")

# Instala los paquetes sinó los tienes instalados
.inst <- .packages %in% installed.packages() if(length(.packages[!.inst]) > 0) install.packages(.packages[!.inst])

#********************************************************************
# 1.2 CARGAR PAQUETES O CREAR FUNCIONES
#********************************************************************
# Carga los paquetes sinó los tienes cargados
lapply(.packages, require, character.only=TRUE)

#********************************************************************
# 2. IMPORTAR/CREAR DATOS
#********************************************************************
data <- read.csv("data.csv",sep = ";")
HOMBRES <- data[data[,1]=="HOMBRE",2]
MUJERES <- data[data[,1]=="MUJER",2]

Una vez hayas cargado los datos ya puedes verificar las suposiciones que requieren el test estadístico. La prueba de hipótesis t-student para grupos independientes requiere dos cosillas:

  • Los grupos provienen de distribuciones normales
  • Las varianzas de los dos grupos son iguales
#********************************************************************
# 3.1 ¿LAS POBLACIONES SON NORMALES?
#********************************************************************
# HOMBRES
#*******************************************************************
# >> 1. QQPLOT
qqnorm(HOMBRES, pch = 1, frame = FALSE)
qqline(HOMBRES, col = "steelblue", lwd = 2)
library("car")
qqPlot(HOMBRES)

# >> 2. HISTOGRAMA para ver la forma de la Distribución
hist(HOMBRES,breaks = 15)

# >> 3. SHAPIRO WILK TEST p-valor -> 0.05 >> es NORMAL
x.test <- shapiro.test(HOMBRES) print(x.test) # MUJERES #******************************************************************* # >> 1. QQPLOT
qqnorm(MUJERES, pch = 1, frame = FALSE)
qqline(MUJERES, col = "steelblue", lwd = 2)
library("car")
qqPlot(MUJERES)

# >> 2. HISTOGRAMA para ver la forma de la Distribución
hist(MUJERES,breaks = 15)

# >> 3. SHAPIRO WILK TEST p-valor>0.05 >> es NORMAL
y.test <- shapiro.test(MUJERES) print(y.test) # CONCLUSIÓN: POBLACIONES HOMBRES y MUJERES SON NORMALES #******************************************************************** # 3.1 ¿LAS VARIANZAS SON IGUALES? #******************************************************************** # >> TEST F para VARIANZAS iguales p-valor>0.05 >> SON IGUALES
var.test(HOMBRES,MUJERES, alternative = "two.sided")

# CONCLUSIÓN: TIENES VARIANZAS DIFERENTES. NO PUEDES APLICAR T-TEST CONVENCIONAL

#********************************************************************
# 3.1 APLICAMOS EL T-TEST MODIFICADO CON VARIANZAS DIFERENTES
#********************************************************************
t.test(HOMBRES,MUJERES, var.equal=FALSE, paired=FALSE)

# CONCLUSIÓN: LOS GRUPOS SON DIFERENTES

Cuando tienes varianzas diferentes puedes utilizar un test t-student modificado. Específico para muestras con varianzas diferentes. En R sería esto:

#********************************************************************
# 3.1 APLICAMOS EL T-TEST MODIFICADO CON VARIANZAS DIFERENTES
#********************************************************************
t.test(HOMBRES,MUJERES, var.equal=FALSE, paired=FALSE)

# CONCLUSIÓN: LOS GRUPOS SON DIFERENTES

El resultado que aparece en RStudio es:

Welch Two Sample t-test

data: HOMBRES and MUJERES
t = 5.5499, df = 254.74, p-value = 7.163e-08
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
8.249306 17.323627
sample estimates:
mean of x mean of y
73.42054 60.63407

Ya puedes rellenar la plantilla de tu estudio.

 

A. Formular las hipótesis:

La hipótesis del investigador o H1: las poblaciones de hombres y mujeres son diferentes

La hipótesis nula o H0: las poblaciones de hombres y mujeres NO son diferentes.

B. El nivel de significación:

5% (0.05)

C. Elección de la prueba estadística:

Prueba welch t-student para grupos independientes

D. P-valor

Es 7.163e-08. En las publicaciones deberíamos poner que el p-valor es  < 0.001 y efectivamente puedes rechazar la hipótesis nula y aceptar la hipótesis del investigador

E. Conclusión

Las poblaciones de hombres y mujeres son diferentes con un nivel de significación < 0.001

 

Foto de portada de Flickr

Hoy has aprendido un montón sobre pruebas de hipótesis. Te he enseñado un símil para que entiendas qué es una prueba de hipótesis y además te enseñado un ejemplo R paso a paso.
¿Te gustaría que te explicará cómo asegurarte si una distribución es normal o no?

Acerca del autor

Jordi Olle Sanchez

Autor de ConceptosClaros.com. Ayuda a investigadores apasionados a aplicar estadística y análisis de datos en sus proyectos para catapultar su carrera investigadora y adaptarse a la era de los datos. Accede a los recursos gratuitos para aplicar estadística en tus datos

Interacciones con los lectores

Comentarios

  1. María Guadalupe Romero Andrade dice

    Excelente material de estudio y trabajo. Muchas gracias por aportes tan importantes para todos los que accesamos al mismo.

  2. Karla Tapia dice

    Excelente aportación!! yo tengo un proyecto de diseño pero no se como aplicar el análisis estadístico, osea, entendí que puedo aplicar la estadística descriptiva… pero ¿Cómo aplicar la estadística inferencial? trato de guiarme con los ejemplos, pero siento que no tienen relación con mi proyecto… si pudiera ayudarme estaré agradecida..


Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

  Acepto la política de privacidad

Responsable del fichero: Jordi Ollé Sánchez
Finalidad; envío de mis publicaciones así como correos comerciales.
La Legitimación; es gracias a tu consentimiento.
Destinatarios:Como usuario e interesado te informo que los datos que me facilitas estarán ubicados en los servidores de Webempresa (proveedor de hosting de Conceptos claros) dentro de la UE. Ver política de privacidad de Webempresa
Podrás ejercer Tus Derechos de Acceso, Rectificación, Limitación o Suprimir tus datos enviando un email a jordi @ conceptosclaros.com o ante la Autoridad de Control
Encontrarás más información en política de privacidad
6-tecnicas-Mockup-presentacion

Descubre cómo Analizar tus Datos con éxito y convertirte en Científico de Datos en tu sector