TEMA 10: HIPÓTESIS ESTADÍSTICAS. TEST DE HIPÓTESIS.
1. CONTRASTES
DE HIPÓTESIS
Para controlar los errores
aleatorios, además del cálculo de intervalos de confianza, contamos con una segunda
herramienta en el proceso de inferencia estadística: los test o contrastes de
hipótesis..
Con los contrastes (test) de
hipótesis la estrategia es la siguiente:
-
Establecemos
a priori una hipótesis cerca del valor del parámetro.
-
Realizamos
la recogida de datos.
-
Analizamos
la coherencia entre la hipótesis previa y los datos obtenidos.
Son herramientas estadísticas para
responder a preguntas de investigación: permite cuantificar la compatibilidad
entre una hipótesis previamente establecida y los resultados obtenidos.
Sean cuales sean los deseos de los
investigadores, el test de hipótesis siempre va a contrastar la hipótesis nula.
Tipo de análisis estadísticos según
el tipo de variables implicadas en el estudio
2. ERRORES
DE HIPÓTESIS.
El
test de hipótesis mide la probabilidad de error que cometo si rechazo la hipótesis
nula.
Con
una misma muestra podemos aceptar o rechazar la hipótesis nula. Todo depende de
una error, al que llamamos α.
·
El
error α es la probabilidad de equivocarnos al rechazar la hipótesis nula.
·
El
error α más pequeño al que podemos rechazar H0 es el error p. (p es
sinónimo de α minimizada)
Habitualmente rechazamos H0
para un nivel α máximo del 5% (p< 0.05). Por encima del 5% de error,
aceptamos la hipótesis nula. Es lo que llamamos “significación estadística”.
3. TIPOS
DE ERRORES EN TEST DE HIPÓTESIS.
El error más importante para
nosotros es el tipo alfa. Aceptamos que podemos equivocarnos hasta un 5%.
4. TEST
DE HIPÓTESIS CHI-CUADRADO.
Para comparar variables
cualitativas (dependiente e independiente).
5. TEST DE STUDENT (comparación de medias)
Se
utiliza cuando la variable independiente es cualitativa (dicotómica) y la
variable dependiente es cuantitativa continua. Solo sirve para comparar dos
grupos.
6. ESTUDIO CONJUNTO
DE DOS VARIABLES.
Para ello
recogemos los datos en unas tablas:
·
En
cada fila tenemos los datos de un individuo. Cada columna representa los
valores que toma unas variables sobre los mismos. Los individuos no se muestran
en ningún orden particular.
·
Dichas
observaciones pueden ser representadas en un diagrama de dispersión. En ellos
cada individuo es un punto cuyas coordenadas son los valores de las variables.
7. DIAGRAMA DE
DISPERSIÓN Y NUBE DE PUNTOS.
Si tenemos
las alturas y los pesos de x individuos representados en un diagrama de
dispersión los coloco en una gráfica para observar la distribución que tienen
ya que existe una RELACIÓN ENTRE AMBAS VARIABLES.
8. PREDICCIÓN DE UNA VARIABLES EN FUNCIÓN DE
OTRA.
Aparentemente
el peso aumenta X Kg por cada Y cm de altura
9. REGRESIÓN LINEAL
SIMPLE: CORRELACIÓN Y DETERMINACIÓN.
·
Se
trata de estudiar la asociación lineal entre dos variables cuantitativas.
·
Ejemplo:
influencia de la edad en las cifras de tensión arterial sistólica
·
Modelos lineales
deterministas:
la variable independiente determine el valor de la variable dependiente.
Entonces para cada valor de la variable independiente solo habría un valor de
la dependiente.
·
Modelos lineales
probabilísticos:
para cada valor de la variable independiente existe una distribución de
probabilidad de valores de la dependiente, con una probabilidad entre 0 y 1.
·
No hay modelo
determinista:
hay una nube de puntos y buscamos la recta que mejor explica l comportamiento
de la variable dependiente en función de la variable independiente.
·
Coeficiente
de correlación (Pearson y Speerman) : Número
adimensional (entre -1 y 1) que mide la fuerza y el sentido de la relación
lineal entre variables,
r = ß1 x Sx /Sy
·
Coeficiente
de determinación: número adimensional (entre 0 y 1) que da
idea de la relación entre las variables relacionadas linealmente, es r2.
No hay comentarios:
Publicar un comentario