Vistas de página en total

martes, 16 de mayo de 2017

TEMA 8

TEMA 8: MEDIDAS DE TENDENCIA CENTRAL, POSICIÓN Y DISPERSIÓN.

Se aplican únicamente a variables cuantitativas.

1.      RESUMEN NUMÉRICO DE UNA SERIE ESTADÍSTICA.

Hay tres grandes tipos de medidas estadísticas:
- Medidas de posición: dan idea de la magnitud, tamaño o posición de las observaciones de los datos una vez que están ordenados de menor a mayor.
- Medidas de tendencia central: dan idea del comportamiento central de los sujetos.
- Medidas de dispersión o variabilidad: dan información acerca de la heterogeneidad de los sujetos, es decir, si son muy diferentes entre sí o no.

Solo se aplican a  variables cuantitativas continuas.
  • Media aritmética o media: para variables cuantitativas. Se calcula para variables cuantitativas y se trata del centro geométrico o de gravedad de nuestros datos. Cuando los datos están agrupados (dos intervalos), para calcular la media utilizamos como valor de referencia de cada intervalo su marca de clase: se calcula una media aritmética ponderada que se obtiene sumando la marca de clase por la frecuencia absoluta, entre N.
  • x= Ʃmc (marca de clase) fi /n (multiplicamos la marca de clase por la frecuencia absoluta y vamos sumando, luego dividimos entre el número de sujetos).
Por ejemplo en el intervalo [60-63] = 60+63/2 (MARCA DE CLASE) ahora realizaríamos fi/n. 
  • Mediana: medida de posición y central. 
·       Propiedad: robustez. Sólo tiene en cuenta la posición de los valores en la muestra y por tanto tiene mucho mejor comportamiento que la media cuando hay observaciones extremas.

·         Moda: Es el valor con mayor frecuencia (que más veces se repite). Si hay más de una se dice que la muestra es bimodal (dos modas) o multimodal (más de dos modas). Se puede calcular para cualquier tipo de variable tanto la cualitativa como la cuantitativa.


2.      MEDIDAS DE POSICIÓN O CUARTILES


Se calculan para variables cuantitativas y, al igual que la mediana, sólo tienen en cuenta la posición ordenado de mayor o menor de los valores en la muestra.
Los cuantiles más usuales son los percentiles, los deciles y los cuartiles, según dividan la muestra ordenada en 100 (perciles), 10 (deciles) ó 4 partes (cuartiles), respectivamente.

-          Percentiles:
o   Dividen la muestra ordenada en 100 partes.
o   El valor del P50 corresponde al valor de la mediana.
-          Deciles:
o   Dividen la muestra ordenada en 10 partes.
o   El valor del D5 corresponde al valor de la mediana y, por tanto, al del P50.
-          Cuartil:
o   Dividen la muestra ordenada en 4 partes. 


3.      MEDIDAS DE DISPERSIÓN

La información aportada por las medidas de tendencia central es limitada.
Ejemplo:
-          Serie 1: 18, 19, 20, 21, 22.(el primer grupo es homogéneo porque tienen edades más cercanas)
-          Mediana serie 1=20
-          Serie 2: 9, 14, 20, 27, 30.
-          Mediana serie 2=20
¿Qué es lo que diferencia a una de otra? La dispersión.

·         Rango o recorrido: Diferencia entre el mayor y el menor valor de la muestra lXn-X1l (valor absoluto).

Según el ejemplo anterior:
-          R1=22-18=4
-          R2=30-9=21 (esto ya nos indica que la serie 2 tiene más dispersión). 


·         Desviación media: Media aritmética de las distancias de cada observación con respecto a la media de la muestra: 

·         Desviación típica o estándar: Cuantifica el error que cometemos si representamos una muestra únicamente por su media.  Esta es la que más se emplea debido a que esta nos da un mayor rango de error.

 

·         Varianza: Expresa la misma información en valores cuadráticos:


·         Recorrido intercuartílico: Diferencia entre el tercer y el primer cuartil = lQ3-Q1l

-      Coeficiente de variación: Es una medida de dispersión relativa (adimensional). Nos sirve para comparar la heterogeneidad de dos series numéricas con independencia. Va de 0 a 1.

Resultado de imagen de fórmula coeficiente de variacion

4.      DISTRIBUCIONES NORMALES

En estadística se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales.
Las distribuciones normales en un histograma aparece la campana de Gauss. Y es simétrica respecto de los valores de posición central, es decir que la moda va a coincidir con la media y la mediana. 

Resultado de imagen de campana de gauss

5.      ASIMETRÍAS Y CURTOSIS



·         Coeficiente de asimetría de una variable: Grado de asimetría de la distribución de sus datos en torno a su media, cuanto más asimétrica sea, valores más diferentes encontraremos. Es adimensional.

Asimetrías:
Los resultados pueden ser los siguientes:
-          g1=0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media).
-          g1>0 (distribución asimétrica positiva; existe mayor concentración de valores  a la derecha de la media que a su izquierda).
-          g1<0 (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de la media que a su derecha).

Resultado de imagen de curva de simetria

·         Curtosis o apuntamiento de la curva.

No tiene relación con la simetría. Sirve para medir el grado de concentración de los valores que toma en torno a su media. Los datos se acumulan mucho.  
Se elige como referencia una variable con distribución normal, de modo que para ella el coeficiente de curtosis es 0. 

Los resultados pueden ser los siguientes:
-          g2=0 (distribución mesocúrtica o normal). Presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).
-          g2>0 (distribución leptocúrtica). Presenta un elevado grado de concentración alrededor de los valores centrales de la variable.
-          g2<0 (distribución platicúrtica). Presenta un reducido grado de concentración alrededor de los valores centrales de la variable.
6.      TIPICACION DE LOS VALORES Y SU RELACION CON LA CAMPANA DE GAUSS.

Trabajamos con una variable continua que:
-          Sigue una distribución normal (TLC)
-          Tiene más de 100 unidades (LGN)
La tipificación nos permite conocer si valor corresponde o no a esa distribución con frecuencia
Sabemos por la forma de la curva que: La media coincide con lo más alto de la campana: 8
La desviación típica es de 2 puntos: 
El 50 % tienen puntuaciones >8
La curtosis se puede calcular para gráficas asimétricas.
-          El 50% tiene puntuaciones <8
-          Aproximadamente el 68% puntúa entre 6 y 10
o   Media +/- 1 desviación típica: 68%

o   Media +/- 2 desviación típica: 95%

o   Media +/- 3 desviación típica: 99% 


No hay comentarios:

Publicar un comentario