TEMA 8: MEDIDAS DE TENDENCIA CENTRAL, POSICIÓN Y DISPERSIÓN.
Se aplican únicamente a variables cuantitativas.
1.
RESUMEN NUMÉRICO DE UNA
SERIE ESTADÍSTICA.
Hay
tres grandes tipos de medidas estadísticas:
- Medidas
de posición: dan idea de la magnitud, tamaño o
posición de las observaciones de los datos una vez que están ordenados de menor
a mayor.
- Medidas
de tendencia central: dan idea del comportamiento central de
los sujetos.
- Medidas de
dispersión o variabilidad: dan información acerca de la heterogeneidad de los
sujetos, es decir, si son muy diferentes entre sí o no.
Solo se aplican
a variables cuantitativas continuas.
- Media aritmética o media: para variables cuantitativas. Se calcula para variables cuantitativas y se trata del centro geométrico o de gravedad de nuestros datos. Cuando los datos están agrupados (dos intervalos), para calcular la media utilizamos como valor de referencia de cada intervalo su marca de clase: se calcula una media aritmética ponderada que se obtiene sumando la marca de clase por la frecuencia absoluta, entre N.
- x= Ʃmc (marca de clase) fi /n (multiplicamos la marca de clase por la frecuencia absoluta y vamos sumando, luego dividimos entre el número de sujetos).
- Mediana: medida de posición y central.
· Propiedad:
robustez. Sólo tiene en cuenta la posición de los valores en la muestra y por
tanto tiene mucho mejor comportamiento que la media cuando hay observaciones
extremas.
·
Moda: Es el valor con mayor frecuencia (que más veces se repite). Si hay más de
una se dice que la muestra es bimodal (dos modas) o multimodal (más de dos
modas). Se puede calcular para cualquier tipo de variable tanto la cualitativa
como la cuantitativa.
2. MEDIDAS DE POSICIÓN O CUARTILES
Se
calculan para variables cuantitativas
y, al igual que la mediana, sólo tienen en cuenta la posición ordenado de mayor o menor de los valores en la muestra.
Los
cuantiles más usuales son los percentiles,
los deciles y los cuartiles, según dividan la muestra
ordenada en 100 (perciles), 10 (deciles) ó 4 partes (cuartiles),
respectivamente.
-
Percentiles:
o
Dividen la muestra ordenada en 100 partes.
o
El valor del P50 corresponde al
valor de la mediana.
-
Deciles:
o
Dividen la muestra ordenada en 10 partes.
o
El valor del D5 corresponde al
valor de la mediana y, por tanto, al del P50.
-
Cuartil:
o
Dividen la muestra ordenada en 4 partes.
3.
MEDIDAS DE DISPERSIÓN
La información aportada por las medidas de tendencia
central es limitada.
Ejemplo:
-
Serie
1: 18,
19, 20, 21, 22.(el primer grupo es homogéneo porque tienen edades más cercanas)
-
Mediana
serie 1=20
-
Serie
2: 9,
14, 20, 27, 30.
-
Mediana
serie 2=20
¿Qué
es lo que diferencia a una de otra? La dispersión.
·
Rango o recorrido: Diferencia entre el mayor y el menor valor de la muestra lXn-X1l
(valor absoluto).
Según
el ejemplo anterior:
-
R1=22-18=4
-
R2=30-9=21 (esto ya nos indica
que la serie 2 tiene más dispersión).
·
Desviación media: Media aritmética de las distancias de cada observación con respecto a la
media de la muestra:
· Desviación típica o estándar: Cuantifica el error que cometemos si representamos una muestra únicamente por su media. Esta es la que más se emplea debido a que esta nos da un mayor rango de error.
·
Varianza: Expresa la misma información en valores cuadráticos:
·
Recorrido
intercuartílico: Diferencia entre el tercer y el
primer cuartil = lQ3-Q1l
- Coeficiente de variación:
Es una medida de dispersión relativa (adimensional).
Nos sirve para comparar la heterogeneidad de dos series numéricas con
independencia. Va de 0 a 1.
4.
DISTRIBUCIONES
NORMALES
En
estadística se llama distribución normal, distribución de Gauss o distribución
gaussiana, a una de las distribuciones de probabilidad de variable continua que
con más frecuencia aparece en fenómenos reales.
Las
distribuciones normales en un histograma aparece la campana de Gauss. Y es
simétrica respecto de los valores de posición central, es decir que la moda va
a coincidir con la media y la mediana.
5.
ASIMETRÍAS
Y CURTOSIS
·
Coeficiente de
asimetría de una variable: Grado de asimetría de la
distribución de sus datos en torno a su media, cuanto más asimétrica sea,
valores más diferentes encontraremos. Es adimensional.
Asimetrías:
Los resultados pueden ser los siguientes:
-
g1=0
(distribución simétrica; existe la misma concentración de valores a la derecha
y a la izquierda de la media).
-
g1>0
(distribución asimétrica positiva; existe mayor concentración de valores a la derecha de la media que a su izquierda).
-
g1<0
(distribución asimétrica negativa; existe mayor concentración de valores a la
izquierda de la media que a su derecha).
·
Curtosis o apuntamiento de la curva.
No tiene relación con la
simetría. Sirve para medir el grado de concentración de los valores que toma en
torno a su media. Los datos se acumulan mucho.
Se elige como referencia una variable con distribución
normal, de modo que para ella el coeficiente de curtosis es 0.
Los resultados pueden ser los siguientes:
-
g2=0 (distribución mesocúrtica o normal).
Presenta un grado de concentración medio alrededor de los valores centrales de
la variable (el mismo que presenta una distribución normal).
-
g2>0 (distribución leptocúrtica).
Presenta un elevado grado de concentración alrededor de los valores centrales
de la variable.
-
g2<0 (distribución platicúrtica).
Presenta un reducido grado de concentración alrededor de los valores centrales
de la variable.
6. TIPICACION DE LOS VALORES Y SU
RELACION CON LA CAMPANA DE GAUSS.
Trabajamos con una variable continua que:
-
Sigue una distribución normal (TLC)
-
Tiene más de 100 unidades (LGN)
La
tipificación nos permite conocer si valor corresponde o no a esa distribución
con frecuencia
Sabemos por la forma de la curva que: La
media coincide con lo más alto de la campana: 8
La
desviación típica es de 2 puntos:
El
50 % tienen puntuaciones >8
La curtosis se puede calcular para gráficas
asimétricas.
-
El 50% tiene puntuaciones <8
-
Aproximadamente el 68% puntúa entre 6 y 10
o
Media +/- 1 desviación típica: 68%
o
Media +/- 2 desviación típica: 95%
o
Media +/- 3 desviación típica: 99%
No hay comentarios:
Publicar un comentario