La tendencia central, la posición y la dispersión son fórmulas que se emplean para cuantificar únicamente VARIABLES CUANTITATIVAS.
RESUMEN NUMÉRICO DE UNA SERIE ESTADÍSTICA.
Además de la utilización de tablas y gráficos también podemos resumir una serie de observaciones mediante medidas estadísticas, que se emplean para la medición de variables cuantitativas continuas como son el peso, la edad, la talla, el tiempo...
Las medidas estadísticas las podemos dividir en 3 grandes grupos:
- Medidas de posición: Aportan información sobre la magnitud o el tamaño ya que los datos se ordenan de menor a mayor.
- Medidas de tendencia central: Ofrecen informacion sobre el comportamiento central de los sujetos.
- Medidas de dispersión o variabilidad: Informan sobre la heterogeneidad de los sujetos, es decir, si son muy diferentes o no.
MEDIDAS DE TENDENCIA CENTRAL.
Media aritmética: Se utiliza para variables CUANTITATIVAS y se trata del centro geométrico de nuestros datos. Se calcula sumando todos los valores y dividiéndolo entre el total de observados.
Cuando los datos están agrupados , para calcular la media utilizamos como valor de referencia cada intervalo. Se calcula una media aritmética ponderada que se calcula sumando la marca de clase por la frecuencia absoluta, entre N.
x= Ʃmcfi/n
Ejemplo:
X= marca de clase x frecuencia + marca de clase x frecuencia.../ Total= 3.5 + 4 + 8.../ 40 = 4.68
Mediana: Medida de posición y central.
- Si el número de observaciones es IMPAR el valor de la observación será justamente la observación que ocupa la posición (n+1/2) Ejemplo: si son 75, pues 76 entre 2 = 38, la mediana seria la edad que tiene el sujeto 38.
- Si el número de observaciones es PAR, el valor de la mediana corresponde a la media entre los dos valores centrales, es decir, la media entre la observación n/2 y la observación (n/2)+1. Ejemplo: cuatro sujetos de edades, 10, 15, 20, 25, cogemos los dos sujetos centrales y hacemos la media aritmética entre ambos.
Propiedad: Sólo tiene en cuenta la posición de los valores en la muestra. tiene mucho mejor comportamiento que la media cuando hay observaciones extremas.
Moda: Corresponde a la categoría. Es el valor con mayor frecuencia
(que más veces se repite). Si hay más de una se dice que la muestra es bimodal (dos modas) o multimodal (más de dos modas).
Se puede
calcular para cualquier tipo de variable tanto la CUALITATIVA como la
CUANTITATIVA. La
Si los datos están agrupados, se habla de clase modal y corresponde al intervalo
en el que el cociente entre la frecuencia relativa y la amplitud (se resta el
intervalo mayor menos el menor) es mayor (hi/ci). Donde
la frecuencia absoluta sea mayor.
MEDIDAS DE POSICIÓN O CUANTILES.
Se calcula para variables CUANTITATIVAS y, a igual que la mediana, solo tiene en cuanta la posición ordenada de mayor a menor.
Los cuantiles más
usuales son los percentiles, los deciles y los cuartiles, según dividan la muestra ordenada en 100 (perciles), 10
(deciles) ó 4 partes (cuartiles), respectivamente.
- Percentiles:
- Dividen la muestra ordenada en 100 partes.
- El percentil “i” (Pi), es aquél valor que, ordenadas las observaciones en forma creciente, el i% de ellas son menores que él y el (100-i) % restante son mayores.
- Para buscar la posición de un percentil en una serie de datos agrupados, buscamos el intervalo en el que la frecuencia relativa acumulada (Hi) sea superior al valor del percentil.
- El valor del P50 corresponde al valor de la mediana.
- Deciles:
- Dividen la muestra ordenada en 10 partes.
- El decil “i” (Di), es aquél valor que, ordenadas las observaciones en forma creciente, el i/10% de ellas son menores que él y el (100-i)/10% restante son mayores.
- El valor del D5 corresponde al valor de la mediana y, por tanto, al del P50.
- Cuartil:
- Dividen la muestra ordenada en 4 partes.
- El Q1, primer cuartil indica el valor que ocupa una posición en la serie numérica de forma que el 25% de las observaciones son menores y que el 75% son mayores.
- El Q2, segundo cuartil indica el valor que ocupa una posición en la serie numérica de forma que el 50% de las observaciones son menores y que el 50% son mayores. Por tanto, el Q2 coincide con el valor del D5, con el valor de la mediana P50.
- El Q3, tercer cuartil indica el valor que ocupa una posición en la serie numérica de forma que el 75% de las observaciones son menores y que el 25% son mayores.
- El Q4, cuarto cuartil indica el valor mayor que se alcanza en la serie numérica.
A continuación les añado un vídeo en el que explica paso a paso el calculo de estas medidas de posición.
MEDIDAS DE DISPERSIÓN.
La información aportada por las medidas de tendencia central es limitada.
Ejemplo:
-
Serie 1: 18, 19, 20, 21,22.
-
Mediana serie 1=20, Media serie 1=20
-
Serie 2: 9, 14, 20, 27,30.
-
Mediana serie 2=20, Media serie 2=20
¿Qué es lo que diferencia a una de
otra? La dispersión.
Rango o recorrido: Diferencia entre el mayor y el menor valor de la muestra lXn-X1l (valor absoluto)
Según el ejemplo anterior:
-
R1=22-18=4
-
R2=30-9=21
(esto ya nos indica que la serie 2 tiene más dispersión).
Desviación media: media aritmética de los distintos valores de cada observación con respecto a la media de la muestra.
Para datos agrupados:
Desviación estándar: Cuantifica el error que cometemos si representamos una muestra únicamente por su media. Esta en la que mas se emplea debido a que esta nos da un mayor rango de error.
Varianza: expresa la misma información en valores cuadráticos.
Recorrido intercuartílico: Diferencia entre el tercer y el primer cuartil = /Q3-Q1/
Coeficiente de variación: es una medida de dispersión relativa (adimensional) ya que todas las demás se expresan en la unidad de medida de la variable.
No sirve para comprar la heterogeneidad de dos series.
C.V = S / x
Ejemplo:
Unas enfermeras han registrado en el
punto de vacunación las edades de nueve niños que han sido vacunados durante
una sesión, obteniéndose los siguientes datos:
3, 2, 4, 2, 1, 3, 5,3 y
4 meses.
Calcular:
a. Media aritmética:
b. Mediana = 1
c. Moda = 3
d. Rango o recorrido
e. Varianza.
f.
Desviación
típica.
g. Coeficiente de variación.
Media aritmética: X = 27/9 = 3
Mediana = 1
Moda = 3
Rango o recorrido: R = 5 - 1 = 4
Varianza:
Desviación típica:
Coeficiente de variación:
Hasta aquí por hoy!
No hay comentarios:
Publicar un comentario