martes, 14 de junio de 2016

Reflexión final

Como última entrada de este blog haré una reflexión final sobre la asignatura, sobre el blog y sobre este primer año de enfermería.

Empezando por el blog decir que personalmente, aunque haya compañeros que les han cogido el gustillo a esto de escribir y publicar cosas, a mi especialmente (puede ser por eso mismo, porque no me guste escribir) no me ha gustado y tampoco veo mucho la finalidad que tiene, porque aunque estaba pensado como herramienta de estudio para ir día a día con la asignatura, creo que solo pocas personas han conseguido dicho objetivo. 

Con respecto a la asignatura decir que lo que más me ha gustado de ella ha sido el proyecto de investigación que he hecho junto a mis tres compañeras. Aunque ha tenido sus complicaciones y nos ha amargado un poco la existencia (y creo que ésto ha sido por dejarlo como siempre todo para el final) he de decir que es gratificante ver el resultado final y sobre todo lo mucho que aprendes sobre el tema escogido, que en nuestro caso fue sobre el embarazo.

Por último hacer una reflexión sobre este primero de enfermería que ya se esta acabando, y aunque parezca mentira se me ha pasado en un abrir y cerrar de ojo. Parece que fue ayer septiembre, cuando me dijeron que estaba admitida en enfermería y por fin iba a estudias lo que quería y ya estoy prácticamente en segundo.
Agradecer a todas esas personas que he conocido este año y que han facilitado este transito por primero de carrera pero, sobre todo agradecer a mis compañeras y compañero de estudio (Cristina Martínez, Irene Guillén y Jesús Bracho) el haber estado ahí en las buenas y en las malas, animarnos y sacarnos fuerzas para seguir estudiando cuando ya dábamos una asignatura por perdida y sobre todo, por todos esos momentos de risa. 




Esto es todo amigos!!

martes, 7 de junio de 2016

SEMINARIO 5

En éste 5º y último seminario de la asignatura de Etic´s realizamos la exposición del trabajo de investigación, "Cuanto sabes sobre tu embarazo" que es un estudio comparativo sobre los conocimientos que tienen las madres de la provincia de Huelva y Sevilla, para saber e identificar cual de las dos tiene mejor información acerca de sus embarazo y cual es la opinión que tienen estas sobre el personal sanitario con respecto a la información que ofrecen durante la gestación. 

En ésta exposición se ha explicado el porque de éste tema para la realización del proyecto de investigación y cuales han sido los resultados obtenidos tras el estudio.


Bueno y con ésta última entrada doy por finalizada la asignatura, aunque ahora viene lo peor...

ÉPOCA DE EXÁMENES! Esperemos que haya suerte...






miércoles, 1 de junio de 2016

TEMA 10: HIPÓTESIS ESTADÍSTICA. TEST DE HIPÓTESIS.

CONTRASTE DE HIPÓTESIS:

Para controlar los errores aleatorios, además del cálculo de intervalos de confianza, contamos con una segunda herramienta en el proceso de inferencia estadística: los test o contrastes de hipótesis.

Con los intervalos nos hacemos una idea de un parámetro de una población dado un par de números entre los que confiamos que esté el valor desconocido.

Con los contrastes (test) de hipótesis la estrategia es la siguiente:
- Establecemos a priori una hipótesis cerca del valor del parámetro.
- Realizar la recogida de datos.
- Analizamos la coherencia entre la hipótesis previa y los datos obtenidos.

Son herramientas estadísticas para responder a preguntas de investigación: permite cuantificar la compatibilidad entre una hipótesis previamente establecida y los resultados obtenidos.

Sean cuales sena los deseos de los investigadores, el test de hipótesis siempre va a contrastar la hipótesis nula (la que establece igualdad entre los grupos a comparar, o lo que es lo mismo, la que no establece relación entre las variables de estudio).

Tipo de análisis estadísticos según el tipo de variables implicadas en el estudio.


ERRORES DE HIPÓTESIS:

El test de hipótesis mide la probabilidad de error que cometo si rechazo nula.
Con una misma muestra podemos aceptar o rechazar la hipótesis nula. Todo depende de un error, al que llamamos alfa.
El error alfa es la probabilidad de equivocarnos al rechazar la hipótesis nula.
El error alfa más pequeño al que podemos rechazar Ho es el error p. (p es sinónimo de alfa minimizada).
Habitualmente rechazamos Ho para un nivel alfa máximo del 5% (p <0,05). Por encima del 5% de error, aceptamos la hipótesis nula. Es lo que llamamos "significación estadística".


TIPOS DE ERRORES EN TEST DE HIPÓTESIS:


El error más importante para nosotros es el tipo alfa. Aceptamos que podemos equivocarnos hasta un 5%.


TEST DE HIPÓTESIS CHI-CUADRADO:


Para comparar variables cualitativas (dependiente e independiente)
Razonamiento a seguir: Suponemos la hipótesis cierta y estudiamos como es de probable que siento iguales dos grupos a comparar se obtengan como los obtenidos o haber encontrado diferencias más grandes por grupos.


TEST DE STUDENT (COMPARACIÓN DE MEDIDAS):


Se utiliza cuando la variable independiente es cualitativa (dicotómica) y la variable es continua.






RELACIONES ENTRE VARIABLES Y REGRESIÓN:

El término regresión fue introducido por Galton en su libro "Natural inheritanca" (1889) refiriéndose a "las de la regresión universal".

  • Cada peculiaridad en un hombre es compartido por sus descendientes, pero en media, en un grado menor. Regresión de la media.
  • Su trabajo se centraba en la descripción de los rasgos físicos de los descendientes (una variable) a partir de los de sus padres (otra variable).
  • Pearson realizó un estudio con mas 1000 registros de grupos familiares observando una relación tipo:
    • Altura del hijo: 85 cm + 0,5 a la altura del padre aproximadamente.
    • Conclusión: los padres muy altos tiene tendencia a acercarse a la media. Lo mismo puede decirse de los padres muy bajos.
  • Hoy en día el sentido de la regresión es de predicción de una media basándonos en el conocimiento de otra.

ESTUDIO CONJUNTO DE DOS VARIABLES.

  • A la derecha tenemos una posible manera de recoger los datos observando dos variables en varios individuos de una muestra.
  • En cada fila tenemos los datos de un individuo. Cada columna representa los valores que toma unas variables sobre los mismos. Los individuos no se muestran en ningún orden particular.
  • Dichas observaciones pueden ser representadas en un diagrama de dispersión ("Scalterplol"). En ellos cada individuo es un punto cuyas coordenadas son los valores de las variables.
  • Nuestro objetivo será intentar reconocer a partir del mismo si hay relación entre las variables, de que Ho y si es posible predecir el valor de una de ellas en función de otras.


DIAGRAMA DE DISPERSIÓN Y NUBE DE PUNTOS:

Tenemos las alturas y los pesos de 30 individuos representados en un diagrama de dispersión.


RELACIÓN ENTRE VARIABLES:

Tenemos las alturas y los pesos de 30 individuos representados en un diagrama de dispersión.

PREDICCIÓN DE UNA VARIABLE EN FUNCIÓN DE OTRA.

Aparentemente el peso aumenta 10 kg por cada 10 cm de altura... o sea el peso aumenta en una unidad por cada unidad de altura.

RELACIÓN DIRECTA E INDIRECTA:

  • Para los valores de X por encima de la media tenemos valores de Y por encima y por debajo en proporciones similares. Incorrelación.
  • Para los valores de X mayores que la media le corresponden valores de Y mayores también.
  • Para los valores de X menores de la media le corresponden valores de Y menores también.
  • Para los valores de X mayores que la media le corresponden valores de Y menores. Esto es relación inversa o decreciente (cierta relación inversa).

MODELOS DE ANÁLISIS DE REGRESIÓN:



REGRESIÓN LINEAL SIMPLE: CORRELACIÓN Y DETERMINACIÓN.

  • Se trata de estudiar la asociación lineal entre dos variables cuantitativas.
  • Ejemplo de insuficiencia de edad en las cifras de tensión arterial sistólica.
  • Regresión lineal simple: una sola variable independiente.
  • Regresión lineal múltiple: más de una variable independiente.
  • Ecuación de la recta: y=ax + b
  • Pendiente de la recta a=ß1. El valor de a positivo la correlación entre las dos variables es directa y si el valor de a es negativo la correlación entre las dos variables es indirecta.
  • Punto de inserción en el eje de coordenadas b= ß0
  • ß1 expresa la cantidad de cambios que se produce en la variable dependiente por unidad de cambio de la variable independiente.
  • ßo expresa cual es el valor de la variable dependiente cuando la independiente vale 0.
  • Modelos lineales deterministas: la variable independiente determine el valor de la variable dependiente.
  • Modelos lineales probabilisticos: para cada valor de la variable independiente existe una distribución de probabilidad de valores de la dependiente, con una probabilidad entre 0 y .
  • La resta a determinar es aquella con la menor de cada punto a ella.
  • Y seria la media de la variable dependiente en un grupo con el mismo valor de la variable independiente Y= y + e.
  • Para construir un modelo de regresión lineal hace falta conocer: Punto de inserción con el eje de coordenadas = ß0 y la pendiente de la resta ß1 (mayor valor de la ß1 la pendiente será muy pronunciada en el sentido directo o inverso).
  • No hay modelo determinista: hay un nube de punto y buscamos la resta que mejor explica el comportamiento de la variable dependiente en función de la variable independiente.      



ANOVA: ANALISIS DE LA VARIANZA

En el test de la t de Student para muestras independientes, aprendimos como usar la distribución t para contrastar la hipótesis de que no existen diferencias ente las medias de dos poblaciones.

Este método no es apropiado por las siguientes razones:

  • Es tendinoso a comparar todas las posibles combinaciones.
  • Cualquier estadístico basado en parte de la evidencia (como ocurre cuando solo se comparan dos grupos) es menos estable que uno basado en toda evidencia.
  • Si se hacen muchas comparaciones aumentan la probabilidad de que alguna resulta significativa.


LA LÓGICA DEL ANOVA:

El contraste de hipótesis del ANOVA se basa en comprobar si las medias de las muestras difieren mas de los que cabe esperar cuando es cierta, la hipótesis nula.
Esta cuestión acerca de las medias se responde analizando las varianzas.
     - Nos fijamos en las varianzas, porque cuando queremos saber si algunas medias difieren enrte si,          tenemos que valorar la varianza entre estas medias.


DOS FUENTES DE VARIABILIDAD:

En ANOVA, un estimador de la variabilidad entre grupos se compara con la variabilidad dentro de los grupo.
    - La variación entre grupos es la variacion entre las medias de los diferentes traramientos debidas         al azar (erro de muestreo) y al efecto de los tratamientos, si es que existe.
    - La variación dentro de los grupos es la variación debida al azar (error de muestreo entre individuos a los que se ha dado el mismo tratamiento.


VARIABILIDAD ENTRE GRUPOS.

Hay mucha variabilidad entre las medias.
las diferencias entre las medias de los grupos son demasiado grandes para atribuirlas al azar.
Es difícil imaginar que los seis grupos son muestras aleatorias tomadas de la misma población.
Se rechaza la hipótesis nula, es decir, existe efecto del tratamiento al menos en unos de los grupo.


VARIABILIDAD ENTRE GRUPOS:

Hay variabilidad entre las medias de los grupo.
Sin embargo, hay más variabilidad dentro de cada grupo.
La mayor variabilidad dentro de los grupos, hace poco creíble que tengamos muestras procedentes de poblaciones diferentes.

EL ESTADÍSTICO F:






domingo, 29 de mayo de 2016

TEMA 9: ESTADÍSTICA INFERENCIAL: MUESTREO Y ESTIMACIÓN.

INFERENCIA ESTADÍSTICA:
Cuando planteamos un estudio en el ámbito sanitario para establecer relaciones entre variables, nuestro interés no suele estar exclusivamente en los pacientes concretos a los que hemos tenido acceso, sino más bien en todos los pacientes similares a estos.
Antes de continuar debemos de saber una serie de conceptos que aparecerán a lo largo del tema:
  • Población de estudio: es el conjunto de pacientes sobre los que queremos estudiar alguna cuestión.
  • Muestra: es el conjunto concreto de individuos que participan en el estudio.
  • Inferencia estadística: es el conjunto de procedimientos estadísticos que permiten pasar de los particular a lo general.
  • Técnica de muestreo: conjunto de procedimientos que permiten elegir muestras de tal forma que estas reflejen las características de la población. Se hace principalmente para evitar sesgos.
Siempre que trabajemos con muestras, aunque sean representativas hay que asumir un cierto error, por pequeño que sea.
  •  Si la muestra se elige por un procedimiento de azar, se puede evaluar ese error. La técnica de muestreo en ese caso se denomina muestreo probabilístico o aleatorio y el error asociado a esa muestra elegida al azar se llama error aleatorio.

  •  En los muestreos no probabilísticos (Ej: estudios de conveniencia. Utilizar a los pacientes de mi hospital como muestra), no es posible evaluar el error. En los muestreos probabilísticos, el error aleatorio es inevitable pero es evaluable gracias a las leyes de la probabilidad.

  • Cuanto mayor sea el tamaño de la muestra, favorezco la reducción del error aleatorio por probabilidad. 

PROCESO
 DE LA INFERENCIA ESTADÍSTICA

Tenemos una población de estudio, y la medida que queremos obtener se llama parámetro.  Hacemos una selección aleatoria y obtenemos una muestra, y la medida de la variable de estudio obtenida en la muestra, se denomina estimador.







        ERROR ESTÁNDAR:
  • Es la medida que trata de captar la variabilidad de los valores del estimador (en este caso la media de los días de curación de la úlcera).
  • El error estándar de cualquier estimador mide el grado de variabilidad en los valores del estimador en las distintas muestras de un determinado tamaño que pudiésemos tomar de una población.
  • Cuanto más pequeño es el error estándar de un estimador, más nos podemos fiar del valor de una muestra concreta.
Si en lugar de variar el valor de la media en las muestras entre 52 y 64 días, variara entre 20 y 90 días, sería menos probable que al seleccionar una muestra y calcular su media, ésta estuviera cercana a 57,46, que es el valor de la media en la población.


       CÁLCULO DE ERROR ESTÁNDAR:
        Depende de cada estimador:
  • Error estándar para una media: 
  • Error estándar para una porporción (frecuencia relativa): 
De ambas fórmulas se deduce que, mientras mayor sea el tamaño de una muestra, menor sera el error estándar.

      TEOREMA CENTRAL DEL LÍMITE:
    Para estimadores que pueden ser expresados como suma de valores muestrales, la distribución de sus valores sigue una distribución normal con media de la población y desviación típica igual al error estándar del estimador de que se trate.
     Si en vez de una muestra, seleccionara 100 muestras y calculara las medias y las pusiera en un histograma, tendría una distribución normal, en la cual el error estándar coincide con la desviación estándar del histograma, por lo tanto si le sumo y le resto a la media una vez la desviación estándar, es decir, el error estándar, tendré el 68.26% de las observaciones. 

      INTERVALOS DE CONFIANZA:
  •  Son un medio de conocer el parámetro en una población midiendo el error que tiene que ver con el azar (error aleatorio).
  • Se trata de un par de números tales que, con un nivel de confianza determinados, podamos asegurar que el valor del parámetro es mayor o menor que ambos números.
  • Se calcula considerando que el estimador muestral sigue una distribución normal, como establece la teoría central del límite.
Cálculo:
      - I.C de un parametro: estimador +- z (e.estándar)
     - Z es un valor que depende del nivel de confianza 1-a con que se quiera dar el intervalo (a= error máximo  admisible: 5%). Por lo tanto Z tiene que ver con el valor que va delante de S en el teorema central del límite. Si I.C es más alto, más probabilidad de que el intervalo esté dentro y por tanto la horquilla sea mayor.
      -Para el nivel de confianza 68% z=1 (No suele utilizarse un intervalo de confianza del 68% porque asumimos un error máximo del 5%).
      - Para nivel de confianza 95% z=1,96 --> 2
      - Para nivel de confianza 99% z=2,58 --> 3
     Mientras mayor sea la confianza que queramos otorgar al intervalo, éste será más amplio, es decir, el extremo inferior y el superior del intervalo estarán más distanciados y, por tanto, el intervalo sera menos preciso.

TIPOS DE MUESTREO:
PROBABILÍSTICO: todos los sujetos de la población tienen una probabilidad distinta de cero en la selección de la muestra conocida. Existe una probabilidad conocida de seleccionar a los sujetos. Sin embargo si lo hacemos a cualquier persona que pase por la calle, no sabemos a quien vamos a encontrarnos para incluir la selección.


NO PROBABILÍSTICO: Puede haber personas en la población que no tengan probabilidad o que se desconozca, de ser seleccionado en la muestra, No existe probabilidad conocida, es una selección arbitraria.
  • Accidental: son aquellos en los que los sujetos de la población no tienen una probabilidad conocida o distinta de 0.
  • Por cuotas: me pongo a pasar un cuestionario en una esquina pero el 50% de las mujeres y el 50% de los hombres, despreciando a la mujer 51 que pasa por la esquina.
*MUESTREO PROBABILÍSTICO:
Todos y cada uno de los elementos tienen la misma probabilidad de ser elegido para la muestra. Es el método que consulte en extraer una parte (o muestra) de una población, de tal forma que todas las muestras posibles de tamaño fijo, tengan la misma probabilidad de ser seleccionados.

-Aleatorio Simple: (es el mas fiable y equitativo)
  1. Se caracteriza porque cada unidad tiene la probabilidad equitativa de ser incluida en la muestra:
    • De sorteo o rifa: Asignamos un nº a cada miembro de la población, calculamos el tamaño muestra y seleccionamos aleatoriamente ese nº. Este método no es fácil cuando la población es muy grande, pasando a usar el sistema que continua.
    • Tabla de números aleatorios: Más economuco y requiere menor tiempo. Se hace cuando disponemos de una lista informatizada en una base de datos de la población de estudio.
- Aleatorio Sistemático
  1. Similar al simple, en donde cada unidad de la muestra tiene la misma probabilidad de ser seleccionada.
- Estratificado:
  1. Se caracteriza por la subdivisión de la población de estudio en subgrupos o estratos, debido a que las variables principales que deben someterse a estudio presentan ciertas variabilidad o distribución conocida que puede afectar a los resultados. 
-Conglomerado:
  1. Se usa cuando no se dispone de una lista detallada y enumerada de cada una de las unidades que conforman la población  y resulta muy complejo elaborarla. En la selección de la muestra en lugar de escogerse cada unidad se toman los subgrupos o conjuntos de unidades conglomerados.
  2. En este tipo de muestreo el investigador no conoce la distribución de la variable.
  3. las inferencias que se hacen en una muestra conglomerada no son tan confiables como las que se obtienen en un estudio por muestreo aleatorio, excluyendo directamente grandes municipios. El municipio se elige por estratificación a su vez.

*MUESTREO PROBABILÍSTICO:
  • No se sigue el proceso aleatorio.
  • No puede considerarse que la muestra sea representativa de una población.
  • Se caracteriza porque el investigador selecciona la muestra siguiendo algunos criterios identificados para los fines del estudio que realiza.
Tipos:
  1. Por cuotas: en el que el investigador selecciona la muestra considerando fenómenos o variables a estudiar como sexo, raza, religión...
  2. Accidental: Consiste en utilizar para el estudio las personas disponibles en un momento dado, según lo que interesa estudiar. De las tres es la mas deficiente.
  3. Por conveniencia o intencional: En el que el investigador, decide según sus objetivos, los elementos que integran la muestra, considerando las unidades "tipicas" de la población que se desea conocer (en función de nuestro interés, muestra accesibilidad...)

TAMAÑO DE LA MUESTRA:
El tamaño de la muestra a tomar va a depender de:
  • Error estándar.
  • De la mínima diferencia entre los grupos de comparación que se considera importante en los valores de la variable a estudiar. Mas grande debe ser la muestra para que mas pequeño sea el error.
  • De la variabilidad de la variable a estudiar (varianza en la población).
  • El tamaño de la población de estudio.
Cálculo del tamaño de una muestra para estimar la media de una población:

Z es un valor que depende del nivel de confianza 1-a con que se quiera dar a los intervalos calculamos a partir de estimadores de esa muestra. (Para nivel de confianza 95% z=1.96 y para el nivel de confianza 99% z=2.58).

S2 es la varianza poblacional.
e: es el error máximo aceptado por los investigadores en las diferencias entre los grupos de comparación de la variable a estudiar.
   - Si trás esta operación se cumple el resultado: N> n (n-1), el cálculo del tamaño muestral termina aquí.
    - Si no se cumple, obtendremos el tamaño de la muestra con esta formula:











martes, 17 de mayo de 2016

TEMA 8: MEDIDAS DE TENDENCIA CENTRAL, POSICIÓN Y DISPERSIÓN.

La tendencia central, la posición y la dispersión son fórmulas que se emplean para cuantificar únicamente VARIABLES CUANTITATIVAS.


RESUMEN NUMÉRICO DE UNA SERIE ESTADÍSTICA.
Además de la utilización de tablas y gráficos también podemos resumir una serie de observaciones mediante medidas estadísticas, que se emplean para la medición de variables cuantitativas continuas como son el peso, la edad, la talla, el tiempo...

Las medidas estadísticas las podemos dividir en 3 grandes grupos:
  • Medidas de posición: Aportan información sobre la magnitud o el tamaño ya que los datos se ordenan de menor a mayor.
  • Medidas de tendencia central: Ofrecen informacion sobre el comportamiento central de los sujetos.
  • Medidas de dispersión o variabilidad: Informan sobre la heterogeneidad de los sujetos, es decir, si son muy diferentes o no.


MEDIDAS DE TENDENCIA CENTRAL.



Media aritmética: Se utiliza para variables CUANTITATIVAS  y se trata del centro geométrico de nuestros datos. Se calcula sumando todos los valores y dividiéndolo entre el total de observados.


Cuando los datos están agrupados , para calcular la media utilizamos como valor de referencia cada intervalo. Se calcula una media aritmética ponderada que se calcula sumando la marca de clase por la frecuencia absoluta, entre N.
                                                                   x= Ʃmcfi/n 

Ejemplo:

X= marca de clase x frecuencia + marca de clase x frecuencia.../ Total= 3.5 + 4 + 8.../ 40 = 4.68

Mediana: Medida de posición y central.
  • Si el número de observaciones es IMPAR el valor de la observación será justamente la observación que ocupa la posición (n+1/2) Ejemplo: si son 75, pues 76 entre 2 = 38, la mediana seria la edad que tiene el sujeto 38.
  • Si el número de observaciones es PAR, el valor de la mediana corresponde a la media entre los dos valores centrales, es decir, la media entre la observación n/2 y la observación (n/2)+1. Ejemplo: cuatro sujetos de edades, 10, 15, 20, 25, cogemos los dos sujetos centrales y hacemos la media aritmética entre ambos.

Propiedad: Sólo tiene en cuenta la posición de los valores en la muestra. tiene mucho mejor comportamiento que la media cuando hay observaciones extremas.

Moda: Corresponde a la categoría. Es el valor con mayor frecuencia (que más veces se repite). Si hay más de una se dice que la muestra es bimodal (dos modas) o multimodal (más de dos modas). 
Se puede calcular para cualquier tipo de variable tanto la CUALITATIVA como la CUANTITATIVA. La 

Si los datos están agrupados, se habla de clase modal y corresponde al intervalo en el que el cociente entre la frecuencia relativa y la amplitud (se resta el intervalo mayor menos el menor) es mayor (hi/ci). Donde la frecuencia absoluta sea mayor.





MEDIDAS DE POSICIÓN O CUANTILES.
Se calcula para variables CUANTITATIVAS y, a igual que la mediana, solo tiene en cuanta la posición ordenada de mayor a menor.
Los cuantiles más usuales son los percentiles, los deciles y los cuartiles, según dividan la muestra ordenada en 100 (perciles), 10 (deciles) ó 4 partes (cuartiles), respectivamente.
  •  Percentiles:
    • Dividen la muestra ordenada en 100 partes.
    • El percentil “i” (Pi), es aquél valor que, ordenadas las observaciones en forma creciente, el i% de ellas son menores que él y el (100-i) % restante son mayores.
    • Para buscar la posición de un percentil en una serie de datos agrupados, buscamos el intervalo en el que la frecuencia relativa acumulada (Hi) sea superior al valor del percentil.
    • El valor del P50 corresponde al valor de la mediana.



  •  Deciles:
    • Dividen la muestra ordenada en 10 partes.
    • El decil “i” (Di), es aquél valor que, ordenadas las observaciones en forma creciente, el i/10% de ellas son menores que él y el (100-i)/10% restante son mayores.
    • El valor del D5 corresponde al valor de la mediana y, por tanto, al del P50.




  • Cuartil:
    • Dividen la muestra ordenada en 4 partes.
    • El Q1, primer cuartil indica el valor que ocupa una posición en la serie numérica de forma que el 25% de las observaciones son menores y que el 75% son mayores.
    • El Q2, segundo cuartil indica el valor que ocupa una posición en la serie numérica de forma que el 50% de las observaciones son menores y que el 50% son mayores. Por tanto, el Q2 coincide con el valor del D5, con el valor de la mediana P50.
    • El Q3, tercer cuartil indica el valor que ocupa una posición en la serie numérica de forma que el 75% de las observaciones son menores y que el 25% son mayores.
    • El Q4, cuarto cuartil indica el valor mayor que se alcanza en la serie numérica.


A continuación les añado un vídeo en el que explica paso a paso el calculo de estas medidas de posición.



MEDIDAS DE DISPERSIÓN.
La información aportada por las medidas de tendencia central es limitada.

Ejemplo:

-          Serie 1: 18, 19, 20, 21,22.
-          Mediana serie 1=20, Media serie 1=20
-          Serie 2: 9, 14, 20, 27,30.
-          Mediana serie 2=20, Media serie 2=20

¿Qué es lo que diferencia a una de otra?  La dispersión.

Rango o recorrido: Diferencia entre el mayor y el menor valor de la muestra lXn-X1l (valor absoluto)

Según el ejemplo anterior:
-          R1=22-18=4
-          R2=30-9=21 (esto ya nos indica que la serie 2 tiene más dispersión).

Desviación media: media aritmética de los distintos valores de cada observación con respecto a la media de la muestra.



Para datos agrupados:



Desviación estándar: Cuantifica el error que cometemos si representamos una muestra únicamente por su media. Esta en la que mas se emplea debido a que esta nos da un mayor rango de error.

Varianza: expresa la misma información en valores cuadráticos.


Recorrido intercuartílico: Diferencia entre el tercer y el primer cuartil = /Q3-Q1/

Coeficiente de variación: es una medida de dispersión relativa (adimensional) ya que todas las demás se expresan en la unidad de medida de la variable.
No sirve para comprar la heterogeneidad de dos series.

  C.V = S / x

Ejemplo:

Unas enfermeras han registrado en el punto de vacunación las edades de nueve niños que han sido vacunados durante una sesión, obteniéndose los siguientes datos:
3, 2, 4, 2, 1, 3, 5,3 y 4 meses.
Calcular:
a.       Media aritmética:
b.      Mediana = 1
c.       Moda = 3
d.      Rango o recorrido
e.      Varianza.
f.        Desviación típica.
g.       Coeficiente de variación.

Media aritmética:   X = 27/9 = 3

Mediana = 1

Moda = 3

Rango o recorrido:    R = 5 - 1 = 4

Varianza:  


Desviación típica:

Coeficiente de variación:


Hasta aquí por hoy!