INFERENCIA ESTADÍSTICA:
Cuando
planteamos un estudio en el ámbito sanitario para establecer relaciones entre
variables, nuestro interés no suele estar exclusivamente en los pacientes
concretos a los que hemos tenido acceso, sino más bien en todos los pacientes
similares a estos.
Antes de continuar debemos de saber una serie de conceptos que aparecerán a lo largo del tema:
- Población de estudio: es el conjunto de pacientes sobre los que queremos estudiar alguna cuestión.
- Muestra: es el conjunto concreto de individuos que participan en el estudio.
- Inferencia estadística: es el conjunto de procedimientos estadísticos que permiten pasar de los particular a lo general.
- Técnica de muestreo: conjunto de procedimientos que permiten elegir muestras de tal forma que estas reflejen las características de la población. Se hace principalmente para evitar sesgos.
Siempre que trabajemos con muestras, aunque sean representativas hay que asumir un cierto error, por pequeño que sea.
- Si la muestra se elige por un procedimiento de azar, se puede evaluar ese error. La técnica de muestreo en ese caso se denomina muestreo probabilístico o aleatorio y el error asociado a esa muestra elegida al azar se llama error aleatorio.
- En los muestreos no probabilísticos (Ej: estudios de conveniencia. Utilizar a los pacientes de mi hospital como muestra), no es posible evaluar el error. En los muestreos probabilísticos, el error aleatorio es inevitable pero es evaluable gracias a las leyes de la probabilidad.
- Cuanto mayor sea el tamaño de la muestra, favorezco la reducción del error aleatorio por probabilidad.
Tenemos una población de estudio, y
la medida que queremos obtener se llama parámetro. Hacemos una selección aleatoria y obtenemos
una muestra, y la medida de la variable de estudio obtenida en la muestra, se
denomina estimador.
ERROR ESTÁNDAR:
- Es la medida que trata de captar la variabilidad de los valores del estimador (en este caso la media de los días de curación de la úlcera).
- El error estándar de cualquier estimador mide el grado de variabilidad en los valores del estimador en las distintas muestras de un determinado tamaño que pudiésemos tomar de una población.
- Cuanto más pequeño es el error estándar de un estimador, más nos podemos fiar del valor de una muestra concreta.
Si en lugar de variar el valor de la media
en las muestras entre 52 y 64 días, variara entre 20 y 90 días, sería menos
probable que al seleccionar una muestra y calcular su media, ésta estuviera
cercana a 57,46, que es el valor de la media en la población.
CÁLCULO DE ERROR ESTÁNDAR:
Depende de cada estimador:
- Error estándar para una media:
- Error estándar para una porporción (frecuencia relativa):
TEOREMA CENTRAL DEL LÍMITE:
Para estimadores que pueden ser expresados
como suma de valores muestrales, la distribución de sus valores sigue una
distribución normal con media de la población y desviación típica igual al
error estándar del estimador de que se trate.
Si en vez de una muestra,
seleccionara 100 muestras y calculara las medias y las pusiera en un
histograma, tendría una distribución normal, en la cual el error estándar
coincide con la desviación estándar del histograma, por lo tanto si le sumo y
le resto a la media una vez la desviación estándar, es decir, el error estándar, tendré el 68.26% de las observaciones.
INTERVALOS DE CONFIANZA:
- Son un medio de conocer el parámetro en una población midiendo el error que tiene que ver con el azar (error aleatorio).
- Se trata de un par de números tales que, con un nivel de confianza determinados, podamos asegurar que el valor del parámetro es mayor o menor que ambos números.
- Se calcula considerando que el estimador muestral sigue una distribución normal, como establece la teoría central del límite.
- I.C de un parametro: estimador +- z (e.estándar)
- Z es un valor que depende del nivel de confianza 1-a con que se quiera dar el intervalo (a= error máximo admisible: 5%). Por lo tanto Z tiene que ver con el valor que va delante de S en el teorema central del límite. Si I.C es más alto, más probabilidad de que el intervalo esté dentro y por tanto la horquilla sea mayor.
-Para el nivel de confianza 68% z=1 (No suele utilizarse un intervalo de confianza del 68% porque asumimos un error máximo del 5%).
- Para nivel de confianza 95% z=1,96 --> 2
- Para nivel de confianza 99% z=2,58 --> 3
Mientras mayor sea la confianza que queramos otorgar al intervalo, éste será más amplio, es decir, el extremo inferior y el superior del intervalo estarán más distanciados y, por tanto, el intervalo sera menos preciso.
TIPOS DE MUESTREO:
PROBABILÍSTICO: todos los sujetos de la población tienen una probabilidad distinta de cero en la selección de la muestra conocida. Existe una probabilidad conocida de seleccionar a los sujetos. Sin embargo si lo hacemos a cualquier persona que pase por la calle, no sabemos a quien vamos a encontrarnos para incluir la selección.
NO PROBABILÍSTICO: Puede haber personas en la población que no tengan probabilidad o que se desconozca, de ser seleccionado en la muestra, No existe probabilidad conocida, es una selección arbitraria.
- Accidental: son aquellos en los que los sujetos de la población no tienen una probabilidad conocida o distinta de 0.
- Por cuotas: me pongo a pasar un cuestionario en una esquina pero el 50% de las mujeres y el 50% de los hombres, despreciando a la mujer 51 que pasa por la esquina.
*MUESTREO PROBABILÍSTICO:
Todos y cada uno de los elementos tienen la misma probabilidad de ser elegido para la muestra. Es el método que consulte en extraer una parte (o muestra) de una población, de tal forma que todas las muestras posibles de tamaño fijo, tengan la misma probabilidad de ser seleccionados.
-Aleatorio Simple: (es el mas fiable y equitativo)
- Se caracteriza porque cada unidad tiene la probabilidad equitativa de ser incluida en la muestra:
- De sorteo o rifa: Asignamos un nº a cada miembro de la población, calculamos el tamaño muestra y seleccionamos aleatoriamente ese nº. Este método no es fácil cuando la población es muy grande, pasando a usar el sistema que continua.
- Tabla de números aleatorios: Más economuco y requiere menor tiempo. Se hace cuando disponemos de una lista informatizada en una base de datos de la población de estudio.
- Aleatorio Sistemático:
- Similar al simple, en donde cada unidad de la muestra tiene la misma probabilidad de ser seleccionada.
- Estratificado:
- Se caracteriza por la subdivisión de la población de estudio en subgrupos o estratos, debido a que las variables principales que deben someterse a estudio presentan ciertas variabilidad o distribución conocida que puede afectar a los resultados.
-Conglomerado:
- Se usa cuando no se dispone de una lista detallada y enumerada de cada una de las unidades que conforman la población y resulta muy complejo elaborarla. En la selección de la muestra en lugar de escogerse cada unidad se toman los subgrupos o conjuntos de unidades conglomerados.
- En este tipo de muestreo el investigador no conoce la distribución de la variable.
- las inferencias que se hacen en una muestra conglomerada no son tan confiables como las que se obtienen en un estudio por muestreo aleatorio, excluyendo directamente grandes municipios. El municipio se elige por estratificación a su vez.
*MUESTREO PROBABILÍSTICO:
- No se sigue el proceso aleatorio.
- No puede considerarse que la muestra sea representativa de una población.
- Se caracteriza porque el investigador selecciona la muestra siguiendo algunos criterios identificados para los fines del estudio que realiza.
Tipos:
- Por cuotas: en el que el investigador selecciona la muestra considerando fenómenos o variables a estudiar como sexo, raza, religión...
- Accidental: Consiste en utilizar para el estudio las personas disponibles en un momento dado, según lo que interesa estudiar. De las tres es la mas deficiente.
- Por conveniencia o intencional: En el que el investigador, decide según sus objetivos, los elementos que integran la muestra, considerando las unidades "tipicas" de la población que se desea conocer (en función de nuestro interés, muestra accesibilidad...)
TAMAÑO DE LA MUESTRA:
El tamaño de la muestra a tomar va a depender de:
- Error estándar.
- De la mínima diferencia entre los grupos de comparación que se considera importante en los valores de la variable a estudiar. Mas grande debe ser la muestra para que mas pequeño sea el error.
- De la variabilidad de la variable a estudiar (varianza en la población).
- El tamaño de la población de estudio.
Cálculo del tamaño de una muestra para estimar la media de una población:
Z es un valor que depende del nivel de confianza 1-a con que se quiera dar a los intervalos calculamos a partir de estimadores de esa muestra. (Para nivel de confianza 95% z=1.96 y para el nivel de confianza 99% z=2.58).
S2 es la varianza poblacional.
e: es el error máximo aceptado por los investigadores en las diferencias entre los grupos de comparación de la variable a estudiar.
- Si trás esta operación se cumple el resultado: N> n (n-1), el cálculo del tamaño muestral termina aquí.
- Si no se cumple, obtendremos el tamaño de la muestra con esta formula:
No hay comentarios:
Publicar un comentario