Vistas de página en total

lunes, 14 de mayo de 2018

Tema 9: Estadística inferencial: Muestreo y estimación.

Hola de nuevo chicos y chicas a esta entrada, esta vez os hablaré sobre la estadística inferencial.
Antes de nada ¿qué es inferir? Pues bien, inferir es cuando nuestro interés no se centra en pacientes concretos sino más bien en todos aquellos pacientes con características similares, es decir, estudiamos pacientes concretos para poder conocer las características similares de grupos más amplios.

Veamos ahora el proceso de la inferencia estadística:

  • Contamos con una población, de la que sacaremos un parámetro, es decir, los datos de la población.
  • En base a dicha población escogemos una muestra de manera aleatoria.
  • De esta muestra, al inferir, obtenemos un estimador, que es el dato que obtenemos de dicha muestra y que extrapolaremos a la población.
Este proceso, por el que a partir del estimador obtenido de la población, me aproximo al parámetro se denomina inferencia.
A continuación os dejo un ejemplo de inferencia estadística:
Ejemplo inferencia:
 Estudio tiempos de curación de úlceras en muestra de 100 pacientes.
- Media del tiempo muestra 1=53,77 días.
- Media del tiempo muestra 2=57,08 días. Si seleccionáramos muchas muestras, cada una nos daría un valor distinto. 

 Construimos histograma con los estimadores de la media de tratamiento calculados en 200 muestras (200 estudios distintos, y de todos calculamos la media) distintas de 100 pacientes cada una.
 El histograma recuerda a una campana de Gauss, por lo tanto seguiría una distribución normal. Esto significa que utilizando los principios que siguen las distribuciones normales puedo hacer inferencias.
Siempre saldría así debido a que tendría una distribución normal. Esto nos permite calcular el error estándar. Que es el error que asumimos cuando seleccionamos una muestra probabilística. La variabilidad de los estimadores anteriores se conoce como error estándar.

Para entender mejor esto último os explico ahora qué es el error estándar, que sigue los tres puntos siguientes:

  • Es la medida que trata de captar la variabilidad de los valores del estimador (en este caso la media de los días de curación de la úlcera). 
  • El error estándar de cualquier estimador, mide el grado de variabilidad en los valores del estimador en las distintas muestras de un determinado tamaño que hayamos escogido de la población.
  • Cuanto más pequeño es el error estándar de un estimador, más confiaremos en el valor de una muestra concreta
Para calcular el error estándar:

  • - Error estándar para una media : 𝑠 √𝑛= 𝑒 
  • - Error estándar para una proporción (frecuencia relativa): √𝑝(1 − 𝑝) 𝑛 ⁄ = 𝑒 
Para comprender las fórmulas es necesario saber que:

  1. S= desviación típica.
  2. n=tamaño de la muestra
  3. p=proporción estimada en la muestra.
De ambas formulas podemos concluir en que, mientras mayor el tamaño muestral, menor será el error estándar

Para continuar, os voy a hablar del teorema central del límite, que sigue las normas básicas que ya vimos en las distribuciones normales que forman la gráfica en forma de campana de Gauss.
Por ejemplo, si en vez de una muestra, seleccionara 100 muestras y calculara las medias al ponerlas en un histograma, tendría una distribución normal, en la cual el error estándar coincide con la desviación estándar del histograma, por lo tanto si le sumo y le resto a la media el error estándar, tendré el 68.26% de las observaciones. Y como he dicho anteriormente sigue las normas básicas de las distribuciones normales:

  • ± 1S   68,26% de las observaciones (muestras). 
  • ± 2S    95,45% de las observaciones. 
  • ± 1,95S  95% de las observaciones 
  • ± 3S      99,73% de las observaciones. 
  • ± 2,58S   99% de las observaciones.
Por último os voy a hablar sobre los intervalos de confianza.
¿Qué son? Son un medio de conocer el parámetro en una población midiendo el error aleatorio.
Se trata de un par de números con los que, dado un nivel de confianza, podremos asegurar que el valor del parámetro se encontrará entre esos dos números.
Lo calcularemos considerando que el estimador muestral sigue una distribución normal.
Para calcular estos intervalos de confianza:

  • I.C.de un parámetro = estimador ± z(e.estándar) 
  • Z es un valor que depende del nivel de confianza 1-α con que se quiera dar el intervalo (α=error máximo admisible: 5%). Por lo tanto Z tiene que ver con el valor que va delante de S en el teorema central del límite. Si I.C es más alto, más probabilidad de que el intervalo esté dentro y por tanto la horquilla será mayor. 
  • Para nivel de confianza 68% z=1 (No suele utilizarse un intervalo de confianza del 68% porque asumimos un error máximo del 5%) 
  • Para nivel de confianza 95% z=1,96→2. 
  • Para nivel de confianza 99% z=2,58→3. 
  • El signo ± significa que cuando se elija el signo negativo se conseguirá el extremo inferior del intervalo y cuando se elija el positivo se tendrá el extremo superior.
Debemos tener en cuenta que, mientras más confianza queramos otorgarle al intervalo más amplio será este, pero a la vez, perderá precisión.
A continuación os dejo un ejercicio resuelto, y con él me despido de ustedes por ahora.



1.  Se estudiaron 93 pacientes en una unidad coronaria para conocer la proporción de enfermos coronarios que presentaban algo riesgo de infarto agudo de miocardio (IAM). Tras estudiar los pacientes se observó que 22 de ellos presentaban algo riesgo de IAM. ¿Cuál sería el intervalo de confianza al 95% de la proporción de general enfermos coronarios con alto riesgo de IAM?
a) Entre el 12% y 51%.
b) Entre el 15% y el 32%.
c) Entre el 19% y el 25%.
d) Entre el 21 % y el 27%.
N=93
22 IAM
P=22/93= 0’24 ;       q=1-p      IC= 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 ± 𝑧(𝑒.𝑒𝑠𝑡á𝑛𝑑𝑎𝑟) =   p±z √𝑝𝑞/ 𝑛= p±z √𝑝(1−𝑝)/n

Z=2                                       e=√0′24∗0′76/93 = 0’044


IC 95% → 0’24±0’044*2=   ·0’328
                                               ·0’152
El intervalo sería [0'152-0'328]

No hay comentarios:

Publicar un comentario