Logo Studenta

Estimación de parámetros (media, proporción) 2020 [Autoguardado]

¡Este material tiene más páginas!

Vista previa del material en texto

Estimación de parámetros:
Estimación puntual y por intervalos. Características deseables de un estimador. Cálculo de los intervalos de confianza para los principales parámetros. 
Estimación de Parámetros: 
Es una de dos grandes ramas en que se divide la inferencia estadística, con el objeto de conocer el valor de algún parámetro de la población bajo interés, que a través del valor de un estadístico calculado a partir de una muestra de dicha población se estima su valor.
Se trata de emplear los estadísticos para estimar los parámetros.
Veremos dos tipos de Estimación
Estimación puntual. Aquí obtendremos un punto, un valor único, como estimación del parámetro.
 
Estimación puntual de parámetros
Ante la desventaja de la estimación puntual se propone una:
Estimación por intervalo. 
Es una serie de valores dentro de la cual se espera que esté contenido el valor verdadero del parámetro.
Se consideran 4 propiedades:
Ser Insesgado o imparcial
Consistencia
Eficiencia
Suficiencia
Propiedades deseables en los estimadores
Criterios para Seleccionar un Buen Estimador 
Podemos evaluar la calidad de una estadística como un buen estimador mediante el uso de cuatro criterios:
 
a. Imparcialidad.
 El termino Imparcialidad se refiere al hecho de que una media de muestra es un estimador no sesgado de la media de la población porque la media de la distribución de muestreo de las medias de muestra tomadas de una población es igual a la media de la población misma.
b.     Eficiencia.
 Se refiere al tamaño del error estándar de la estadística. Si comparamos dos estadísticas de una muestra del mismo tamaño y tratamos de decidir cual de ellas es un mejor estimador más eficiente, escogeríamos la que tuviera el menor error estándar o la menor desviación estándar de la distribución de muestreo.
c.     Coherencia.
 Una estadística es un estimador coherente de un parámetro de la población si al aumentar el tamaño de la muestra, se tiene la certeza de que el valor de la estadística se aproxima bastante al valor del parámetro de la población.
 
d.     Suficiencia.
 Un estimador es suficiente si utiliza una cantidad de la información contenida en la muestra que ningún otro estimador podría extraer información adicional de la muestra sobre el parámetro de la población que se está estimando.
Intervalo de confianza 
es una estimación por intervalo, en la cual se asigna una determinada confiabilidad.
Fórmula general del intervalo de confianza
Estimador + (Coeficiente de confiabilidad)(Error estándar)
En este caso, se ofrece un intervalo de valores que contendrán con cierta probabilidad al parámetro que queremos estimar.
¿Y cómo fijamos tal confiabilidad? Usualmente un 95%. El intervalo de confianza sobre la media al 95% quiere decir que el 95% de las veces que repitamos el proceso de muestreo para la media muestral, la media poblacional estará dentro de tal intervalo.
 
Sabemos que la distribución subyacente es normal, lo cual nos ayuda enormemente. 
Como la confiabilidad es un área central del 95%, en una distribución normal estándar, es fácil saber qué calificación estándar (z) deja a la izquierda el 2.5% de los datos en tablas es -1.96 y 97.5% de los datos permite encontrar al lado derecho z en tabla igual a 1.96.
Ahora habrá que pasar esos datos a puntuaciones directas....
Pero, ¿cómo calculamos estos dos límites?
 Intervalos de confianza para los principales parámetros: El caso de la media (1)
 Intervalos de confianza para el caso de la media (1)
Ejemplo 1 Un fisioterapeuta desea estimar con 99% de confianza la media de la fuerza máxima de un músculo particular en cierto grupo de individuos. Se inclina a suponer que los valores de dicha fuerza muestran una distribución aproximadamente normal con una varianza de 144. Una muestra de 15 individuos que participaron en el experimento presentó una media de 84.3.
1. Datos:			2. Fórmula		3. Sustituyendo
n= 15			 84.3
σ= = 12	
	= = 3.0984	Intervalo de confianza al 99% para estimar µ [ 76.3, 92.3 ] 
Z de tabla= 2.58
4. Interpretación: De cada 100 veces que se construya el Intervalo de este modo, 99 de las veces la media verdadera de la población µ estará contenida entre una fuerza muscular de [76.3, 92.3 ]
 = 84.3
Ejemplo 2.
Un equipo de investigadores esta interesado en la puntualidad de los pacientes en las citas concertadas. De los consultorios médicos generales, se encontró en una muestra de 35 pacientes llegaba 17.2 minutos tarde a las citas, en promedio. Una investigación previa demuestra que la desviación estándar era de 8 minutos aproximadamente, se tiene la sensación de que la distribución de la población no era normal. ¿Cuál es el intervalo de confianza de 90% para µ, que es el promedio real de impuntualidad en las citas?
Solución: Como el tamaño de la muestra es grande (n>30) y además se conoce la desviación estándar de la población (σ), con base en el Teorema Central del Límite la distribución muestral de la media se aproxima a la normalidad.
1. Datos:		2. Fórmula			3. Sustituyendo
n=35		 17.2
σ= 8					 17.2
= 17.2		 Intervalo de confianza al 90% para estimar µ [ 15.0 a 19.4 ]
4. Interpretación: De cada 100 veces que se construya el Intervalo de este modo, 90 de las veces la media verdadera de la población µ estará contenida entre una puntualidad de [15.0 a 19.4 ]
Intervalo de confianza al 90% para estimar µ [ 15.0 a 19.4 ]
Interpretación : De cada 100 veces que se construya el intervalo para estimar 
la media de este modo 90 de las veces la media de la población quedará 
contenida entre 15.0 y 19.4 minutos de tardanza para acudir a las citas 
médicas.
Tarea: Construye los intervalos de confianza al 95& para estimar la media de los 
ejercicios de la página 160 de Bioestadística Wayne W. Daniel.
6.2.1	6.2.2	6.2.3	y 6.2.4
EJERCICIOS
Construya para cada ejercicio los intervalos de confianza al 90, 95 y 99 por ciento para la media de la población y establezca su interpretación tanto probabilística como práctica. 
Indique cual interpretación es mas adecuada utilizar cuando tratamos sobre intervalos de confianza con alguien que no conoce de estadística y establezca el razonamiento elegido.. 
Explique por que los tres intervalos no tienen la misma amplitud. Indique cual de los tres intervalos es preferible como estimador de la media de la población, y establezca el razonamiento de su elección.
6.2.1 Se pretende estimar el numero promedio de latidos del corazón por minuto para cierta
poblaci6n. Se encontró que el número promedio de latidos por minuto para 49 personas era de 90. Considere que esos 49 pacientes constituyen una muestra aleatoria y que la población sigue una distribución normal, con una desviación estándar de 10.
6.2.2 Se pretende estimar la concentración media de bilirrubina indirecta en el suero de niños de cuatro días de nacidos. La media para una muestra de 16 niños es de 5.98mg/100 cc. Considérese que la concentración de bilirrubina en los niños de cuatro días de nacidos sigue una distribución aproximadamente normal con una desviación estándar de 3.5 mg/100 cc.
6.2.3 En un estudio acerca de la duración de la hospitalización dirigido por varios hospitales en cooperación, se extrajo una muestra aleatoria de 64 individuos con ulcera péptica de la lista de todos los pacientes con esa enfermedad internados alguna vez en los hospitales participantes.
Se determinó para cada uno de ellos el tiempo de hospitalización. Se encontró que la
Duración media de hospitalización fue de 8.25 días y se sabe que la desviación estándar de
la población es de tres días.
6.2.4 Una muestra de 100 hombres adultos aparentemente sanos, de 25 años de edad, muestra
una presión sistólica sanguínea media de 125. Considere que la desviación estándar de la
población es de 15.
Como encontrar en la tabla el valor de Z para una confiabilidad del 90%.
En la curva normal el 90% está al centro, y el 10% restante se divide en ambos extremos de la curva o sea 0.10/2 = 0.05
Sebusca 0.05 dentro de la tabla y solo se encuentran dos aproximaciones 0.0495 y 0.0505, para cada área tenemos una Z = -1.64 y otra Z = -1.65 
cuyo punto medio es -1.64+(-1.65) / 2 = -1.645 misma utilizada en el ejemplo 2.
 Z -0.04 -0-05
-1.60 --------------- 0,0495 0.0505 
 5% 90% 5% 
 -1.645 +1.645
Intervalo de confianza para la media µ, cuando se desconoce σ y la muestra es pequeña n<30 se utiliza la distribución t de Student
En este caso se cambia por donde s es la desviación estándar estimada de la
 
población cuya fórmula es 
Este cambio se debe al Químico William Sealy Gosset cuyo trabajo lo publicó a principios del siglo XX. En Dublin Irlanda.
Propiedades de la distribución t La distribución t tiene las siguientes propiedades:
Tiene una media de O.
2. Es simétrica con respecto a la media.
3. En general, tiene una variancia mayor que 1, pero esta tiende a 1 a medida
que aumenta el tamaño de la muestra. 
 Para df> 2, la variancia de la distribución t es df / (df - 2), donde df representa los grados de libertad. En forma alterna, puesto que df = n - 1 para n > 3, se puede escribir la varianza de la distribución t como (n - 1)/(n - 3).
4. La variable t va de - DO hasta + 00.
5. La distribución t es realmente una familia de distribuciones, puesto que hay
una distribución diferente por cada valor de la muestra de n - 1, que es el
divisor que se utiliza para calcular . Recuerde que n - 1 representa los grados
de libertad. En la figura 6.3.1 se muestran las distribuciones t correspondientes
a algunos valores de los grados de libertad.
5. La distribución t es realmente una familia de distribuciones, puesto que hay una 
 distribución diferente por cada valor de la muestra de n - 1, que es el divisor que se 
 utiliza para ca1cular . Recuerde que n - 1 representa los grados de libertad. En la 
 figura 6.3.1 se muestran las distribuciones t correspondientes a algunos valores de 
 los grados de libertad. 6. Comparada con la distribución normal, la distribución t e 
 menos espigada en el centro y tiene colas mas largas. En la figura 6.3.2 se compara
 la distribución t con la distribución normal.
7. La distribución t se aproxima a la distribución normal a medida que n - 1 se
 aproxima al infinito.
Intervalo de confianza para la media µ, cuando se desconoce σ y la muestra es 
pequeña n<30 se utiliza la distribución t de Student
La fórmula para el intervalo es:
Ejemplo 1
Kaminsky y Rechberger encontraron en un estudio sobre la preeclampsia que la media de la presión sistólica sanguínea en 10 mujeres sanas y que no están embarazadas es de 119 con una desviación estándar de 2.1
¿Cuál es el error estándar estimado para la media?
=
b) Construya un intervalo de confianza del 99% para estimar la media de la población µ a partir de la muestra de 10 personas. 
Datos:		Fórmula			Sustituyendo
n=10		 1
 s= 2.1 					 1
= 119					 119 2.1583
 Intervalo de confianza al 99% para estimar µ [ 116.8 a 121.2 ]
Interpretación: De cada 100 veces que se construya el intervalo de este modo, 99 de las veces
la media de la población estará contenida entre 116.8 y 121.2 de presión sistólica sanguínea
entre mujeres sanas que padecen preeclampsia.
El valor de t de tablas, con grados de libertad gl = n-1 y un nivel de significación alfa α=0.01 
tenemos: n-1 0.01 Prueba bilateral
	 
	 9 ----------------------- 3.25 t de Student de tabla es 3.25
c) ¿Cual es la precisión estimada?
	Es d = (t)() = 2.1583
d) ¿Qué consideraciones deben hacerse para comprobar la validez del intervalo de confianza?
 Antes de ocupar el coeficiente de confiabilidad t de Student debe considerarse que se desconoce a la desviación estándar de la población, aunque se supone que su distribución se aproxima a la normalidad, además que el tamaño de la muestra es pequeña generalmente menor que 30 individuos. 
Tarea: Realiza los ejercicios de las páginas 163 y 164
Ejercicios Número 		6.3.1	6,3,2	 y	6.3.3		
6.3.1 Utilice la distribud6n t para encontrar el factor de confiabilidad para el intervalo de confianza basado en los siguientes coeficientes de confianza y tamaños de las muestras
6.3.2 En una investigación acerca de la dependencia del flujo y volumen de todo el sistema respiratorio en un grupo de pacientes con enfermedad obstructiva pulmonar crónica, conectados a respiradores artificiales, Tantucci et ai. (A-2) registraron los siguientes valores de línea de base del flujo continuo. inspiratorio (l/s): .90, .97, 1.03,1.10, 1.04, 1.00. considere que una muestra aleatoria simple esta conformada por seis individuos a partir de una población que. sigue una distribuci6n normal, con individuos de la misma enfermedad. 
a) ¿Cual es la estimaci6n puntual de la media de la poblaci6n? 
b) ¿Cual es la desviación estándar de la muestra? 
¿Cuál es la estimación del error estándar para la media de la muestra? 
0.0277
d) Construya un intervalo de confianza de 95 por ciento para el flujo medio continuo inspiratorio de la poblaci6n. 
e) ¿Cuál es la precisión de la estimación? 
f) Explique la interpretaci6n probabilística para este Intervalo de confianza. 
g) Explique la interpretación practica para este intervalo de confianza. .
 1.007 2.571 x 0.0277
 1.007 0.0712
 [ 0.9358 a 1.0782 ]
Intervalo de confianza del 95% para estimar la media de la población.
g) Interpretación práctica
Interpretación: De cada 100 veces que se construya el intervalo de este modo 95 de las veces la media verdadera de la población estará contenida entre [ 0.9358 a 1.0782 ] l/s de inspiración pulmonar.
Intervalo de confianza para estimar la proporción de una población π
Preguntas frecuentes
¿Qué proporción de pacientes que reciben un tipo especial de cuidado se recuperan?
¿Qué proporción de alguna población tiene cierta enfermedad?
¿Qué proporción de una población es inmune a cierta enfermedad?
Las respuestas pueden enfocarse a través del muestreo y la estimación del parámetro π
Ejemplo 1. Mathers et al encontraron en una muestra de 591 pacientes internados en un 
hospital psiquiátrico, que 204 admitieron el consumo de marihuana al menos una vez durante
su vida. Se pretende construir un intervalo de confianza del 95% para la proporción de
Individuos que consumieron marihuana en su vida en la población muestreada de los 
internos del hospital psiquiátrico. 
Datos:		Fórmula			 Sustituyendo:
n=591		 0.3452 
 p= 204/591= 0.3452 0.3452 (0.01956)
			 0.3452 0.0383
 	Intervalo de confianza al 95% para estimar π [ 0.3069 a 0.3835 ]
Interpretación: De cada 100 veces que se construya el intervalo de este modo, 95 de las veces la proporción verdadera de pacientes internados en el hospital psiquiátrico, que han consumido marihuana al menos una vez en su vida, será de al menos 30.7% y a lo mas del 38.4%
TAREA: Hacer los ejercicios de la página 178 números: 6.5.1 6.5.2 6.5.3 y 6.5.4
					 	
Ejercicios
Para cada uno de los siguientes ejercicios establezca la interpretación práctica y probabilística de los intervalos que se pide construir. Identifique cada componente del intervalo: la estimación puntual, el coeficiente de confiabilidad y el error estándar. 
Explique por que los coeficientes de confiabilidad no son los mismos para todos los ejercicios.6.5.1 	En una investigación de niños maltratados en pacientes psiquiátricos, Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947, con antecedentes de abuso sexual y maltrato físico. 
	Construya un intervalo de confianza de 90 por ciento para la proporción de la población.
6.5.2 	Catania et al. (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros, con edades entre 20 y 44, residentes en áreas geográficas caracterizadas por tasas altas de enfermedades de transmisión sexual e ingreso a programas de drogas. De 1229 encuestados, 50 por ciento respondieron que nunca utilizaron preservativos. 
	Construya un intervalo de confianza de 95 por ciento para la proporción de la población que nunca utiliza preservativos.
6.5.3 	Rothberg y Lits (A-I 5 ) estudiaron el efecto del estrés de la maternidad durante el embarazo en el peso del producto. Los individuos eran 86 mujeres blancas con antecedentes de estrés que no tenían factores de riesgo medico u obstétrico conocido de peso bajo del producto. Los investigadores encontraron que 12.8 por ciento de las madres estudiadas dieron a luz bebes que cubrían el criterio de peso bajo. 	Construya un intervalo de confianza de 99 por ciento para la proporción de la población.
6.5.4 	En una muestra aleatoria simple de 125 varones desempleados, quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 años inclusive, 88 declararon que eran consumidores regulares de bebidas alcohólicas. 
	Construya un intervalo de confianza de 95 por ciento para la proporción de la población.
Determinación del tamaño de la muestra para estimar la media de una población µ
Al iniciar el planteamiento de una encuesta o experimento, surge la pregunta de que tan grande debe elegirse la muestra para que sea representativa. 
De la respuesta apropiada depende el éxito del trabajo bajo investigación, por lo que no se debe tomar tan a la ligera. Si la muestra es muy grande se incrementa el costo y tal vez se desperdicien recursos, si es muy pequeña frecuentemente dan resultados que carecen de uso práctico.
De la observación del intervalo obtenemos las unidades que se extiende hacia uno u otro lado del estimador, denominado margen de error. y se mide mediante:
 d = (Coeficiente de confiabilidad)(Error estándar)
 		
Muestreo Para estimar la media 
Caso 1. Si el muestreo es con reemplazo o la población es muy grande o infinita 
 d = de aquí despejando n tenemos:
 = Tamaño de la muestra para estimar la media de la población µ
Caso 2. Si el muestreo es sin reemplazo a partir de una población pequeña o finita 
		 d = 
					
					 						 factor de corrección por
 población finita
Y despejando n se obtiene 
Ejemplo 1. Un nutriólogo del departamento de salud, efectuará una encuesta entre una Población de muchachas adolescentes con el fin de determinar su ingestión diaria Promedio de proteínas (medidas en gramos), pide la asesoría de un bioestadístico acerca del tamaño de la muestra que debe tomar.
	Antes de que el estadístico pueda ayudar al nutriólogo, éste debe proporcionar tres elementos de información: La dimensión deseada del intervalo de confianza (margen de error), el nivel de confianza deseado y la magnitud de la varianza de la población.
Solución: 
	Si el nutriólogo requiere un intervalo de confianza con una dimensión aproximada a 10 gramos , es decir la estimación se debería encontrar alrededor de 5 gramos de la media de la población en ambas direcciones. Esto es 5 gramos corresponde al margen de error.
	
	Si la confiabilidad es de .95 y que con experiencia previa percibe que la desviación estándar es de alrededor de 20 gramos. 					
	
 
TAREA : Realizar los ejercicios 6.7.1, 6.7.2 6.7.3 y 6.7.4 de la página 183
 del libro Bioestadística de Wayne W. Daniel.
 
EJERCICIOS
6.7.1 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su
hospital. Si se desea un intervalo de confianza de 99 por dentro con una amplitud de 1 libra,
¿Qué tan grande debe ser la muestra de los registros de nacimiento? Suponga que un estimaσdor razonable para σ es 1 libra. ¿De que tamaño debe ser la muestra si el coeficiente de
confiabilidad se hace descender a .95?
'6.7.2 El director de la sección de control dela rabia del departamento de salud publica, desea
extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso
del ano anterior para estimar la edad media de las personas mordidas. Requiere un intervalo
de confianza de 95 por dentro, decide utilizar un valor de 2.5 para d y, a partir de estudios
anteriores, estima que la desviación estándar de la poblacion esta alrededor de los 15 años.
¿Qué tan grande debe ser el tamaño de la muestra?
6.7.3 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mg/100 ml) de pacientes atendidos en una clínica para diabéticos durante el transcurso de los últimos 10 años. Determine el numero de registros que el medico debe examinar para obtener un intervalo de confianza de 90 por ciento para 11 si la dimensión requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varianza de 60.
6.7.4 Se desea estimar la edad media en la que a los pacientes de esclerosis múltiple se les diagnostico el padecimiento por primera vez. Se requiere un intervalo de confianza de 95 por ciento con una dimensión de 10 anos. Si la variancia de la poblaci6n es de 90, ~¿Qué tan grande deberá ser la muestra?
Determinación del tamaño de la muestra para estimar la proporción π de una población.
De la observación del intervalo para estimar π obtenemos las unidades que se extiende hacia uno u otro lado del estimador denominado margen de error. y se mide mediante:
 d = (Coeficiente de confiabilidad)(Error estándar)
 		
Si el muestreo es con reemplazo o de una población grande tenemos
 d= 
			Despejando donde q = 1-p
Ahora si el muestreo es sin reemplazo a partir de una población finita y pequeña. 
		 d = 
Que al despejar n, resulta en: factor de corrección por
					 población finita.
		 
			 
Ejemplo 1. 
Se planea realizar una encuesta para determinar que proporción de familias en 
cierta área carece de servicios médicos. Se cree que la proporción no puede ser 
Mayor que 0.35. Se desea un intervalo de confianza del 95% con d = 0.05
¿De que tamaño debe seleccionarse la muestra de familias?
Si es posible omitir la corrección por población finita, se tiene
	= 349.6
Por lo tanto el tamaño de muestra es de 350 familias a quienes entrevistar acerca
de la carencia de servicios médicos.
TAREA: Realizar los ejercicios de las páginas 184 y 185 ejercicios número 6.8.1
6.8.2	6.8.3 y 6.8.4 Libro de texto.
Tarea 1: Construye los intervalos de confianza al 95% para estimar la media de los ejercicios de la página 160 	
Ejercicios 6.2.1	6.2.2	6.2.3	y 6.2.4
Tarea 2: Realiza los ejercicios de las páginas 163 y 164
Ejercicios Número 		6.3.1	6,3,2	 y	6.3.3	
TAREA 3: Hacer los ejercicios de la página 178 números: 6.5.1 6.5.2 6.5.3 y 6.5.4
TAREA 4 : Realizar los ejercicios 6.7.1, 6.7.2 6.7.3 y 6.7.4 de la página 183
TAREA 5 : Realizar los ejercicios de las páginas 184 y 185 ejercicios número 
6.8.1 6.8.2	6.8.3 y 6.8.4
Bioestadística Wayne W. Daniel.

Continuar navegando