Logo Studenta

Estimación Puntual

¡Este material tiene más páginas!

Vista previa del material en texto

Cristian Camilo Holguin C
1004767300
Estimación Puntual-Pruebas de Hipótesis
Estimación: Estimar qué va a ocurrir respecto a algo (o qué está ocurriendo, o qué ocurrió), a pesar de ser un elemento muy claramente estadístico, está muy enraizado en nuestra cotidianidad. Dentro de ello, además hacemos estimaciones dentro de un intervalo de posibilidades. Por ejemplo: “creo que terminaré la tarea en unos 5-6 días”.
La estimación de parámetros tiene por finalidad asignar valores a los parámetros poblacionales a partir de los estadísticos obtenidos en las muestras. Dicho de otra manera, la finalidad de la estimación de parámetros es caracterizar las poblaciones a partir de la información de las muestras (por ejemplo, inferir el valor de la Media de la población a partir de los datos de la muestra).
Digamos que dada una población que siga una distribución de cierto tipo con función de probabilidad (de cuantía o de densidad)-f(X, θ )dependiente	de un parámetro o varios desconocidos " θ ", aventurar en base a los datos muestrales el valor que toma o puede tomar el parámetro o parámetros .Será el valor concreto que tomará el estimador al aplicar la muestra concreta obtenida y será, por tanto, la solución concreta de nuestro problema.
Tipos de estimación: Existen dos tipos de estimación de parámetros, puntual y por intervalos:
-Estimación puntual
-Estimación por intervalos 
Estimación puntual: La estimación puntual consiste en atribuir un valor (la estimación) al parámetro poblacional. Si la muestra es representativa de la población, podemos esperar que los estadísticos calculados en las muestras tengan valores semejantes a los parámetros poblacionales, y la estimación consiste en asignar los valores de los estadísticos muestrales a los parámetros poblacionales. Los estadísticos con que obtenemos las estimaciones se denominan estimadores.
Ejemplo
Se desea estimar la Media de las puntuaciones del curso 2003/4, pero solo se dispone de 50 puntuaciones seleccionadas aleatoriamente. La Media de la muestra (el estimador), es igual a 5.6 y atribuimos este valor (la estimación) a la Media del curso completo.
Resumiendo:
Podemos utilizar como estimadores de la Media de la población otros estadísticos de tendencia central como la Moda o la Mediana, pero NO todos los estimadores son apropiados. Los estimadores deben satisfacer ciertos requisitos, y por esta razón, interesa conocer sus propiedades a fin de utilizar los que sean adecuados según las circunstancias de la estimación.
Características estimadoras
 
1) Sesgo. Se dice que un estimador es insesgado si la Media de la distribución del estimador es igual al parámetro.
Estimadores insesgados son la Media muestral (estimador de la Media de la población) y la Varianza (estimador de la Varianza de la población):
Ejemplo
En una población de 500 puntuaciones cuya Media (m) es igual a 5.09 han hecho un muestreo aleatorio (número de muestras= 10000, tamaño de las muestras= 100) y hallan que la Media de las Medias muestrales es igual a 5.09, (la media poblacional y la media de las medias muestrales coinciden). En cambio, la Mediana de la población es igual a 5 y la Media de las Medianas es igual a 5.1 esto es, hay diferencia ya que la Mediana es un estimador sesgado.
La Varianza es un estimador sesgado. Ejemplo: La Media de las Varianzas obtenidas con la Varianza
en un muestreo de 1000 muestras (n=25) en que la Varianza de la población es igual a 9.56 ha resultado igual a 9.12, esto es, no coinciden. En cambio, al utilizar la Cuasivarianza
la Media de las Varianzas muestrales es igual a 9.5, esto es, coincide con la Varianza de la población ya que la Cuasivarianza es un estimador insesgado.
 
2) Consistencia. Un estimador es consistente si aproxima el valor del parámetro cuanto mayor es n (tamaño de la muestra).
Algunos estimadores consistentes son:
Ejemplo
En una población de 500 puntuaciones cuya Media (m) es igual a 4.9 han hecho tres muestreos aleatorios (número de muestras= 100) con los siguientes resultados:
vemos que el muestreo en que n=100 la Media de las Medias muestrales toma el mismo valor que la Media de la población.
 
3) Eficiencia. Diremos que un estimador es más eficiente que otro si la Varianza de la distribución muestral del estimador es menor a la del otro estimador. Cuanto menor es la eficiencia, menor es la confianza de que el estadístico obtenido en la muestra aproxime al parámetro poblacional.
Ejemplo
La Varianza de la distribución muestral de la Media en un muestreo aleatorio (número de muestras: 1000, n=25) ha resultado igual a 0.4. La Varianza de la distribución de Medianas ha resultado, en el mismo muestreo, igual a 1.12, (este resultado muestra que la Media es un estimador más eficiente que la Mediana).
Estimaciones de intervalo e intervalo de confianza: La estimación por intervalos consiste en establecer el intervalo de valores donde es más probable se encuentre el parámetro. La obtención del intervalo se basa en las siguientes consideraciones:
a) Si conocemos la distribución muestral del estimador podemos obtener las probabilidades de ocurrencia de los estadísticos muestrales.
b) Si conociéramos el valor del parámetro poblacional, podríamos establecer la probabilidad de que el estimador se halle dentro de los intervalos de la distribución muestral.
c) El problema es que el parámetro poblacional es desconocido, y por ello el intervalo se establece alrededor del estimador. Si repetimos el muestreo un gran número de veces y definimos un intervalo alrededor de cada valor del estadístico muestral, el parámetro se sitúa dentro de cada intervalo en un porcentaje conocido de ocasiones. Este intervalo es denominado "intervalo de confianza".
 
Ejemplo
Se generan 100000 muestras aleatorias (n=25) de una población que sigue la distribución Normal, y resulta:
La distribución de las Medias muestrales aproxima al modelo Normal:
En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias muestrales es
(Nota: Los valores +-1.96 que multiplican la Desviación Típica de la distribución muestral son los valores cuya función de distribución es igual a 0.975 y 0.025 respectivamente y se pueden obtener en las tablas de la distribución Normal estandarizada o de funciones en aplicaciones informáticas como Excel). Seguidamente generamos una muestra de la población y obtenemos su Media, que es igual a 4.5. Si establecemos el intervalo alrededor de la Media muestral, el parámetro poblacional (5.1) está incluido dentro de sus límites:
Ahora bien, la distancia de un punto A a un punto B es la misma que de B a A. Por esa razón, la distancia desde m a la Media muestral es la misma que va de la Media muestral a m. En consecuencia, si hacemos un muestreo con un número grande de muestras observamos que el 95% de las veces (aproximadamente) el valor de la Media de la población (m) se encuentra dentro del intervalo definido alrededor de cada uno de los valores de la Media muestral. El porcentaje de veces que el valor de m se halla dentro de alguno de los intervalos de confianza es del 95%, y es denominado nivel de confianza.
Si queremos establecer un intervalo de confianza en que el % de veces que m se halle dentro del intervalo sea igual al 99%, la expresión anterior es:
(Obtenemos el valor +-2.58 que multiplica la Desviación Típica de la distribución muestral en las tablas de la distribución Normal estandarizada o de funciones en aplicaciones informáticas como Excel), y son los valores cuya función de probabilidad es igual a 0.995 y 0.005 respectivamente).
Cálculo de estimación de intervalos de la media a partir de grandes muestras:
Intervalo para , conocida como distribución poblacional desconocida (σ); nivel de confianza dado 1 − α 
Cálculo de estimaciones de intervalo de la proporción a partir de grandes muestras: Un estimador puntual de la proporción P en un experimento binomial está dado por la estadística P=X/N, donde x representa el número de éxitos en n pruebas. Por tanto, la proporción de la muestra p =x/n se utilizará como estimadorpuntual del parámetro P.
Si no se espera que la proporción P desconocida esté demasiado cerca de 0 ó de 1, se puede establecer un intervalo de confianza para P al considerar la distribución muestral de proporciones.
Al despejar P de esta ecuación nos queda:
En este despeje podemos observar que se necesita el valor del parámetro P y es precisamente lo que queremos estimar, por lo que lo sustituiremos por la proporción de la muestra p siempre y cuando el tamaño de muestra no sea pequeño.
Cuando n es pequeña y la proporción desconocida P se considera cercana a 0 ó a 1, el procedimiento del intervalo de confianza que se establece aquí no es confiable, por tanto, no se debe utilizar. Para estar seguro, se debe requerir que np ó nq sea mayor o igual a 5.
El error de estimación será la diferencia absoluta entre p y P, y podemos tener el nivel de confianza de que esta diferencia no excederá .
Ejemplos:
Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas amplias para evaluar la función eléctrica de su producto. Todos los reproductores de discos compactos deben pasar todas las pruebas antes de venderse. Una muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o más pruebas. Encuentre un intervalo de confianza de 90% para la proporción de los reproductores de discos compactos de la población que no pasan todas las pruebas.
Solución:
n=500
p = 15/500 = 0.03
z(0.90) = 1.645
0.0237<P<0.0376
Se sabe con un nivel de confianza del 90% que la proporción de discos defectuosos que no pasan la prueba en esa población esta entre 0.0237 y 0.0376.
Estimaciones de intervalos mediante la distribución t: Supóngase que se toma una muestra de una población normal con media  y varianza . Si es el promedio de las n observaciones que contiene la muestra aleatoria, entonces la distribución  es una distribución normal estándar. Supóngase que la varianza de la población 2 es desconocida. ¿Qué sucede con la distribución de esta estadística si se reemplaza  por s? La distribución t proporciona la respuesta a esta pregunta.
La media y la varianza de la distribución t son  = 0 y  para >2, respectivamente.
La siguiente figura presenta la gráfica de varias distribuciones t. La apariencia general de la distribución t es similar a la de la distribución normal estándar: ambas son simétricas y unimodales, y el valor máximo de la ordenada se alcanza en la media  = 0. Sin embargo, la distribución t tiene colas más amplias que la normal; esto es, la probabilidad de las colas es mayor que en la distribución normal. A medida que el número de grados de libertad tiende a infinito, la forma límite de la distribución t es la distribución normal estándar.
 
Propiedades de las distribuciones t
Cada curva t tiene forma de campana con centro en 0.
Cada curva t, está más dispersa que la curva normal estándar z.
A medida que  aumenta, la dispersión de la curva t correspondiente disminuye.
A medida que  , la secuencia de curvas t se aproxima a la curva normal estándar, por lo que la curva z recibe a veces el nombre de curva t con gl = 
La distribución de la variable aleatoria t está dada por:
Esta se conoce como la distribución t con  grados de libertad.
Sean X1, X2, . . . , Xn variables aleatorias independientes que son todas normales con media  y desviación estándar . Entonces la variable aleatoria  tiene una distribución t con  = n-1 grados de libertad.
La distribución de probabilidad de t se publicó por primera vez en 1908 en un artículo de W. S. Gosset. En esa época, Gosset era empleado de una cervecería irlandesa que desaprobaba la publicación de investigaciones de sus empleados. Para evadir esta prohibición, publicó su trabajo en secreto bajo el nombre de "Student". En consecuencia, la distribución t normalmente se llama distribución t de Student, o simplemente distribución t. Para derivar la ecuación de esta distribución, Gosset supone que las muestras se seleccionan de una población normal. Aunque esto parecería una suposición muy restrictiva, se puede mostrar que las poblaciones no normales que poseen distribuciones en forma casi de campana aún proporcionan valores de t que se aproximan muy de cerca a la distribución t.
La distribución t difiere de la de Z en que la varianza de t depende del tamaño de la muestra y siempre es mayor a uno. Unicamente cuando el tamaño de la muestra tiende a infinito las dos distribuciones serán las mismas.
Se acostumbra representar con el valor t por arriba del cual se encuentra un área igual a . Como la distribución t es simétrica alrededor de una media de cero, tenemos; es decir, el valor t que deja un área de  a la derecha y por tanto un área de  a la izquierda, es igual al valor t negativo que deja un área de  en la cola derecha de la distribución. Esto es, t0.95 = -t0.05, t0.99=-t0.01, etc.
Para encontrar los valores de t se utilizará la tabla de valores críticos de la distribución t del libro Probabilidad y Estadística para Ingenieros de los autores Walpole, Myers y Myers.
Ejemplo:
El valor t con  = 14 grados de libertad que deja un área de 0.025 a la izquierda, y por tanto un área de 0.975 a la derecha, es
t0.975=-t0.025 = -2.145
Si se observa la tabla, el área sombreada de la curva es de la cola derecha, es por esto que se tiene que hacer la resta de . La manera de encontrar el valor de t es buscar el valor de  en el primer renglón de la tabla y luego buscar los grados de libertad en la primera columna y donde se intercepten  y  se obtendrá el valor de t.
Determinación del tamaño de muestra en estimación: Para determinar el tamaño muestral de un estudio, debemos considerar diferentes situaciones
A.  Estudios para determinar parámetros. Es decir pretendemos hacer inferencias a valores poblacionales (proporciones, medias) a partir de una muestra (Tabla 1).
B.  Estudios para contraste de hipótesis. Es decir pretendemos comparar si las medias o las proporciones de las muestras son diferentes.
	Tabla 1.  Elementos de la Inferencia Estadística
	
		
	 A. Estudios para determinar parámetros
	
	
Con estos estudios pretendemos hacer inferencias a valores poblacionales (proporciones, medias) a partir de una muestra.
A.1. Estimar una proporción:
Si deseamos estimar una proporción, debemos saber:
a. El nivel de confianza o seguridad (1-a ). El nivel de confianza prefijado da lugar a un coeficiente (Za ). Para una seguridad del 95% = 1.96, para una seguridad del 99% = 2.58.
b. La precisión que deseamos para nuestro estudio.
c. Una idea del valor aproximado del parámetro que queremos medir (en este caso una proporción). Esta idea se puede obtener revisando la literatura, por estudio pilotos previos. En caso de no tener dicha información utilizaremos el valor p = 0.5 (50%).
Ejemplo: ¿A cuantas personas tendríamos que estudiar para conocer la prevalencia de diabetes?
Seguridad = 95%; Precisión = 3%: Proporción esperada = asumamos que puede ser próxima al 5%; si no tuviésemos ninguna idea de dicha proporción utilizaríamos el valor p = 0,5 (50%) que maximiza el tamaño muestral:
donde:
· Za 2 = 1.962 (ya que la seguridad es del 95%)
· p = proporción esperada (en este caso 5% = 0.05)
· q = 1 – p (en este caso 1 – 0.05 = 0.95)
· d = precisión (en este caso deseamos un 3%)
Si la población es finita, es decir conocemos el total de la población y deseásemos saber cuántos del total tendremos que estudiar la respuesta seria:
donde:
· N = Total de la población
· Za2 = 1.962 (si la seguridad es del 95%)
· p = proporción esperada (en este caso 5% = 0.05)
· q = 1 – p (en este caso 1-0.05 = 0.95)
· d = precisión (en este caso deseamos un 3%).
¿A cuántas personas tendría que estudiar de una población de 15.000 habitantes para conocer la prevalencia de diabetes?
Seguridad = 95%; Precisión = 3%; proporción esperada = asumamos que puede ser próxima al 5% ; si no tuviese ninguna idea de dicha proporción utilizaríamos el valor p = 0.5 (50%) que maximiza el tamaño muestral.
Según diferentes seguridades el coeficiente de Za varía, así:
· Si la seguridad Za fuese del90% el coeficiente sería 1.645
· Si la seguridad Za fuese del 95% el coeficiente sería 1.96
· Si la seguridad Za fuese del 97.5% el coeficiente sería 2.24
· Si la seguridad Za fuese del 99% el coeficiente sería 2.576
A.2. Estimar una media:
Si deseamos estimar una media: debemos saber:
· El nivel de confianza o seguridad (1-a ). El nivel de confianza prefijado da lugar a un coeficiente (Za ). Para una seguridad del 95% = 1.96; para una seguridad del 99% = 2.58.
· La precisión con que se desea estimar el parámetro (2 * d es la amplitud del intervalo de confianza).
· Una idea de la varianza S2 de la distribución de la variable cuantitativa que se supone existe en la población.
Ejemplo: Si deseamos conocer la media de la glucemia basal de una población, con una seguridad del 95 % y una precisión de ± 3 mg/dl y tenemos información por un estudio piloto o revisión bibliográfica que la varianza es de 250 mg/dl
Si la población es finita, como previamente se señaló, es decir conocemos el total de la población y desearíamos saber cuantos del total tendríamos que estudiar, la respuesta sería:
		B. Estudios para contraste de hipótesis:
Estos estudios pretenden comparar si las medias o las proporciones de las muestras son diferentes.  Habitualmente el investigador pretende comparar dos tratamientos.  Para el cálculo del tamaño muestral se precisa conocer:
a. Magnitud de la diferencia a detectar que tenga interés clínicamente relevante. Se pueden comparar dos proporciones o dos medias.
b. Tener una idea aproximada de los parámetros de la variable que se estudia (bibliografía, estudios previos).
c. Seguridad del estudio (riesgo de cometer un error a)
d. Poder estadístico (1 - b) (riesgo de cometer un error b)
e. Definir si la hipótesis va a ser unilateral o bilateral.
· Bilateral: Cualquiera de los dos parámetros a comparar (medias o proporciones) puede ser mayor o menor que el otro. No se establece dirección.
· Unilateral: Cuando se considera que uno de los parámetros debe ser mayor que el otro, indicando por tanto una dirección de las diferencias.
La hipótesis bilateral es una hipótesis más conservadora y disminuye el riesgo de cometer un error de tipo I (rechazar la H0 cuando en realidad es verdadera).
B1. Comparación de dos proporciones:
Donde:
· n = sujetos necesarios en cada una de las muestras
· Za = Valor Z correspondiente al riesgo deseado
· Zb = Valor Z correspondiente al riesgo deseado
· p1 = Valor de la proporción en el grupo de referencia, placebo, control o tratamiento habitual.
· p2 = Valor de la proporción en el grupo del nuevo tratamiento, intervención o técnica.
· p = Media de las dos proporciones p1 y p2 
Los valores Za según la seguridad y Zb según el poder se indican en la Tabla 2 (8).
B2. Comparación de dos medias:
Donde:
· n = sujetos necesarios en cada una de las muestras
· Za = Valor Z correspondiente al riesgo deseado
· Zb = Valor Z correspondiente al riesgo deseado
· S2 = Varianza de la variable cuantitativa que tiene el grupo control o de referencia.
· d = Valor mínimo de la diferencia que se desea detectar (datos cuantitativos)
Los valores Za según la seguridad y Zb según el poder se indican en la Tabla 2 (8).
	Tabla 2.  Valores de Za y Zb más frecuentemente utilizados
	Za
	a
	Test unilateral
	Test bilateral
	0.200
0.150
0.100
0.050
0.025
0.010
	0.842
1.036
1.282
1.645
1.960
2.326
	1.282
1.440
1.645
1.960
2.240
2.576
	Potencia
	b
	(1-b)
	Zb
	0.01
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
0.45
0.50
	0.99
0.95
0.90
0.85
0.80
0.75
0.70
0.65
0.60
0.55
0.50
	2.326
1.645
1.282
1.036
0.842
0.674
0.524
0.385
0.253
0.126
0.000
Ejemplo de comparación de dos medias:
Deseamos utilizar un nuevo fármaco antidiabético y consideramos que seria clínicamente eficaz si lograse un descenso de 15 mg/dl respecto al tto. Habitual con el antidiabético estándar. Por estudios previos sabemos que la desviación típica de la glucemia en pacientes que reciben el tratamiento habitual es de 16 mg/dl. Aceptamos un riesgo de 0.05 y deseamos un poder estadístico de 90% para detectar diferencias si es que existen.
                        
precisamos 20 pacientes en cada grupo.
Ejemplo de comparación de dos proporciones:
Deseamos evaluar si el Tratamiento T2 es mejor que el tratamiento T1 para el alivio del dolor para lo que diseñamos un ensayo clínico. Sabemos por datos previos que la eficacia del fármaco habitual está alrededor del 70% y consideramos clínicamente relevante si el nuevo fármaco alivia el dolor en un 90%. Nuestro nivel de riesgo lo fijamos en 0.05 y deseamos un poder estadístico de un 80%.
n = 48 pacientes. En cada grupo precisamos 48 pacientes.
		
	 El tamaño muestral ajustado a las pérdidas:
En todos los estudios es preciso estimar las posibles perdidas de pacientes por razones diversas (pérdida de información, abandono, no respuesta….) por lo que se debe incrementar el tamaño muestral respecto a dichas pérdidas.
El tamaño muestral ajustado a las pérdidas se puede calcular:
Muestra ajustada a las pérdidas = n (1 / 1–R)
· n = número de sujetos sin pérdidas
· R = proporción esperada de pérdidas
Así por ejemplo si en el estudio anterior esperamos tener un 15% de pérdidas el tamaño muestral necesario seria:  48 (1 / 1-0.15) = 56 pacientes en cada grupo.
PRUEBA DE HIPOTESIS
¿Que es?: Una prueba de hipótesis es una regla que especifica si se puede aceptar o rechazar una afirmación acerca de una población dependiendo de la evidencia proporcionada por una muestra de datos.
Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la hipótesis nula y la hipótesis alternativa. La hipótesis nula es el enunciado que se probará. Por lo general, la hipótesis nula es un enunciado de que "no hay efecto" o "no hay diferencia". La hipótesis alternativa es el enunciado que se desea poder concluir que es verdadero de acuerdo con la evidencia proporcionada por los datos de la muestra.
Con base en los datos de muestra, la prueba determina si se puede rechazar la hipótesis nula. Usted utiliza el valor p para tomar esa decisión. Si el valor p es menor que el nivel de significancia (denotado como α o alfa), entonces puede rechazar la hipótesis nula.
Ejemplo: Usted puede seguir seis pasos básicos para configurar y realizar correctamente una prueba de hipótesis. Por ejemplo, el gerente de una fábrica de tuberías desea determinar si el diámetro promedio de los tubos es diferente de 5 cm. El gerente sigue los pasos básicos para realizar una prueba de hipótesis.
NOTA
Debe determinar los criterios para la prueba y el tamaño de muestra necesario antes de recolectar los datos.
Especificar las hipótesis.
En primer lugar, el gerente formula las hipótesis. La hipótesis nula es: la media de la población de todos los tubos es igual a 5 cm. Formalmente, esto se escribe como: H0: μ = 5
Luego, el gerente elige entre las siguientes hipótesis alternativas:
	Condición que se probará
	Hipótesis alternativa
	La media de la población es menor que el objetivo.
	unilateral: μ < 5
	La media de la población es mayor que el objetivo.
	unilateral: μ > 5
	La media de la población es diferente del objetivo.
	bilateral: μ ≠ 5
Como tiene que asegurarse de que los tubos no sean más grandes ni más pequeños de 5 cm, el gerente elige la hipótesis alternativa bilateral, que indica que la media de la población de todos los tubos no es igual a 5 cm. Formalmente, esto se escribe como H1: μ ≠ 5
Elegir un nivel de significancia (también denominado alfa o α).
El gerente selecciona un nivel de significancia de 0.05, que es el nivel de significancia más utilizado.
Determinar la potencia y el tamaño de la muestra para la prueba.
El gerente utiliza un cálculo de potencia y tamaño de la muestra para determinar cuántos tubos tiene que medir para tener una buena probabilidad de detectar una diferencia de 0.1 cm o más con respecto al diámetro objetivo.
Recolectar los datos.
Recoge una muestra de tubos y mide los diámetros.
Comparar el valor p de la prueba con el nivel de significancia.
Después de realizar la prueba de hipótesis,el gerente obtiene un valor p de 0.004. El valor p es menor que el nivel de significancia de 0.05.
Decidir si rechazar o no rechazar la hipótesis nula.
El gerente rechaza la hipótesis nula y concluye que el diámetro medio de todos los tubos no es igual a 5 cm.
Prueba de hipótesis de medias cuando se conoce de desviación estándar de la población: Si se conoce la desviación de la población ( σ ), la distribución de muestreo adecuada es la distribución normal. Si la población de muestreo es la normal, la distribución será normal en el caso de todos los tamaños de la muestra, y el valor estadístico de prueba a usar es:
Prueba de hipótesis de Proporción: Muestras grandes
La finalidad de una prueba de k muestras es evaluar la aseveración que establece que todas las k muestras independientes provienen de poblaciones que presentan la misma proporción de algún elemento. De acuerdo con esto, las hipótesis nula y alternativa son
En una muestra se puede dar un conjunto de sucesos, los cuales ocurren con frecuencias observadas "o"(las que se observa directamente) y frecuencias esperadas o teóricas "e" (las que se calculan de acuerdo a las leyes de probabilidad).
Por lo tanto el valor estadístico de prueba para este caso es la prueba ji cuadrado o conocida también como chi cuadrado
Como sucede con las distribuciones t y F, la distribución ji cuadrado tiene una forma que depende del número de grados de libertad asociados a un determinado problema.
Para obtener un valor crítico (valor que deja un determinado porcentaje de área en la cola) a partir de una tabla de ji cuadrado, se debe seleccionar un nivel de significación y determinar los grados de libertad para el problema que se esté resolviendo.
Ejemplos ilustrativos:
Determine el número de grados de libertad y obtenga el valores crítico en el niveles 0,05 se significación.
Solución:
Los grados de libertad se calculan aplicando la fórmula:
Los cálculos en Excel se muestran en la siguiente figura:
2) La siguiente tabla muestra las frecuencias observadas y las frecuencias esperadas al lanzar un dado 60 veces. Contrastar la hipótesis de que el dado es bueno, con un nivel de significación de 0,01.
	Cara del dado
	1
	2
	3
	4
	5
	6
	Frecuencia observada
	6
	8
	9
	15
	14
	8
	Frecuencia esperada
	10
	10
	10
	10
	10
	10
Solución:
Prueba de hipótesis de medias cuando no se conoce la desviación estándar de la población:
Si no se conoce la desviación estándar de la población ( σ ), el valor estadística de prueba es:
BIBLIOGRAFIA
Estimación:
http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap03.html
https://sites.google.com/site/estadisitica5demayo/unidad-ii-inferencia-estadistica/3-5-distribucion-t-de-student
https://www.uv.es/webgid/Inferencial/tema_8_estimacin.html
https://www.fisterra.com/mbe/investiga/9muestras/9muestras2.asp
file:///C:/Users/Daniel/Downloads/Documents/EstimacionEstadistica.pdf
https://www.fisterra.com/mbe/investiga/9muestras/9muestras2.asp
Prueba de hipotesis:
https://support.minitab.com/es-mx/minitab/18/help-and-how-to/statistics/basic-statistics/supporting-topics/basics/what-is-a-hypothesis-test/
https://www.monografias.com/trabajos91/prueba-hipotesis-medias-excel-y-winstats/prueba-hipotesis-medias-excel-y-winstats.shtml
https://www.monografias.com/trabajos91/prueba-hipotesis-proporciones-z-y-ji-cuadrado-empleando-excel-y-winstats/prueba-hipotesis-proporciones-z-y-ji-cuadrado-empleando-excel-y-winstats.shtml#pruebadepc
https://www.mty.itesm.mx/egap/materias/nb-4004/pruebas_de_hipostesis_proporciones_y_chi_cuadarada.doc

Continuar navegando