Cuadernillo 9B (Pruebas de Hipotesis) - Maria Cristina Rodriguez Escalante

•

Outros

0

Desafío Peru Veintitrés

18/5/2023

¡Este material tiene más páginas!

Entonces, ¿te gustó este material?

Ayude a animar a otros estudiantes a mejorar el contenido

¿Te gustó este material? ¡Compartir! 🧡

Otros

148.545 Materiales compartidos

Descarga la aplicación para disfrutar aún más

Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!

Vista previa del material en texto

Estadística I 
 
Cuadernillo N° 9B 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
PRUEBAS 
DE
HIPÓTESIS
 
-2- www.grupolamatriz.com 
 
PRUEBAS DE HIPÓTESIS 
 
A los supuestos que se hacen sobre los valores de los parámetros de una población se 
les denomina hipótesis. En una investigación estadística se tiene como propósito verificar 
la racionalidad de éstos supuestos o hipótesis. Al proceso de verificar la racionalidad de 
estos supuestos se le denomina prueba de hipótesis. 
Una prueba de hipótesis es un procedimiento basado en la evidencia muestral y en la 
teoría de la probabilidad, empleado para determinar si la hipótesis es un enunciado 
razonable. La estadística inferencial es la encargada de usar información de una muestra 
aleatoria para llevar a cabo las pruebas de hipótesis. 
 
Tipos de Hipótesis: 
Teniendo en cuenta que un proceso de decisión debe conducir a resultados sin 
ambigüedades, es necesario que el rango de valores de un parámetro sea particionado en 
dos hipótesis mutuamente excluyentes y complementarias. 
 
HIPÓTESIS PLANTEADA O NULA (Hp) 
Es el supuesto que se hace acerca del valor de un parámetro, cuya validez será verificada 
de acuerdo a la evidencia muestral captada. 
 
HIPÓTESIS ALTERNANTE (Ha) 
Es la hipótesis que se debe aceptar en caso de ser rechazada la hipótesis planteada. 
 
La prueba de hipótesis es un procedimiento de decisión para establecer la aceptación o 
rechazo de una hipótesis planteada. 
Los procedimientos de pruebas de hipótesis se han desarrollado para tomar decisiones 
sobre las hipótesis planteadas. La decisión que se tome sobre la hipótesis alternante será 
una consecuencia de la decisión tomada sobre la hipótesis planteada. 
Los resultados que se derivan de la decisión tomada están sujetos a ciertos niveles de 
confiabilidad y riesgo, lo cual supone que es también posible tomar decisiones erradas. 
Pruebas de Hipótesis 
 
 www.grupolamatriz.com -3- 
TIPOS DE ERROR 
Cuando se establece una Hp, se debe tomar una decisión sobre la racionalidad de la 
misma, ésta puede ser aceptarla o rechazarla. Sin embargo, al conocer a la población real 
o el verdadero valor del parámetro, la Hp será Verdadera (V) o Falsa (F), esto nos llevará 
a una de las siguientes situaciones: 
 
 Si aceptamos Si rechazamos 
Hp (V) 
Hp (F) 
Decisión correcta 
ERROR TIPO II 
ERROR TIPO I 
Decisión correcta. 
 
ERROR TIPO I 
Ocurre al rechazar una hipótesis planteada cuando ésta es realmente Verdadera. 
La Máxima probabilidad deseada de cometer error tipo I es representada por , esto es: 
 = Máx. P [cometer ERROR TIPO I]. 
 
ERROR TIPO II 
Ocurre al aceptar una hipótesis planteada cuando ésta es realmente Falsa. 
La probabilidad de cometer error tipo II es representada por :  = P [ERROR TIPO II] 
 
Consideraciones para  y  
  es establecido por el investigador (se define en la Población Hipotética) 
  se determina en base a la distribución real (Población Real) 
  y  están inversamente relacionados. 
 
Potencia de Prueba 
Es la probabilidad de rechazar una hipótesis planteada o nula cuando ésta es realmente 
Falsa. Es decir, es la probabilidad de tomar una decisión correcta cuando Hp es Falsa. 
 
 Potencia de Prueba = 1 -  
 
Región crítica o Región de rechazo 
Área o región donde se rechaza la Hp. Es el conjunto de valores del estadístico de prueba 
para los cuales se rechaza Hp. 
 
Valor Crítico o Valor Tabular 
Es el valor o valores que define(n) donde comienza(n) la(s) región(es) crítica(s). 
Pruebas de Hipótesis 
 
-4- www.grupolamatriz.com 
Nivel de significancia 
Es la máxima probabilidad que se establece con el fin de hacer mínimo el error tipo I. 
Es la probabilidad más alta de rechazar Hp cuando es verdadera. 
Es establecido por el investigador. 
 
NOTA: 
Para el proceso de prueba de hipótesis debemos considerar la siguiente simbología. 
  = Nivel de significación de la prueba. 
  = Parámetro sobre el cual se desea probar un supuesto      1 2 1 2{ , , - , - } 
 0 = valor hipotético del parámetro. 
 E = Estadístico de prueba a usar (Z, T, 2 , etc.) 
 E1 = Valor tabular o punto crítico izquierdo. 
 E2 = Valor tabular o punto crítico derecho. 
 
SUPUESTOS DE LOS PARAMETROS 
1. Para la media y la varianza:  y 2 
 i. las observaciones son elegidas aleatoriamente. 
 ii. las observaciones elegidas provienen de una distribución normal. 
2. Para comparar medias o variancias: 
 i. las observaciones son elegidas aleatoriamente. 
 ii. las observaciones elegidas provienen de distribuciones normales. 
 iii. las muestras provienen de poblaciones independientes. 
3. Para la proporción:  
 i. las observaciones son elegidas aleatoriamente. 
 ii. el tamaño de muestra es grande. 
4. Para comparar proporciones: 
 i. las observaciones son elegidas aleatoriamente. 
 ii. el tamaño de las muestras debe ser grande. 
 iii. las muestras provienen de poblaciones independientes. 
 
 
Pruebas de Hipótesis 
 
 www.grupolamatriz.com -5- 
Antes de empezar con las pruebas de hipótesis, RECUERDE QUE: 
 
MCR MSR 

 =
2
2 X
X n
 
 −
 =
−
2
2 X
X
N n
.
n N 1
 
=
2
2 X
X
S
S
n
 
−
=
−
2
2 X
X
S N n
S .
n N 1
 
 − 
 =2p
(1 )
n
 
 −  −
 =
−
2
p
(1 ) N n
.
n N 1
 
−
 =
2
p
p(1 p)
n
 
− −
 =
−
2
p
p(1 p) N n
.
n N 1
 
 
 Siendo: 
n = Tamaño de la muestra N = Tamaño de la población 
=x Media o Promedio muestral  = Media o Promedio poblacional 
=2xs Varianza muestral  =
2
x Varianza poblacional 
=2
x
s Varianza muestral de los 
promedios muestrales 
 =2
x
Varianza de todos los 
promedios muestrales 
p = éxito de la proporción en la 
muestra 
 = éxito de la proporción en la 
población 
 =
2
p Varianza muestral de las 
proporciones muestrales 
 =2p Varianza de todas las 
proporciones muestrales 
 
Procedimiento general para realizar una prueba de hipótesis: 
Ante un evidente supuesto: (parámetro < = > valor), podríamos establecer un orden para 
llevar a cabo la prueba de hipótesis: 
1° Planteamiento de la hipótesis. 
 
 CASO A: Pruebas bilaterales Hp:  = 0; Ha:   0 
 
 CASO B: Pruebas Unilaterales a la derecha: Hp:   0 (Hp:  = 0); Ha:  > 0 
 
 CASO C: Pruebas unilaterales a la izquierda: Hp:   0 (Hp:  = 0); Ha:  < 0 
 
Pruebas de Hipótesis 
 
-6- www.grupolamatriz.com 
/2 1 - 
Región de 
Aceptación
Región de 
Rechazo
/2
E1 E2
Región de 
Rechazo
1 - 
Región de 
Aceptación

E2
Región de 
Rechazo

1 - 
Región de 
Aceptación
Región de 
Rechazo
E1
2° Elección del nivel de significación  (usar dato según prueba unilateral o 
bilateral). 
3° Determinación de la prueba a usar (E). Establecer los supuestos de la prueba. 
4° Obtención de los puntos críticos o valores tabulares. Establecer los criterios de 
decisión. 
 
 CASO A: Pruebas bilaterales 
 
 
 
 
 
 
 CASO B: Pruebas Unilaterales a la Derecha 
 
 
 
 
 
 
 CASO C: Pruebas Unilaterales a la Izquierda 
 
 
 
 
 
 
5° Cálculo del valor de la prueba. 
 Se obtiene ECAL reemplazando los datos proporcionados en la muestra. 
6° Decisión y conclusiones. 
Se acepta Hp si: 
1 CAL 2
E E E  
Se rechaza Hp si: 
CAL 1 CAL 2
E E ó E E  
Se acepta Hp si: ECAL  E2 
Se rechaza Hp si: ECAL > E2 
Se acepta Hp si: ECAL  E1 
Se rechaza Hp si: ECAL < E1 
Pruebas de Hipótesis 
 
 www.grupolamatriz.com -7- 
PRUEBAS ESTADÍSTICAS Y VALORES TABULARES 
[Utilice: 2/= para pruebas bilaterales y = para pruebas unilaterales.] 
 
1. Hipótesis sobre la media poblacional: μ 
 a) Si: 
2σ es conocida la prueba estadística es: 
 
-
= X
x
X μ
Z
σ
 Valores tabulares: 
1 (Ω) 2 (1 Ω)Z Z ; Z Z −= = 
 
 b) Si: 
2σ No es conocida la prueba estadística es: 
 −
− 
=  (n 1)
X
X
T T
S
 Valores tabulares: 1 (Ω,n 1) 2 (1 Ω,n 1)T T ; T T− − −= = 
 
 
2. Hipótesissobre la proporción poblacional:  
 
 
− 
=
p
p
Z Valores tabulares: )1(2)(1 ZZ ;ZZ − == 
 
 
3. Hipótesis sobre la diferencia de medias: 21 − 
 a) Si: 2 2
1 2
 y   son conocidas la prueba de hipótesis es: 
 
 
( ) ( )
x x1 2
1 2 1 2X X μ μ
Z
σ
−
− − −
= 
 
 Utilice: 
−
 =  + 
1 2 1 2
2 2 2
X X X X
 
 
 Los valores tabulares son: )1(2)(1 ZZ ;ZZ − == 
 
 
 
Pruebas de Hipótesis 
 
-8- www.grupolamatriz.com 
 b) Si: 2 2
1 2
 y   No son conocidas pero homogéneas, la prueba de hipótesis es: 
 
 
( ) ( )
1 2
1 2 1 2
x x
X X μ μ
T
S
−
− − −
= 
 
 Utilice: 
MCR MSR 






+=
− 21
2
p
2
2x1x n
1
n
1
SS 
















−
−
+







−
−
=
− 1N
nN
n
1
1N
nN
n
1
SS
2
22
21
11
1
2
p
2
2x1x
 
 
 Siendo: 
2 2
2 1 1 2 2
p
1 2
(n 1)S (n 1)S
S
n n 2
− + −
=
+ −
 (Variancia ponderada muestral) 
 Los valores tabulares son: ( ) ( )1 2 1 21 2Ω,n n 2 1 Ω,n n 2
T T ; T T
+ − − + −
= = 
 
 c) Si: 2 2
1 2
 y   No son conocidas pero heterogéneas, la prueba de hipótesis es: 
 
 
−
− − −
=
1 2
1 2 1 2
x x
(X X ) (μ μ )
T
S
 
 
 Utilice: 
−
= +
1 2 1 2
2 2 2
X X X X
S S S 
 
 Los valores tabulares son: 1 ( ,λ) 2 (1 ,λ)T T ; T T −= = 
 
 Siendo  el número de grados de libertad: 1 2
1 2
2 2 2
X X
2 2 2 2
X X
1 2
(S S )
(S ) (S )
n 1 n 1
+
 =
+
− −
 
 
 Si  no es un número entero, lo debemos redondear al entero más cercano. 
 
 
 
 
 
Pruebas de Hipótesis 
 
 www.grupolamatriz.com -9- 
4. Hipótesis sobre la diferencia de proporciones: 21 − 
 
 La prueba estadística es: 
 
 
 Los valores tabulares son: )1(2)(1 ZZ ;ZZ − == 
 
 Siendo 0 el valor hipotético, se presentan dos casos: 
 
 i. Si: 0=δ0 se utiliza 
21
2211
nn
pnpn
p
+
+
= 
 Utilice: 
MCR MSR 
-
-
1 2
2
p p
1 2
1 1
p(1 p)[ ]ˆ
n n
 = + ( )
















+







=
1N
nN
n
1
1N
nN
n
1
p1pˆ
2
22
21
11
1
2
2p1p -
-
-
-
-
- 
 
 ii. Si: 0δ  0 
 Utilice: 
MCR MSR 
( ) ( )
2
22
1
112
2p1p n
p1p
+
n
p1p
=σ̂
--
-
 
( ) ( )





−
+





=
1N
nN
n
p1p
1N
nN
n
p1p
ˆ
2
22
2
22
1
11
1
112
2p1p -
-
-
--
-
 
 
 
El valor P 
El valor-p es el nivel de significancia más pequeño que conduce al rechazo de Hp. 
 * Si valor-p <   Se rechaza Hp. 
 * Si valor-p    Se acepta Hp. 
 
−
− −  − 
=
 1 2
1 2 1 2
p p
(p p ) ( )
Z
 
 
-10- www.grupolamatriz.com 
Ejercicios propuestos para la Clase 
 
Ejercicio #1 
En un estudio realizado en las cadenas de tiendas del Hipermercado Nacional, se eligieron 
al azar 37 clientes de la ciudad A y 35 clientes de la ciudad B, siendo uno de los objetivos 
el analizar las compras de víveres mediante tarjetas de crédito. Mediante las muestras 
tomadas el último fin de semana se encontró la siguiente información sobre los montos de 
las compras a crédito y el número de clientes que van a cancelar su compra en 3 cuotas: 
 
Ciudad n 
Monto promedio de 
compra a crédito 
(soles) 
Desviación 
estándar 
N° de clientes que van a 
cancelar en tres cuotas 
A 37 126 53,6 30 
B 35 202 72,9 32 
 Use  = 0,05 para pruebas unilaterales y  = 0,10 para pruebas bilaterales. 
a) La gerencia sospecha que la verdadera media de los montos de compra a crédito en 
víveres de los clientes de la ciudad B es mayor a 200 soles. ¿Qué puede concluir al 
respecto? 
b) La gerencia afirma que la verdadera proporción de clientes en la ciudad A que van a 
cancelar sus compras en tres cuotas es menor a 0,85. ¿Está Ud. de acuerdo con esta 
afirmación? 
c) La gerencia sostiene que la verdadera media de los montos de compra a crédito de 
la ciudad B supera al de la ciudad A en 50 soles. ¿Qué puede Ud. concluir al 
respecto? Asuma que las varianzas poblacionales son homogéneas. 
d) ¿Se puede concluir que la verdadera proporción de clientes que van a pagar sus 
compras en tres cuotas en la ciudad B supera en más de 0,1 al de la ciudad A? 
 
 
Pruebas de Hipótesis 
 
 www.grupolamatriz.com -11- 
5. Prueba para la Media con Datos Pareados o Correlacionados. 
 Cuando se realizan dos mediciones en momentos diferentes para las mismas 
unidades de muestreo, correspondientes a una misma variable, se generan dos 
conjuntos de datos que No son independientes entre sí, debido a que los datos están 
relacionados con el mismo elemento de población. 
 A los pares generados por este mecanismo se les denomina datos pareados y se 
supone que siguen una distribución normal o aproximadamente normal. 
 Sean: (X1,Y1), (X2,Y2), …..,(Xn,Yn), los “n” datos pareados. 
 Se supone que: Xi N(1, 21 ) y que: Yi N(2, 
2
2 ) 
 Además que Xi e Yi No son Independientes, pero si lo son: (Xi,Yi) de (Xj,Yj), para ij. 
 El parámetro en estudio será:  =  −d X Y 
 Procedimiento 
 (1) Planteamiento: 
 Hp: d ≥ 0 Hp: d ≤ 0 Hp: d = 0 
 Ha: d < 0 Ha: d > 0 Ha: d  0 
 (2) Elección del nivel de significancia: “”. 
 (3) Prueba Estadística: 
−
− 
= d (n 1)
d
d
T T
S
 
 Siendo: == = −

n
i
i 1
d
d X Y
n
 con di = Xi - Yi 
 =
2
2 d
d
S
S
n
 
 =
−
=
−

n
22
i
2 i 1
d
d nd
S
n 1
 
 (4) Punto(s) crítico(s) CRITERIOS DE DECISIÓN 
 (5) Valor de la Prueba: TCAL. 
 (6) Decisión y Conclusiones. 
Nota: 
• Se usa T de Student porque no se conoce la varianza poblacional y se supone que 
se tiene una distribución normal para las diferencias. 
• Se utiliza solo una muestra aleatoria.