Logo Studenta

Teste de Hipóteses em Estatística

¡Este material tiene más páginas!

Vista previa del material en texto

Parte 2 – Estadística Prof. María B. Pintarelli 
 171 
9- Test o prueba de hipótesis 
 
9.1 – Introducción 
 
Hasta ahora hemos estudiado el problema de estimar un parámetro desconocido a partir de una muestra 
aleatoria. 
En muchos problemas se requiere tomar una decisión entre aceptar o rechazar una proposición sobre 
algún parámetro. Esta proposición recibe el nombre de hipótesis estadística, y el procedimiento de toma 
de decisión sobre la hipótesis se conoce como prueba o test de hipótesis. 
Como se emplean distribuciones de probabilidad para representar poblaciones, también podemos decir 
que una hipótesis estadística es una proposición sobre la distribución de probabilidad de una variable 
aleatoria, donde la hipótesis involucra a uno más parámetros de esta distribución. 
Por ejemplo, supongamos que cierto tipo de motor de automóvil emite una media de 100 mg de óxidos 
de nitrógeno (NOx) por segundo con 100 caballos de fuerza. Se ha propuesto una modificación al diseño 
del motor para reducir las emisiones de NOx. El nuevo diseño se producirá si se demuestra que la media 
de su tasa de emisiones es menor de 100 mg/s. Se construye y se prueba una muestra de 50 motores 
modificados. La media muestral de emisiones de NOx es de 92 mg/s, y la desviación estándar muestral 
es de 21 mg/s. 
La variable aleatoria de interés en este caso es X: “tasa de emisión de un motor modificado tomado al 
azar”. 
La preocupación de los fabricantes consiste en que los motores modificados no puedan reducir todas la 
emisiones; es decir que la media poblacional pudiera ser 100 o mayor que 100. 
Entonces, la pregunta es: ¿es factible que esta muestra pueda provenir de una v.a. con media 100 o 
mayor? 
Éste es el tipo de preguntas que las pruebas de hipótesis están diseñadas para responder. Veremos cómo 
construir una prueba de hipótesis, pero podemos decir que en general se basa en construir a partir de la 
muestra aleatoria un estadístico, y según el valor que tome este estadístico de prueba se aceptará o se 
rechazará la hipótesis. 
Se ha observado una muestra con media 92=X . 
Hay dos interpretaciones posibles de esta observación: 
1- La media poblacional es realmente mayor o igual que 100, y la media muestral es menor que 100 
debido a la variabilidad propia de la variable aleatoria X 
2- La media poblacional es en realidad menor que 100, y la media muestral refleja este hecho. 
Estas dos explicaciones tienen nombres: la primera se llama hipótesis nula; la segunda es la hipótesis 
alternativa. 
En la mayoría de las situaciones la hipótesis nula dice que el efecto que indica la muestra es atribuible 
solamente a la variación aleatoria del estadístico de prueba. 
La hipótesis alternativa establece que el efecto que indica la muestra es verdadero. 
Para hacer las cosas más precisas, todo se expresa mediante símbolos. La hipótesis nula se denota por 
0H , la hipótesis alternativa se denota con 1H . Como es usual la media poblacional se anota µ . Por lo 
tanto se tiene 
 
 100:0 ≥µH contra 100:1 <µH (hipótesis alternativa unilateral) 
 
Esencialmente, para realizar una prueba de hipótesis se pone la hipótesis nula en juicio. Se asume que 
0H es verdadera, de la misma manera como se empieza en un juicio bajo el supuesto de que un acusado 
es inocente. La muestra aleatoria proporciona la evidencia. 
 
Parte 2 – Estadística Prof. María B. Pintarelli 
 172 
Las hipótesis son siempre proposiciones sobre los parámetros de la población o distribución bajo 
estudio, no proposiciones sobre la muestra. 
Otros tipos de hipótesis que podrían formularse son 
 
 100:0 ≤µH contra 100:1 >µH (hipótesis alternativa unilateral) 
o 
 
 100:0 =µH contra 100:1 ≠µH (hipótesis alternativa bilateral) 
 
 
En el ejemplo tenemos 5021 ,...,, XXX muestra aleatoria de la v.a. X definida anteriormente. 
Como estamos haciendo una hipótesis sobre la media poblacional es razonable tomar como estadístico 
de prueba a X . El valor observado de la media muestral es 92=X . 
Si el valor de X es muy “menor” que 100 entonces se considera que hay evidencia en contra 0H y se la 
rechaza, aceptando la hipótesis alternativa. 
Si el valor de X no es “muy menor” que 100 entonces se considera que no hay evidencia en contra 0H 
y se rechaza la hipótesis alternativa. 
Ya veremos como construir una regla de decisión, supongamos ahora que tenemos la siguiente regla: 
 
 




≥
<
95
95 
0
0
XsiHaceptase
XsiHrechazase
 
 
El intervalo 





∞,95 es la zona de aceptación. 
La región 





∞− 95; es la zona de rechazo o región crítica. 
Mientras que 95 es el punto crítico. 
 
Como estamos tomando una decisión basados en el valor de un estadístico podemos cometer dos tipos 
de errores: rechazar 0H cuando ésta es verdadera, es decir el estadístico toma valores en la zona de 
rechazo cuando 0H es verdadera; o aceptar 0H cuando ésta es falsa, es decir que el estadístico tome 
valores en la zona de aceptación cuando 0H es falsa. 
El primero se conoce como error de tipo I, y el segundo como error de tipo II. 
Debido a que la decisión se basa en variables aleatorias es posible asociar probabilidades a los errores de 
tipo I y II, específicamente anotamos 
 
 )( ItipodeerrorP=α 
 
 )( IItipodeerrorP=β 
A )( ItipodeerrorP=α se lo conoce como nivel de significancia del test. 
Para calcular estas probabilidades debemos conocer la distribución del estadístico de prueba en el caso 
de ser 0H verdadera, es decir debemos conocer la distribución del estadístico de prueba “bajo 0H ”. 
Parte 2 – Estadística Prof. María B. Pintarelli 
 173 
En el ejemplo anterior la muestra es grande, ya sabemos que por T.C.L. el estadístico 
 
)1,0(
100
N
n
s
X
Z ≈
−
= si 0H es verdadera, o sea )1,0(
50
21
100
N
X
Z ≈
−
= 
 
Entonces para calcular α planteamos: 
 
( )==<=





== 100/95/)( 00 µα XPVesHHrechazarPItipodeerrorP
( ) 04648.095352.016835.1
50
21
10095
50
21
10095
50
21
100
=−=−Φ=










−
Φ≈










−
<
−
=
X
P 
 
Esto significa que el 4.64% de las muestras aleatorias conducirán al rechazo de la hipótesis 100:0 ≥µH 
cuando el verdadero µ sea mayor o igual que 100. 
 
En este caso el gráfico de la zona de rechazo es 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Del gráfico anterior vemos que podemos reducir α al aumentar la zona de aceptación. Por ejemplo 
supongamos que ahora la regla de decisión es 
 
 




≥
<
93
93 
0
0
XsiHaceptase
XsiHrechazase
 
 
Entonces ( )==<=





== 100/93/)( 00 µα XPVesHHrechazarPItipodeerrorP 
( ) 00939.099061.01357.2
50
21
10093
50
21
10093
50
21
100
=−=−Φ=










−
Φ≈










−
<
−
=
X
P 
 
 
04648.0=α 






50
21
,100
2
N 
Parte 2 – Estadística Prof. María B. Pintarelli 
 174 
También se puede reducir α aumentando el tamaño de la muestra. Supongamos que 85=n , entonces 
 
( )==<=





== 100/95/)( 00 µα XPVesHHrechazarPItipodeerrorP
( ) 01426.098574.01195.2
85
21
10095
85
21
10095
85
21
100
=−=−Φ=









−
Φ≈










−
<
−
=
X
P 
 
 
También es importante examinar la probabilidad de cometer error de tipo II, esto es 
 
 ) / ()( 00 falsaesHHaceptarPIItipodeerrorP ==β 
Pero en este caso para llegar a un valor numérico necesitamos tener una alternativa específica pues en 
nuestro ejemplo: 
 
( )
( )µβµµµ
µβ
=










−
Φ−=










−
≥
−
=
=≠≥===
50
21
95
1
50
21
95
50
21
100/95) / ()( 00
X
P
XPfalsaesHHaceptarPIItipodeerrorP
 
 
Donde anotamos con µ a la verdadera media poblacional desconocida. 
Podemos entonces calcular β para un valor particular de µ , por ejemplo nos puede interesar como se 
comporta el test cuando la verdadera media es 94=µ , entonces 
 
( ) ( ) 3707.062930.013367.01
50
21
9495
1
50
21
9495
50
21
94
94 =−=Φ−=










−
Φ−=










−
≥
−
=
X
Pβ 
 
Gráficamente: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
100:0 =µHbajo 
94:1 =µHbajo 
3707.0)94( =β 
rechazodezona 
Parte 2 – Estadística Prof. María B. Pintarelli 
 175 
La probabilidad β de cometer error de tipo II crece a medida que el valor verdadero de µ se acerca al 
valor hipotético. Por ejemplo si el verdadero valor de µ fuera 94.7 entonces 
 
( ) ( ) 46017.053983.01101015.01
50
21
7.9495
1
50
21
7.9495
50
21
7.94
7.94 =−=Φ−=










−
Φ−=










−
≥
−
=
X
Pβ 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Además, la probabilidad β de cometer error de tipo II disminuye a medida que el valor verdadero de µ 
se aleja del valor hipotético. Por ejemplo si el verdadero valor de µ fuera 90 entonces 
 
( ) ( ) 04648.095352.016835.11
50
21
9095
1
50
21
9095
50
21
90
90 =−=Φ−=










−
Φ−=










−
≥
−
=
X
Pβ 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
0'10:0 =µHbajo 
7.94:1 =µHbajo 
rechazodezona 
46017.0)7.94( =β 
 
( ) 04648.090 =β 
rechazodezona 
90:1 =µHbajo 
100:0 =µHbajo 
Parte 2 – Estadística Prof. María B. Pintarelli 
 176 
También se puede reducir la probabilidad de cometer error de tipo II con el tamaño de la muestra. Por 
ejemplo si 85=n entonces y 94=µ 
 
( ) ( ) 32997.067003.014390.01
85
21
9495
1
85
21
9495
85
21
94
94 =−=Φ−=










−
Φ−=










−
≥
−
=
X
Pβ 
 
 
Lo que se ha visto en los ejemplos anteriores se puede generalizar. Podemos recalcar los siguientes 
puntos importantes: 
1- El tamaño de la región crítica, y en consecuencia la probabilidad α de cometer error de tipo I, 
siempre pueden reducirse mediante una selección apropiada de los valores críticos. 
2- Los errores tipo I y II están relacionados. Una disminución en la probabilidad en un tipo de error 
siempre da como resultado un aumento en la probabilidad del otro, siempre que el tamaño de la 
muestra no cambie. 
3- En general, un aumento en el tamaño de la muestra reduce tanto a α como a β , siempre que los 
valores críticos se mantengan constantes. 
4- Cuando la hipótesis nula es falsa, β aumenta a medida que el valor verdadero del parámetro tiende 
al valor hipotético propuesto por la hipótesis nula. El valor de β disminuye a medida que aumenta 
la deferencia entre el verdadero valor medio y el propuesto. 
 
En general el investigador controla la probabilidad α del error de tipo I cuando selecciona los valores 
críticos. Por lo tanto el rechazo de la hipótesis nula de manera errónea se puede fijar de antemano. Eso 
hace que rechazar la hipótesis nula sea una conclusión fuerte. 
La probabilidad β de error de tipo II no es constante, sino que depende del valor verdadero del 
parámetro. También depende β del tamaño de la muestra que se haya seleccionado. Como β está en 
función del tamaño de la muestra y del valor verdadero del parámetro, la decisión de aceptar la hipótesis 
nula se la considera una conclusión débil, a menos que se sepa que β es aceptablemente pequeño. Por 
lo tanto cuando se acepta 0H en realidad se es incapaz de rechazar 0H . No se puede rechazar 0H 
pues no hay evidencia en contra 0H . 
Un concepto importante es el siguiente: 
La potencia de un test es la probabilidad de rechazar la hipótesis nula. La simbolizamos ( )µπ . Para los 
valores de µ tal que la alternativa es verdadera se tiene 
 
 ( ) ( )µβµπ −=





= 1/ 00 falsaesHHrechazarP 
 
Las pruebas estadísticas se comparan mediante la comparación de sus propiedades de potencia. 
La potencia es una medida de la sensibilidad del test, donde por sensibilidad se entiende la capacidad de 
una prueba para detectar diferencias. 
En el ejemplo anterior, la sensibilidad de la prueba para detectar la diferencia entre una tasa de emisión 
media de 100 y otra de 94 es ( ) ( ) 6293.03707.0194194 =−=−= βπ . Es decir si el valor verdadero de la 
tasa de emisión media es 94, la prueba rechazará de manera correcta 0H y detectará esta diferencia el 
62.93% de las veces. Si el investigador piensa que este valor es bajo entonces el investigador puede 
aumentar α o el tamaño de la muestra. 
 
Parte 2 – Estadística Prof. María B. Pintarelli 
 177 
 9.2 – Prueba de hipótesis sobre la media, varianza conocida 
 
Veamos ahora cómo construir una regla de decisión sobre la media de una población. 
Supongamos que la variable aleatoria de interés X tiene una media µ y una varianza 2σ conocida. 
Asumimos que X tiene distribución normal, es decir ) ,(~ 2σµNX . 
Nuevamente, como en el ejemplo introductorio, es razonable tomar como estadístico de prueba al 
promedio muestral X . Bajo las suposiciones hechas tenemos que 





n
NX
2
,~
σ
µ . 
Supongamos que tenemos las hipótesis 
 
 00 : µµ =H contra 01 : µµ ≠H 
 
Donde 0µ es una constante específica. Se toma una muestra aleatoria nXXX ,...,, 21 de la población. 
Si 00 : µµ =H es verdadera, entonces 





n
NX
2
0 ,~
σ
µ , por lo tanto el estadístico 
n
X
Z
σ
µ0−= tiene distribución )1,0(N si 00 : µµ =H es verdadera 
Tomamos a Z como estadístico de prueba 
Si 00 : µµ =H es verdadera entonces ααα −=






≤≤− 1
22
zZzP 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Es evidente que una muestra que produce un valor del estadístico de prueba que cae en las colas de la 
distribución de Z será inusual si 00 : µµ =H es verdadera, por lo tanto esto es un indicador que 0H es 
falsa. 
Entonces la regla de decisión es: 
 
 





≤
>
2
0
2
0
α
α
zZsiHaceptar
zZsiHrechazar
 
 
2
αz 
2
αz− 
0 
)1,0(N 
2
α
 
2
α
− 
 Zona de aceptación 
Parte 2 – Estadística Prof. María B. Pintarelli 
 178 
Notar que la probabilidad que la estadística de prueba tome un valor que caiga en la zona de rechazo si 
0H es verdadera es igual a α , es decirla probabilidad de cometer error de tipo I es α pues 
 
α
αα
σ
µ
σ
µ
µµ
σ
µ
αα
α
=+=










−<
−
+










>
−
=
=










=>
−
=





=
22
/)(
2
0
2
0
0
2
0
00
z
n
X
Pz
n
X
P
z
n
X
PVesHHrechazarPItipodeerrorP
 
 
Ejemplo: 
El porcentaje deseado de SiO2 en cierto tipo de cemento aluminoso es 5.5. Para probar si el verdadero 
promedio de porcentaje es 5.5 para una planta de producción en particular, se analizaron 16 muestras 
obtenidas de manera independiente. Supongamos que el porcentaje de SiO2 en una muestra está 
normalmente distribuido con 3.0=σ , y que 25.5=x . 
¿Indica esto de manera concluyente que el verdadero promedio de porcentaje difiere de 5.5?. Utilice 
01.0=α 
 
Solución: 
La v.a. de interés es X: “porcentaje de SiO2 en cierto tipo de cemento aluminoso” 
Asumimos que )3 ,(~ 2µNX 
Podemos plantear las hipótesis 
 
 5.5:0 =µH contra 5.5:1 ≠µH 
 
 Tenemos una muestra de tamaño 16=n que dio un promedio muestral 25.5=x 
 Como 01.0=α entonces 575.2005.0
2
== zzα 
 
Por lo tanto la regla de decisión es 










≤
−
>
−
575.2
16
3
5.5
575.2
16
3
5.5
0
0
X
siHaceptar
X
siHrechazar
 
 
El estadístico 
16
3
5.5−X
 toma el valor 333333.0
16
3
5.525.5
0 =
−
=z 
 
Como 
2
01.00 575.2333333.0 zz =<= se acepta 0H 
También podemos desarrollar tests o pruebas de hipótesis para el caso de que la hipótesis alternativa es 
unilateral. 
Parte 2 – Estadística Prof. María B. Pintarelli 
 179 
Supongamos las hipótesis 
 
 00 : µµ =H contra 01 : µµ >H 
 
En este caso la región crítica debe colocarse en la cola superior de la distribución normal estándar y el 
rechazo de 0H se hará cuando el valor calculado de 0z sea muy grande, esto es la regla de decisión será 
 
 








≤
−
>
−
α
α
σ
µ
σ
µ
z
n
X
siHaceptar
z
n
X
siHrechazar
0
0
0
0
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
De manera similar para las hipótesis 
 
 00 : µµ =H contra 01 : µµ <H 
 
se calcula el valor del estadístico de prueba 0z y se rechaza 0H si el valor de 0z es muy pequeño, es 
decir la regla de decisión será 
 
 








−≥
−
−<
−
α
α
σ
µ
σ
µ
z
n
X
siHaceptar
z
n
X
siHrechazar
0
0
0
0
 
 
 
α 
αz aceptaciondezona 
)1,0(N 
0 
Parte 2 – Estadística Prof. María B. Pintarelli 
 180 
 
 
 
 
 
 
 
 
 
 
 
 
Ejemplo: 
Se sabe que la duración, en horas, de un foco de 75 watts tiene una distribución aproximadamente 
normal, con una desviación estándar de 25=σ horas. Se toma una muestra aleatoria de 20 focos, la cual 
resulta tener una duración promedio de 1040=x horas 
¿Existe evidencia que apoye la afirmación de que la duración promedio del foco es mayor que 1000 
horas?. Utilice 05.0=α . 
 
Solución: 
La v.a. de interés es X: “duración en horas de un foco tomado al azar” 
Asumimos )52 ,(~ 2µNX 
Podemos plantear las hipótesis 
 
 1000:0 =µH contra 1000:1 >µH 
 
Tenemos una muestra de tamaño 20=n que dio un promedio muestral 1040=x 
Como 05.0=α entonces 645.105.0 == zzα 
Por lo tanto la regla de decisión es 








≤
−
>
−
645.1
20
25
1000
645.1
20
25
1000
0
0
X
siHaceptar
X
siHrechazar
 
El estadístico toma el valor 
20
25
1000−
=
X
Z toma el valor 1554.7
20
25
10001040
0 =
−
=z 
Como 05.00 645.11554.7 zz =>= se rechaza 0H 
 
 
P- valor 
 
Hasta ahora se dieron los resultados de una prueba de hipótesis estableciendo si la hipótesis nula fue o 
no rechazada con un valor especificado de α o nivel de significancia. 
A menudo este planteamiento resulta inadecuado, ya que no proporciona ninguna idea sobre si el valor 
calculado del estadístico está apenas en la región de rechazo o bien ubicado dentro de ella. Además, esta 
forma de establecer los resultados impone a otros usuarios el nivel de significancia predeterminado. 
 αz− 0 
α 
)1,0(N 
aceptaciondezona 
Parte 2 – Estadística Prof. María B. Pintarelli 
 181 
Para evitar estas dificultades, se adopta el enfoque del p-valor. El valor p o p-valor es la probabilidad de 
que el estadístico de prueba tome un valor que sea al menos tan extremo como el valor observado del 
estadístico de prueba cuando la hipótesis nula es verdadera. Es así como el p-valor da mucha 
información sobre el peso de la evidencia contra 0H , de modo que el investigador pueda llegar a una 
conclusión para cualquier nivel de significancia especificado. 
La definición formal del p-valor es la siguiente: 
 
Para las pruebas de distribuciones normales presentadas hasta el momento, es sencillo calcular el p-
valor. 
Si 0z es el valor calculado del estadístico de prueba Z, entonces el p-valor es 
a) si las hipótesis son 0100 : contra : µµµµ ≠= HH 
 ( ) ( ) ( ) ( )[ ] ( )[ ] ( )[ ]000000 1212111 zzzzzZPzZPvalorp Φ−=−Φ−=−Φ−Φ−=<−=>=− 
b) si las hipótesis son 0100 : contra : µµµµ >= HH 
 ( ) ( ) ( )000 11 zzZPzZPvalorp Φ−=≤−=>=− 
c) si las hipótesis son 0100 : contra : µµµµ <= HH 
 ( ) ( )00 zzZPvalorp Φ=<=− 
 
Un p-valor muy chico significa mucha evidencia en contra de 0H ; un p-valor alto significa que no hay 
evidencia en contra 0H 
Notar que: 
αα ciasignifican de nivelcon acepta se entonces Si 0Hvalorp −< 
αα ciasignifican de nivelcon rechaza se entonces Si 0Hvalorp −> 
Esto se ilustra en las siguientes figuras: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Ejemplos: 
1- En el ejemplo anteúltimo referido al porcentaje deseado de SiO2 en cierto tipo de cemento aluminoso 
las hipótesis eran: 5.5:0 =µH contra 5.5:1 ≠µH ; y el estadístico de prueba tomó el valor 
2
01.00 575.2333333.0 zz =<= ; por lo tanto se aceptaba 0H . 
 El valor p es el nivel de significancia más pequeño que conduce al rechazo de la hipótesis nula 0H 
 
α 
αz 
valorp − 
0z 
0z αz 
rechazodezona 
rechazodezona 
Parte 2 – Estadística Prof. María B. Pintarelli 
 182 
En esta caso ( ) ( )[ ] ( )[ ] [ ] 7414.062930.01233333.01212 00 =−=Φ−=Φ−=>=− zzZPvalorp 
Como el p-valor es muy alto no hay evidencia en contra 0H . Se necesitaría tomar un valor de α 
mayor a 0.7414 para rechazar 0H . 
 
2- En el último ejemplo, sobre la duración, en horas, de un foco de 75 watts, las hipótesis eran 
 1000:0 =µH contra 1000:1 >µH ; y el estadístico Z tomó el valor 05.00 645.11554.7 zz =>= ; 
 por lo tanto se rechazaba 0H . 
 En este caso 
 ( ) ( ) ( ) 01554.711 00 ≈Φ−=Φ−=>=− zzZPvalorp 
 Como el p-valor es casi cero hay mucha evidencia en contra de 0H . Prácticamente para ningún 
 valor de α se acepta 0H 
 
 
Error de tipo II y selección del tamaño de la muestra 
 
En la prueba de hipótesis el investigador selecciona directamente la probabilidad del error de tipo I. Sin 
embargo, la probabilidad β de cometer error de tipo II depende del tamaño de la muestra y del valor 
verdadero del parámetro desconocido. 
Supongamos las hipótesis 
 0100 : contra : µµµµ ≠= HH 
Entonces si anotamos con µ al valor verdadero del parámetro 
 
( )










≠≤
−
== 0
2
0
00 µµσ
µ
β αz
n
X
PfalsaesHHaceptarP 
Como la hipótesis nulaes falsa, entonces 
n
X
σ
µ0− no tiene distribución )1,0(N 
Por lo tanto hacemos lo siguiente: 
 
nn
X
n
X
n
X
σ
µµ
σ
µ
σ
µµµ
σ
µ 000 −+
−
=
−+−
=
−
 ; y ahora como )1,0(~ N
n
X
σ
µ−
 pues se estandarizó a 
 
X con el verdadero µ , entonces 
=










≠≤
−
≤−=










≠≤
−
= 0
2
0
2
0
2
0 µµ
σ
µ
µµ
σ
µ
β ααα z
n
X
zPz
n
X
P 
( ) ( )
=










−
−≤
−
≤
−
−−=










≠≤
−
+
−
≤−=
n
z
n
X
n
zPz
nn
X
zP
σ
µµ
σ
µ
σ
µµ
µµ
σ
µµ
σ
µ
αααα
0
2
0
2
0
2
0
2
 
Parte 2 – Estadística Prof. María B. Pintarelli 
 183 
( ) ( ) ( ) ( )







 −
−−Φ−






 −
−Φ=










−
−−Φ−










−
−Φ= nznz
n
z
n
z
σ
µµ
σ
µµ
σ
µµ
σ
µµ
αααα
0
2
0
2
0
2
0
2
 
 
En consecuencia 
 
 
 
 
 
 
 
Para un valor específico de µ y un valor de α dado, podemos preguntarnos qué tamaño de muestra se 
necesita para que β sea menor que un valor dado en particular 0β . 
Por ejemplo si 00 >− µµ entonces podemos aproximar 
( )
00
2
≈






 −
−−Φ nz
σ
µµ
α , y planteamos que 
( ) ( ) 00
2
β
σ
µµ
µβ α <




 −
−Φ= nz . Buscamos en la tabla de la )1,0(N para qué z se cumple que 
( ) 0β=Φ z , lo anotamos 0βz− , y entonces podemos escribir 
 
( ) ( )
( )20
2
2
20
2
0
2
0
00
 
µµ
σ
σ
µµ
σ
µµ
βα
βαβα
−






+
>⇒
−
<+⇒−<
−
−
zz
nnzzznz 
 
En el caso de ser 00 <− µµ entonces podemos aproximar 
( )
10
2
≈






 −
−Φ nz
σ
µµ
α , y planteamos que 
( ) ( ) 00
2
1 β
σ
µµ
µβ α <




 −
−−Φ−= nz . Es decir 
( )





 −
−−Φ<− nz
σ
µµ
β α
0
2
01 
Buscamos en la tabla de la )1,0(N para qué z se cumple que ( ) 01 β−=Φ z , lo anotamos 0βz , y 
entonces podemos escribir 
( ) ( )
{ ( )20
2
2
2
0-
0
2
0
2
0
0
00
 
µµ
σ
σ
µµ
σ
µµ
βα
µµ
βαβα
−






+
>⇒
−
−<+⇒>
−
−−
<
zz
nnzzznz 
 
En consecuencia queda la misma fórmula que la anterior 
Por lo tanto 
 
 
 
 
 
 
 Si las hipótesis son 0100 : contra : µµµµ ≠= HH , entonces 
 ( ) ( ) ( ) 




 −
−−Φ−




 −
−Φ= nznz
σ
µµ
σ
µµ
µβ αα
0
2
0
2
 
 Si las hipótesis son 0100 : contra : µµµµ ≠= HH , entonces 
 
( )20
2
2
2 0
µµ
σβα
−




 +
>
zz
n 
Parte 2 – Estadística Prof. María B. Pintarelli 
 184 
En forma análoga se pude probar que si las hipótesis son 
 
 0100 : contra : µµµµ >= HH 
Entonces 
( ) =










≠≤
−
== 0
0
00 µµσ
µ
β αz
n
X
PfalsaesHHaceptarP 
 
( ) ( ) ( )





 −
−Φ=










−
−Φ=










−
−≤
−
=










≠≤
−
+
−
= nz
n
z
n
z
n
X
Pz
nn
X
P
σ
µµ
σ
µµ
σ
µµ
σ
µ
µµ
σ
µµ
σ
µ
αααα
000
0
0 
 
Entonces 
 
 
 
 
 
 
 
Y si tenemos las hipótesis 0100 : contra : µµµµ <= HH 
( )
( ) ( )





 −−−Φ−=










−
−−≥
−
=










≠−≥
−
+
−
=
=










≠−≥
−
==
nz
n
z
n
X
Pz
nn
X
P
z
n
X
PfalsaesHHaceptarP
σ
µµ
σ
µµ
σ
µ
µµ
σ
µµ
σ
µ
µµ
σ
µ
β
ααα
α
00
0
0
0
0
00
1
 
 
 
Entonces 
 
 
 
 
 
 
 
Y además con una deducción análoga al caso de alternativa bilateral: 
 
 
 
 
 
 
 
 
 Si las hipótesis son 0100 : contra : µµµµ >= HH , (o 01 : µµ >H ) entonces 
 
( )
( )20
22
0
µµ
σβα
−
+
>
zz
n 
 Si las hipótesis son : 0100 : contra : µµµµ >= HH entonces 
 
 ( ) ( ) 




 −
−Φ= nz
σ
µµ
µβ α
0 
 Si las hipótesis son : 0100 : contra : µµµµ <= HH entonces 
 
 ( ) ( ) 




 −
−−Φ−= nz
σ
µµ
µβ α
01 
Parte 2 – Estadística Prof. María B. Pintarelli 
 185 
Ejemplos: 
1- En el ejemplo referido al porcentaje deseado de SiO2 en cierto tipo de cemento aluminoso las 
hipótesis eran: 5.5:0 =µH contra 5.5:1 ≠µH ; y el estadístico de prueba tomó el valor 
2
01.00 575.2333333.0 zz =<= ; por lo tanto se aceptaba 0H . Teníamos 16=n y 3=σ 
 Si el verdadero promedio de porcentaje es 6.5=µ y se realiza una prueba de nivel 01.0=α con 
 base en n = 16, ¿cuál es la probabilidad de detectar esta desviación? 
 ¿Qué valor de n se requiere para satisfacer 01.0=α y 01.0)6.5( =β ? 
 
 Solución: 
 La probabilidad de detectar la desviación es la potencia del test cuando 6.5=µ , es decir 
 ( ) ( )6.51/6.5 00 βπ −=





= falsaesHHrechazarP 
 Como estamos con hipótesis alternativa bilateral, calculamos 
 
 
( ) ( ) ( )
( ) ( ) ( ) ( )
( ) ( ) 0107.06.5 9893.099664.0199266.0
708.2441.216
3
5.56.5
575.216
3
5.56.5
575.2
6.56.5
6.5 0
2
0
2
=⇒=−−=
=−Φ−Φ=




 −−−Φ−




 −−Φ=
=






 −
−−Φ−






 −
−Φ=
π
σ
µ
σ
µ
β αα nznz
 
 
 Ahora se quiere hallar n tal que 01.0)6.5( =β , como el test es bilateral podemos usar directamente la 
fórmula con 33.201.00 == zzβ 
 
 
( )
( )
( )
21654 1225.21653
5.56.5
333.2575.2
2
22
2
0
2
2
2
0
≥⇒=
−
+
=
−






+
> n
zz
n
µµ
σβα
 
 
 
2- En el último ejemplo, sobre la duración, en horas, de un foco de 75 watts, las hipótesis eran 
 1000:0 =µH contra 1000:1 >µH ; y el estadístico Z tomó el valor 05.00 645.11554.7 zz =>= ; 
 por lo tanto se rechazaba 0H . 
 En este caso 25=σ y 20=n 
 Si la verdadera duración promedio del foco es 1050 horas, ¿cuál es la probabilidad de error de tipo 
 II para la prueba? 
 ¿Qué tamaño de muestra es necesario para asegurar que el error de tipo II no es mayor que 0.10 si la 
 duración promedio verdadera del foco es 1025 hs. ? 
 Solución: 
 Como las hipótesis son 1000:0 =µH contra 1000:1 >µH entonces 
 ( ) ( ) ( ) ( ) 029927.720
25
10001050
645.10 ≠−Φ=




 −−Φ=




 −
−Φ= nz
σ
µµ
µβ α 
 Para hallar n tal que ( ) 1.01025 ≤β aplicamos la fórmula con 285.11.00 == zzβ 
 
Parte 2 – Estadística Prof. María B. Pintarelli 
 186 
 
( )
( )
( )
( )
9 584.8
10001025
25285.1645.1
2
22
2
0
22
0 ≥⇒=
−
+
=
−
+
> n
zz
n
µµ
σβα 
 
 
Relación entre test de hipótesis e intervalos de confianza 
 
Existe una estrecha relación entre la prueba de hipótesis bilateral sobre un parámetro µ y el intervalo de 
confianza de nivel α−1 para µ . 
Específicamente supongamos que tenemos las hipótesis 
 
 0100 : contra : µµµµ ≠= HH 
La regla de decisión es 
 
 









≤
−
>
−
2
0
0
2
0
0
α
α
σ
µ
σ
µ
z
n
X
siHaceptar
z
n
X
siHrechazar
 
 
Aceptar 0H si 
2
0
ασ
µ
z
n
X
≤
−
 es equivalente a: aceptar 0H si 
2
0
2
αα σ
µ
z
n
X
z ≤
−
≤− ; y esto es a 
su vez equivalente, despejando 0µ , a: 
 
aceptar 0H si 
n
zX
n
zX σµσ αα
2
0
2
−≤≤− ; es decir si 





−−∈
n
zX
n
zX σσµ αα
22
0 ; 
Pero resulta que 





−−
n
zXn
zX σσ αα
22
; es el intervalo de confianza que se construiría para el 
verdadero parámetro µ de nivel α−1 . 
 
Por lo tanto la regla de decisión queda: 
 
 













−−∈






−−∉
n
zX
n
zXsiHaceptar
n
zX
n
zXsiHrechazar
σσµ
σσµ
αα
αα
22
00
22
00
;
;
 
 
Ejemplo: 
En el ejemplo referido al porcentaje deseado de SiO2 en cierto tipo de cemento aluminoso las 
hipótesis eran: 5.5:0 =µH contra 5.5:1 ≠µH ; 
y teníamos 16=n ; 3=σ ; un promedio muestral 25.5=x 
Parte 2 – Estadística Prof. María B. Pintarelli 
 187 
 Como 01.0=α entonces 575.2005.0
2
== zzα 
Construimos un intervalo de confianza de nivel 99.001.011 =−=−α 
 
[ ]18125.7 ;31875.3
16
3
575.225.5 ;
16
3
575.225.5;
22
=





+−=





−−
n
zX
n
zX σσ αα 
 
Entonces la regla de decisión es: 
 
[ ]
[ ]



∈
∉
18125.7 ;31875.35.5
18125.7 ;31875.35.5
0
0
siHaceptar
siHrechazar
 
 
Como [ ]18125.7 ;31875.35.5 ∈ , entonces se acepta 0H . 
 
 
 9.3 – Prueba de hipótesis sobre la media, varianza desconocida para muestras grandes 
 
Hasta ahora se ha desarrollado el procedimiento de test de hipótesis para la hipótesis nula 
 : 00 µµ =H suponiendo que 
2σ es conocida, pero en la mayoría de las situaciones prácticas 2σ es 
desconocida. En general si 30≥n , entonces la varianza muestral 2S está próxima a 2σ en la mayor 
parte de las muestras, de modo que es posible sustituir 2S por 2σ . Es decir el estadístico 
 
 )1,0(0 N
n
S
X
Z ≈
−
=
µ
 aproximadamente, si 30≥n si : 00 µµ =H 
 
Además, si no podemos decir que la muestra aleatoria proviene de una población normal, sea 2σ 
conocida o no, por T.C.L. los estadísticos 
 
 )1,0(0 N
n
S
X
Z ≈
−
=
µ
 aproximadamente, si 30≥n si : 00 µµ =H 
 Y 
 )1,0(0 N
n
X
Z ≈
−
=
σ
µ
 aproximadamente, si 30≥n si : 00 µµ =H 
Las pruebas de hipótesis tendrán entonces un nivel de significancia aproximadamente de α 
 
Ejemplo: 
Un inspector midió el volumen de llenado de una muestra aleatoria de 100 latas de jugo cuya etiqueta 
afirmaba que contenían 12 oz. La muestra tenía una media de volumen de 11.98 oz y desviación 
estándar de 0.19 oz. Sea µ la verdadera media del volumen de llenado para todas las latas de jugo 
recientemente llenadas con esta máquina. El inspector probará 12:0 =µH contra 12:1 ≠µH 
a) Determinar el p-valor 
b) ¿Piensa que es factible que la media del volumen de llenado es de 12 oz? 
 
Parte 2 – Estadística Prof. María B. Pintarelli 
 188 
Solución: 
La v.a. de interés sería X: “volumen de llenado de una lata tomada al azar” 
No se especifica ninguna distribución para X. Anotamos µ=)(XE y 2)( σ=XV , ambas desconocidas. 
Se toma una muestra de 100=n latas y se obtiene 98.11=x y 19.0=s 
Las hipótesis son 12:0 =µH contra 12:1 ≠µH 
El estadístico de prueba es 
 
100
120
S
X
n
S
X
Z
−
=
−
=
µ
 y si 12:0 =µH es verdadera entonces )1,0(NZ ≈ 
El estadístico Z toma el valor 0526.1
100
19.0
1298.11
0 −=
−
=z 
Como la hipótesis alternativa es bilateral entonces 
( ) ( )[ ] [ ] 29372.085314.0120526.1120 =−=Φ−≈>=− zZPvalorp 
Como el p-valor es mayor que 0.05 se considera que no hay evidencia en contra de 12:0 =µH 
Por lo tanto es factible que la media del volumen de llenado sea de 12 oz 
 
 
 
 9.4 – Prueba de hipótesis sobre la media de una distribución normal, varianza desconocida 
 
Cuando se prueban hipótesis sobre la media µ de una población cuando 2σ es desconocida es posible 
utilizar los procedimientos de prueba dados anteriormente siempre y cuando el tamaño de la muestra sea 
grande ( 30≥n ). Estos procedimientos son aproximadamente válidos sin importar si la población de 
interés es normal o no. Pero si la muestra es pequeña y 2σ es desconocida debe suponerse que la 
distribución de la variable de interés es normal. 
Específicamente, supongamos que la v.a. de interés tiene distribución ),( 2σµN donde µ y 2σ son 
desconocidas. 
Supongamos las hipótesis 0100 : contra : µµµµ ≠= HH 
Sea nXXX ,...,; 21 una muestra aleatoria de tamaño n de la v.a. X y sean X y 
2S la media y la varianza 
muestrales respectivamente. 
El procedimiento se basa en el estadístico 
 
 
nS
X
T
/
0µ−= 
El cual, si la hipótesis nula es verdadera, tiene distribución Student con n-1 grados de libertad. 
Entonces, para un nivel α prefijado, la regla de decisión es 
 





≤
>
−
−
1,
2
0
1,
2
0
n
n
tTsiHaceptar
tTsiHrechazar
α
α
 es decir 









≤
−
>
−
−
−
1,
2
0
0
1,
2
0
0
n
n
t
n
S
X
siHaceptar
t
n
S
X
siHrechazar
α
α
µ
µ
 
Parte 2 – Estadística Prof. María B. Pintarelli 
 189 
La lógica sigue siendo la misma, si el estadístico de prueba toma un valor inusual, entonces se 
considera que hay evidencia en contra 0H y se rechaza la hipótesis nula. Como ahora la distribución 
del estadístico es Student, nos fijamos si T toma un valor 0t en las colas de la distribución Student con 
n-1 grados de libertad. 
 
Si la alternativa es 01 : µµ >H entonces la regla de decisión es 




≤
>
−
−
1,0
1,0
n
n
tTsiHaceptar
tTsiHrechazar
α
α
 
Si la alternativa es 01 : µµ <H entonces la regla de decisión es 




−≥
−<
−
−
1,0
1,0
n
n
tTsiHaceptar
tTsiHrechazar
α
α
 
 
Ejemplo: 
Antes de que una sustancia se pueda considerar segura para enterrarse como residuo se deben 
caracterizar sus propiedades químicas. Se toman 6 muestras de lodo de una planta de tratamiento de 
agua residual en una región y se les mide el pH obteniéndose una media muestral de 6.68 y una 
desviación estándar muestral de 0.20. ¿Se puede concluir que la media del pH es menor que 7.0? Utilizar 
05.0=α y suponer que la muestra fue tomada de una población normal. 
 
Solución: 
La v.a. de interés es X: “pH de una muestra de lodo tomada al azar” 
Asumimos que X tiene distribución ),( 2σµN 
Las hipótesis serían 0.7: contra 0.7: 10 <= µµ HH 
El estadístico de prueba es 
6/
0.7
S
X
T
−
= y toma el valor 919.3
6/20.0
0.768.6
0 −=
−
=t 
Buscamos en la tabla de la distribución Student 015.25,05.01, ==− tt nα 
Entonces como 015.2919.3 5,05.01,0 −=−=−<−= − ttt nα se rechaza 0H , por lo tanto hay evidencia que 
0.7<µ 
 
P-valor de un test t 
 
En este caso el cálculo del p- valor se realiza considerando: 
Si 0t es el valor calculado del estadístico de prueba T, entonces el p-valor es 
a) las hipótesis son 0100 : contra : µµµµ ≠= HH 
 ( ) ( ) ( )( )000 121 tTPtTPtTPvalorp ≤−=≤−=>=− 
b) las hipótesis son 0100 : contra : µµµµ >= HH 
 ( ) ( )00 1 tTPtTPvalorp ≤−=>=− 
c) las hipótesis son 0100 : contra : µµµµ <= HH 
 ( )0tTPvalorp ≤=− 
 
Para calcular el p-valor en una prueba t nos encontramos con la dificultad que las tablas de la Student no 
son completas, por lo tanto en algunas ocasiones se deberá acotar el p-valor 
En el ejemplo anterior para calcular el p-valor de la prueba como es un test con alternativa unilateral 
( ) ( )919.30 −≤=≤=− TPtTPvalorp 
Parte 2 – Estadística Prof. María B. Pintarelli 
 190 
Buscamos en la tabla de la distribución Student la fila donde figuran 5=ν grados de libertad y vemos 
que el valor 3.919 no está tabulado. 
Pero 032.4919.3365.3<< , y ( ) 01.0365.35 =>TP y ( ) 005.0032.45 =>TP 
Por lo tanto ( ) 01.0919.3005.0 5 <>< TP , es decir 
( ) 01.0919.3005.0 5 <−<=−< TPvalorp 
Podemos deducir que existe evidencia de que la media del pH es menor que 0.7 
 
 
 
 9.5 – Prueba de hipótesis sobre la diferencia de dos medias, varianzas conocidas 
 
Supongamos que tenemos dos variables aleatorias independientes normalmente distribuidas: 
( )
( )

2
222
2
111
σ,µN~X
σ,µN~X
 y suponemos que las varianzas 21σ y 
2
2σ son conocidas. 
 
Sean además 
( )
111211 n
X,...,X,X una muestra aleatoria de tamaño 1n de 1X 
( )
222221 n
X,...,X,X una muestra aleatoria de tamaño 2n de 2X . 
 
 El interés recae en probar que 021 ∆=− µµ donde 0∆ es un valor fijado, por ejemplo si 00 =∆ 
entonces se querrá probar que 021 =− µµ es decir que las medias son iguales. 
Ya sabemos que bajo las suposiciones anteriores 
 
 













=






=
∑
∑
=
=
2
1
1 2
2
2
22
2
2
1 1
2
1
11
1
1
1
1
n
i
i
n
i
i
n
σ
,µN~X
n
X
n
σ
,µN~X
n
X
 
 
Y además 
 





+−−
2
2
2
1
2
1
2121 ,N~
nn
XX
σσ
µµ . 
Por lo tanto 
 
( ) ( )1,0N~
2
2
2
1
2
1
2121
nn
XX
Z
σσ
µµ
+
−−−
= , es decir, tiene distribución normal estandarizada. 
Si consideramos las hipótesis 
 
 02110210 : contra : ∆≠−∆=− µµµµ HH 
 
Parte 2 – Estadística Prof. María B. Pintarelli 
 191 
Entonces usamos como estadístico de prueba a 
2
2
2
1
2
1
021
nn
XX
Z
σσ
+
∆−−
= 
 Y ( )1,0N~
2
2
2
1
2
1
021
nn
XX
Z
σσ
+
∆−−
= si : 0210 ∆=− µµH es verdadera 
 
Por lo tanto la regla de decisión será 
 





≤
>
2
0
2
0
α
α
zZsiHaceptar
zZsiHrechazar
 donde 
2
2
2
1
2
1
021
nn
XX
Z
σσ
+
∆−−
= 
 
 
Si 0211 : ∆>− µµH entonces la regla de decisión es 




≤
>
α
α
zZsiHaceptar
zZsiHrechazar
0
0
 
 
Si 0211 : ∆<− µµH entonces la regla de decisión es 




−≥
−<
α
α
zZsiHaceptar
zZsiHrechazar
0
0
 
 
Ejemplos: 
1- Un diseñador de productos está interesado en reducir el tiempo de secado de una pintura tapaporos. 
Se prueban dos fórmulas de pintura. La fórmula 1 tiene el contenido químico estándar, y la fórmula 2 
tiene un nuevo ingrediente secante que debe reducir el tiempo de secado. De la experiencia se sabe que 
la desviación estándar del tiempo de secado es 8 minutos, y esta variabilidad no debe verse afectada 
por la adición del nuevo ingrediente. Se pintan 10 especímenes con la fórmula 1 y otros 10 con la 
fórmula 2. los tiempos promedio de secado muestrales fueron 1211 =x minutos y 1122 =x minutos 
respectivamente. 
¿A qué conclusiones debe llegar el diseñador del producto sobre la eficacia del nuevo ingrediente 
utilizando 05.0=α ? 
 
Solución: 
Aquí las hipótesis son 0: contra 0: 211210 >−=− µµµµ HH 
 
El estadístico de prueba es 
10
8
10
8 22
21
+
−
=
XX
Z y toma el valor 52.2
10
8
10
8
112121
220
=
+
−
=z 
 
Buscamos en la tabla de la normal estándar 645.105.0 == zzα 
 
Parte 2 – Estadística Prof. María B. Pintarelli 
 192 
Como 645.152.2 05.00 ==>= zzz α se rechaza 0H al nivel 0.05 y se concluye que el nuevo 
ingrediente disminuye el tiempo de secado. 
 
El cálculo del p-valor y la deducción de β la probabilidad de cometer error de tipo II se obtienen de 
manera análoga a los casos anteriores. Por ejemplo para la alternativa bilateral la expresión para β 
es la siguiente donde anotamos δµµ =∆−∆=∆−− 021 
 
 ( )














+
−−Φ−














+
−Φ==
2
2
2
1
2
12
2
2
2
1
2
12
00 
nn
z
nn
zfalsaesHHaceptarP
σσ
δ
σσ
δ
β αα 
 
 
En el ejemplo anterior el ( ) ( ) ( ) 0059052.2152.20 −=Φ−=>=>=− ZPzZPvalorp 
 
También es posible obtener fórmulas para el tamaño de la muestra necesario para obtener una β 
específica para una diferencia dada en las medias δµµ =∆−∆=∆−− 021 y α . Si asumimos que 
nnn == 21 entonces 
 
 
 
 
 
 
 
 
 
 
 
 
 
9.6 – Prueba de hipótesis sobre la diferencia de dos medias, varianzas desconocidas 
 
Caso 1: 22
2
1 σσ ≠ 
 
Supongamos que tenemos dos variables aleatorias independientes normalmente distribuidas: 
 
( )
( )

2
222
2
111
σ,µN~X
σ,µN~X
 y las varianzas 21σ y 
2
2σ son desconocidas . 
 
y además 
 
( )
111211 n
X,...,X,X es una muestra aleatoria de tamaño 1n de 1X 
( )
222221 n
X,...,X,X es una muestra aleatoria de tamaño 2n de 2X . 
Para 0211 : ∆≠− µµH es 
( )
2
2
2
2
1
2
2 0
δ
σσβα +


 +
>
zz
n 
 
Para 0211 : ∆>− µµH o 0211 : ∆<− µµH es 
( ) ( )
2
2
2
2
1
2
0
δ
σσβα ++>
zz
n 
Parte 2 – Estadística Prof. María B. Pintarelli 
 193 
Si las muestras aleatorias se toma de una distribución normal, donde 1σ y 2σ son desconocidos, 
301 ≥n y 302 ≥n , entonces se puede probar que al reemplazar 1σ por S1 y 2σ por S2, el estadístico 
 
 )1,0(
)(
1
2
1
1
2
1
2121 N
n
S
n
S
XX
≈
+
−−− µµ
. aproximadamente 
Por lo tanto si anotamos 
1
2
1
1
2
1
021
n
S
n
S
XX
Z
+
∆−−
= valen las reglas de decisión vistas en la sección anterior, 
con la diferencia que el nivel de significancia del test será aproximadamente α−1 
 
Si ahora 1n o 2n no son mayores que 30, entonces 
 
1
2
1
1
2
1
021*
n
S
n
S
XX
T
+
∆−−
= 
tiene distribución aproximadamente Student con ν grados de libertad bajo la hipótesis 
0210 : ∆=− µµH donde 
 
( )
( ) ( )
11 2
2
2
2
2
1
2
1
1
1
2
2
2
21
2
1
−
+
−
+
=
n
nS
n
nS
nSnS
ν si ν no es entero, se toma el entero más próximo a ν 
 
Por lo tanto, si las hipótesis son 
 
02110210 : contra : ∆≠−∆=− µµµµ HH entonces la regla de decisión es 
 





≤
>
ν
α
ν
α
,
2
*
0
,
2
*
0
tTsiHaceptar
tTsiHrechazar
 
 
Si 0211 : ∆>− µµH entonces la regla de decisión es 




≤
>
να
να
,
*
0
,
*
0
tTsiHaceptar
tTsiHrechazar
 
 
Si 0211 : ∆<− µµH entonces la regla de decisión es 




−≥
−<
να
να
,
*
0
,
*
0
tTsiHaceptar
tTsiHrechazar
 
 
Ejemplo: 
Un fabricante de monitores prueba dos diseños de microcircuitos para determinar si producen un flujo 
de corriente equivalente. El departamento de ingeniería ha obtenido los datos siguientes: 
Parte 2 – Estadística Prof. María B. Pintarelli 
 194 
 
Diseño 1 151 =n 2.241 =x 10
2
1 =s 
Diseño 2 102 =n 9.232 =x 20
2
2 =s 
 
Con 10.0=α se desea determinar si existe alguna diferencia significativa en el flujo de corriente 
medio entre los dos diseños, donde se supone que las poblaciones son normales. 
 
Solución: 
Las variables aleatorias de interés son 
:1X “flujo de corriente en diseño 1” 
:2X “flujo de corriente en diseño 2” 
Asumimos que ( )2111 ,N~ σµX y ( )2222 ,N~ σµX donde los parámetros son desconocidos 
Las hipótesis serían 0: contra 0: 211210 ≠−=− µµµµ HH 
El estadístico de prueba es 
 
1015
2
1
2
1
21*
SS
XX
T
+
−
= que en este caso toma el valor 18.0
10
20
15
10
9.232.24*
0 =
+
−
=t 
Debemos buscar en la tabla de la distribución Student 
νν
α
,
2
10.0
,
2
tt = entonces calculamos 
( )
( ) ( )
( )
( ) ( )
15 9333.14
110
1020
115
1510
10201510
11
22
2
2
2
2
22
1
2
1
1
1
2
2
2
21
2
1 =⇒=
−
+
−
+
=
−
+
−
+
= νν
n
nS
n
nS
nSnS
 
 
Por lo tanto 753.115,05.0
,
2
== tt
ν
α 
Como 753.118.0 15,05.0
*
0 =<= tt entonces se acepta 0: 210 =− µµH 
No hay evidencia fuerte que las medias de los dos flujos de corriente sean diferentes. 
Si calculamos el p-valor 
( ) ( ) 40.018.0**0* >>=>=− TPtTPvalorp 
 
 
Caso 2: 222
2
1 σσσ == 
 
Supongamos que tenemos dos variables aleatorias independientes normalmente distribuidas: 
 
( )
( )

2
222
2
111
σ,µN~X
σ,µN~X
 y las varianzas 21σ y 
2
2σ son desconocidas pero iguales. 
 
y además 
( )
111211 n
X,...,X,X es una muestra aleatoria de tamaño 1n de 1X 
( )
222221 n
X,...,X,X es una muestra aleatoria de tamaño 2n de 2X . 
Parte 2 – Estadística Prof. María B. Pintarelli 
 195 
Sean 1X y 2X las medias muestrales y 
2
1S y 
2
2S las varianzas muestrales. Como 
2
1S y 
2
2S son los 
estimadores de la varianza común 2σ , entonces construimos un estimador combinado de 2σ . Este 
estimador es 
 
 
( ) ( )
2
11
21
2
22
2
112
−+
−+−
=
nn
SnSn
S p 
Se puede comprobar que es un estimador insesgado de 2σ . 
Ya vimos que se puede probar que el estadístico 
 
21
021
11
nn
S
XX
T
p +
∆−−
=
r
 tiene distribución Student con 221 −+ nn grados de libertad 
 
Por lo tanto, si las hipótesis son 
 
02110210 : contra : ∆≠−∆=− µµµµ HH entonces la regla de decisión es 
 





≤
>
−+
−+
2,
2
0
2,
2
0
21
21
nn
nn
tTsiHaceptar
tTsiHrechazar
α
α
 
 
Si 0211 : ∆>− µµH entonces la regla de decisión es 




≤
>
−+
−+
2,0
2,0
21
21
nn
nn
tTsiHaceptar
tTsiHrechazar
α
α
 
 
Si 0211 : ∆<− µµH entonces la regla de decisión es 




−≥
−<
−+
−+
2,0
2,0
21
21
nn
nn
tTsiHaceptar
tTsiHrechazar
α
α
 
 
Ejemplo: 
Se tienen las mediciones del nivel de hierro en la sangre de dos muestras de niños: un grupo de niños 
sanos y el otro padece fibrosis quística. Los datos obtenidos se dan en la siguiente tabla: 
 
sanos 91 =n 9.181 =x 
22
1 9.5=s 
enfermos 132 =n 9.112 =x 
22
2 3.6=s 
 
Podemos asumir que las muestras provienen de poblaciones normales independientes con iguales 
varianzas. 
Es de interés saber si las dos medias del nivel de hierro en sangre son iguales o distintas. Utilizar 
05.0=α 
 
Solución: 
 Las variables de interés son 
:1X “nivel de hierro en sangre de un niño sano tomado al azar” 
:2X “nivel de hierro en sangre de un niño con fibrosis quística tomado al azar” 
Parte 2 – Estadística Prof. María B. Pintarelli 
 196 
Asumimos que ( )211 ,N~ σµX y ( )222 ,N~ σµX 
Consideramos las hipótesis 
 0: contra 0: 211210 ≠−=− µµµµ HH 
Para calcular el valor del estadístico de prueba, primero calculamos 
 
( ) ( ) ( ) ( )
14.6
2139
3.61139.519
2
11 22
21
2
22
2
112 =
−+
−+−
=
−+
−+−
==
nn
SnSn
SS pp 
 
El estadístico de prueba es 
13
1
9
1
21
+
−
=
pS
XX
T
r
 y toma el valor 63.2
13
1
9
1
14.6
9.119.18
0 =
+
−
=t 
 
Buscamos en la tabla de la distribución Student 086.220,025.0
2,
2
21
==
−+
tt
nn
α 
Como 086.263.2 20,025.00 =>= tt entonces se rechaza 0: 210 =− µµH 
 
Si calculamos el p-valor de la prueba 
 
( )( ) ( )( ) ( )63.2263.21212 0 >=<−=<−=− TPTPtTPvalorp 
 
Vemos de la tabla de la Student que 528.220,01.0 =t y 845.220,005.0 =t por lo tanto 
 
( ) 01.0263.22005.02 ×<>=−<× TPvalorp es decir 02.001.0 <−< valorp 
 
 
 
 9.7 – Prueba de hipótesis sobre la diferencia de dos medias para datos de a pares 
 
Ya se vio el caso, cuando se habló de intervalos de confianza para una diferencia de medias, de datos 
dados de a pares, es decir ( ) ( ) ( )nn XXXXXX 2122122111 ,;...;,;, 1 . 
Las variables aleatorias 1X y 2X tienen medias 1µ y 2µ respectivamente. 
Consideramos jjj XXD 21 −= con nj ,...,2,1= . 
Entonces 
 ( ) ( ) ( ) ( ) 212121 µµ −=−=−= jjjjj XEXEXXEDE 
 y 
 
( ) ( ) ( ) ( ) ( ) ( )212221212121 ,2,2 XXCovXXCovXVXVXXVDV jjjjjjj −+=−+=−= σσ 
 
Estimamos ( ) 21 µµ −=jDE con ( ) 21
1
21
1
11
XXXX
n
D
n
D
n
j
jj
n
j
j −=−== ∑∑
==
 
En lugar de tratar de estimar la covarianza, estimamos la ( )jDV con ( )∑
=
−
−
=
n
j
jD DD
n
S
1
2
1
1
 
Parte 2 – Estadística Prof. María B. Pintarelli 
 197 
Anotamos 21 µµµ −=D y ( )jD DV=2σ 
 
Asumimos que ( )2,N~ DDjD σµ con nj ,...,2,1= 
 
Las variables aleatorias en pares diferentes son independientes, no lo son dentro de un mismo par. 
Para construir una regla de decisión nuevamente, consideramos el estadístico 
 
 
nS
D
T
D
D
/
µ−
= con distribución 1−nt 
Si tenemos las hipótesis 
 
 02110210 : contra : ∆≠−∆=− µµµµ HH 
 
Entonces el estadístico de prueba es 
 
nS
D
T
D /
0∆−= y tiene distribución 1−nt si 0210 : ∆=− µµH es verdadera 
 
Por lo tanto, la regla de decisión es 





≤
>
−
−
1,
2
0
1,
2
0
n
n
tTsiHaceptar
tTsiHrechazar
α
α
 donde 
nS
D
T
D /
0∆−= 
 
Si 0211 : ∆>− µµH entonces la regla de decisión es 




≤
>
−
−
1,0
1,0
n
n
tTsiHaceptar
tTsiHrechazar
α
α
 
 Si 0211 : ∆<− µµH entonces la regla de decisión es 




−≥
−<
−
−
1,0
1,0
n
n
tTsiHaceptar
tTsiHrechazar
α
α
 
Ejemplo: 
Se comparan dos microprocesadores en una muestra de 6 códigos de puntos de referencia para 
determinar si hay una diferencia en la rapidez. Los tiempos en segundos utilizados para cada procesador 
en cada código están dados en la siguiente tabla: 
 
 Código 
 1 2 3 4 5 6 
Procesador A 27.2 18.1 27.2 19.7 24.5 22.1 
Procesador B 24.1 19.3 26.8 20.1 27.6 29.8 
 
¿Puede concluir que las medias de la rapidez de ambos procesadores son diferentes con nivel de 
significancia 0.05? 
 
Solución: 
Las variables aleatorias de interés son 
:1X “rapidez del procesador A en un código tomado al azar” 
:2X “rapidez del procesador B en un código tomado al azar” 
Como ambas variables se miden sobre un mismo código no podemos asumir que son independientes. 
Parte 2 – Estadística Prof. María B. Pintarelli 
 198 
Las hipótesis son 0: contra 0: 211210 ≠−=− µµµµ HH 
Necesitamos la muestra de las diferencias jD : 
3.1, -1.2; 0.4; -0.4; -3.1; -7.7 
De esta muestra obtenemos 483333.1−=d y 66246.3=Ds 
 
Además 05.0=α → 571.25,025.0
1,
2
==
−
tt
n
α 
El estadístico de prueba es 
6/DS
D
T = y toma el valor 99206.0
6/66246.3
483333.1
0 =
−
=t 
Como 571.299206.0 5,025.0
1,
2
0 ==<=
−
ttt
n
α entonces se acepta la hipótesis nula. No hay evidencia de que 
las medias de la rapidez de ambos procesadores sean diferentes. 
 
 
 
9.8 – Tests de hipótesis sobre la varianza 
 
Supongamos que se desea probar la hipótesis de que la varianza de una población normal es igual a un 
valor específico, por ejemplo 20σ . 
Sea ( )nX,...,X,X 21 una muestra aleatoria de tamaño n de una v.a. X, donde ),(~ 2σµNX . 
Tomamos como estimador puntual de 2σ a ( )
2
11
2
1
1
∑
=
−
−
=
n
i XX
n
S 
Luego a partir de este estimador puntual construimos el estadístico 
( )
2
21
σ
Sn
X
−
= 
Este estadístico contiene al parámetro desconocido a estimar 2σ y ya sabemos que tiene una 
distribución llamada ji-cuadrado con n-1 grados de libertad 
Supongamos las hipótesis20
2
0 : σσ =H contra 
2
0
2
1 : σσ ≠H 
 
Tomamos como estadístico de prueba a 
 
( )
2
0
21
σ
Sn
X
−
= y si 20
2
0 : σσ =H es verdadera , entonces 
( )
2
0
21
σ
Sn
X
−
= ~ 2 1−nχ 
 
Nuevamente, el razonamiento es: si el estadístico X que bajo 20
2
0 : σσ =H tiene distribución 
2
1−nχ toma 
un valor “inusual”, se considera que hay evidencia en contra H0 
Recordar que la distribución 2 1−nχ es asimétrica. Entonces la regla de decisión es 
 
 





≤≤
<>
−−−
−−−
2
1,
2
2
1,
2
1
0
2
1,
2
1
2
1,
2
0
nn
nn
XsiHaceptar
XóXsiHrecahzar
αα
αα
χχ
χχ
 donde 
( )
2
0
21
σ
Sn
X
−
= 
 
Parte 2 – Estadística Prof. María B. Pintarelli 
 199 
Si 20
2
1 : σσ >H entonces la regla de decisión es 




≤
>
−
−
2
1,0
2
1,0
n
n
XsiHaceptar
XsiHrecahzar
α
α
χ
χ
 
 
Si 20
2
1 : σσ <H entonces la regla de decisión es 




≥
<
−−
−−
2
1,10
2
1,10
n
n
XsiHaceptar
XsiHrecahzar
α
α
χ
χ
 
 
Para calcular el p-valor, si el estadístico X tomó el valor 0x , y teniendo en cuenta que no hay simetría en 
la distribución ji-cuadrado, hacemos: 
 
Si 20
2
1 : σσ >H entonces ( )0xXPvalorp >=− 
Si 20
2
1 : σσ <H entonces ( )0xXPvalorp <=− 
Si 20
2
1 : σσ ≠H entonces ( ) ( )





><=− 00 ,min2 xXPxXPvalorp 
 
Ejemplo: 
Consideremos nuevamente el ejemplo visto en la sección de intervalos de confianza para la varianza 
sobre la máquina de llenado de botellas. Al tomar una muestra aleatoria de 20 botellas se obtiene una 
varianza muestral para el volumen de llenado de 0153.02 =s oz2. 
Si la varianza del volumen de llenado es mayor que 0.01 oz2, entonces existe una proporción inaceptable 
de botellas que serán llenadas con una cantidad menor de líquido. ¿Existe evidencia en los datos 
muestrales que sugiera que el fabricante tiene un problema con el llenado de las botellas? Utilice 
05.0=α 
 
Solución: 
La variable de interés es X: “volumen de llenado de una botella tomada al azar” 
Asumimos ),(~ 2σµNX 
Los datos son 0153.02 =s de una muestra de tamaño 20=n 
 
Las hipótesis son 01.0: 20 =σH contra 01.0:
2
1 >σH 
 
05.0=α → 14.302 19,05.0
2
1, ==− χχα n 
 
El estadístico de prueba es 
( )
01.0
191 2
2
0
2 SSn
X
×
=
−
=
σ
 y toma el valor 
07.29
01.0
0153.019
01.0
19 2
0 =
×
=
×
=
S
x 
 
Como <= 07.290x 14.30
2
19,05.0 =χ entonces no hay evidencia fuerte de que la varianza del volumen 
de llenado sea menor que 0.01 
Para calcular el p-valor 
( ) ( )07.290 >=>=− XPxXPvalorp 
Parte 2 – Estadística Prof. María B. Pintarelli 
 200 
Buscamos en la tabla de la distribución ji-cuadrado y vemos que en la fila con 19=ν no figura 29.07, 
pero 27.20 < 29.07 < 30.14, y además 
 
 
( )
( )
10.005.0
05.014.30
10.020.27
<−<⇒



=>
=>
valorp
XP
XP
 
 
En la figura siguiente se ilustra la situación 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
9.9 – Tests de hipótesis sobre la igualdad de dos varianzas 
 
Supongamos que tenemos interés en dos poblaciones normales independientes, donde las medias y las 
varianzas de la población son desconocidas. Se desea probar la hipótesis sobre la igualdad de las dos 
varianzas, específicamente: 
 Supongamos que tenemos dos variables aleatorias independientes normalmente distribuidas: 
 
( )
( )

2
222
2
111
σ,µN~X
σ,µN~X
 y 1µ ; 2µ ; 
2
1σ y 
2
2σ son desconocidos 
 
y además 
 
( )
111211 n
X,...,X,X es una muestra aleatoria de tamaño 1n de 1X 
( )
222221 n
X,...,X,X es una muestra aleatoria de tamaño 2n de 2X . 
Sean 21S y 
2
2S las varianzas muestrales, 
2
1S y 
2
2S son los estimadores de 
2
1σ y 
2
2σ respectivamente. 
Consideramos el estadístico 
 
2
2
2
2
2
1
2
1
σ
σ
S
S
F = 
 
 
Parte 2 – Estadística Prof. María B. Pintarelli 
 201 
Notar que F contiene al parámetro de interés 
2
1
2
21
σ
σ , pues 
2
1
2
2
2
2
2
1
σ
σ
×
×
=
S
S
F 
Sabemos que F tiene una distribución llamada Fisher con 11 −n y 12 −n grados de libertad. 
 
 Sean las hipótesis 22
2
10 : σσ =H contra 
2
2
2
11 : σσ ≠H 
 
Tomamos como estadístico de prueba a 
2
2
2
1
S
S
F = 
Vemos que 
2
2
2
1
S
S
F = ~ 1,1 21 −− nnF si 
2
2
2
10 : σσ =H es verdadera 
Recordando que la distribución Fisher es asimétrica, la regla de decisión es 
 
 





≤≤
<>
−−−−−
−−−−−
2
1,1,
2
2
1,1,
2
1
0
2
1,1,
2
1
2
1,1,
2
0
2121
2121
nnnn
nnnn
fFfsiHaceptar
fFófFsiHrecahzar
αα
αα
 
 
 
Si 22
2
11 : σσ >H entonces la regla de decisión es 




≤
>
−−
−−
2
1,1,0
2
1,1,0
21
21
nn
nn
fFsiHaceptar
fFsiHrecahzar
α
α
 
Si 22
2
11 : σσ <H entonces la regla de decisión es 




≥
<
−−−
−−−
2
1,1,10
2
1,1,10
21
21
nn
nn
fFsiHaceptar
fFsiHrecahzar
α
α
 
Para calcular el p-valor, si el estadístico F tomó el valor 0f , y teniendo en cuenta que no hay simetría 
en la distribución Fisher, hacemos: 
 
 Si 22
2
11 : σσ >H entonces ( )0fFPvalorp >=− 
 Si 22
2
11 : σσ <H entonces ( )0fFPvalorp <=− 
 Si 22
2
11 : σσ ≠H entonces ( ) ( )





><=− 00 ,min2 fFPfFPvalorp 
 
 Ejemplo: 
En una serie de experimentos para determinar la tasa de absorción de ciertos pesticidas en la piel se 
aplicaron cantidades medidas de dos pesticidas a algunos especímenes de piel. Después de un tiempo 
se midieron las cantidades absorbidas (en gµ ). Para el pesticida A la varianza de las cantidades 
absorbidas en 6 muestras fue de 2.3; mientras que para el B la varianza de las cantidades absorbidas en 
10 especímenes fue de 0.6. Suponga que para cada pesticida las cantidades absorbidas constituyen una 
muestra aleatoria de una población normal. ¿Se puede concluir que la varianza en la cantidad 
absorbida es mayor para el pesticida A que para el B? Utilizar 05.0=α 
 
Solución: 
Las variables aleatorias de interés son 
Parte 2 – Estadística Prof. María B. Pintarelli 
 202 
:1X “cantidad absorbida de pesticida A en un espécimen de piel tomado al azar” 
:2X “cantidad absorbida de pesticida B en un espécimen de piel tomado al azar” 
Asumimos que ( )2111 ,N~ σµX y ( )2222 ,N~ σµX 
 
Las hipótesis son 22
2
10 : σσ =H contra 
2
2
2
11 : σσ <H 
Los datos son 3.221 =s y 6.0
2
2 =s 
61 =n ; 102 =n 
El estadístico de prueba es 
2
2
2
1
S
S
F = y toma el valor 83.3
6.0
3.2
0 ==f 
Buscamos en la tabla de la distribución Fisher 48.39,5,05.0 =f 
Como 9,5,05.00 48.383.36.0
3.2
ff =>== se rechaza 22
2
10 : σσ =H 
Para saber cuánta evidencia hay contra la hipótesis nula, calculamos el p-valor 
De la tabla de la Fisher vemos que 06.683.348.3 9,5,01.09,5,05.0 =<<= ff 
Por lo tanto 05.001.0 <−< valorp 
 
En la figura siguiente se ilustra la situación 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
9.10 – Tests de hipótesis sobre una proporción 
 
En muchos problemas se tiene interés en una variable aleatoria que sigue una distribución binomial. 
Por ejemplo, un proceso de producción que fabrica artículos que son clasificados como aceptables o 
defectuosos. Lo más usual es modelar la ocurrencia de artículos defectuosos con la distribución 
binomial, donde el parámetro binomial p representa la proporción de artículos defectuosos producidos. 
En consecuencia, muchos problemas de decisión incluyen una prueba de hipótesis con respectoa p. 
Consideremos las hipótesis 
 
 00 : ppH = contra 01 : ppH ≠ 
 
 
Parte 2 – Estadística Prof. María B. Pintarelli 
 203 
Supongamos que consideramos una muestra aleatoria ( )nXXX ...,, 21 de tamaño n , donde Xi tiene 
una distribución binomial con parámetros 1 y p: Xi ~ B(1,p). 
 Ya sabemos que =X nXXX +++ ...21 , es una v.a. cuya distribución es binomial con parámetros n 
y p: X~B(n,p). De acuerdo con esto, la variable aleatoria P̂ definida: 
n
X
P̂ = representa la proporción 
de individuos de la muestra que verifican la propiedad de interés. 
Además 
 
( ) ( ) pnp
n
XE
nn
X
EP̂E ===




=
11
, y ( ) ( ) ( )
n
pp
pnp
nn
X
VP̂V
−
=−=




=
1
1
1
2
 
Consideramos el estadístico de prueba 
 
 
( )
n
pp
pP
Z
00
0
1
ˆ
−
−
= 
 
Si 00 : ppH = es verdadera entonces ( )
)1,0(
1
ˆ
00
0 N
n
pp
pP
Z ≈
−
−
= aproximadamente por T.C.L. 
Por lo tanto la regla de decisión es 
 





≤
>
2
0
2
0
α
α
zZsiHaceptar
zZsiHrechazar
 donde 
( )
n
pp
pP
Z
00
0
1
ˆ
−
−
= 
 
Si 01 : ppH > entonces la regla de decisión es 




≤
>
α
α
zZsiHaceptar
zZsiHrechazar
0
0
 
 
Si 01 : ppH < entonces la regla de decisión es 




−≥
−<
α
α
zZsiHaceptar
zZsiHrechazar
0
0
 
 
Observaciones: 
1- La prueba descrita anteriormente requiere que la proporción muestral esté normalmente distribuida. 
Esta suposición estará justificada siempre que 100 >np y ( ) 101 0 >− pn , donde 0p es la proporción 
poblacional que se especificó en la hipótesis nula. 
2- También se podía haber tomado como estadístico de prueba a 
( )00
0
1 pnp
npX
Z
−
−
= donde X~B(n,p) 
Ejemplo: 
Un fabricante de semiconductores produce controladores que se emplean en aplicaciones de motores 
automovilísticos. El cliente requiere que la fracción de controladores defectuosos en uno de los pasos 
de manufactura críticos no sea mayor que 0.05, y que el fabricante demuestre esta característica del 
proceso de fabricación con este nivel de calidad, utilizando 05.0=α . E fabricante de semiconductores 
Parte 2 – Estadística Prof. María B. Pintarelli 
 204 
toma una muestra aleatoria de 200 dispositivos y encuentra que 4 de ellos son defectuosos. ¿El 
fabricante puede demostrar al cliente la calidad del proceso? 
 
Solución: 
Sea la v.a. X: “número de controladores defectuosos en la muestra” 
Entonces X ~ B(200, p) donde p es la proporción de controladores defectuosos en el proceso 
Las hipótesis son 05.0:0 =pH contra 05.0:1 <pH 
Como 05.0=α entonces 645.105.0 −=−=− zzα 
El estadístico de prueba es 
( ) ( )
200
05.0105.0
05.0ˆ
1
ˆ
00
0
−
−
=
−
−
=
P
n
pp
pP
Z y toma el valor 95.10 −=z 
Como <−= 95.10z 645.105.0 −=−=− zzα entonces se rechaza 0H , y se concluye que la fracción de 
controladores defectuosos es menor que 0.05. 
Calculamos el p-valor 
( ) ( ) ( ) 0256.095.195.10 =−Φ=−<=<=− ZPzZPvalorp 
 
 
Valor de β y selección del tamaño de la muestra 
 
Podemos obtener expresiones aproximadas para la probabilidad de cometer error de tipo II de manera 
análoga a las obtenidas para los test para la media 
 
Si 01 : ppH ≠ entonces 
 
( )
( )
( )
( )
( )














−
−
+−
Φ−














−
−
+−
Φ≈
≈





=
n
pp
n
pp
zpp
n
pp
n
pp
zpp
falsaesHHaceptarPp
1
1
1
1 00
2
0
00
2
0
00
αα
β
 
 
Si 01 : ppH < entonces 
 
( )
( )
( )












−
−
−−
Φ−≈





=
n
pp
n
pp
zpp
falsaesHHaceptarPp
1
1
1
00
0
00
α
β 
 
Si 01 : ppH > entonces 
( )
( )
( )












−
−
+−
Φ≈





=
n
pp
n
pp
zpp
falsaesHHaceptarPp
1
1 00
0
00
α
β 
Parte 2 – Estadística Prof. María B. Pintarelli 
 205 
 
Estas ecuaciones pueden resolverse para encontrar el tamaño aproximado de la muestra n para que con 
un nivel de significancia de α la probabilidad de cometer error de tipo II sea menor o igual que un 
valor específico 0β . Las ecuaciones se deducen como en casos anteriores y son 
 
Si 01 : ppH ≠ entonces 
( ) ( )
2
0
00
2
11
0










−
−+−
≥
pp
ppzppz
n
βα
 
Si 01 : ppH < ó 01 : ppH > entonces 
( ) ( )
2
0
00 11 0








−
−+−
≥
pp
ppzppz
n
βα 
 
Ejemplo: 
Volviendo al ejemplo anterior, supongamos que la verdadera proporción de componentes defectuosos 
en el proceso es 03.0=p , ¿cuál es el valor de β si 200=n y 05.0=α ? 
 
Solución: 
Ya que la alternativa es 01 : ppH < aplicamos la fórmula 
( )
( )
( )
( )
( )
( ) 67.044.01
200
03.0103.0
05.0105.0
645.103.005.0
1
1
1
1
00
0
00
=−Φ−=












−
−
−−
Φ−=
=












−
−
−−
Φ−≈





=
n
n
pp
n
pp
zpp
falsaesHHaceptarPp
α
β
 
 
Como la probabilidad de aceptar que el proceso tiene la calidad deseada cuando en realidad 03.0=p 
es bastante alta, podemos preguntar qué tamaño de muestra se necesita para que en el test anterior sea 
1.0<β si la verdadera proporción de defectuosos es 03.0=p . En este caso aplicamos la fórmula 
donde 28.11.00 == zzβ 
 
( ) ( ) ( ) ( )
832
05.003.0
03.0103.028.105.0105.0645.111
22
0
00 0 ≈







−
−+−
=








−
−+−
≥
pp
ppzppz
n
βα 
 
La muestra requerida es muy grande, pero la diferencia a detectar 05.003.00 −=− pp es bastante 
pequeña. 
 
 
 
 
 
 
Parte 2 – Estadística Prof. María B. Pintarelli 
 206 
 
9.11 – Tests de hipótesis sobre dos proporciones 
 
Las pruebas de hipótesis sobre diferencia de medias pueden adaptarse al caso donde tenemos dos 
parámetros binomiales 1p y 2p de interés. 
Específicamente, supongamos que se toman dos muestras aleatorias 
( )
111211 n
X,...,X,X es una muestra aleatoria de tamaño 1n de 1X 
( )
222221 n
X,...,X,X es una muestra aleatoria de tamaño 2n de 2X 
Donde ),1(~ 11 pBX ; ),1(~ 22 pBX y 1X y 2X independientes. 
Ya sabemos que ∑
=
=
1
1
1
1
1
1ˆ
n
i
iX
n
P y ∑
=
=
2
1
2
2
2
1ˆ
n
i
iX
n
P son estimadores insesgados de 1p y 2p 
respectivamente, con varianzas ( ) ( )
1
11
1
1ˆ
n
pp
PV
−
= y ( ) ( )
2
22
2
1ˆ
n
pp
PV
−
= 
Supongamos las hipótesis 
 
 0: contra 0: 211210 ≠−=− ppHppH 
 
Notar que si la hipótesis nula es verdadera entonces ppp == 21 , donde p es desconocido. 
El estadístico 
( ) 





+−
−
=
21
21
11
1
ˆˆ
nn
pp
PP
Z tiene distribución aproximadamente )1,0(N por T.C.L. si 
 0: 210 =− ppH es verdadera. Tomamos como estimador de p a 
21
1 1
21
1 2
ˆ
nn
XX
P
n
i
n
i
ii
+
+
=
∑ ∑
= = y lo 
reemplazamos en Z 
Entonces el estadístico de prueba es 
( ) 





+−
−
=
21
21
11ˆ1ˆ
ˆˆ
nn
PP
PP
Z que bajo 0: 210 =− ppH se puede 
probar que tiene distribución aproximadamente )1,0(N 
 
Entonces la regla de decisión es 





≤
>
2
0
2
0
α
α
zZsiHaceptar
zZsiHrechazar
 donde 
( ) 





+−
−
=
21
21
11ˆ1ˆ
ˆˆ
nn
PP
PP
Z 
 
Si 0: 211 >− ppH entonces la regla de decisión es 




≤
>
α
α
zZsiHaceptar
zZsiHrechazar
0
0
 
 
Si 0: 211 <− ppH entonces la regla de decisión es 




−≥
−<
α
α
zZsiHaceptar
zZsiHrechazar
0
0
 
Parte 2 – EstadísticaProf. María B. Pintarelli 
 207 
 
 
Ejemplo: 
En una muestra de 100 lotes de un producto químico comprado al distribuidor A, 70 satisfacen una 
especificación de pureza. En una muestra de 70 lotes comprada al distribuidor B, 61 satisfacen la 
especificación. ¿Pude concluir que una proporción mayor de los lotes del distribuidor B satisface la 
especificación? 
 
 
Solución: 
Los parámetros de interés son 1p y 2p las verdaderas proporciones de lotes que cumplen las 
especificaciones de pureza. 
Tenemos una muestra aleatoria ( )
111211 n
X,...,X,X de tamaño 1001 =n donde 7.0100
701ˆ
1
1
1
1
1 === ∑
=
n
i
iX
n
P 
 
Y otra muestra ( )
222221 n
X,...,X,X de tamaño 702 =n donde 70
611ˆ
2
1
2
2
2 == ∑
=
n
i
iX
n
P 
Las hipótesis son 0: contra 0: 211210 <−=− ppHppH 
 
El estadístico de prueba es 
( ) 





+−
−
=
21
21
11ˆ1ˆ
ˆˆ
nn
PP
PP
Z donde 
21
1 1
21
1 2
ˆ
nn
XX
P
n
i
n
i
ii
+
+
=
∑ ∑
= = 
En este caso 
170
131
70100
6170ˆ
21
1 1
21
1 2
=
+
+
=
+
+
=
∑ ∑
= =
nn
XX
P
n
i
n
i
ii
 
 
El estadístico toma el valor 6163.2
70
1
100
1
170
131
1
170
131
70
61
100
70
0 −=





 +




 −
−
=z 
 
Para saber cuánta evidencia hay contra 0: 210 =− ppH calculamos el p-valor 
( ) ( ) 0045.06163.20 =−Φ=<=− zZPvalorp 
Como el p-valor es menor que 0.05, se considera que hay mucha evidencia contra 0: 210 =− ppH y 
se rechaza la hipótesis nula. 
 
 
Valor de β 
Cuando 0: 210 =− ppH es falsa, la varianza de 21 ˆˆ PP − es 
 ( ) ( ) ( ) ( ) ( )
2
22
1
11
2121
11ˆˆˆˆ
n
pp
n
pp
PVPVPPV
−
+
−
=+=− 
 
Parte 2 – Estadística Prof. María B. Pintarelli 
 208 
Anotamos ( ) ( ) ( ) ( ) ( )
2
22
1
11
2121ˆˆ
11ˆˆˆˆ
21 n
pp
n
pp
PVPVPPV
PP
−
+
−
=+=−=
−
σ 
 
 
Entonces 
 
Si 0: 211 ≠− ppH 
( ) ( )














−−





+−
Φ−














−−





+
Φ≈
−− 2121 ˆˆ
21
21
2
ˆˆ
21
21
2
1111
PPPP
pp
nn
qpzpp
nn
qpz
σσ
β
αα
 
 
Donde 
21
2211
nn
pnpn
p
+
+
= y pq −=1 
 
Si 0: 211 >− ppH entonces 
( )














−−





+
Φ≈
− 21 ˆˆ
21
21
11
PP
pp
nn
qpz
σ
β
ε
 
Si 0: 211 <− ppH entonces 
( )














−−





+−
Φ−≈
− 21 ˆˆ
21
21
11
1
PP
pp
nn
qpz
σ
β
α
 
Podemos deducir fórmulas para el tamaño de la muestra, nuevamente asumiendo que nnn == 21

Continuar navegando

Materiales relacionados

19 pag.
Inferencia Estadistica - ALICAR OCANTO

SIN SIGLA

User badge image

Ali Ocanto Bastidas

22 pag.
hipotesis_estadistica

User badge image

Estudiando Ingenieria

13 pag.
Prueba de Hipotesis

UNAM

User badge image

isabelpb64