Logo Studenta

S14_PPT_EA_NEGOCIOS (2016-2)

¡Este material tiene más páginas!

Vista previa del material en texto

¿Alguno de ellos nos proporcionara
mayor blancura?
¿Todos los detergentes serán iguales?
¿Se podrá determinar si existe diferencia 
significativa entre los tipos de 
detergentes?
SITUACIÓN PROBLEMA:
Supongamos una empresa que tiene
cuatro tiendas ubicadas en cuatro
zonas de Lima, el gerente de la
empresa conoce que la distribución
del porcentaje de sus clientes es
20%, 30%, 40% y 10% en sus tiendas
respectivamente; pero sospecha que
debido a un cambio de imagen se ha
producido una modificación en la
distribución porcentual de sus
clientes, ¿como podríamos verificar si
se produjo este cambio o no?. Este
es un típico caso donde es útil usar la
prueba de bondad de ajuste.
APLICACIONES DE LA DISTRIBUCIÓN
CHI-CUADRADO
LOGRO DE SESIÓN:
o Al término de la sesión, el estudiante resuelve ejercicios de
pruebas de hipótesis de Chi-Cuadrado, aplicando los
diferentes casos hipotéticos según el tipo de variables y su
relación entre las variables, demostrando dominio de tema
y la presentación de ejercicios en el tiempo establecido.
USOS DE LA CHI-CUADRADO:
Para hacer inferencias acerca de la varianza poblacional. Es decir,
para calcular Intervalos de Confianza y Prueba de hipótesis para la
varianza poblacional.
Para hacer pruebas de Bondad de Ajuste. O sea, para probar si un
conjunto de datos sigue una distribución pre-determinada.
Para hacer análisis de tablas de contingencia.
TEMAS RELACIONADOS:
Ajuste de distribuciones: Es un contraste de significación para
saber si los datos de una muestra son conformes a una ley de
distribución teórica que sospechamos que es la correcta.
Homogeneidad de varias muestras cualitativas: Sirve para
contrastar la igualdad de procedencia de un conjunto de muestras de
tipo cualitativo.
Tablas de contingencia: Es un contraste para determinar la
dependencia o independencia de caracteres cualitativos.
PRUEBA DE BONDAD DE AJUSTE:
Esta prueba se usa cuando se quiere probar la hipótesis
de que unos datos muéstrales provienen de una
determinada distribución.
Para esta prueba es necesario agrupar o distribuir las
observaciones de la muestra en intervalos de clase,
preferiblemente del mismo tamaño.
PRUEBA DE BONDAD DE AJUSTE:
El estadístico de prueba es: 




K
i i
ii
E
EO
X
1
2
2 )(
 
Donde: 
Oi = Total de valores que caen en el intervalo i. 
Ei = Número esperado de valores en el intervalo i. 
k = Número de intervalos de clase en que se distribuyen las observaciones. 
El número esperado de observaciones para ese intervalo está dado por: 
Ei =nPi 
Donde: 
 Pi es la probabilidad de que una observación quede en el intervalo i, de acuerdo con 
la función de densidad que se esté analizando, y n es el número total de 
observaciones. 
PRUEBA DE BONDAD DE AJUSTE:
Las pruebas de hipótesis son:
H0: La forma de la distribución es una distribución …
H1: La forma de la distribución no es una distribución …
Debe de rechazarse H0 si:
Donde:
k es el número de intervalos de clase.
p es el número de parámetros de la distribución que se va analizar.
α: nivel de significancia.
Si la frecuencia esperada en una celda es menor que 5, se combina
esta celda con la celda anterior o con las que sea necesario para
ser mayor o igual a 5.
…CONTINUACIÓN:
Si la hipótesis nula es cierta 
entonces:
tiene una distribución X2 con k-p-1 grados de libertad.




k
i i
ii
E
EO
1
2
2 )(
(son k-p-1 grados de libertad, porque si sabemos k-1 de las pi, también
sabemos la k-ésima, pues su suma es 1 y los “p” parámetros es cero).
Finalmente, para hacer la prueba se compara el valor computado de
X2 con el valor X2 k-p-1, α obtenido de la tabla de la distribución Ji
Cuadrado con k-p-1 grados de libertad.
Se Rechazo la hipótesis nula al nivel de significancia α(100)% si
observamos que X2 > X2 k-p-1, α
CHI-CUADRADO: REGIÓN DE RECHAZO HO
EJEMPLO:
El número de defectos por unidad observada en una muestra de 100 radios 
dio la siguiente distribución de frecuencias: 
 
Número de defectos 0 1 2 3 4 5 6 7 
Número de radios 28 32 15 10 6 4 3 2 
 
Verificar si la distribución de estos datos se aproxima a la distribución 
Poisson con un nivel de significancia de 5% 
SOLUCIÓN:
1. Ho: La distribución de los datos es Poisson. 
2. H1: La distribución de los datos no es Poisson. 
3. Nivel de significancia: α = 0.05 
4. Estadístico de prueba:
 
 
 
 
 
Donde: Los esperados iij nPE  
5. Regla de decisión: Rechazar H0 si: X2 > X2 k-p-1, α 
 
Cálculos: 
 Valor crítico: K = 5, p =1, luego: X2 k-p-1, α = X2 5-1-1, 0.05 = X2 3, 0.05 = 
7.815 
 Estadístico de Prueba: 
El parámetro de la distribución Poisson es la media, que es desconocida y 
debe estimarse a través de los datos: 𝑥 = 1.68 




k
i i
ii
E
EO
1
2
2 )(
TABLA DE PROBABILIDAD DE LA 
DISTRIBUCIÓN CHI CUADRADO
Grados de 
Libertad: 
gl = 3
Nivel de significancia:  = 0.05
 χ2 = 7.8147
χ2 = 7.8147
Región de 
Rechazo de H0
SOLUCIÓN: CONTINUACIÓN … 
 
Número de 
defectos: x 
pi = P[X = x] Ei = npi Oi 
i
ii
E
EO 2)( 
 
0 
1 
2 
3 
4 
5 
6 
7 
 
0.18637 
 0.31311 
 0.26301 
 0.14729 
 0.06186 
 0.02079 0.08986 
0.00582 
 0.00140 
18.6374 
31.31083 
26.3011 
14.72861 
8.986175 
 
28 
32 
15 
10 
6 
4 = 15 
3 
2 
4.703356 
0.015169 
4.855872 
1.518119 
4.024636 
 
Total 15.11715 
 
Luego, el valor estadístico es: 
X2 = 15.11715 
 
 
 
 
 
 
 
 = 7.815 15.117 
Conclusión: Se rechaza Ho, es decir, los datos no se ajustan a una distribución 
Poisson, con un nivel de significancia del 5% 
La Pasta Italiana es una cadena de restaurantes ubicados a lo largo de la costa peruana, el
propietario, desea añadir filete a su menú. Antes de hacerlo, decide contratar a Mognolia, para
que lleve a cabo una encuesta entre personas adultas para saber cual es su platillo favorito
cuando comen fuera de casa. Magnolia seleccionó una muestra de 120 adultos y les pidió que
indicaran su comida favorita cuando salen a cenar.
¿Es razonable concluir que no hay preferencia entre los cuatro platillos?
EJEMPLO
Plato favorito Frecuencia
Pollo 32
Pescado 24
Carne 35
Pasta 29
Total 120
Paso1. Formule las hipótesis nula y alterna.
Ho: No hay diferencia entre las proporciones de adultos 
que eligen cada platillo.
H1: Existe diferencia entre las proporciones de adultos 
que eligen cada platillo.
Continue …
SOLUCIÓN:
PRUEBA DE INDEPENDENCIA DE DOS VARIABLES:
Las Hipótesis nula y alternativa:
H0: Las variables son independientes entre sí
H1: Las variables no son independientes entre sí
Los datos se refieren 
a dos variables de 
escala nominal
Cada variable tiene 
dos o más 
categorías
Se debe usar la prueba chi
cuadrada para poner a prueba si 
existe o no una relación entre 
las variables
En la Prueba de 
Independencia de dos 
variables:
PRUEBA DE INDEPENDENCIA DE DOS VARIABLES:
O un agente de seguros tal vez quiera determinar 
si diferentes grupos ocupacionales tienden a sufrir 
diferentes tipos de lesiones en el trabajo
Al director de una campaña le 
puede interesar si la afiliación 
a un partido se relaciona con 
el nivel educativo
Por ejemplo:
David Plouffe, director de la 
campaña presidencial de Barack
Obama
Venta de seguros, una 
profesión y una carrera 
con proyección de futuro. 
PRUEBA DE INDEPENDENCIA DE DOS VARIABLES:
El propósito de la prueba chi
cuadrada en tales 
aplicaciones no es identificar 
la naturaleza exacta de una 
relación entre las variables 
nominales; 
La meta de esta técnica es 
simplemente probar si las variables 
son o no independientes entre sí.
PRUEBA DE INDEPENDENCIA DE DOS VARIABLES:
PROCEDIMIENTO DE LA PRUEBA
Crear la tabla de 
contingencias
Una tabla de 
contingencias 
tiene r filas y k 
columnas.
Comparar las tablas de 
frecuencias observadas y 
de frecuencias esperadas
Medir la diferenciaentre 
estas tablas mediante el 
estadístico de prueba χ2
Las frecuencias 
observadas reflejarán 
una clasificación 
cruzada de los 
integrantes de una 
sola muestra
La tabla de 
frecuencias 
esperadas se 
construye 
suponiendo que la 
hipótesis nula es 
verdadera
ESTADISTICO DE PRUEBA:
o r: Número de filas en la tabla de contingencia
o c: Número de columnas en la tabla de contingencia
o Oij: Frecuencia observada en la fila i, columna j
o Eij: Frecuencia esperada en la fila i, columna j
o gl = (r – 1) (c – 1) (gl = df)
 

 


r
1i
c
1j ij
2
ijij2
0
E
EO
χ
El estadístico chi cuadrado ( χ2) de la prueba 
se calcula:
Las frecuencias esperadas cuando se pone a prueba la 
independencia de las variables:
La frecuencia esperada en la fila i, 
columna j es: 
Eij = Ri(Cj)/n 
Donde:
Ri: total de la fila i.
Cj: total de la columna j.
n : El número total de observaciones
ESTADISTICO DE PRUEBA:
EJEMPLO:
 El tipo de vehículo (auto, camioneta, camión de carga)
 El comportamiento del conductor frente a la señal de alto (alto total, casi
detenido, no respeta la señal)
Una investigadora de
seguridad de tránsito
observó 500 vehículos en
una señal de alto en un
vecindario suburbano y
registró:
Conducta en la señal de alto
Total
Detenido
Avanza sin 
motor
No respeta 
la señal
Tipo de 
vehículo
Sedán 183 107 60 350
Camioneta 54 27 19 100
Camión de 
carga
14 20 16 50
Total 251 154 95 500
Con un nivel de confianza de 0.05, ¿puede haber alguna relación entre el comportamiento del
conductor y el tipo de vehículo que conduce?
SOLUCIÓN:
Formulamos las hipótesis nula y 
alternativa:
H0: La conducta del conductor y el tipo 
de vehículos son independientes.
H1: Existe una relación entre las 
variables anteriores.
La tabla de las frecuencias observadas refleja las intersecciones de las
diversas categorías de las dos variables.
Por ejemplo: se observaron 183 personas que conducían sedán y estaban
detenidos en la señal de alto.
La tabla de contingencia tiene r = 3 filas y c = 3 columnas
SOLUCIÓN:
Fila i = 1, columna j = 1:
Fila i = 2, columna j = 1:
Fila i = 3, columna j = 1:
175.7
500
350(251)CR
E 1111 
n
50.2
500
100(251)CR
E 221 
n
1
5.1
500
50(251)
E31 2
13 
n
CR
Conducta en la señal de alto
Total
Detenido
Avanza sin 
motor
No respeta 
la señal
Tipo de 
vehículo
Sedán 183 107 60 350
Camioneta 54 27 19 100
Camión de 
carga
14 20 16 50
Total 251 154 95 500
Fila i = 1, columna j = 2:
Fila i = 2, columna j = 2:
Fila i = 3, columna j = 2:
8.1072112 
500
350(154)
E
n
CR
8.302222 
500
100(154)
E
n
CR
4.152332 
500
50(154)
E
n
CR
Fila i = 1, columna j = 3:
Fila i = 2, columna j = 3:
Fila i = 3, columna j = 3:
5.663113 
500
350(95)
E
n
CR
193223 
500
100(95)
E
n
CR
5.93333 
500
50(95)
E
n
CR
SOLUCIÓN:
ESPERADO
Conducta en la señal de alto
Total
Detenido
Avanza sin 
motor
No respeta 
la señal
Tipo de 
vehículo
Sedán 175.7 107.8 66.5 350
Camioneta 50.2 30.8 19 100
Camión de 
carga
25.1 15.4 9.5 50
Total 251 154 95 500
OBSERVADO
Conducta en la señal de alto
Total
Detenido
Avanza sin 
motor
No respeta 
la señal
Tipo de 
vehículo
Sedán 183 107 60 350
Camioneta 54 27 19 100
Camión de 
carga
14 20 16 50
Total 251 154 95 500
SOLUCIÓN:
Determinamos el valor del estadístico de prueba χ2:
         
         
431.12
5.9
5.916
4.15
4.1520
1.25
1.2514
19
1919
8.30
2.50
2.5054
5.66
5.6660
8.107
8.107107
7.175
7.175183
22222
2222




















 
2
0
r
1i
c
1j ij
2
ijij2
0
χ
30.8-27
E
EO
χ
Para determinar el valor crítico de la prueba χ2, tomamos el
nivel de significancia de 0.05 y calculamos los grados de
libertad:
df = (r – 1) (c – 1) = (3 – 1) (3 – 1) = 2 x 2 = 4 → df = 4
TABLA DE PROBABILIDAD DE LA 
DISTRIBUCIÓN CHI CUADRADO
Grados de 
Libertad: 
gl = 4
Nivel de significancia:  = 0.05
 χ2 = 9.49
χ2 = 9.49
Región de 
Rechazo de H0
SOLUCIÓN:
R.A. R.C.
α = 0.05
Χ2 = 9.49
Χ0
2 = 12.431
El valor crítico de χ2 es 9.49
Observamos que el valor
calculado de χ2 cae en la
región crítica, por lo tanto:
La hipótesis nula se rechaza
con un nivel de significancia
de 0.05.
Concluimos que existe una
relación entre las variables.
 ¿CÓMO RESOLVER PROBLEMAS
APLICANDO LA DISTRIBUCIÓN CHI-
CUADRADO
 CON RESPECTO A LA SITUACIÓN
PROBLEMA, CON UN NIVEL DE
SIGNIFICACIÓN DEL 5%, ¿SE HABRÁ
PRODUCIDO UNA MODIFICACIÓN EN
LA DISTRIBUCIÓN PORCENTUAL DE
SUS CLIENTES O NO?.
¿ QUÉ HEMOS APRENDIDO HOY?
BIBLIOGRAFÍA BÁSICA:
Nro. CÓDIGO AUTOR TÍTULO AÑO
1
519.2
SCHE
SCHEAFFER Mc.
CLAVE
PROBABILIDAD Y
ESTADÍSTICA
PARA INGENIERÍA
2005
2
519.5
LEVI/P
LEVINE-
KREHBIEL-
BERENSON
ESTADÍSTICA
PARA
ADMINISTRACIÓN.
2006
3
519.2
HINE
WILLIAM W.
HINES
DOUGLAS C.
MONTGOMERY
DAVID M.
GOLDSMAN
CONNIE M.
BORROR
PROBABILIDAD Y
ESTADÍSTICA
PARA INGENÍERIA
2011
Estimado estudiante, puedes revisar los siguientes textos que se encuentran en
tu biblioteca:

Continuar navegando

Materiales relacionados

114 pag.
DO-UC-EG-MT-A0175-20162

SIN SIGLA

User badge image

Mucha Aprendizaje

38 pag.
Semana1_Estadistica_Descriptiva_Patricia_Guevara

Escola Santa Afra

User badge image

Edgar Gallegos

140 pag.
EJERCICIOS_probabilidad pdf

Colegio Sao Jose

User badge image

jair ayesta