Logo Studenta

Ayudantía N9

¡Estudia con miles de materiales!

Vista previa del material en texto

Ayudantía N°9
7 de Junio 
● Compara un conjunto de categorías de dos o más muestras 
diferentes a partir de sus frecuencias.
● Evalúa las frecuencias observadas en relación a las 
esperadas para determinar si existen o no diferencias 
significativas. 
● Las muestras deben ser independientes, y trabaja con 
tablas de contingencia. 
Test de X2 o chi/ji cuadrado
La hipótesis nula que se asume para la prueba de chi-cuadrado es 
que no hay diferencias significativas entre las frecuencias 
observadas y las esperadas.
¿Qué tan probable es que las muestras provengan de poblaciones 
con las mismas proporciones? ¿Qué tan real es la diferencia?
Pregunta
Frecuencias Observadas: son los datos obtenidos de las muestras.
Frecuencias Esperadas: corresponden al número de casos que se espera 
encontrar si es que no existiera una relación entre las categorías. Se 
multiplica el total de fila por el total de columna y luego se divide por el 
total de toda la tabla (columnas+filas).
Tablas de contingencia
Frecuencias observadas
Frecuencias esperadas
* Cálculo de frecuencias esperadas
Fórmula Chi cuadrado:
Cálculo Chi cuadrado:
Luego el valor de X2 en la tabla de distribución de 
chi-cuadrado.
Grados de libertad: (Nº de filas en la tabla -1) * (Nº de 
columnas en la tabla -1), en este ejemplo sería 
(2-1)*(2-1)=1
La significancia es cercana a 0.2, por lo que podemos 
concluir que las diferencias observadas entre el sitio de 
San Pedro y San Pablo, respecto a las frecuencias de los 
tiestos de ollas y cuencos, no es significativa (X2=1.5, 
p-value>0.2). Es decir, no hay una asociación 
significativa entre sitio y tipo de tiesto.
V de Cramer: Corresponde a una medida de fuerza que permite evaluar la relación 
o magnitud de la asociación entre las diferentes categorías.
Los valores de la V de Cramer varían entre 0 y 1:
 0 representa una independencia absoluta entre las variables. No hay asociación. 
 0.5 refleja una relación moderada.
 0.7 refleja una relación moderada-alta. 
 1 refleja una dependencia o asociación perfecta. 
Efectos del tamaño de la muestra → en una muestra pequeña, solo los resultados 
muy fuertes llegan a ser significativos. Y en una muestra grande, resultados 
incluso débiles pueden llegar a ser significativos. 
Evaluando la fuerza de la asociación:
-
 +
El test de X2 debe cumplir con algunos supuestos importantes:
● No debe haber ningún valor esperado que sea inferior a 1.
● No más del 20% de valores esperados sea menor a 5.
Si estos supuestos no se cumplen y se trabaja con una muestra muy 
pequeña, se recurre al test exacto de Fisher.
Test exacto de Fisher
X2
chisq <- Chisq.test(data)
Resultados → chisq
Valores esperados → chisq$expected
Valores observados → chisq$observed
*En tabla de 2x2 es mejor como precaución agregar:
Chisq.test(variable, correct = FALSE)
Chi cuadrado + V de Cramer:
assocstas(data)*
 *Library(vcd)
“La diferencia entre los casos con respecto a sus proporciones de 
categorías x, tiene x significancia y x fuerza (X2=x, p-value=x, V=x)”
Cómo se dice:

Otros materiales

Materiales relacionados