Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Dr. Guillermo Pastor Morales Romero UNIVERSIDAD NACIONAL DE EDUCACIÓN ENRIQUE GUZMÁN Y VALLE Alma Máter del Magisterio Nacional Estadística no paramétrica Chi-cuadrado SEMINARIO DE ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EDUCACIONAL Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada Tablas de contingencia Tabla de contingencia o tabulación cruzada, es una tabla de dos dimensiones y cada dimensión contiene una variable cualitativa. La prueba no paramétrica de Ji Cuadrada ( X2) se calcula en base a una tabla de contingencia. Una Tabla de contingencia nos permiten describir dos o más variables- ‹Nº› Taller de Estadística Aplicada Ejemplo Una tabla de 2 x 2: Una tabla de 2 x 3: Candidato A Candidato B Masculino Femenino Norte Sur Partido derechista 180 100 Partido del centro 190 280 Partido izquierdista 170 120 ‹Nº› Taller de Estadística Aplicada Descripción de Tablas de contingencia Las tablas de contingencia son útiles para describir conjuntamente dos o más variables. Esto se efectúa convirtiendo las frecuencias observadas en frecuencias relativas o porcentajes. En una tabulación cruzada puede haber tres tipos de porcentajes respecto a cada celda: Porcentaje en relación al total de frecuencias observadas(N). Porcentaje en relación al total marginal de la columna. Porcentaje en relación al total marginal de la fila. ‹Nº› Taller de Estadística Aplicada Descripción de Tablas de contingencia - Ejemplo En la siguiente tabla se tiene las frecuencias observadas. Candidato A Candidato B Total Masculino 25 40 65 Femenino 25 10 35 Total 50 50 100 ‹Nº› Taller de Estadística Aplicada Descripción de Tablas de contingencia - Ejemplo En porcentajes por fila se tiene Candidato A Candidato B Total Masculino 25 40 65 Femenino 25 10 35 Candidato A Candidato B Total Masculino 38% 62% 100% Femenino 71% 29% 100% ‹Nº› Taller de Estadística Aplicada Gráficos En el gráfico se observa que un poco más de la tercera parte de los varones prefieren al candidato A mientras que más de las dos terceras partes de las mujeres prefieren al Candidato B……. ‹Nº› Taller de Estadística Aplicada Gráfico de barras de comparación de preferencias según género Masculino Candidato A Candidato B 0.38000000000000045 0.62000000000000077 Femenino Candidato A Candidato B 0.71000000000000063 0.29000000000000031 ¿CUÁLES SON LAS SUPOSICIONES DE LA ESTADÍSTICA NO PARAMÉTRICA? Para realizar análisis no paramétricos, debe partirse de las siguientes consideraciones: La mayoría de estos análisis no requieren de supuestos acerca de la forma de la distribución poblacional. Aceptan distribuciones no normales. Las variables no necesariamente deben estar medidas en un nivel por intervalo o de razón, pueden analizar datos nominales u ordinales. Si se quieren aplicar análisis no paramétrica a datos por intervalos o razón, éstos deben ser resumidos a categorías discretas (a unas cuantas). Las variables deben ser categorías. Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada ¿CUÁLES SON LOS MÉTODOS O PRUEBAS ESTADÍSTICAS NO PARAMÉTRICAS MÁS UTILIZADAS? La Chi-cuadrada o Ji-Cuadrada o X2. Los coeficientes de correlación e independencia para tabulaciones cruzadas. Los coeficientes de correlación por rangos ordenados de Spearman y Kendall. Prueba de U de Mann Whitney Pruebas W de Wilcoxon Las Pruebas no paramétricas más utilizadas son: Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada Distribución Ji-Cuadrada o Chi-cuadrada o X2?. Es una prueba útil para variables categóricas y estadística, es aplicable cuando la variable nominal está compuesto por dos o más categorías. Tiene dos aplicaciones: La prueba de bondad de ajuste Chi-cuadrada. La prueba Chi-cuadrada de asociación. Ambas pruebas se utilizan para determinar si las frecuencias observadas (O) en las categorías difieren significativamente de las frecuencias esperadas (E). Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada Es una prueba estadística para evaluar hipótesis acerca de la relación entre dos variables categóricas. Símbolo: X2 Hipótesis a probar: Correlaciones Variables involucradas: Dos variables (la prueba Chi-cuadrada no considera relaciones causales). Nivel de medición de las variables Nominal u ordinal (o intervalos o razón reducidas a ordinales) Procedimiento La Chi-cuadrada se calcula por medio de una tabla de contingencia o tabulación cruzada, que es una tabla de dos dimensiones y cada dimensión contiene una variable. A su vez, cada variable se subdivide en dos o más categorías. Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada CARACTERÍSTICAS La Distribución X2 se lee con grados de libertad G.L = (Nº de filas - 1)(Nº de columnas - 1). No tiene valores negativos. El valor mínimo es 0. Todas las curvas son asimétricas Cuando aumentan los grados de libertad las curvas son menos elevadas y más extendidas a la derecha. Se utiliza para variables medidas en escala nominal u ordinal. Las fórmulas son: Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada Ejemplo 1. Variable, categoría y tabla de contingencia 2x2: Sean las variables SEXO (Masculino y Femenino) y CANDIDATO (“A” y “B”). La tabla de contingencia o tabulación cruzada es: CANDIDATO “A” “B” Masculino SEXO Femenino 20 30 40 25 Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada Variable Categoría CANDIDATO “A” “B” Masculino SEXO Femenino 20 30 40 25 Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada Ejemplo 2. Estudio de Tabla de contingencia 3x2: Se estudia a 1040 estudiantes de los niveles de educación primaria y secundaria y a los cuales se aplica un instrumento que mide el aprendizaje de la matemática, en las dimensiones de aprendizaje conceptual, procedimental y actitudinal. Variables: APRENDIZAJE categorías: Conceptual, Procedimental, Actitudinal. NIVEL DE EDUCACIÓN categorías: Primaria, Secundaria. NIVEL DE EDUCACIÓN Primaria Secundaria APRENDIZAJE Conceptual Procedimental Actitudinal 180 100 190 280 170 120 TABLA DE CONTINGENCIA Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada Tabla de frecuencias observadas (O): NIVEL DE EDUCACIÓN TOTAL Primaria Secundaria APRENDIZAJE Conceptual Procedimental Actitudinal 180 100 280 190 280 470 170 120 290 TOTAL 540 500 1040 La Chi-cuadrada es una comparación entre las tablas de frecuencias observadas y la denominada tabla de frecuencias esperadas (la tabla que esperaríamos encontrar si las variables fueran estadísticamente independientes o no estuvieran relacionadas). Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada La frecuencia esperada de cada celda, casilla o recuadro, se calcula mediante la siguiente fórmula aplicada a la tabla de frecuencias observadas: N = es el número total de frecuencias observadas. E = (marginal del reglón)(marginal de columna) / N. NIVEL DE EDUCACIÓN Marginal de filas Primaria Secundaria APRENDIZAJE Conceptual Procedimental Actitudinal (280)(540)/1040 (280)(500)/1040 280 (470)(540)/1040 (470)( 500)/1040 470 (290)(540)/1040 (290)(500)/1040 290 marginal de columnas 540 500 1040 Tabla de frecuencias esperadas (E): Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada Frecuencia observada: NIVEL DE EDUCACIÓN TOTAL Primaria Secundaria APRENDIZAJE Conceptual Procedimental Actitudinal 145,4 134,6 280 244,0 226,0 470 150,6 139,4 290 TOTAL 540 500 1040 NIVEL DE EDUCACIÓN TOTAL Primaria secundaria APRENDIZAJEConceptual Procedimental Actitudinal 180 100 280 190 280 470 170 120 290 TOTAL 540 500 1040 Frecuencia esperada: Donde: O: frecuencia observada en cada celda E: frecuencia esperada en cada celda Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada Celda O E O-E (O-E)2 (O-E)2 / E Conceptual/Primaria 180 145,4 34,6 1197,16 8,23 Procedimental/ Primaria 190 244,4 -54,4 2959,36 12,11 Actitudinal / Primaria 170 150,6 19,4 376,36 2,50 Conceptual / Secundaria 100 134,6 -34,6 1197,16 8,69 Procedimental /Secundaria 280 226,0 54,0 2916,00 12,80 Actitudinal / Secundaria 120 139,4 -19,4 376,36 2,70 X2 = 47,33 Para saber si el valor de X2 es o no significativo, debemos calcular los grados de libertad. G.L. = (Nº de filas - 1)(Nº de columnas - 1). Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada Para el ejemplo: Nº de filas = 1 y Nº de columnas = 2; entonces G.L. = (3-1)(2-1) = 2. Luego, acudimos a la “tabla de distribución de Chi-cuadrado”, eligiendo nuestro nivel de confianza ( = 0,05 ó = 0,01). Si el valor obtenido de X2 es igual o superior al valor de la “tabla”, decimos que las variables están relacionadas o no son independientes. Aplicación: Para el nivel de confianza de =0,05 y g.l. = 2, el X2 de tabla es 5,9915 (ver tabla). X2Obtenido = 47,33 X2Crítico = 5,9915 Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada Prueba de hipótesis: H0: No existe relación entre el aprendizaje y los niveles de educación. H1: Existe relación entre el aprendizaje y niveles de educación. X2obtenido X2crítico entonces variables no son independientes; es decir existe una relación entre Aprendizaje y los niveles educativos X2obtenido X2crítico entonces se rechaza la hipótesis nula (H0), y por lo tanto se acepta la hipótesis alterna (H1). Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada Establezca la Ho a ser probada; por ejemplo, Ho: 1 = 2 = 0,5 Especifique el nivel de significancia α, por ejemplo: α = 0.5 Haga una tabla de frecuencias obtenidas Deduzca las frecuencias esperadas a partir de Ho: Calcule el grado de libertad: Producto de (categorías - 1) Calcule el valor de X2 a partir de las frecuencias obtenidas y frecuencias esperadas. Mediante la tabla de X2 obtenga el valor teórico. Compara dichos valores. Establezca la conclusión con respecto a Ho: Retenga Ho si valor de tabla > Valor calculado. Retenga Ho si valor de tabla < Valor calculado. Paso Nº 1 Paso Nº 2 Paso Nº 3 Paso Nº 4 Taller de Estadística Aplicada ‹Nº› Taller de Estadística Aplicada Total de Fila x Total de Columna F. Esperada= Total General ( ) E E O X å - = 2 2
Compartir