Logo Studenta

Sesion7_Chi-cuadrado

¡Este material tiene más páginas!

Vista previa del material en texto

Dr. Guillermo Pastor Morales Romero
UNIVERSIDAD NACIONAL DE EDUCACIÓN
ENRIQUE GUZMÁN Y VALLE
Alma Máter del Magisterio Nacional
Estadística no paramétrica
Chi-cuadrado
SEMINARIO DE ESTADÍSTICA APLICADA A LA INVESTIGACIÓN EDUCACIONAL
 Taller de Estadística Aplicada
‹Nº›
 Taller de Estadística Aplicada
 
Tablas de contingencia
Tabla de contingencia o tabulación cruzada, es una tabla de dos dimensiones y cada dimensión contiene una variable cualitativa.
La prueba no paramétrica de Ji Cuadrada ( X2) se calcula en base a una tabla de contingencia.
Una Tabla de contingencia nos permiten describir dos o más variables-
‹Nº›
 Taller de Estadística Aplicada
 
Ejemplo
Una tabla de 2 x 2:
Una tabla de 2 x 3:
		Candidato A	Candidato B
	Masculino		
	Femenino		
		Norte	Sur
	Partido derechista	180	100
	Partido del centro	190	280
	Partido izquierdista	170	120
‹Nº›
 Taller de Estadística Aplicada
 
Descripción de Tablas de contingencia
Las tablas de contingencia son útiles para describir conjuntamente dos o más variables. Esto se efectúa convirtiendo las frecuencias observadas en frecuencias relativas o porcentajes. En una tabulación cruzada puede haber tres tipos de porcentajes respecto a cada celda:
Porcentaje en relación al total de frecuencias observadas(N).
Porcentaje en relación al total marginal de la columna.
Porcentaje en relación al total marginal de la fila.
‹Nº›
 Taller de Estadística Aplicada
 
Descripción de Tablas de contingencia - Ejemplo
En la siguiente tabla se tiene las frecuencias observadas.
		Candidato A	Candidato B	Total
	Masculino	25	40	65
	Femenino	25	10	35
	Total	50	50	100
‹Nº›
 Taller de Estadística Aplicada
 
Descripción de Tablas de contingencia - Ejemplo
En porcentajes por fila se tiene
		Candidato A	Candidato B	Total
	Masculino	25	40	65
	Femenino	25	10	35
		Candidato A	Candidato B	Total
	Masculino	38%	62%	100%
	Femenino	71%	29%	100%
‹Nº›
 Taller de Estadística Aplicada
 
Gráficos
En el gráfico se observa que un poco más de la tercera parte de los varones prefieren al candidato A mientras que más de las dos terceras partes de las mujeres prefieren al Candidato B…….
‹Nº›
 Taller de Estadística Aplicada
 
Gráfico de barras de comparación de preferencias según género
Masculino 	
Candidato A 	Candidato B 	0.38000000000000045	0.62000000000000077	Femenino 	
Candidato A 	Candidato B 	0.71000000000000063	0.29000000000000031	
¿CUÁLES SON LAS SUPOSICIONES DE LA ESTADÍSTICA NO PARAMÉTRICA?
Para realizar análisis no paramétricos, debe partirse de las siguientes consideraciones:
La mayoría de estos análisis no requieren de supuestos acerca de la forma de la distribución poblacional. Aceptan distribuciones no normales.
Las variables no necesariamente deben estar medidas en un nivel por intervalo o de razón, pueden analizar datos nominales u ordinales.
Si se quieren aplicar análisis no paramétrica a datos por intervalos o razón, éstos deben ser resumidos a categorías discretas (a unas cuantas). Las variables deben ser categorías.
 Taller de Estadística Aplicada
‹Nº›
 Taller de Estadística Aplicada
 
¿CUÁLES SON LOS MÉTODOS O PRUEBAS ESTADÍSTICAS NO PARAMÉTRICAS MÁS UTILIZADAS?
La Chi-cuadrada o Ji-Cuadrada o X2.
Los coeficientes de correlación e independencia 
para tabulaciones cruzadas.
Los coeficientes de correlación por rangos
ordenados de Spearman y Kendall.
Prueba de U de Mann Whitney
Pruebas W de Wilcoxon
Las Pruebas no paramétricas más utilizadas son:
 Taller de Estadística Aplicada
‹Nº›
 Taller de Estadística Aplicada
 
Distribución Ji-Cuadrada o Chi-cuadrada o X2?.
Es una prueba útil para variables categóricas y estadística, es aplicable cuando la variable nominal está compuesto por dos o más categorías. Tiene dos aplicaciones:
 La prueba de bondad de ajuste Chi-cuadrada.
 La prueba Chi-cuadrada de asociación.
Ambas pruebas se utilizan para determinar si las frecuencias observadas (O) en las categorías difieren significativamente de las frecuencias esperadas (E). 
 Taller de Estadística Aplicada
‹Nº›
 Taller de Estadística Aplicada
 
Es una prueba estadística para evaluar hipótesis acerca de la relación entre dos variables categóricas.
	Símbolo:	 X2
	Hipótesis a probar:	Correlaciones
	Variables involucradas:	Dos variables (la prueba Chi-cuadrada no considera relaciones causales).
	Nivel de medición de las variables	Nominal u ordinal (o intervalos o razón reducidas a ordinales)
	Procedimiento	La Chi-cuadrada se calcula por medio de una tabla de contingencia o tabulación cruzada, que es una tabla de dos dimensiones y cada dimensión contiene una variable. A su vez, cada variable se subdivide en dos o más categorías.
 Taller de Estadística Aplicada
‹Nº›
 Taller de Estadística Aplicada
 
CARACTERÍSTICAS
La Distribución X2 se lee con grados de libertad G.L = (Nº de filas - 1)(Nº de columnas - 1).
No tiene valores negativos. El valor mínimo es 0.
Todas las curvas son asimétricas
Cuando aumentan los grados de libertad las curvas son menos elevadas y más extendidas a la derecha.
Se utiliza para variables medidas en escala nominal u ordinal.
Las fórmulas son: 
 Taller de Estadística Aplicada
‹Nº›
 Taller de Estadística Aplicada
 
Ejemplo 1. Variable, categoría y tabla de contingencia 2x2:
 
Sean las variables SEXO (Masculino y Femenino) y CANDIDATO (“A” y “B”). La tabla de contingencia o tabulación cruzada es:
		 CANDIDATO
 “A” “B”	
	Masculino
SEXO
Femenino	20	30
		40	25
 Taller de Estadística Aplicada
‹Nº›
 Taller de Estadística Aplicada
 
Variable
Categoría
		 CANDIDATO
 “A” “B”	
	Masculino
SEXO
Femenino	20	30
		40	25
 Taller de Estadística Aplicada
‹Nº›
 Taller de Estadística Aplicada
 
Ejemplo 2. Estudio de Tabla de contingencia 3x2:
Se estudia a 1040 estudiantes de los niveles de educación primaria y secundaria y a los cuales se aplica un instrumento que mide el aprendizaje de la matemática, en las dimensiones de aprendizaje conceptual, procedimental y actitudinal.
Variables:
APRENDIZAJE 	 categorías: Conceptual, Procedimental, Actitudinal. NIVEL DE EDUCACIÓN categorías: Primaria, Secundaria.
		 NIVEL DE EDUCACIÓN		
			Primaria Secundaria 	
	APRENDIZAJE	Conceptual
 Procedimental
Actitudinal	180	100
			190	280
			170	120
TABLA DE CONTINGENCIA
 Taller de Estadística Aplicada
‹Nº›
 Taller de Estadística Aplicada
 
Tabla de frecuencias observadas (O):
		 NIVEL DE EDUCACIÓN				TOTAL
				Primaria Secundaria 		
	APRENDIZAJE	Conceptual
 Procedimental
Actitudinal		180	100	280
				190	280	470
				170	120	290
	 		TOTAL	540	500	1040
La Chi-cuadrada es una comparación entre las tablas de frecuencias observadas y la denominada tabla de frecuencias esperadas (la tabla que esperaríamos encontrar si las variables fueran estadísticamente independientes o no estuvieran relacionadas). 
 Taller de Estadística Aplicada
‹Nº›
 Taller de Estadística Aplicada
 
La frecuencia esperada de cada celda, casilla o recuadro, se calcula mediante la siguiente fórmula aplicada a la tabla de frecuencias observadas:
N = es el número total de frecuencias observadas. 
E = (marginal del reglón)(marginal de columna) / N.
		 NIVEL DE EDUCACIÓN			Marginal de filas
			 Primaria Secundaria 		
	APRENDIZAJE	Conceptual
 Procedimental
Actitudinal	(280)(540)/1040	(280)(500)/1040	280
			(470)(540)/1040	(470)( 500)/1040	470
			(290)(540)/1040	(290)(500)/1040	290
	marginal de columnas		540	500	1040
Tabla de frecuencias esperadas (E):
 Taller de Estadística Aplicada
‹Nº›
 Taller de Estadística Aplicada
 
Frecuencia observada:
		NIVEL DE EDUCACIÓN			TOTAL
			 Primaria Secundaria 		
	APRENDIZAJE	Conceptual
Procedimental
Actitudinal	145,4	134,6	280
			244,0	226,0	470
			150,6	139,4	290
	 TOTAL		540	500	1040
		NIVEL DE EDUCACIÓN			TOTAL
			Primaria secundaria 		
	APRENDIZAJEConceptual
Procedimental
Actitudinal	180	100	280
			190	280	470
			170	120	290
	TOTAL		540	500	1040
Frecuencia esperada:
Donde:
O: frecuencia observada
 en cada celda
E: frecuencia esperada 
 en cada celda 
 Taller de Estadística Aplicada
‹Nº›
 Taller de Estadística Aplicada
 
	Celda	O	E	O-E	(O-E)2	(O-E)2 / E
	Conceptual/Primaria	180	145,4	34,6	1197,16	8,23
	Procedimental/ Primaria	190	244,4	-54,4	2959,36	12,11
	Actitudinal / Primaria	170	150,6	19,4	376,36	2,50
	Conceptual / Secundaria	100	134,6	-34,6	1197,16	8,69
	Procedimental /Secundaria	280	226,0	54,0	2916,00	12,80
	Actitudinal / Secundaria	120	139,4	-19,4	376,36	2,70
					X2 =	47,33
Para saber si el valor de X2 es o no significativo, debemos calcular los grados de libertad.
G.L. = (Nº de filas - 1)(Nº de columnas - 1). 
 Taller de Estadística Aplicada
‹Nº›
 Taller de Estadística Aplicada
 
Para el ejemplo: Nº de filas = 1 y Nº de columnas = 2; entonces G.L. = (3-1)(2-1) = 2.
Luego, acudimos a la “tabla de distribución de Chi-cuadrado”, eligiendo nuestro nivel de confianza ( = 0,05 ó  = 0,01).
Si el valor obtenido de X2 es igual o superior al valor de la “tabla”, decimos que las variables están relacionadas o no son independientes.
Aplicación:
Para el nivel de confianza de =0,05 y g.l. = 2, el X2 de tabla es 5,9915 (ver tabla). 
		X2Obtenido = 47,33
X2Crítico = 5,9915
 Taller de Estadística Aplicada
‹Nº›
 Taller de Estadística Aplicada
 
 Taller de Estadística Aplicada
‹Nº›
 Taller de Estadística Aplicada
 
Prueba de hipótesis:
H0: 	No existe relación entre el aprendizaje y los 	niveles de educación.
H1: 	Existe relación entre el aprendizaje y niveles de 	educación.
X2obtenido  X2crítico entonces variables no son independientes; es decir existe una relación entre Aprendizaje y los niveles educativos
X2obtenido  X2crítico entonces se rechaza la hipótesis nula (H0), y por lo tanto se acepta la hipótesis alterna (H1).
 Taller de Estadística Aplicada
‹Nº›
 Taller de Estadística Aplicada
 
Establezca la Ho a ser probada; por ejemplo,
Ho: 1 = 2 = 0,5
Especifique el nivel de significancia α, por ejemplo: α = 0.5
Haga una tabla de frecuencias obtenidas
Deduzca las frecuencias esperadas a partir de Ho:
Calcule el grado de libertad: Producto de (categorías - 1)
Calcule el valor de X2 a partir de las frecuencias obtenidas y frecuencias esperadas.
Mediante la tabla de X2 obtenga el valor teórico.
Compara dichos valores.
Establezca la conclusión con respecto a Ho:
Retenga Ho si valor de tabla > Valor calculado.
Retenga Ho si valor de tabla < Valor calculado.
Paso Nº 1
Paso Nº 2
Paso Nº 3
Paso Nº 4
 Taller de Estadística Aplicada
‹Nº›
 Taller de Estadística Aplicada
 
Total de Fila x Total de Columna
F. Esperada=
Total General
(
)
E
E
O
X
å
-
=
2
2

Continuar navegando