Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Ayudantía Estadística I 1/75 Ejercicio 1 1. Clasifique los siguientes estudios según sean descriptivos o inferenciales, y a cuál modalidad corresponde. a) Se desea conocer los posibles liderazgos en un curso de 2 de enseñanza media. Para ese efecto se aplica un sociométrico, instrumento que permite, según respuestas a preguntas del tipo “¿con quién prefieres hacer un trabajo de investigación?”, establecer las personas que aglutinan a sus compañeros en torno a este tipo de actividad. Estudio Descriptivo. b) Se desea conocer la autoimagen de los niños que viven en internados de protección simple. Para tal efecto se obtiene una muestra de ellos, y se les aplica la Escala da Autoconcepto de Piers y Harris. Estudio Inferencial, tipo A. c) Se ha seleccionado un grupo de profesores que trabajan en colegios municipalizados de la comuna de Santiago. Interesa conocer si se relaciona el grado de participación que ellos han tenido con diferentes proyectos educativos y el rendimiento escolar, evaluado con una prueba estándar. Estudio Descriptiva. d) De acuerdo a estudios realizados en el año 2000 se encontró que el 40% de los niños de 17 años y menos habían presentado iniciación sexual en una población del área metropolitana. Al sacar una muestra de esa población en el año 2003 se encontró que un 45% de los niños de esas edades se han iniciado sexualmente, ¿Difiere este grupo de la población anterior? Estudio Inferencial, tipo B. e) Interesa estudiar si hay diferencias en la tolerancia al dolor en personas introvertidas versus extrovertidas. Se evalúa un grupo de 100 personas en esa dimensión de la personalidad, y se separa en 2 grupos (grupo de extrovertidos versus grupo de introvertidos). Se aplica el test de tolerancia al dolor, y se realiza la comparación entre ambos grupos. Estudio Inferencial, tipo C. 2. Diga a qué grupo de escala pertenecen las siguientes variables: a) Escolaridad (no lee ni escribe — básica incompleta — básica completa — media incompleta — media completa — técnica - universitaria). Ordinal b) Notas de enseñanza media. Intervalar c) Grado de neuroticismo. Ordinal d) Práctica de algún deporte (si - no). Nominal e) Clasificación de los sujetos según su nacionalidad. Nominal Ayudantía Estadística I 2/75 3. Diga en qué tipos de escala son admisibles las siguientes transformaciones de los valores X, sabiendo que X sólo puede admitir valores positivos. a) 2iT x= Nominal Ordinal Intervalar 4 3 16 9 3 2 9 4 1 7 1 5 − − = − − ≠ b) 2 i i xT = Nominal Ordinal Intervalar 3 2 3 2 1 2 1 2 4 3 2 3 2 1 1 1 1 1 − − = − − = = 4 3 2 1,5 3 2 1,5 1 1 0,5 1 0,5 1 1 − − = − − = = De Razón 3 2 4 2 3 4 4 3 3 = = 4 2 3 1,5 1,3 1,3 = = c) 5i iT x= − Nominal Ordinal Intervalar ( ) ( ) 1 23 2 4 3 2 3 1 1 1 1 1 1 − − −− = − − − − = = De Razón 4 1 3 2 1,3 0,5 − = − ≠ T 2x 1 1 2 4 3 9 4 16 T 2i x 1 0,5 2 1 3 1,5 4 2 T 5ix − 1 -4 2 -3 3 -2 4 -1 Ayudantía Estadística I 3/75 Ejercicio 2: Distribución de Frecuencias 1. Al evaluar a los alumnos de dos sextos básicos de un colegio, en la variable atención y concentración, se han encontrado los siguientes puntajes: 2. Elabore una distribución de frecuencias con intervalos de clase cuya amplitud de intervalo sea 3, en límites aparentes. 3. Transforme a límites reales. Ayudantía Estadística I 4/75 4. Construya un: a) polígono de frecuencias. b) un histograma. c) Un polígono de frecuencia acumulada. Ayudantía Estadística I 5/75 Ejercicio 3: Distribución de frecuencias y gráficos. 1. Se ha aplicado la prueba de autoconcepto de Pears y Harris a 50 niños. Se han obtenido los siguientes puntajes: a) Elabore la distribución de frecuencias con intervalos de clase cuya amplitud de intervalo sea 5 en límites aparentes. b) Transforme a límites reales. Ayudantía Estadística I 6/75 c) Construya el polígono de frecuencias. Ayudantía Estadística I 7/75 Ejercicio 4: Distribución de frecuencias y gráficos 1. Se ha aplicado la prueba de Wechsler a un grupo de estudiantes de cuarto medio de enseñanza media, obteniéndose los siguientes puntajes: a) Elabore una distribución de frecuencias con amplitud de intervalo 5. b) Construya el polígono de frecuencias c) Construya la curva de frecuencias relativas acumuladas Ayudantía Estadística I 8/75 Ayudantía Estadística I 9/75 Ejercicio 5: Distribución de frecuencias y medidas de tendencia central 1. Se ha medido el tiempo de reacción de 50 universitarios. Los valores han sido ordenados de menor a mayor. Construya el diagrama de tallo y hojas. 2. Con los datos del problema anterior, realice una distribución de frecuencia y calcule el modo y la mediana. Luego de la construcción de la tabla. Calculamos el Modo: (Lím.sup.abs Lím.inf.abs) 2 Mo += (0,110 0,115) 0,1125 2 Mo += = Ayudantía Estadística I 10/75 Y luego la Mediana: anterior2 inf erior absoluto N fac Md L i f ⎛ ⎞− ⎜ ⎟= + ⎜ ⎟ ⎝ ⎠ 50 1620,110 0,005 0,114 11 Md ⎛ ⎞− ⎜ ⎟= + ⋅ = ⎜ ⎟ ⎝ ⎠ El cálculo pude también hacerse con esta distribución, variando el i (distribución anterior i=0,05; en la distribución siguiente i=0,003). La mediana sería la misma, pero el Modo variaría levemente, en este caso Mo =0,1135. Ayudantía Estadística I 11/75 Ejercicio 6: Distribución de frecuencias y medidas de tendencia central 1. Un psicólogo clínico desea evaluar la flexibilidad cognitiva de un grupo de pacientes a quienes ha aplicado una terapia específica. Agrupa los datos en una tabla de frecuencias y decide calcular el modo, la mediana y el promedio. Calcule Ud. estos estadígrafos y refiérase a la forma de la distribución. Calculamos el Mo. (Lím.sup.abs Lím.inf.abs) 2 Mo += 33 36 34,5 2 Mo += = Calculamos la Md. anterior2 inf erior absoluto N fac Md L i f ⎛ ⎞− ⎜ ⎟= + ⎜ ⎟ ⎝ ⎠ 50 16230 3 32,7 10 Md ⎛ ⎞− ⎜ ⎟= + ⋅ = ⎜ ⎟ ⎝ ⎠ Ayudantía Estadística I 12/75 Calculamos el promedio. fx X N = ∑ 1584 31,68 50 X = = Finalmente gracias a los valores obtenidos, podemos decir que la distribución es asimétrica negativa, debido a la distribución de las medidas de tendencia central ( X Md Mo< < ), lo que quiere decir que la mayoría de los puntajes son bajos. Esta distribución tendría aproximadamente la siguiente forma: Ayudantía Estadística I 13/75 Ejercicio 7: Medidas de variabilidad 1. Se ha evaluado a un grupo de postulantes a la carrera de Educación de Párvulos, en la variable tendencia a la protección. Se ha realizado un agrupamiento de los datos en forma de tabla de frecuencias. a) Calcule el recorrido y el rango semi intercuartil Ambos son medidas que sólo podemos calcular con límites reales. Hacemos, entonces, la transformación. Recorrido (Límites reales) Lim.real.sup deladistribución -Lim.real.inf de la distribuciónW = 28,5 -2,5=27W = Rango semi-intercuartil (Límites reales) 3 1 2 Q QQ −= Calculamos entonces el 1Q y 3Q . 0 frecuencia acumulada anteriorMedida de orden Límite inferior intervalar frecuencia absoluta P N i−⎛ ⎞= + ⎜ ⎟ ⎝ ⎠ 1 13,5Q = Ayudantía Estadística I 14/75 El 1Q podríamos calcularlo, pero como la frecuencia acumulada es exactamente el valor del 0P N , entonces sabemos que el 1Q es igual al límite superior de ese intervalo. 3 0,75 100 63Q 19,5 3 21,9 15 ⋅ −⎛ ⎞= + ⋅ =⎜ ⎟ ⎝ ⎠ Finalmente calculamos el Q 3 1 2 Q QQ −= 21,9 13,5 4,2 2 Q −= = b) Construya la caja y bigotes con lainformación obtenida desde la tabla siguiente: Para construir la caja y bigotes necesitamos, además de los datos que tenemos, el valor de la mediana (o 2Q ). anterior2 inf erior absoluto 100 41216,5 3 17.73 22 N fac Md L i f Md ⎛ ⎞− ⎜ ⎟= + ⎜ ⎟ ⎝ ⎠ ⎛ ⎞− ⎜ ⎟= + ⋅ ⎜ ⎟ ⎝ ⎠ Y el Rango Intercuartil 3 1 21,9 13,5 8,4 RI Q Q RI = − = − = Ubicación de las observaciones atípicas ( ) ( ) . 1,5 . 1,5 8,4 . 12,6 Obs Atipica RI Obs Atipica Obs Atipica = ⋅ = ⋅ = 1 3 . 13,5 8,4 0,9 . 21,9 12,6 34,5 Q Obs Atipica Q Obs Atipica ← − = − = → + = + = Como el límite inferior es 1.5, no hay observaciones o casos atípicos ya que estos comienzan en el punto 0,9 (hacia la izquierda). Ayudantía Estadística I 15/75 Como el límite superior es 28.5, no hay observaciones o casos atípicos ya que estos comienzan en el punto 34,5 (hacia la derecha). Ubicación de las observaciones atípicas extremas ( ) ( ) . 3 . 3 8,4 . 25,2 Obs Atipica RI Obs Atipica Obs Atipica = ⋅ = ⋅ = 1 3 . . 13,5 25,2 11,7 . . 21,9 25,2 47,1 Q Obs Atipica Extrema Q Obs Atipica Extrema ← − = − = − → + = + = Lógicamente, tampoco se presentan observaciones atípicas extremas. Diagrama de caja y bigotes Ayudantía Estadística I 16/75 Ejercicio 8: Medidas de variabilidad. 1. Calcular el rango, el rango semi intercuartil y la desviación estándar de la siguiente distribución de puntajes: Rango 50 -1=49W = Rango semi intercuartil 3 1 2 Q QQ −= 0 frecuencia acumulada anteriorMedida de orden Límite inferior intervalar frecuencia absoluta P N i−⎛ ⎞= + ⎜ ⎟ ⎝ ⎠ 1 0, 25 70 1015 7 20, 25 10 Q ⋅ −⎛ ⎞= + ⋅ =⎜ ⎟ ⎝ ⎠ 1 13,5Q = 3 0,75 70 47Q 36 7 38,14 18 ⋅ −⎛ ⎞= + ⋅ =⎜ ⎟ ⎝ ⎠ 3 1 2 Q QQ −= 38,14 20,25 8,945 2 Q −= = Ayudantía Estadística I 17/75 Desviación Standard ' ' ' 33 0,47 70 ofxX N X = = = ∑ '2 '2' ' 2 197 0, 47 1,61 70 ifxS X N S = − = − = ∑ ' 1,61 7 11,27 S S i S = ⋅ = ⋅ = 2. Agregando la mediana y el promedio interprete los resultados. Refiérase a la forma de la distribución. Mediana anterior2 inf erior absoluto 70 32229 7 30,4 15 N fac Md L i f Md ⎛ ⎞− ⎜ ⎟= + ⎜ ⎟ ⎝ ⎠ ⎛ ⎞− ⎜ ⎟= + ⋅ = ⎜ ⎟ ⎝ ⎠ Promedio ' pto.medio del intervalo central 0,47 7 25,5 28,79 X X i X = ⋅ + = ⋅ + = Finalmente gracias a los valores obtenidos, podemos decir que la distribución es asimétrica negativa, debido a la distribución de las medidas de tendencia central ( X Md Mo< < ), lo que quiere decir que la mayoría de los puntajes son bajos. Esta distribución tendría aproximadamente la siguiente forma: Ayudantía Estadística I 18/75 Ejercicio 9: Promedio y desviación estándar 1. Se ha controlado el peso a un grupo de personas, previo a iniciar un tratamiento para la obesidad. Los datos se presentan en la tabla siguiente: a) Calcule el promedio y la desviación estándar utilizando el método abreviado Promedio ' ' ' 45 0,818 55 ofxX N X = − = = − ∑ ' pto.medio del intervalo central 0,818 5 97,5 93,41 X X i X = ⋅ + = − ⋅ + = Desviación Standard ( ) '2 '2' 2' 259 0,818 2,01 55 ifxS X N S = − = − − = ∑ ' 2,01 5 10,05 S S i S = ⋅ = ⋅ = Ayudantía Estadística I 19/75 b) Responda qué ocurriría con estas medidas (promedio y desviación) si todas las personas pesaran 5 kilos más. De ser así, la desviación Standard se mantendría constantes y el promedio aumentaría en 5 unidades, quedando en: 98,41X = Ayudantía Estadística I 20/75 Ejercicio 10: Medidas de posición 1. En un colegio, se ha evaluado a los cuartos básicos, en sus conocimientos de Historia de Chile, con el objeto de seleccionar representantes para asistir a un concurso de conocimientos que será televisado a todo el país. Los puntajes obtenidos por los alumnos se presentan en la tabla de frecuencias siguiente: a) Se ha decidido enviar a 7 representantes del colegio. Indique cuál es el puntaje de corte. 0 frecuencia acumulada anteriorMedida de orden Límite inferior intervalar frecuencia absoluta P N i−⎛ ⎞= + ⎜ ⎟ ⎝ ⎠ 0,95 140 13190 10 9 92, 2 x x P P ⋅ −⎛ ⎞= + ⋅⎜ ⎟ ⎝ ⎠ = El puntaje de corte es 92,2. b) Si un alumno obtuvo 65 puntos, ¿en qué percentil se encuentra? 0 frecuencia acumulada anteriorMedida de orden Límite inferior intervalar frecuencia absoluta P N i−⎛ ⎞= + ⎜ ⎟ ⎝ ⎠ Ayudantía Estadística I 21/75 0 0 140 6765 60 10 30 0,5857 0,59 0,59 100 59 P P Percentil ⋅ −⎛ ⎞= + ⋅⎜ ⎟ ⎝ ⎠ = ≈ = ⋅ = Se encuentra en el percentil 59 ( 59P ), esto quiere decir, que deja por debajo el 59% de los casos. Ayudantía Estadística I 22/75 Ejercicio 11: Distribución Normal 1. ¿Qué porcentaje de casos está comprendido entre z= +1 y z= -1? Primero debemos saber el área por la cual nos están preguntando: Luego, debemos saber cómo calcular el área total. Esto lo hacemos sumando las áreas individuales. Entonces, buscamos las áreas en la tabla “Standard normal distribución”; Finalmente el área total es igual a: Ayudantía Estadística I 23/75 2. ¿A qué valor Z le corresponde el P50? El percentil 50 corresponde al valor z = 0. 3. ¿Cuál es el valor que corresponde a un sujeto que obtuvo 60 puntos en un test de psicomotricidad fina, si el promedio del grupo fue de 100 puntos y la desviación de 30? ¿Cuál es el porcentaje de casos que quedaron bajo él? Lo que tenemos que calcular es el valor z , que corresponde al puntaje X(puntaje bruto) dado. 60 100 1,3 30 x xz s z − = − = = − Para saber que porcentaje queda por debajo del valor z = -1,3, debemos calcular esta área: Para esto buscamos en la tabla Finalmente deja por debajo el 40,32% de casos. Ayudantía Estadística I 24/75 4. ¿Cuántos casos obtuvieron nota inferior al 4.0 en una prueba de literatura para estudiantes de 3º medio si el promedio del grupo fue la nota 5.0 y S= 0,6? El grupo evaluado constó de 120 estudiantes. Tenemos que buscar el valor z que corresponde al valor x que nos están dando. 4,0 5,0 1,667 0,6 x xz s z − = − = = − Luego buscamos el área que deja por debajo este valor, en la tabla z. Finalmente, calculamos el número de alumnos que corresponde al porcentaje del área que calculamos, sabiendo que la cantidad total de alumnos corresponde a 120. 100% 120 45, 25% x → → 54,3x = Finalmente 54 (debemos siempre aproximar, cuando se trata de personas) alumnos tuvieron una nota inferior a 4,0. 5. Un psicólogo clínico desea realizar un taller de expresión de emociones para adolescentes que presentan inhibición social. Después de aplicar una prueba de habilidades sociales a un grupo de 60 adolescentes, determina que elegirá al 25% de aquellos que han rendido con los puntajes más bajos de la prueba. Dada la siguiente distribución de puntajes, ¿hasta qué puntaje pudiesen obtener los jóvenes para quedar incluidos en el taller? Ayudantía Estadística I 25/75 Primero debemos saber a que cantidad de casos corresponde el 25% del grupo de adolescentes, luego: 0,25 60 15⋅ = Luego, debemos saber a que intervalo corresponde. Para esto calculamos las fac. En este caso lo encontraremos en el tercer intervalo (15 — 20). Debemos entender que estamos buscando un puntaje x, que deja el 25% de los casos por debajo de él. 0 frecuencia acumulada anteriorMedida de orden Límite inferior intervalar frecuencia absoluta P N i−⎛ ⎞= + ⎜ ⎟ ⎝ ⎠ 0, 25 60 1315 5 12 0, 25 60 1315 5 12 15,8 x x x P P P ⋅ −⎛ ⎞= + ⋅⎜ ⎟ ⎝ ⎠ ⋅ −⎛ ⎞= + ⋅⎜ ⎟ ⎝ ⎠ = 6. Si los puntajes se hubiesen distribuido normalmente ¿Qué valordejaría al 25% bajo él? Primero debemos saber que área debajo de la curva corresponde al 25% más bajo de esta. Esto lo sabemos, ya que la mitad del área corresponde a 0,5 y un cuarto a 0,25. Ayudantía Estadística I 26/75 Ahora, vamos a la tabla y buscamos este valor en la parte central de esta. Aun que sabemos que encontraremos un valor positivo, debemos tener claro, que este valor es negativo ya que queda al lado izquierdo de la curva. Luego necesitamos calcular el promedio y la desviación estándar de la distribución. Promedio ' ' ' 12 0,2 60 ofxX N X = − = = − ∑ ' pto.medio del intervalo central 0,2 5 22,5 21,5 X X i X = ⋅ + = − ⋅ + = Desviación Standard ( ) '2 '2' 2' 142 0, 2 1,5253 60 ifxS X N S = − = − − = ∑ ' 1,5253 5 7,6267 S S i S = ⋅ = ⋅ = Finalmente, calculamos el puntaje x que deja por debajo el 25% del área bajo la curva, a través de la fórmula de z. 21,50,67 7,6267 16,39 x xz s x x − = − − = = Si esta distribución fuera normal, el puntaje 16,39 dejaría por debajo el 25% de los casos. Ayudantía Estadística I 27/75 Ejercicio 12: Distribución Normal 1. Determine qué % de área queda comprendido entre z = -1,5 y z = 1,5. Primero debemos saber el área por la cual nos están preguntando: Luego, debemos saber cómo calcular el área total. Esto lo hacemos sumando las áreas individuales. Entonces, buscamos las áreas en la tabla “Standard normal distribución”; Finalmente el área total es igual a: Ayudantía Estadística I 28/75 Como sabemos que el área total debajo de la curva es igual a 1, podemos calcular a que porcentaje corresponde 0,8664. Esto es el 86,64% del área bajo la curva. 2. Determine el % de área que queda comprendido entre z = 1,2 y 2,2. Primero debemos saber el área por la cual nos están preguntando: Luego, debemos saber cómo calcular el área total. Esto lo hacemos restándole al área mayor (a1) el área menor (a2): Entonces, buscamos las áreas a1 y a2 en la tabla “Standard normal distribución”; Finalmente, calculamos el área total restando los valores obtenidos: Ayudantía Estadística I 29/75 Como sabemos que el área total debajo de la curva es igual a 1, podemos calcular a que porcentaje corresponde 0,1012. Esto es el 10,12% del área bajo la curva. 3. Calcule el P20 de una distribución normal cuyo promedio es 32 y S = 10. Percentil 20 significa que es el puntaje que deja por debajo el 20% del área bajo la curva. Luego, podemos calcular el puntaje z que corresponde a este punto. Hay que recordar que el valor que estamos buscando pertenece al área total de la mitad de la curva, menos el valor de la cola izquierda. Buscamos en la tabla z, el valor 0,3 en la parte central de las áreas. Ayudantía Estadística I 30/75 Y luego, a través de la fórmula z, el valor de x. 320,84 10 23,6 x xz s x x − = − − = = Finalmente el percentil 20, es decir, el puntaje x que deja por debajo el 20% de los casos, es igual a 23,6. 4. Calcule el puntaje que corresponde a una persona cuyo z = - 0,3 siendo el promedio igual a 100 y la desviación estándar igual a 30. A través de la fórmula z: 1000,3 30 91 x xz s x x − = − − = = El puntaje e una persona, cuyo puntaje z es igual a -0,3 es 91 puntos. 5. Determine cuántas personas quedan por debajo del puntaje 300 en una distribución normal cuyo promedio fue de 200 puntos y desviación estándar =70. El N del grupo fue de 500 personas. Calcule además, la probabilidad que existe de que al sacar un sujeto al azar de este grupo, obtenga sobre 300 puntos. Debemos calcular el área que esta bajo el puntaje x=300. Para esto calculamos el puntaje z al que pertenece el puntaje x=300. 1,43 x xz s x − = = Ayudantía Estadística I 31/75 Calculamos el área que queda bajo la curva, sabiendo que por lo menos el valor del área de la mita de la curva, es 0,5 Calculamos el área que nos falta Sumamos las áreas Sabemos que el área bajo la curva es igual a 0,9236, lo que implica que hay un 92,36% de personas que tienen un puntaje inferior a 300 puntos. Luego, como sabemos que el 100% son 500 personas, calculamos a que corresponde el porcentaje calculado: 100% 500 92,36% x → → 461,8x = Finalmente, encontramos que hay 462 personas que han obtenido menos de 300 puntos. Por otro lado, la probabilidad que al sacar un sujeto al azar del complemento de este grupo, y que este obtenga sobre 300 puntos, es igual a la probabilidad total (1)menos la probabilidad total, menos la probabilidad de que un sujeto obtenga bajo 300 puntos(0,9236), es decir, 1 0,9236 0,0764− = . Ayudantía Estadística I 32/75 Ejercicio 13: Distribución Normal 1. Calcular el área comprendida entre un z = -1,8 y un z = 1,5 en la curva normal. Primero debemos saber el área por la cual nos están preguntando: Luego, debemos saber cómo calcular el área total. Esto lo hacemos sumando las áreas individuales a1 y a2. Entonces, buscamos las áreas a1 y a2 en la tabla “Standard normal distribución”; Finalmente el área total es igual a: Ayudantía Estadística I 33/75 2. Calcule la proporción de casos que hay entre un z = 1,5 y un z = 2,0 en la curva normal. Primero debemos saber el área por la cual nos están preguntando: Luego, debemos saber cómo calcular el área total. Esto lo hacemos restándole al área mayor (a1) el área menor (a2): Entonces, buscamos las áreas a1 y a2 en la tabla “Standard normal distribución”; Finalmente, calculamos el área total restando los valores obtenidos: Ayudantía Estadística I 34/75 3. En una clínica se ha evaluado con un instrumento para medir stress, el grado de tensión que genera a las personas exponerse a operaciones de cirugía plástica. Se ha logrado evaluar 120 pacientes en un año, encontrándose que el puntaje promedio fue de 35 puntos y la desviación Standard de 10 puntos. Si la distribución de puntajes se ajustó a una curva normal, calcule: a) El número de personas que obtuvieron por sobre 40 puntos. Nos dicen que el total del área bajo la curva corresponde a una muestra de 120 personas, es decir, que el 100% del área bajo la curva corresponde a 120 personas. Calculamos el puntaje z correspondiente a los 40 puntos x xz s − = 40 35 0,5 10 z −= = Entonces tenemos que: Calculamos el área que queda por sobre el puntaje z = 0,5. Esto lo hacemos restando al a1 (área total de la mitad de la curva = 0,5) el a2. Ahora tenemos que saber que el área 0,3085, implica que debajo de este parte de la curva hay un 30,85% del total del área bajo la curva. Inicialmente dijimos que el 100% de la curva corresponde a 120 personas, luego, nos vasta con preguntarnos que cantidad de personas corresponden al 30,85% del área. 100% 120 30,85% x → → 120 30,85 37,02 100 x ⋅= = Ayudantía Estadística I 35/75 Podemos concluir que hay 37 personas que han obtenido por sobre los 40 puntos. b) El puntaje de corte del 25% que puntuó más bajo. Hay que tener presente que nos preguntan por un puntaje bruto o x, y que nos dicen que este puntaje deja por debajo de él el 25% de los casos, es decir, un área de 0,25. Buscamos el área 0,5 en la tabla “Standard normal distribución”, en la parte central, es decir, en la parte de las áreas. No hay que olvidar que aunque este valor es positivo en la tabla (debido al tipo de tabla que estamos utilizando), en realidad es un valor negativo por encontrarse a la izquierda de la curva. 0,25 0,67área z= → = − Finalmente, calculamos el valor x (bruto) correspondiente a este valor z,que acabamos de calcular. 350,67 10 x − − = 28,3x = El puntaje de corte del 25% más bajo es 28,3. Ayudantía Estadística I 36/75 c) Si de este grupo se eligiese una persona al azar, ¿Cuál sería la probabilidad de que puntúe entre 40 y 50 puntos? Primero, debemos saber que la probabilidad de un evento, es igual al área bajo la curva. Luego, esto es lo que debemos calcular, el área que existe entre los puntajes brutos o x 40 y 50. Calculamos los puntajes z, que corresponden a los puntajes x 40 y 50. x xz s − = 40 40 35 0,5 10 z −= = 50 50 35 1,5 10 z −= = Finalmente calculamos el área bajo la curva La probabilidad de elegir al azar una persona de este grupo es de 0,2417. Ayudantía Estadística I 37/75 Ejercicio 14: Transformaciones de puntajes a escala z 1. Un psicólogo a cago de Un psicólogo a cargo de la selección de personal de una empresa debe elegir a un Ingeniero Comercial para el cargo de Jefe Administrativo del departamento de adquisiciones de la empresa. Han postulado 50 personas, pero él ha dejado a los 3 que presentaron mejores puntajes en las pruebas aplicadas. Los resultados han sido los siguientes: ¿A cuál de los 3 elegiría? Debemos calcular los puntajes z, de cada uno de los tres sujetos, en cada una de las cuatro pruebas aplicadas. Luego calculamos el promedio total de cada uno de los sujetos. Elegimos el que tiene mayor promedio. Es decir, el Sujeto 1. Ayudantía Estadística I 38/75 Ejercicio 15: Transformación de puntajes a escala z y t 1. Se desea seleccionar un vendedor de artículos médicos. Se llama a concurso y se eligen 2 posibles candidatos frente a los cuales hay que tomar una decisión. Los puntajes obtenidos por ellos son los siguientes: ¿Cuál elegiría? Debemos calcular los puntajes z, de cada uno de los dos candidatos, en cada una de las tres pruebas aplicadas. Luego calculamos el promedio total de cada uno de los candidatos. Elegimos el que tiene mayor promedio. Es decir, el Candidato A. Ayudantía Estadística I 39/75 2. A un grupo de pobladores damnificados por un sismo se les ha aplicado una escala de depresión encontrándose la siguiente distribución: Hay que preocuparse de que los intervalos estén en límites reales, si no es el caso, se debe hacer la transformación. En este caso, la transformación no es necesaria. Calculamos la columna fac. Calculamos la columna Pac. Para esto dividimos cada puntaje de la columna fac, por el N (total frecuencia). Cuando los valores de esta columna dejen de ser menores y comiencen a ser mayores que 0,5, se trazará una “línea de corte” (línea imaginaria, si se quiere) en entre estos intervalos. Calculamos la columna de las áreas. Esto se hace restando a 0,5 el valor de cada puntaje de la columna Pac, hasta la línea de corte. Pasada la línea de corte los valores se calcularán restando a los valores de la columna Pac el valor 0,5. En esta columna el valor inicial y final será 0,5, y los valores serán siempre positivos. Los valores de esta columna se aproximarán a 4 decimales. Los valores de esta columna se aproximarán a 4 decimales. Se calcularan los valores de los límites z, mirando en la parte central de la tabla z, los valores correspondientes a la columna de las áreas. Estos valores corresponderán al límite superior del intervalo z, y se completarán con el límite inferior de acuerdo a la norma de los límites reales. Por convención el primer intervalo comenzará desde el -5 y último intervalo finalizará en 5. Los valores que se encuentran antes de la línea de corte serán negativos (por corresponder al lado izquierdo de la curva normal), y los siguientes, positivos (por corresponder al lado derecho de la curva normal). Los valores de esta columna se aproximarán a 2 decimales. Finalmente a través de la fórmula 10 50t z= ⋅ + , calculamos la columna final (t). Esta columna debe empezar en 0 y terminar en 100. Los valores de esta columna serán enteros. Ayudantía Estadística I 40/75 Ejercicio 16: Transformación de puntajes a escala z y t 1. Se está concursando el cargo de Educadora de Párvulos y se ha decidido aplicar instrumentos para medir las variables estabilidad emocional, autoconcepto y asertividad. Se presentaron 60 candidatas, pero se eligieron 2 que obtuvieron los más altos puntajes en los instrumentos ¿A cuál de ellas elegiría para el cargo? ¿Cuál elegiría? Debemos calcular los puntajes z, de cada uno de las dos postulantes, en cada una de las tres pruebas aplicadas. Luego calculamos el promedio total de cada uno de las postulantes. Elegimos la que tiene mayor promedio. Es decir, la postulante A. 2. Transforme la siguiente distribución de puntajes a puntajes T El procedimiento es el mismo que en el ejercicio 15-2. Ayudantía Estadística I 41/75 Ejercicio 17: Puntajes T y Prueba de la Bondad del Ajuste 1. Transforme a puntajes T los límites de los intervalos de la siguiente distribución de puntajes: El procedimiento es el mismo que en el ejercicio 15-2. 2. Analice si la distribución anterior es una distribución normal de puntajes. Primero, debemos verificar que los intervalos estén en límites reales. Calculamos el promedio mediante el método abreviado. Para esto construimos las columnas x’, fx’, y fx’². ' ' ofxX N = ∑ ' 29 0,386 0,4 75 X −= = − ≈ − ' pto.medio del intervalo centralX X i= ⋅ + 0,386 3 18,5=17,342X = − ⋅ + Calculamos la desviación estándar mediante el método abreviado. '2 '2' ifxS X N = −∑ ' 2383 0, 4 2, 23 75 S = − = 'S S i= ⋅ 2,23 3 6,69S = ⋅ = Ayudantía Estadística I 42/75 Con el promedio y la desviación estándar, calculamos la columna de los puntajes z. Calculamos la columna áreas, buscando los puntajes z en la tabla z. Calculamos la columna f. Esto lo hacemos dependiendo del lado de la curva que nos encontremos, si nos encontramos al lado izquierdo de la curva, los valores de esta columna corresponden a la resta del área del límite superior con el área del límite inferior de cada intervalo. Si encontramos que el límite inferior y el límite superior están en distintos lados de la curva, entonces procedemos a sumar las áreas, y finalmente, si nos encontramos en el lado derecho de la curva, restamos el límite superior del inferior. Calculamos la columna ft, multiplicando cada valor de la columna f, por el valor total de la suma de frecuencias. La fórmula es la siguiente. ft f N= ⋅ Tenemos que calcular 2χ según la fórmula: ( )2 o t t f f f χ − =∑ Para esto, calculamos la columna 2absχ sustrayendo a cada valor de la columna ft, la frecuencia absoluta observada en ese intervalo, elevando al cuadrado y dividiendo este resultado por el valor ft. La fórmula es la siguiente: ( )2t2 absoluta del intervalo abs t f f f χ − = Y calculamos 2obsχ (chi-cuadrado observado) sumando el total de la columna 2absχ . Ahora tenemos que calcular el 2tχ (chi-cuadrado teórico). Para esto, tenemos que calcular los grado de libertad ( 3gl K= − ), y buscar el 2tχ en la tabla IX chi-cuadrado con gl grados de libertad y con un nivel de confianza del 0,05, a menos que se le indique otra cosa. 10 3 7gl = − = 2 14,06tχ = Una vez que tenemos el 2obsχ y el 2 tχ , tenemos que compararlos. Solamente si 2 2obs tχ χ< entonces podemos decir que la distribución tiene la forma de curva normal o bien que se distribuye normalmente. Ayudantía Estadística I 43/75 Como vemos, el 2obsχ es igual a 4,34. Como el 2obsχ es menor que el 2 tχ , la distribución muestral se ajusta a la curva normal. Resumen final de los resultados: Ayudantía Estadística I44/75 Ejercicio 18: Prueba de la Bondad del Ajuste 1. Verifique si la siguiente distribución es una distribución normal de puntajes. Primero, debemos verificar que los intervalos estén en límites reales. Calculamos el promedio mediante el método abreviado. Para esto construimos las columnas x’, fx’, y fx’². ' ' ofxX N = ∑ ' 26 0,48 54 X −= = − ' pto.medio del intervalo centralX X i= ⋅ + 0,48 4 34=32,08X = − ⋅ + Calculamos la desviación estándar mediante el método abreviado. '2 '2' ifxS X N = −∑ ' 2230 0, 48 2,007 54 S = − = 'S S i= ⋅ 2,007 4 8,028S = ⋅ = Finalmente, con los datos que tenemos, utilizamos la misma técnica que en el ejercicio 17 y construimos la tabla. Ayudantía Estadística I 45/75 Como vemos, obtenemos un 2obsχ = 39,635. Calculamos los grados de libertad y buscamos en la tabla correspondiente el 2 tχ 3 7 3 4 gl K gl = − = − = 2 9, 488tχ = Como el 2obsχ es mayor que el 2 tχ , la distribución muestral no se ajusta a la curva normal. Resumen final de los resultados: Ayudantía Estadística I 46/75 EJERCICIO Nº 19: Normalización 1. Normalice la siguiente distribución de puntajes: Calculamos el promedio mediante el método abreviado. Para esto construimos las columnas x’, fx’, y fx’². ' ' ' 75 0,708 106 ofxX N X = = = ∑ ' pto.medio del intervalo central 0,708 5 37,5=41,04 X X i X = ⋅ + = ⋅ + Calculamos la desviación estándar mediante el método abreviado. '2 '2' ' 2459 0,708 1,957 106 ifxS X N S = − = − = ∑ ' 1,957 5 9,78 S S i S = ⋅ = ⋅ = Calculamos la columna Pfac. Calculamos la columna áreas a partir de la columna Pfac. Cuando los valores del intervalo se encuentren al lado izquierdo de la curva, los valores de la columna área será, igual a 0,5 menos el valor Pfac. Mientras que si los valores del intervalo se encuentran al lado derecho de la curva, los valores Ayudantía Estadística I 47/75 de la columna área se calcularan como el valor de la columna Pfac menos 0,5. Los valores de la columna área son buscados en la parte central de la tabla D y constituyen los intervalos de la columna z. Finalmente calculamos los intervalos X’’ (x dos prima) despejando los valores a partir de la fórmula z, mediante el promedio y la desviación estándar calculados previamente. ''X z S X= ⋅ + Resumen de datos: Ayudantía Estadística I 48/75 EJERCICIO Nº 20: Correlación Un profesor de Estadística desea saber si existe correlación entre las notas de las pruebas solemnes que ha aplicado durante el semestre. Para ello decide calcular un coeficiente de correlación ¿Qué coeficiente aplica? Calcule e interprete el resultado. Utilizaremos el coeficiente de correlación de Pearson. Para la creación de la tabla, colocamos la variable Y en el eje horizontal, y la variable X en el eje vertical. Creamos la columna fx sumando las frecuencias verticalmente. Y la columna fy sumando las frecuencias horizontalmente. Creamos la columna x ‘ e y ‘ determinando un intervalo central, e incrementando una unidad hacia arriba y disminuyéndola hacia abajo. Creamos la columna fx ’ multiplicando la columna f por la x ’. Del mismo modo calculamos la columna fy ‘. Calculamos la columna fy ‘². Multiplicando la columna fx ’ por x ’. Del mismo modo calculamos la columna fy ‘². Calculamos la columna de frecuencias secundarias, ubicada al lado de la columna de frecuencias inicial. Esto lo hacemos multiplicando para cada casillero y ‘ por x ‘ por la frecuencia del casillero. Calculamos la columna fx ’y ‘ sumando verticalmente la columna de frecuencias secundarias. Del mismo modo calculamos la columna, solo que sumamos las frecuencias horizontalmente. Una vez construida la tabla calculamos Ayudantía Estadística I 49/75 Calculamos: 'X , 'Y , 'xS , 'yS . 86' 1,43 60 X = = 48' 0,8 60 Y = = ( )2218' 1, 43 1, 26 60x S = − = ( )2130' 0,8 1, 236 60y S = − = Ayudantía Estadística I 50/75 Podemos también calcular los promedios y desviaciones, pero para la fórmula que utilizaremos, esto no es necesario. 86' 1,43 60 X = = 48' 0,8 60 Y = = ( )2218' 1, 43 1, 26 60x S = − = ( )2130' 0,8 1, 236 60y S = − = Calculamos xyr ( ) ' '' ' ' ' 104 60 1, 43 0,8 60 1, 26 1, 236 0,38 xy xy xy fx y N X Y r NSx Sy r r − = − ⋅ ⋅ = ⋅ ⋅ = ∑ Podemos decir, que hay una correlación es moderada directa entre la variable x e y. Calculamos 2xyr . 2 20,38 0,14xyr = = Podemos decir que el 14% de la varianza de la variable X1 queda explicado por la varianza de la variable X2, y que el 14% de la varianza de la variable X2 queda explicado por la varianza de la variable X1. Ayudantía Estadística I 51/75 EJERCICIO Nº 21: Correlación 1. Un psicólogo laboral desea saber si existe asociación entre desempeño laboral e inteligencia para el cargo de operario (etiquetando cajones de fruta de exportación). Evalúa a un grupo de operarios y obtiene los siguientes resultados: a) Calcule el coeficiente de correlación Calculamos la columna total ft, sumando las frecuencias de las columnas p y q. Creamos la columna x ‘. Calculamos la columna fpx ‘ multiplicando la columna p por la columna x ‘. Calculamos la columna ftx ‘ multiplicando la columna total fr por la columna x ‘. Finalmente calculamos la columna ftx ‘². A partir de estos datos calculamos: 'pX , pX , 'tX , tX , 'tS . Calculamos 'pX , pX , 'tX , tX , 'tS y tS . 27' 0,844 32 pX − = = − 0,844 10 95 86,56pX = ⋅ + = 14' 0,259 54 tX − = = − 0,258 10 95 92,41tX = − ⋅ + = ( )2106' 0, 259 1,377 54t S = − − = ' 1,377 10 13,77tS = ⋅ = Ayudantía Estadística I 52/75 Calculamos P 32 0,59 54 Npp Nt = = = Con el valor de P, buscamos en la tabla el “y” correspondiente. 0,3888y = Reemplazamos en la fórmula p t t X X prb S y − = ⋅ y calculamos. 86,56 92,41 0,59 0,64 13,77 0,3888 rb −= ⋅ = − b) Interprete el resultado Hay una correlación alta e inversa entre el desempeño laboral y la inteligencia. Calculamos 2xyr . 2 20,64 0, 41xyr = − = Podemos decir que el 41% de la varianza de la variable desempeño laboral queda explicado por la varianza de la variable inteligencia, y que el 14% de la varianza de la variable inteligencia queda explicado por la varianza de la variable desempeño laboral. Ayudantía Estadística I 53/75 EJERCICIO Nº 22: Correlación 1. Un profesor básico desea saber si existe relación entre interés por la lectura y la ortografía. Para este fin aplica a os alumnos de 6º año básico un test que mide interés por la lectura y una prueba de ortografía. Luego clasifica a los alumnos en dos grupos en cada variable, resultando loa siguiente tabla de doble entrada: a) Nota: ambas variables se distribuyen normalmente. Calcule e interprete. Los valores totales son calculados como sumas horizontales y verticales. La casilla inferior derecha es la suma de los totales tanto verticales como horizontales. Los valores en la esquina de los casilleros centrales son los ft y son calculados de la siguiente manera: 95 92(64) 45,28 193 ft ⋅= = 98 92(28) 46,72 193 ft ⋅= = 101 95(31) 45,28 193 ft ⋅= = 101 98(70) 51,28 193 ft ⋅= = Calculamos 2χ , de acuerdo con la fórmula, de la siguiente manera: ( ) ( ) ( ) ( ) ( ) ( )2 2 2 2 2 22 2 2 8 19,65 6 16,38 64 45,28 98 46,72 31 45,28 70 51,28 19,65 16,38 45,28 46,72 45,28 51,28 7,7394 7,5008 7,0482 46,8338 29,1222 o o o χ χ χ − − − − − − = + + + + + = + + + = Calculamos C 2 2 29,1222 0,36 29,1222 193 C N C χ χ = + = = + Hayuna relación baja y directa entre las variables lectura y ortografía. Ayudantía Estadística I 54/75 Calculamos 2tχ , para esto calculamos los grados de libertad. ( )( ) 2 2 ;0,05 2 1 2 1 1 3,841t gl gl χ = − − = = Como 2 2o tχ χ> , podemos decir que la correlación es significativa al 0,05%, esto implica que los datos en la tabla no son producto del azar. Existe una correlación débil y directa entre la ortografía y el interés en la lectura. Esta correlación es significativa, lo que quiere decir que es distinta de 0. Ayudantía Estadística I 55/75 EJERCICIO Nº 23: Correlación 1. Un estudiante de Psicología desea saber si el estado de ánimo depresivo se asocia al autoconcepto. Evalúa ambas variables con los instrumentos correspondientes y luego dicotomiza la variable autoconcepto. A continuación confecciona la siguiente tabla, para el cálculo del coeficiente de correlación. a) ¿Qué coeficiente de correlación utiliza? Calculamos la columna total ft, sumando las frecuencias de las columnas p y q. Creamos la columna x ‘. Calculamos la columna fpx ‘ multiplicando la columna p por la columna x ‘. Calculamos la columna ftx ‘ multiplicando la columna total fr por la columna x ‘. Finalmente calculamos la columna ftx ‘². A partir de estos datos calculamos: 'pX , pX , 'tX , tX , 'tS . Calculamos 'pX , pX , 'tX , tX , 'tS y tS . 77' 1,2031 64 pX − = = − 1,2031 10 44,5 32,469pX = − ⋅ + = 6' 0,0469 128 tX − = = − 0,0468 10 44,5 44,0313tX = − ⋅ + = ( )2586' 0,0469 2,1391 128t S = − − = 2,1391 10 21,391tS = ⋅ = Ayudantía Estadística I 56/75 Calculamos P 64 0,5 128 Npp Nt = = = Con el valor de P, buscamos en la tabla el “y” correspondiente. 0,3989y = Reemplazamos en la fórmula p t t X X prb S y − = ⋅ y calculamos. 32,469 44,0313 0,5 0,68 21,391 0,3959 rb −= ⋅ = − b) ¿Cómo interpreta el resultado? La correlación entre estado de ánimo depresivo y autoconcepto es alta e inversa. Calculamos 2xyr . 2 20,68 0, 46xyr = − = Podemos decir que el 46% de la varianza de la variable depresión queda explicado por la varianza de la variable autoconcepto, y que el 14% de la varianza de la variable autoconcepto queda explicado por la varianza de la variable depresión. Ayudantía Estadística I 57/75 EJERCICIO Nº 24: Correlación 1. Un profesor de Educación Media desea saber si existe correlación entre las notas de Enseñanza media y los resultados a la Prueba de Aptitud Académica. Dicotomiza ambas variables y recoge la información de los alumnos egresados de 10 Colegios a los cuales ha tenido acceso. X=Puntajes en PAA. Y = NEM. a) Calcule el coeficiente de correlación correspondiente e interprete Los valores totales son calculados como sumas horizontales y verticales. La casilla inferior derecha es la suma de los totales tanto verticales como horizontales. Los valores en la esquina de los casilleros centrales son los ft y son calculados de la siguiente manera: 500 450(350) 250 900 ft ⋅= = 500 450(150) 250 900 ft ⋅= = 400 450(100) 200 900 ft ⋅= = 400 450(300) 200 900 ft ⋅= = Calculamos 2χ , de acuerdo con la fórmula, de la siguiente manera: ( ) ( ) ( ) ( )2 2 2 22 2 2 350 250 150 250 100 200 300 200 250 250 200 200 40 40 50 50 180 o o o χ χ χ − − − − = + + + = + + + = Ayudantía Estadística I 58/75 Podemos decir entonces, que los valores no están distribuidos al azar, y que existe una relación entre las variables. Calculamos C 2 2 180 0, 41 180 900 C N C χ χ = + = = + Hay una correlación moderada y directa entre N.E.M y Puntajes P.A.A. Esta correlación es significativa, es decir, es distinta de 0. Calculamos 2tχ , para esto calculamos los grados de libertad. ( )( ) 2 1 ;0,05 2 1 2 1 1 3,841t gl gl χ = − − = = Como 2 2o tχ χ> , podemos decir que la correlación es significativa al 0,05%, es decir, la distribución de los puntajes en la tabla no se debe al azar. 2. Los asistentes a un curso internacional de Psicología Clínica deben llenar una ficha donde se consulta entre otros aspectos si han estudiado técnicas de hipnosis. Uno de los organizadores del curso desea saber si existe relación entre el conocimiento de técnicas de hipnosis y la nacionalidad. a) Calcule el coeficiente de correlación correspondiente e interprete. Los valores totales son calculados como sumas horizontales y verticales. Ayudantía Estadística I 59/75 La casilla inferior derecha es la suma de los totales tanto verticales como horizontales. Los valores en la esquina de los casilleros centrales son los ft y son calculados de la siguiente manera: 60 60(40) 32,73 110 ft ⋅= = 60 50(20) 27,27 110 ft ⋅= = 50 60(20) 27,27 110 ft ⋅= = 50 50(30) 22,73 110 ft ⋅= = Calculamos 2χ , de acuerdo con la fórmula, de la siguiente manera: ( ) ( ) ( ) ( )2 2 2 22 2 2 40 32,73 20 27,27 20 27,27 30 22,73 32,73 27,27 27,27 22.73 1,61 1,94 1,94 2,33 7,82 o o o χ χ χ − − − − = + + + = + + + = Podemos decir entonces, que los valores no están distribuidos al azar, y que existe una relación entre las variables. Calculamos C 2 2 7,88 0,26 7,88 110 C N C χ χ = + = = + Hay una correlación leve y directa entre NEM y PAA. Esta correlación es significativa, es decir, es distinta de 0. Calculamos 2tχ , para esto calculamos los grados de libertad. ( )( ) 2 1 ;0,05 2 1 2 1 1 3,841t gl gl χ = − − = = Como 2 2o tχ χ> , podemos decir que la correlación es significativa al 0,05%, es decir, la distribución de los puntajes en la tabla no se debe al azar. Ayudantía Estadística I 60/75 EJERCICIO Nº 25: Correlación 1. Un psicólogo laboral desea conocer el grado de asociación entre satisfacción laboral y rendimiento laboral. Aplica un instrumento para medir la primera variable, y recoge a través de diversos indicadores, el puntaje que representa rendimiento laboral. Obtiene los siguientes valores: a) Calcule rs y calcule r de Pearson para comparar. Calculamos rs. Se crea la columna R1 a partir de la variable X. Esto lo hacemos dando un rango a cada variable. Asignándole el número 1 al valor más pequeño e incrementando desde ahí en una unidad. Del mismo modo creamos la columna R2, a partir de los datos de la columna Y. Calculamos la columna D restando la columna R2 a la R1 1 2D R R= − Calculamos la columna D², elevando al cuadrado la columna D. Para terminar con la tabla, sumamos los valores de la columna D². Ayudantía Estadística I 61/75 Reemplazamos en la fórmula rs y calculamos. ( ) 2 2 6 1 1 D rs N N = − − ∑ ( )2 6 110,51 12 12 1 0,61 rs rs ⋅ = − − = Podemos decir que existe una correlación alta y directa entre la variable satisfacción laboral y la variable rendimiento laboral. Calculamos Pearson. Calculamos los promedios para cada una de las variables. Calculamos la fila de los desvíos con respecto al promedio para cada una de las variables. Calculamos el cuadrado de la fila de los desvíos. Multiplicamos los cuadrados de los desvíos. Sumamos la columna. Calculamos xS y yS según la fórmula: ( ) ( ) 2 2 362,9 5,499 12 114,3 3,09 12 x y X X S N Y Y S N − = = = − = = = ∑ ∑ Ayudantía Estadística I 62/75 Finalmente calculamos rxy , con la fórmula para datos no agrupados. ( )( ) ( )( ) 120,7 120,7 0,59 12 5,499 3,09 203,9 xy x y xy X X Y Y r NS S r − − = = = = ∑ Hay una correlación moderada directa entre la variable satisfacción laboral y la variable rendimiento laboral. Calculamos 2xyr . 2 20,59 0,35xyr = = Podemos decirque el 35% de la varianza de la variable satisfacción laboral queda explicado por la varianza de la variable rendimiento laboral, y que el 35% de la varianza de la variable rendimiento laboral queda explicado por la varianza de la variable satisfacción laboral. Ayudantía Estadística I 63/75 EJERCICIO Nº 26: Correlación 1. Se ha realizado un estudio con la población de mayores de 40 años, para determinar si el encontrarse viviendo la vida en pareja favorece el estado de ánimo de la población. Al evaluar a 500 personas se encuentran los siguientes resultados: a) Calcule el coeficiente de correlación correspondiente e interprete el resultado Los valores totales son calculados como sumas horizontales y verticales. La casilla inferior derecha es la suma de los totales tanto verticales como horizontales. Los valores en la esquina de los casilleros centrales son los ft y son calculados de la siguiente manera: 350 280(250) 196 500 ft ⋅= = 350 110(70) 77 550 ft ⋅= = 350 110(30) 77 500 ft ⋅= = 150 280(30) 84 500 ft ⋅= = 150 110(40) 33 500 ft ⋅= = 150 110(80) 33 500 ft ⋅= = Calculamos 2χ , de acuerdo con la fórmula, de la siguiente manera: ( ) ( ) ( ) ( ) ( ) ( )2 2 2 2 2 22 2 2 250 196 70 77 30 77 30 84 40 33 80 33 196 77 77 84 33 33 18,37 0,636 28,69 1,48 34,71 1,48 66,93 152,296 o o o χ χ χ − − − − − − = + + + + + = + + + + + + = Podemos decir entonces, que los valores no están distribuidos al azar, y que existe una relación entre las variables. Ayudantía Estadística I 64/75 Calculamos V ( ) 2 1 152,296 0,55 500(2 1) cramer cramer V N k V χ = − = = − Hay una correlación moderada y directa entre vida en pareja y estado de ánimo. . Esta correlación es significativa, es decir, es distinta de 0. Calculamos 2tχ , para esto calculamos los grados de libertad. ( )( ) 2 1 ;0,05 2 1 3 1 2 5,991t gl gl χ = − − = = Como 2 2o tχ χ> , podemos decir que la correlación es significativa al 0,05%, es decir, la distribución de los puntajes en la tabla no se debe al azar. Ayudantía Estadística I 65/75 EJERCICIO Nº 27: Correlación parcial El Departamento de Aplicación de la Prueba de Aptitud para ingreso a la Universidad ha realizado un estudio entre resultados de P.A.A. y las notas de enseñanza media, y entre resultados de P.A.A. y cociente intelectual. PAA y NEM correlacionaron en 0,65. PAA y CI correlacionaron en 0,70. Por estudios previos se sabe que CI correlaciona con NEM en 0,55 con notas. Si eliminamos la influencia del CI, ¿Qué valor de relación encontramos entre NEM y PAA? Nota: los datos de este ejercicio son ficticios. 12 13 23 0,65 0,55 0,70 r r r = = = 1 2 3 N.E.M P.A.A C.I V V V = = = ( )( ) ( )( ) 12 13 23 12.3 2 2 13 23 12.3 2 2 12.3 1 1 0,65 0,55 0,70 1 0,55 1 0,70 0, 445 r r rr r r r r − ⋅ = − − − ⋅ = − − = La correlación entre NEM y PAA, eliminando el efecto de la variable C.I es Moderada y directa. Ayudantía Estadística I 66/75 EJERCICIO Nº 28: Correlación parcial En un grupo de estudiantes de Educación Básica se ha realizado un estudio de las variables que inciden en el rendimiento escolar. Se ha podido establecer los valores de las siguientes correlaciones: Afán de logro y rendimiento = 0,58 Horas de estudio y rendimiento = 0,70 Afán de logro y horas de estudio = 0,40 Calcule el coeficiente de correlación parcial entre horas de estudio y rendimiento, eliminando el efecto de la variable afán de logro. 12 13 23 0,70 0,58 0,40 r r r = = = 1 2 3 rendimiento horas de estudio afán de logro V V V = = = ( )( ) ( )( ) 12 13 23 12.3 2 2 13 23 12.3 2 2 12.3 1 1 0,70 0,58 0, 40 1 0,58 1 0, 40 0,62 r r rr r r r r − ⋅ = − − − ⋅ = − − = La correlación entre horas de estudio y rendimiento, eliminando el efecto de la variable afán de logro es alta y directa. Ayudantía Estadística I 67/75 EJERCICIO Nº 29: Correlación, Regresión 1. Se desea estudiar la relación entre los resultados de una prueba de antónimos y ordenamiento de frases. Los resultados se presentan a continuación: a) Calcule el coeficiente de correlación. Utilizaremos el coeficiente de correlación de Pearson. Para la creación de la tabla, colocamos la variable Y en el eje horizontal, y la variable X en el eje vertical. Creamos la columna fx sumando las frecuencias verticalmente. Y la columna fy sumando las frecuencias horizontalmente. Creamos la columna x ‘ e y ‘ determinando un intervalo central, e incrementando una unidad hacia arriba y disminuyéndola hacia abajo. Creamos la columna fx ’ multiplicando la columna f por la x ’. Del mismo modo calculamos la columna fy ‘. Calculamos la columna fy ‘². Multiplicando la columna fx ’ por x ’. Del mismo modo calculamos la columna fy ‘². Calculamos la columna de frecuencias secundarias, ubicada al lado de la columna de frecuencias inicial. Esto lo hacemos multiplicando para cada casillero y ‘ por x ‘ por la frecuencia del casillero. Calculamos la columna fx ’y ‘ sumando verticalmente la columna de frecuencias secundarias. Del mismo modo calculamos la columna, solo que sumamos las frecuencias horizontalmente. Una vez construida la tabla calculamos Ayudantía Estadística I 68/75 Ayudantía Estadística I 69/75 Calculamos: 'X , 'Y , 'xS , 'yS . 158' 1,398 113 X = = 30' 0,265 113 Y −= = − ( )2630' 1,398 1,9 113x S = − = ( )2578' 0, 265 2, 25 113y S = − − = Calculamos xyr ( ) ' '' ' ' ' 262 113 1,398 0, 265 113 1,9 2, 25 0,63 xy xy xy fx y N X Y r NSx Sy r r − = − ⋅ ⋅− = ⋅ ⋅ = ∑ Podemos decir, que hay una correlación es alta directa entre las variables prueba de antónimos y ordenamiento de frases. Calculamos 2xyr . 2 20,63 0, 40xyr = = Podemos decir que el 40% de la varianza de la variable prueba de antónimos queda explicado por la varianza de la variable ordenamiento de frases, y que el 40% de la varianza de la variable ordenamiento de frases queda explicado por la varianza de la variable prueba de antónimos. b) Calcule las ecuaciones de regresión. Para calcular las ecuaciones de regresión, además de los datos que ya tenemos, necesitamos los promedios, y las desviaciones estándar de las dos variables. ' punto medio del intervalo central 1,398 2 10 12,8 X X i X = ⋅ + = ⋅ + = ' 1,9 2 3,8 x x x S S i S = ⋅ = ⋅ = ' punto medio del intervalo central 0,265 2 22 21,47 Y Y i Y = ⋅ + = − ⋅ + = ' 2, 25 2 4,5 y y y S S i S = ⋅ = ⋅ = Ayudantía Estadística I 70/75 ( ) ( )4,50,63 12,8 21,47 3,8 0,75 11,87 y xy x S Y r X X Y S Y X Y X ⎛ ⎞ = − +⎜ ⎟ ⎝ ⎠ ⎛ ⎞= − +⎜ ⎟ ⎝ ⎠ = − ( ) ( )3,80,63 21,47 12,8 4,5 0,53 1,38 x xy y SX r Y Y X S X Y X Y ⎛ ⎞ = − +⎜ ⎟⎜ ⎟ ⎝ ⎠ ⎛ ⎞= − +⎜ ⎟ ⎝ ⎠ = − Interpretación: Por cada unidad que aumente la variable x, la variable y aumentará en 0,75. c) Compruebe la exactitud de los coeficientes b obtenidos. 2 20,75 0,53 0,63 0,3975 0,3969 xy yxb b r⋅ = ⋅ = = Ayudantía Estadística I 71/75 EJERCICIO Nº 30: Correlación Múltiple 1. A través de diferentes estudios se ha logrado establecer las siguientes correlaciones entre variables: X1 = Éxito laboral X2 = Inteligencia X3 = Asertividad X4 = Logro X5 = Autoestima a) Estime la relación entre éxito laboral y las variables inteligencia y asertividad actuando conjuntamente. 2 2 2 12 13 13 12 23 1.23 2 23 2 2 2 1.23 2 2 1.23 2 1 0,6 0,7 2 0,7 0,6 0, 45 1 0, 45 0,59 r r r r rR r R R + − ⋅ ⋅ = − + − ⋅ ⋅ ⋅ = − = 2 1.23 1.23 1.23 0,59 0,768 0,77 R R R = = = ≈La correlación entre éxito laboral y las variables inteligencia y asertividad actuando conjuntamente, es alta y directa. b) Estime el puntaje de éxito laboral si los promedios y desviaciones de las variables son los siguientes: X1 =24 S1 = 8,5 X2 = 96 S2 = 18 X3 = 45 S3 = 15 Ayudantía Estadística I 72/75 12 13 23 12.3 2 231 r r r r β − ⋅= − 12.3 2 0,6 0,7 0,45 0,36 1 0,45 β − ⋅= = − 13 12 23 13.2 2 231 r r r r β − ⋅= − 13.2 2 0,7 0,6 0,45 0,54 1 0,45 β − ⋅= = − 1 12.3 12.3 2 Sb S β= ⋅ 12.3 8,5 0,36 0,17 18 b = ⋅ = 1 13.2 13.2 3 Sb S β= ⋅ 13.2 8,5 0,54 0,31 15 b = ⋅ = 1 12.3 2 13.2 3a X b X b X= − − 24 0,17 96 0,31 45 6,27a = − ⋅ − ⋅ = − 1 12.3 2 13.2 3X a b x b x= + + 1 2 36, 27 0,17 0,31X x x= − + + Calculamos el error (Varianza). 2 1.34 1 1.341S S R= − 1.34 1.34 8,5 1 0,59 5, 44 S S = − = ± Ayudantía Estadística I 73/75 EJERCICIO Nº 31: Correlación Múltiple En una Universidad del Estado de Ohio, se ha realizado un estudio para conocer los mejores predictores del rendimiento en Matemáticas en el primer año de universidad. Para este fin se ha generado la siguiente matriz de correlaciones: Correlaciones de puntuaciones de 4 exámenes y las notas obtenidas en Matemáticas en primer año de Universidad. x1= Notas en Matemáticas de primer año. x2= Examen psicológico. x3= Examen de geometría. x4= Examen de álgebra. x5= Examen de aptitud para la ingeniería. c) Calcule el coeficiente de correlación múltiple entre la variable dependiente x1 y la combinación de las variables independientes X3 y X4. 2 2 2 13 14 14 13 34 1.34 2 34 2 2 2 1.23 2 2 1.23 2 1 0,51 0,61 2 0,61 0,51 0,61 1 0,61 0, 40 r r r r rR r R R + − ⋅ ⋅ = − + − ⋅ ⋅ ⋅ = − = 2 1.34 1.34 1.34 0, 40 0,63 R R R = = = La correlación entre notas de matemáticas de primer año y las variables examen de geometría y examen de álgebra actuando conjuntamente es alta y directa. Ayudantía Estadística I 74/75 d) Establezca la ecuación de regresión múltiple e interprete. 13 14 34 13.4 2 341 r r r r β − ⋅= − 13.4 2 0,51 0,61 0,61 0,219 0,22 1 0,61 β − ⋅= = ≈ − 14 13 34 14.3 2 341 r r r r β − ⋅= − 14.3 2 0,61 0,51 0,61 0,476 0,48 1 0,61 β − ⋅= = ≈ − 1 13.4 13.4 3 Sb S β= ⋅ 13.4 2, 42 0,22 0,289 0,29 1,84 b = ⋅ = ≈ 1 14.3 14.3 4 Sb S β= ⋅ 14.3 2, 42 0,48 0,51 2,26 b = ⋅ = 1 13.4 3 14.3 4a X b X b X= − − 5,7 0,29 5,44 0,51 5,37 1,38a = − ⋅ − ⋅ = 1 13.4 3 14.3 4X a b x b x= + ⋅ + ⋅ 1 3 41,38 0,29 0,51X x x= + ⋅ + ⋅ e) Calcule el error de estimación, si la muestra con la que se trabajó era de 120 casos. Calculamos el error (Varianza). 2 1.34 1 1.341S S R= − 1.34 1.34 2, 42 1 0, 40 1,87 S S = − = Para interpretar el error, podemos dar adjudicar arbitrariamente notas a las variables examen de geometría y examen de álgebra. Así por ejemplo X3=5,5 y X4=5,4. 1 3 4 1 1,38 0,29 0,51 1,38 0,29 5,5 0,51 5,4 5,7 X x x X = + ⋅ + ⋅ = + ⋅ + ⋅ = Tenemos entonces que 1 5,7 0,8 6,5X = + = 1 5,7 0,8 4,9X = − = Como conclusión, podemos decir que del total de casos, aproximadamente 82 (68,26%) de ellos han obtenido notas entre 4,9 y 6,5. Ayudantía Estadística I 75/75 EJERCICIO Nº 32: Regresión 1. En una investigación se ha evaluado a los asistentes a una jornada de trabajo social en dos variables: interés por las personas y facilidad parta adaptarse a ambientes nuevos. Se encontró que la relación entre las variables fue igual a 0,78. El promedio de interés por las personas fue de 52 con una desviación estándar de 10 y la facilidad para adaptarse tuvo como promedio 70 y una desviación estándar de 15. a) Calcule la recta de regresión. ( ) ( ) ( ) 150,78 52 70 10 1,17 14, 2 21, 205 1,17 9,16 y xy x S Y r X X Y S Y X Y X Y X ⎛ ⎞ = − +⎜ ⎟ ⎝ ⎠ ⎛ ⎞= − +⎜ ⎟ ⎝ ⎠ = − + = + ( ) ( ) ( ) 100,78 70 52 15 0,52 70 52 0,52 15,6 x xy y SX r Y Y X S X Y X Y X Y ⎛ ⎞ = − +⎜ ⎟⎜ ⎟ ⎝ ⎠ ⎛ ⎞= − +⎜ ⎟ ⎝ ⎠ = − + = − b) Calcule el error de estimación 2 2 1 15 1 0,78 9,39 yx y yx yx S S r S S = − = − = c) Interprete el resultado. Por cada unidad que aumente la variable interés por las personas, la variable facilidad parta adaptarse a ambientes nuevos aumentará en 1,17 unidades.
Compartir