Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Distribución de Frecuencias Distribución de Frecuencias 2 AREA DE INTERES DATOS Tema de Investigación -Antecedentes Previos -Objetivos -Preguntas de Investigación -Posibles Hipótesis -Unidad de Análisis -Población -Variables ORGANIZAR Y RESUMIR ESTADÍSTICA DESCRIPTIVA (Tablas, Gráficos, Medidas Descriptivas, etc.) INTERPRETACIÓN INFERENCIA ESTADÍSTICA ¿Población o Muestra? CONCLUSIONES Población Muestra Probabilidad INFORMACIÓN Esquema de las etapas de un estudio estadístico 3 • VARIABLE: es lo que se va a medir y representa una característica de la UNIDAD DE ANÁLISIS. • ¿QUIÉNES VAN A SER MEDIDOS?: Los sujetos u objetos o Unidades de Análisis de una Población o una Muestra • POBLACIÓN : Es el total de unidades de análisis que son tema de estudio. Muestra: 60 trabajadores de empresas de comunicación Unidad de análisis: Trabajador de empresa de comunicación Variables: sexo, edad, salario, Nº de horas de trabajo, etc. Población: “Las personas que trabajan en empresas de comunicación” • MUESTRA: Es un conjunto de unidades de análisis provenientes de una población. Muestra 4 TIPOS DE VARIABLES Variables Cuantitativas Variable: corresponde a la característica de la Unidad de Análisis Intervalo DISCRETA Variables Cualitativas CONTINUA Toma valores enteros Ejemplos: Número de Hijos, Número de empleados de una empresa, Número de asignaturas aprobadas en un semestre, etc. Toma cualquier valor dentro de un intervalo Ejemplos: Peso; Estatura; Temperatura, etc. Unidad de Medida: Gramos o Kilos para la variable Peso; Grados C o F para Temperatura ORDINALNOMINAL Característica o cualidad cuyas categorías no tienen un orden preestablecido. Ejemplos: Sexo, Deporte Favorito, etc. Característica o cualidad cuyas categorías tienen un orden preestablecido. Ejemplos: Calificación (S, N, A); Grado de Interés por un tema, etc. La operación básica en estadística descriptiva consiste en presentar la información para su estudio. El objeto de la estadística descriptiva es la realización de comparaciones significativas entre agrupaciones de datos ¿CÓMO PUEDO DESCRIBIR A UNA POBLACIÓN O MUESTRA?????? Características de las distribuciones de frecuencias Agrupación (organización, ordenación) Tratamiento aritmético de los datos Operaciones Básicas con los datos Las distribuciones son la forma en que se organizan y se comparan los datos obtenidos. Hay distribuciones de frecuencias, porcentuales y acumuladas. Unitarias, (tipo I). CADA UNIDAD UN VALOR Recorrido de la variable pequeño y población o muestra pequeña EDADES EN UNA FAMILIA Agrupadas en frecuencias (tipo II) VALORES REPETIDOS PARA POCAS CATEGORIAS de la variable Recorrido de la variable pequeño pero muestra o universo grande (es decir, hay valores que se repiten SEXOS EN ESTA CLASE Agrupadas en intervalos de clase y frecuencias (tipo III) MUCHOS VALORES POSIBLES Y MUCHAS CATEGORIAS de la variable Recorrido de la variable grande y muestra o población grande INGRESOS, PESO, EDADES, ETC Tipos de distribuciones Las distribuciones de frecuencias son la expresión analítica de las variables y son fundamentales en el análisis UNIVARIABLE (y bivariable). Y son la base de las distribuciones porcentuales y agrupadas Son distribuciones donde cada una de las CATEGORIAS en las que se descompone una variable son presentadas en relación al número de CASOS que tienen. Las DISTRIBUCIONES O TABLAS DE FRECUENCIAS sirven para la expresión de cualquier tipo de variable (CUALITATIVAS, CUANTITATIVAS, CONTINUAS Y DISCRETAS, ORDINAL, NOMINAL, INTERVALO, ETC) Construcción de una distribución de frecuencias para datos no agrupados ¿Cómo presentar los datos? La frecuencia absoluta para una clase 𝑓𝑖 particular es el número de observaciones que caen en cada clase. La frecuencia relativa o porcentajepara una clase particular es su frecuencia absoluta entre el número total de observaciones. 𝑝𝑖 = 𝑓𝑖 𝑛 Esta frecuencia ayuda a resumir en forma ordenada la información contenida en la muestra tanto en tablas como en gráficas Genero frecuencia Porcentaje M 19 0,63 F 11 0,37 Total 30 1 Diagrama de barras Tabla de distribución de frecuencias Una vez asignadas las categorías a una variable, llamaremos FRECUENCIA al número de casos en cada una de esas categorías y los resultados los expresaremos en las llamadas TABLAS DE FRECUENCIAS: VARIABLE: CUALITATIVA, NOMINAL Nacionalidad 929 192 24 3 52 1200 Española Latinoamericana Magrebí Subsahariana Otras Total Frequency CATEGORIAS EDAD_RECODE_ENDOS 223 194 244 222 317 1200 entre 15 y 16 años entre 17 y 18 años entre 19 y 20 años entre 21 y 22 años entre 23 y 24 años Total Frequency Si la variable está expresada en escala de intervalo, llamaremos también INTERVALO (O CLASE) a las categorías definidas: CATEGORIAS intervalos/clase LA MAYORÍA DE LAS VARIABLES CONTINUAS HAN DE ADQUIRIR LA FORMA DE INTERVALO (AGRUPADA) Y TAMBIEN MUCHAS DISCRETAS, A EFECTOS DE FACILITAR SU ANÁLISIS Llamaremos FRECUENCIA ABSOLUTA al número total de casos en cada categoría CATEGORIAS intervalos/clase Frecuencia de clase/Frecuencia absoluta SIMPLE Frecuencia absoluta simple (también llamada frecuencia de clase): número de veces que se repite un suceso. Expresión= fi N o n= Número total de casos (suma de todas las fi)..N=∑fi Tabla de frecuencias ABSOLUTAS 223 194 244 222 317 1200 entre 15 y 16 años entre 17 y 18 años entre 19 y 20 años entre 21 y 22 años entre 23 y 24 años Total Fi Llamaremos FRECUENCIA ABSOLUTA acumulada a la suma de cada categoría con la anterior N o n= Número total de casos (suma de todas las fi)..N=∑fi Tabla de frecuencias ABSOLUTAS ACUMULADAS fi fa izquierda 100 100 derecha 250 350 Centro 300 650 Total (N o n) 650 Frecuencia ABSOLUTA ACUMULADA Para establecer comparaciones más allá de la pura observación, se emplean las llamadas FRECUENCIAS RELATIVAS que son el cociente entre cada frecuencia absoluta (f¡) con el total de casos (N) Frecuencia relativa: Es una PROPORCIÓN .Expresión= ∑fi/N fi fr Hombres 100 0.29 Mujeres 250 0.71 Total (N o n) 350 1.00 Frecuencia RELATIVA Al igual que en las frecuencias absolutas acumuladas, existe la frecuencia relativa acumulada (EXPRESIÓN: fra) fi fr fra Hombres 100 0.29 0.29 Mujeres 250 0.71 1.00 Total (N o n) 350 1.00 1.00 Frecuencia RELATIVA ACUMULADA CADA FRECUENCIA RELATIVA (fr) multiplicada por 100 da como resultado el porcentaje f¡ fr % fra Hombres 100 0.29 X100 29% Mujeres 250 0.71 71% Total (N) 350 1.00 100% Frecuencia RELATIVA ACUMULADA Frecuencia relativa X 100: Es un porcentaje .Expresión = %FRA En las distribuciones de frecuencias con datos agrupados o de intervalo, los datos se presentan de manera fácil y comprensible...Pero se pierde información EDAD 223 18,6 18,6 194 16,2 34,8 244 20,3 55,1 222 18,5 73,6 317 26,4 100,0 1200 100,0 etre 15 y 16 años entre 17 y 18 años entre 19 y 20 años entre 21 y 22 años entre 23 y 24 años Total Valid Frequency Percent Cumulative Percent ¿cuánta GENTE HAY DE 16 AÑOS?? Si las variables son cuantitativas discretas las tablas de frecuencias se realizan con la creación de diferentes clases en base a los datos que toma la variable. Edad frecuencia porcentaje 38 3 0,10 39 3 0,10 40 6 0,20 41 1 0,03 42 3 0,10 43 2 0,07 44 4 0,13 45 3 0,10 46 4 0,13 47 0 0,00 48 0 0,00 49 1 0,03 Total 30 1,00 Ejemplo: Número de veces que han ido a cine en el último mes los alumnos de una clase. 2 3 0 1 5 3 2 3 0 0 2 1 2 1 0 2 1 1 1 3 4 0 0 2 1 xi fi fr % fA 0 6 0,24 24 6 1 7 0,28 28 13 2 6 0,24 24 19 3 4 0,16 16 23 4 1 0,04 4 24 5 1 0,04 4 25 25 1 100 Ejemplo: Edad promedio de los estudiantes de 11 en un colegio público. 16 18 14 15 17 14 19 18 20 21 17 15 16 18 16 18 17 15 19 1817 20 18 20 17 18 19 21 18 19 xi fi fr % fA 14 2 0,066 6,6 2 15 3 0,1 10 5 16 3 0,1 10 8 17 5 0,166 16,6 13 18 8 0,266 26,6 21 19 4 0,133 13,3 25 20 3 0,1 100 28 21 2 0,066 6,6 30 30 0,997 99,7 Ejercicio en Clase. Reúnanse en grupos de tres personas. Realice una pequeña encuesta usando el total de estudiantes del salón como población. Sexo Edad Talla de Zapatos Lugar de Nacimiento EPS Trabaja Estado civil ¿De que tipo de variable se trata? Construya la tabla de frecuencias correspondiente para la variable que ustedes determinen de interés. Construcción de una distribución de frecuencias para datos agrupados Número de intervalos de clase= K Marca de clase: valor intermedio. Tomamos como marca de clase el punto medio de cada intervalo y lo calculamos sumando los extremos del intervalo y dividiéndolo entre 2. La marca de clase es el valor que representa a todo el intervalo para el cálculo de algunos parámetros como la media aritmética o la desviación típica. edad fi Marca de clase Entre 15 y 18 100 16.5 Entre 19 y 22 250 20.5 Entre 23 y 26 300 24.5 Total (N o n) 650 Conceptos en las variables de intervalos o agrupadas Límites del intervalo; los valores superiores e inferiores (límite superior= Li Límite inferior Li-1 Cuando trabajamos con variables discretas, no hay problema con los límites reales; ejemplo NUM DE HIJOS EN UN FAMILIA EL LIMITE INFERIOR DE LA CLASE “ENTRE 3 Y 4” NO SE SUPERPONE AL SUPERIOR DE LA CLASE “ENTRE 1 Y 2” HIJOS f¡ Marca de clase Entre 1 y 2 100 1.5 Entre 3 y 4 250 3.5 Entre 5 y 6 300 5.5 Total (N o n) 650 Conceptos en las variables de intervalos o agrupadas (II) Cuando trabajamos con variables CONTÍNUAS, SI HAY PROBLEMAS UNA VEZ QUE LAS AGRUPAMOS O CREAMOS INTERVALOS EJEMPLO; VARIABLE EDAD: EL LIMITE INFERIOR DE LA CLASE “ENTRE 3 Y 4” SE SUPERPONE AL SUPERIOR DE LA CLASE “ENTRE 1 Y 2” EDAD f¡ Marca de clase Entre 15 y 18 100 16.5 Entre 19 y 22 250 20.5 Entre 23 y 26 300 24.5 Total (N o n) 650 Conceptos en las variables de intervalos o agrupadas (II) Para resolver el problema, se emplean teóricamente los llamados “limites reales” EJEMPLO; VARIABLE EDAD: EL LIMITE SUPERIOR DE LA CLASE “ENTRE 15 Y 18” SE SUMA AL INFERIOS DE LA CLASE “ENTRE 19 Y 22 AÑOS” Y SE DIVIDE POR DOS EDAD fi Marca de clase Límites reales Entre 15 y 18 100 16.5 De 14.50 a 18,50 Entre 19 y 22 250 20.5 De 18,50 a 22.50 Entre 23 y 26 300 24.5 De 22,50 a 26,50 Total (N o n) 650 Conceptos en las variables de intervalos o agrupadas (II) Si las variables son cuantitativas continuas las tablas de frecuencias se realizan con la creación de intervalos numéricos que formarán las diferentes clases Tiempo frecuencia Porcentaje 9331 – 9931 1 0,03 9931 - 10531 1 0,03 10531 – 11131 3 0,10 11131 – 11731 6 0,20 11731 – 12331 5 0,17 12331 – 12931 5 0,17 12931 – 13531 6 0,20 13531 – 14131 3 0,10 Total 30 1,00 Ejemplo 22 19 16 13 18 15 20 14 15 16 15 16 20 13 15 18 15 13 18 15 𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 Dado el siguiente conjunto de datos: 1. Determine el Rango (R) 2. Determine el número de intervalos (K) 3. Determine la Amplitud 𝑅 = 22 − 13 = 9 Regla de Sturges para determinar el número de intervalos 𝐾 = 1 + 3,322 𝐿𝑜𝑔 𝑁 • El resultado se aproxima al menor valor • Se recomienda que el número de intervalos sea impar, en este caso de ser necesario se aproxima al número mayor. El número de casillas que se realizan en la tabla. 𝐾 = 1 + 3,322 𝐿𝑜𝑔 20 = 5,32 K 𝐾 = 5 Amplitud del intervalo 𝐴 = 𝑅 𝐾 Para llenar las clases en la tabla se toma el menor valor y se le suma la amplitud del intervalo. Es recomendable aproximar al siguiente entero (no es necesario) El primer valor de cada clase es el Limite inferior (Li) y el otro se denomina limite superior (Ls) 𝐴 = 9 5 = 1,8 ≅ 2 Clases 13 - 15 15 – 17 … Marca de clase 𝑥 = 𝐿𝑖 + 𝐿𝑠 2 Clases x f fr % fA [13 – 15) 14 4 0,2 20 4 [15 – 17) 16 9 0,45 45 13 [17 – 19) 18 3 0,15 15 16 [19 – 21) 20 3 0,15 15 19 [21 – 23) 22 1 0,05 5 20 20 1 100 Representación gráfica de distribuciones de frecuencias El análisis de cada variable se hace de acuerdo a su escala de medición Podemos hacer diagramas, tablas y resúmenes numéricos de los datos recopilados Diagrama de tallo y hojas El diagrama de tallo y hojas (Stem-and-Leaf Diagram) es un semigráfico que permite presentar la distribución de una variable cuantitativa. Consiste en separar cada dato en el último dígito (que se denomina hoja) y las cifras delanteras restantes (que forman el tallo). Útil para pocos elementos (20 y 50 elementos). Este diagrama se utilizaba más en los años 80 y 90, cuando los ordenadores no dibujaban gráficos aunque si que escribían dígitos. Ejemplo: Horario de trenes Según un articulo de Juan C. Dürsteler en InfoVis.net, tomamos como ejemplo un horario de trenes confeccionado a partir de un díptico de la línea Castelldefels-Barcelona/Sants recogido en la estación de Renfe. Originalmente el horario ocupa una tabla de 10 filas y 9 columnas más una columna "viuda" con el tren de las 22:38. Un total de 91 campos con formato hh.mm cada uno, 455 caracteres. En el diagrama Stem & Leaf se representa la hora a la izquierda de la barra de separación | y los minutos de la salida de cada tren a la derecha. La frecuencia de los trenes se deduce fácilmente de la longitud de las filas y es, además, muy fácil ver en que minutos de cada hora pasan típicamente los mismos. Por otra parte, dado que a algunas horas se repite exactamente el horario de los trenes se puede reducir aún más el tamaño del gráfico, sin perder información y ganando en claridad. Al final tenemos 59 campos de 2 dígitos, 118 caracteres más los separadores, es decir 4 veces menos dígitos que con el horario original, menos espacio y más claridad. Ejemplo Diagrama de Tallo y hojas Se usa con pocos valores Los datos están ordenados Encontramos fácilmente mínimo y máximo Encontramos fácilmente los percentiles Da una visión gráfica de la distribución de los datos diagrama de tallo y hojas para la variable edad 38|0 = 38.0 Ejercicio Construir un diagrama de Tallo – hoja que representa la calificación de 20 estudiantes. 82 74 88 66 58 74 78 84 96 76 62 68 72 92 86 76 52 76 82 78 Ordenemos los datos de menor a mayor. Realice el diagrama de tallo y hojas ¿Cuál es el dato con mayor frecuencia? ¿En que tallo esta la mayor frecuencia? Diagrama de Puntos Útil para cuando tenemos pocos datos discretos Normalmente, las distribuciones de frecuencias se representan de forma gráfica. Es una manera de mostrar de forma visual las relaciones entre los datos. Tres agrupaciones en cuanto al tipo de representación: Gráficos para comparar categorías dentro de una variable Gráficos para análisis y comparación de distribuciones Gráficos para la distribución conjunta de dos variables Las representaciones de las distribuciones de frecuencias La elección de cada tipo de gráfico dependerá de: Los objetivos del análisis que vayamos a efectuar. Del tipo de variable que vayamos a tratar.(cualitativas/cuantitativas y continuas o discretas) Las representaciones de las distribuciones de frecuencias Diagrama de barras (simples y apilables) Grafico de áreas Diagrama de sectores Gráficos para la descripción y comparación de categorías en una variable DIAGRAMA DE BARRAS Interesa comparar las categorías de una variable Tipo de variables; cualitativas o cuantitativas discretas. Compara datos en % o en frecuencias para cada una de las categorías. 40 60 0 10 20 30 40 50 60 Hombres Mujeres sexo Diagrama de barras. Variable cuantitativa discreta 20 25 40 10 2 3 0 5 10 15 20 25 30 35 40 Uno dos tres cuatro cinco seis Num de hijos en hogar -Este tipo de gráfico se utiliza generalmentepara representar la frecuencia de las categorías de una variable cualitativa. -Cuando una variable es cuantitativa se puede utilizar este tipo de gráfico sólo si la variable se ha transformada en categorías. -Hay distintas versiones de estos gráficos (por ejemplo en Excel), y en algunos casos son muy útiles para describir el comportamiento de una variable en distintos grupos. Diagrama de barras. Barras apiladas. Variable cuantitativa discreta en dos poblaciones 20 25 25 15 40 45 10 10 2 53 0 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Andalucia Galicia seis cinco cuatro Tres Dos Uno GRAFICO DE AREAS Interesa comparar dos categorías o dos poblaciones (o más) sobre una variable cuantitativa continua. Muy empleado en análisis de series temporales. Gráfico de Áreas. Variable cuantitativa continua. Comparación de tres categorías de la variable “situación laboral” en cuanto a los ingresos 45 30 20 10 30 52 65 85 25 18 15 5 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 2000 3000 4000 5000 desconocido ocupados parados DIAGRAMA DE SECTORES Para comparar pocas categorías de una variable cualitativa o cuantitativa discreta. El cálculo de los grados: el arco de cada sector equivale a la frecuencia de esa categoría, con lo cual se DIVIDE LA FRECUENCIA ABSOLUTA DE CADA CATEGORÍA POR EL NUMERO TOTAL DE CASOS Y SE MULTIPLICA POR 360 Hombres: 700/1200*360=210 grados Mujeres: 500/1200*360=150 grados Un circulo tiene 360 grados NOTACION DE LOS GRADOS DEL ANGULO: άi 30 70 Hombres mujeres DIAGRAMA DE SECTORES. Variable CUALITATIVA. Comparación de sexo en una muestra 56 TIPOS DE GRÁFICOS 1. Gráfico de Sectores Circulares (de Torta) Distribución de las unidades de análisis de acuerdo a variable 1 A 20% D 10% C 40% B 30% Distribución de las unidades de análisis de acuerdo a variable 1 B 30% C 40% D 10% A 20% Distribución de las unidades de análisis de acuerdo a variable 1 B 30% C 40% D 10% A 20% GRAFICOS PARA EL ANALISIS Y LA COMPARACION DE DISTRIBUCIONES Histogramas Polígonos de frecuencias Diagrama de CAJAS Las representaciones de las distribuciones de frecuencias HISTOGRAMA Adecuadas para variables de intervalo, cuantitativas de tipo contínuo Los distintos intervalos se ordenan de menor a mayor y de izquierda a derecha.(convención que no siempre se aplica) A diferencia del diagrama de barras, el histograma representa superficies. La dimensión de cada categoría se calcula mediante S=b (base =amplitud del intervalo)*h (altura=porcentaje o frecuencias) CALCULO DE DENSIDAD DE FRECUENCIA (EN INTERVALOS DE AMPLITUD DESIGUAL: Di= fi Ci Las representaciones de las distribuciones de frecuencias 59 Histograma - Permite la representación de la frecuencia de una variable Cuantitativa. - El eje x se refiere a la variable. - El eje y se refiere a la frecuencia (Nº , %). - Cada barra representa la frecuencia de la variable en la población en estudio (o la muestra). -El histograma se puede construir desde los datos de la tabla de frecuencia de la variable en estudio. 1413121110987 15 10 5 0 edad F re c u e n c ia N º edad Histograma Distribución de los hijos de trabajadores de la empresa de acuerdo a edad Ejemplo En el gráfico se puede observar el número de hijos , de menor edad (7-8 años), las de mayor edad (13-14 años); y además que la mayoría de hijos de los trabajadores están entre los 10 y 12 años. HISTOGRAMA. Variable cuantitativa contínua y de intervalo Datos agrupados/intervalos iguales POLIGONO DE FRECUENCIA Adecuadas para variables de intervalo, cuantitativas de tipo continuo Son una alternativa a los histogramas La línea que cruza en cada categoría representa la marca de clase 62 edad 1413121110987 15 10 5 0 edad F re c u e n c ia N º Distribución de los hijos de trabajadores de la empresa de acuerdo a edad -Esta representación se basa en el Histograma. -Sólo es útil para variables cuantitativas. -El eje x se refiere a la variable. - El eje y se refiere a la frecuencia (Nº , %). -Los puntos que permiten la unión de las líneas representa el centro de clase (o marca de clase). DIAGRAMA DE CAJA (BOX PLOT) Tiene como finalidad evaluar la FORMA de una distribución. Se trata de un gráfico basado en los CUARTILES, (dividen a la distribución en 4 partes) que ofrece información sobre la simetría y concentración de la distribución. Útil para detectar casos atípicos en la distribución 65 - Permite identificar gráficamente la mediana, los cuartiles 1 y 3 (percentiles 25 y 75), mínimo y máximo de una variable. - Sólo es útil para variables cuantitativas. -El eje x permite identificar la población en estudio. - El eje y representa los valores de la variable en estudio.1473584N = HombresMujeres E d ad 100 90 80 70 60 50 40 30 20 10 0 Edad de las personas que se realizaron angioplastia entre 1980 y 2000 Otros tipos de Gráficos Número de alumnos matriculados en la Carrera A según año de ingreso 0 20 40 60 80 100 1998 1999 2000 2001 2002 2003 año de ingreso N º d e a lu m n o s Número de alumnos matriculados en la Carrera B según año de ingreso 0 20 40 60 80 100 1998 1999 2000 2001 2002 2003 año de ingreso N º d e a lu m n o s 68 Número de alumnos matriculados en las Carreras según año de ingreso 0 50 100 150 200 1998 1999 2000 2001 2002 2003 año ingreso N º d e a lu m n o s Carrera B Carrera A año de ingreso Carrera A Carrera B 1998 60 80 1999 55 70 2000 80 50 2001 40 60 2002 68 50 2003 70 75 Nº de alumnos 70 Ejercicio: confección de una tabla de frecuencia para una variable continua 10,5 10,7 9,5 10,5 11,8 11,2 12,0 10,3 13,5 12,3 10,6 9,8 10,7 11,5 11,1 10,6 9,3 12,9 10,4 7,5 10,2 8,7 10,9 9,9 11,7 10,3 10,6 10,5 11,9 11,0 13,9 10,6 10,0 10,8 10,6 - 7,3 8,0 8,5 12,5 9,7 - Los datos corresponden a la edad de los hijos de los trabajadores de una empresa 7,3 9,7 10,4 10,6 11,1 12,3 7,5 9,8 10,5 10,6 11,2 12,5 8,0 9,9 10,5 10,7 11,5 12,9 8,5 10,0 10,5 10,7 11,7 13,5 8,7 10,2 10,6 10,8 11,8 13,9 9,3 10,3 10,6 10,9 11,9 - 9,5 10,3 10,6 11,0 12,0 - Datos ordenados de menor a mayor 1) Construya un Diagrama de Tallo y Hoja 2) ¿Cuál es la variable?; ¿Cuál es la Unidad de análisis?; ¿Cuánto vale n?; ¿Cuál es el rango de la variable?. 3) Sobre una Tabla de frecuencia: ¿Cuántos intervalos podría construir?; ¿Cuál es la amplitud de cada intervalo?; ¿Cuántas medidas de frecuencia puede obtener para cada intervalo?. 4) Construir tabla de frecuencia para la variable: Intervalos, centro de clase, amplitud, frecuencias. Realice la siguiente actividad Diagrama de Tallo y Hoja: permite organizar los datos de una variable medida sobre un conjunto de individuos. Su utilidad viene dada cuando no contamos con herramientas automáticas para ordenar los datos. Tablas de Contingencia Cuando el interés es estudiar las respuestas de los sujetos a dos variables, es necesario construir tablas de clasificación cruzada conocidas como Tablas de contingencia o de doble entrada. Se construyen para datos cualitativos. Para datos cuantitativos es necesario categorizarlas. Ejemplo En una encuesta se recogieron los datos de diez sujetos respecto al estado civil y el sexo. Sujeto 1 2 3 4 5 6 7 8 9 10 Estado Civil C S S D C D S S C D Sexo M M F F M M F M F M ¿Cómo se clasifican estos 10 sujetos en base a estas dos variables? Sexo Estado Civil Masculino Femenino Total Soltero 2 1 3 Casado 2 2 4 Divorciado 2 1 3 Total 6 4 10 Fuente: Datos Imaginarios Tabla 1. Estado Civil y sexo de los encuestados ¿Cual es el porcentaje de mujeres encuestadas? ¿Cual es el porcentaje de mujeres solteras? ¿De los solteros cual es el porcentaje de mujeres? Tablas de contingencia para variablescuantitativas Sujeto 1 2 3 4 5 6 7 8 9 10 Estado Civil C S S D C D S S C D Sexo M M F F M M F M F M Edad 18 25 18 20 21 21 23 25 23 20 Sexo Edad Masculino Femenino Total 18 - 29 1 1 2 20 - 21 3 1 4 22 - 23 0 2 2 24 - 25 2 0 2 Total 6 4 10 Tabla 1. Edad y sexo de los encuestados Permiten observar la respuesta simultanea de dos variables. Para la construcción de la tabla de contingencia: en las filas se colocan las modalidades de una variable y en las columnas las de la segunda variable. Cada casilla de la tabla contiene las frecuencias absolutas de los sujetos que cumplen con los dos criterios de clasificación. Ejercicio Dados los datos recopilados en clase correspondientes en SEXO y EDAD, realice la tabla de contingencia correspondiente. Sexo Edad Masculino Femenino Total 18 - 20 21 - 23 24 - 26 27 - 29 30 - 32 Total Analicemos lo que la tabla indica ¿Cuál es el porcentaje de hombres entre 24 y 26 años? De las mujeres ¿Cuál es el porcentaje que tiene entre 30 y 32 años de edad? De los hombres ¿Cuál es la proporción que tiene entre 21 y 23? Gracias por su atención
Compartir