Logo Studenta

Clase 2 Distribución de Frecuencias

¡Este material tiene más páginas!

Vista previa del material en texto

Distribución de Frecuencias
Distribución de Frecuencias
2
AREA DE INTERES DATOS
Tema de Investigación
-Antecedentes Previos 
-Objetivos
-Preguntas de Investigación
-Posibles Hipótesis
-Unidad de Análisis
-Población
-Variables
ORGANIZAR Y RESUMIR
ESTADÍSTICA DESCRIPTIVA
(Tablas, Gráficos, Medidas 
Descriptivas, etc.)
INTERPRETACIÓN
INFERENCIA ESTADÍSTICA
¿Población o Muestra?
CONCLUSIONES
Población 
Muestra
Probabilidad
INFORMACIÓN
Esquema de las etapas de un estudio 
estadístico
3
• VARIABLE: es lo que se va a medir y representa una característica de la 
UNIDAD DE ANÁLISIS.
• ¿QUIÉNES VAN A SER MEDIDOS?: Los sujetos u objetos o Unidades de Análisis 
de una Población o una Muestra
• POBLACIÓN : Es el total de unidades de análisis que son tema de estudio.
Muestra: 60 trabajadores de empresas de comunicación
Unidad de análisis: Trabajador de empresa de comunicación
Variables: sexo, edad, salario, Nº de horas de trabajo, etc. 
Población: 
“Las personas que trabajan
en empresas de 
comunicación” 
• MUESTRA: Es un conjunto de unidades de análisis provenientes de una población.
Muestra
4
TIPOS DE VARIABLES
Variables Cuantitativas
Variable: corresponde a la característica de la Unidad de Análisis
Intervalo 
DISCRETA
Variables Cualitativas
CONTINUA
Toma valores enteros 
Ejemplos: Número de Hijos, Número de 
empleados de una empresa, Número de 
asignaturas aprobadas en un semestre, etc.
Toma cualquier valor dentro de un intervalo 
Ejemplos: Peso; Estatura; Temperatura, etc.
Unidad de Medida: Gramos o Kilos para la variable Peso; Grados C o F para Temperatura
ORDINALNOMINAL
Característica o cualidad 
cuyas categorías no tienen 
un orden preestablecido. 
Ejemplos: Sexo, Deporte 
Favorito, etc.
Característica o cualidad cuyas 
categorías tienen un orden 
preestablecido. 
Ejemplos: Calificación (S, N, A); 
Grado de Interés por un tema, etc.
 La operación básica en estadística descriptiva 
consiste en presentar la información para su 
estudio.
 El objeto de la estadística descriptiva es la 
realización de comparaciones significativas entre 
agrupaciones de datos
 ¿CÓMO PUEDO DESCRIBIR A UNA POBLACIÓN O 
MUESTRA??????
Características de las distribuciones de 
frecuencias 
 Agrupación (organización, ordenación)
 Tratamiento aritmético de los datos
Operaciones Básicas con los datos
Las distribuciones son la forma en que 
se organizan y se comparan los datos 
obtenidos.
Hay distribuciones de frecuencias, 
porcentuales y acumuladas.
 Unitarias, (tipo I). CADA UNIDAD UN VALOR
 Recorrido de la variable pequeño y población o muestra pequeña
 EDADES EN UNA FAMILIA
 Agrupadas en frecuencias (tipo II) VALORES REPETIDOS PARA POCAS 
CATEGORIAS de la variable
 Recorrido de la variable pequeño pero muestra o universo grande (es decir, hay 
valores que se repiten
 SEXOS EN ESTA CLASE
 Agrupadas en intervalos de clase y frecuencias (tipo III) MUCHOS VALORES 
POSIBLES Y MUCHAS CATEGORIAS de la variable
 Recorrido de la variable grande y muestra o población grande
 INGRESOS, PESO, EDADES, ETC
Tipos de distribuciones
 Las distribuciones de frecuencias son la expresión 
analítica de las variables y son fundamentales en el 
análisis UNIVARIABLE (y bivariable). Y son la base de las 
distribuciones porcentuales y agrupadas
 Son distribuciones donde cada una de las CATEGORIAS 
en las que se descompone una variable son presentadas 
en relación al número de CASOS que tienen.
 Las DISTRIBUCIONES O TABLAS DE FRECUENCIAS sirven 
para la expresión de cualquier tipo de variable 
(CUALITATIVAS, CUANTITATIVAS, CONTINUAS Y 
DISCRETAS, ORDINAL, NOMINAL, INTERVALO, ETC)
Construcción de una distribución de 
frecuencias para datos no agrupados
¿Cómo presentar los datos?
 La frecuencia absoluta para una clase 𝑓𝑖 particular es el número de 
observaciones que caen en cada clase.
 La frecuencia relativa o porcentajepara una clase particular es su frecuencia 
absoluta entre el número total de observaciones.
𝑝𝑖 =
𝑓𝑖
𝑛
Esta frecuencia ayuda a resumir en forma ordenada la información contenida en 
la muestra tanto en tablas como en gráficas
Genero frecuencia Porcentaje
M 19 0,63
F 11 0,37
Total 30 1
Diagrama de barras
Tabla de distribución de frecuencias
 Una vez asignadas las categorías a una variable, 
llamaremos FRECUENCIA al número de casos en cada una 
de esas categorías y los resultados los expresaremos en las 
llamadas TABLAS DE FRECUENCIAS:
 VARIABLE: CUALITATIVA, NOMINAL
Nacionalidad
929
192
24
3
52
1200
Española
Latinoamericana
Magrebí
Subsahariana
Otras
Total
Frequency
CATEGORIAS
EDAD_RECODE_ENDOS
223
194
244
222
317
1200
entre 15 y 16 años
entre 17 y 18 años
entre 19 y 20 años
entre 21 y 22 años
entre 23 y 24 años
Total
Frequency
 Si la variable está expresada en escala de intervalo, llamaremos 
también INTERVALO (O CLASE) a las categorías definidas:
CATEGORIAS
intervalos/clase
LA MAYORÍA DE LAS VARIABLES CONTINUAS HAN DE ADQUIRIR 
LA FORMA DE INTERVALO (AGRUPADA) Y TAMBIEN MUCHAS 
DISCRETAS, A EFECTOS DE FACILITAR SU ANÁLISIS
 Llamaremos FRECUENCIA ABSOLUTA al número total de casos en cada 
categoría
CATEGORIAS
intervalos/clase
Frecuencia de 
clase/Frecuencia 
absoluta SIMPLE
Frecuencia absoluta simple (también llamada frecuencia de clase): 
número de veces que se repite un suceso. Expresión= fi
N o n= Número total de casos (suma de todas las fi)..N=∑fi
Tabla de frecuencias ABSOLUTAS
223
194
244
222
317
1200
entre 15 y 16 años
entre 17 y 18 años
entre 19 y 20 años
entre 21 y 22 años
entre 23 y 24 años
Total
Fi
 Llamaremos FRECUENCIA ABSOLUTA acumulada a la suma de cada 
categoría con la anterior
N o n= Número total de casos (suma de todas las fi)..N=∑fi
Tabla de frecuencias ABSOLUTAS ACUMULADAS
fi fa
izquierda 100 100
derecha 250 350
Centro 300 650
Total (N o n) 650
Frecuencia 
ABSOLUTA 
ACUMULADA
 Para establecer comparaciones más allá de la pura 
observación, se emplean las llamadas FRECUENCIAS 
RELATIVAS que son el cociente entre cada frecuencia 
absoluta (f¡) con el total de casos (N)
Frecuencia relativa: Es una PROPORCIÓN .Expresión= ∑fi/N
fi fr
Hombres 100 0.29
Mujeres 250 0.71
Total (N o n) 350 1.00
Frecuencia 
RELATIVA
 Al igual que en las frecuencias absolutas 
acumuladas, existe la frecuencia relativa 
acumulada (EXPRESIÓN: fra)
fi fr fra
Hombres 100 0.29 0.29
Mujeres 250 0.71 1.00
Total (N o 
n)
350 1.00 1.00
Frecuencia RELATIVA 
ACUMULADA
 CADA FRECUENCIA RELATIVA (fr) multiplicada por 
100 da como resultado el porcentaje
f¡ fr % fra
Hombres 100 0.29 X100 29%
Mujeres 250 0.71 71%
Total (N) 350 1.00 100%
Frecuencia RELATIVA 
ACUMULADA
Frecuencia relativa X 100: Es un porcentaje .Expresión = %FRA
En las distribuciones de frecuencias con datos 
agrupados o de intervalo, los datos se presentan de 
manera fácil y comprensible...Pero se pierde 
información
EDAD
223 18,6 18,6
194 16,2 34,8
244 20,3 55,1
222 18,5 73,6
317 26,4 100,0
1200 100,0
etre 15 y 16 años
entre 17 y 18 años
entre 19 y 20 años
entre 21 y 22 años
entre 23 y 24 años
Total
Valid
Frequency Percent
Cumulative
Percent
¿cuánta GENTE HAY 
DE 16 AÑOS??
Si las variables son cuantitativas discretas las tablas de 
frecuencias se realizan con la creación de diferentes clases 
en base a los datos que toma la variable.
Edad frecuencia porcentaje
38 3 0,10
39 3 0,10
40 6 0,20
41 1 0,03
42 3 0,10
43 2 0,07
44 4 0,13
45 3 0,10
46 4 0,13
47 0 0,00
48 0 0,00
49 1 0,03
Total 30 1,00
Ejemplo: Número de veces que han ido a cine en el último mes 
los alumnos de una clase.
2 3 0 1 5
3 2 3 0 0
2 1 2 1 0
2 1 1 1 3
4 0 0 2 1
xi fi fr % fA
0 6 0,24 24 6
1 7 0,28 28 13
2 6 0,24 24 19
3 4 0,16 16 23
4 1 0,04 4 24
5 1 0,04 4 25
25 1 100
Ejemplo: Edad promedio de los estudiantes de 11 en un 
colegio público.
16 18 14 15 17
14 19 18 20 21
17 15 16 18 16
18 17 15 19 1817 20 18 20 17
18 19 21 18 19
xi fi fr % fA
14 2 0,066 6,6 2
15 3 0,1 10 5
16 3 0,1 10 8
17 5 0,166 16,6 13
18 8 0,266 26,6 21
19 4 0,133 13,3 25
20 3 0,1 100 28
21 2 0,066 6,6 30
30 0,997 99,7
Ejercicio en Clase.
 Reúnanse en grupos de tres personas.
 Realice una pequeña encuesta usando el total de estudiantes del salón como población.
 Sexo
 Edad
 Talla de Zapatos
 Lugar de Nacimiento
 EPS
 Trabaja
 Estado civil
 ¿De que tipo de variable se trata?
 Construya la tabla de frecuencias correspondiente para la variable que ustedes 
determinen de interés.
Construcción de una distribución de 
frecuencias para datos agrupados
Número de intervalos de clase= K
Marca de clase: valor intermedio. Tomamos como marca de clase el punto 
medio de cada intervalo y lo calculamos sumando los extremos del 
intervalo y dividiéndolo entre 2. La marca de clase es el valor que 
representa a todo el intervalo para el cálculo de algunos parámetros 
como la media aritmética o la desviación típica. 
edad fi Marca de clase
Entre 15 y 18 100 16.5
Entre 19 y 22 250 20.5
Entre 23 y 26 300 24.5
Total (N o n) 650
Conceptos en las variables de intervalos o 
agrupadas
Límites del intervalo; los valores superiores e inferiores (límite 
superior= Li Límite inferior Li-1
 Cuando trabajamos con variables discretas, no hay problema con los 
límites reales; ejemplo NUM DE HIJOS EN UN FAMILIA
 EL LIMITE INFERIOR DE LA CLASE “ENTRE 3 Y 4” NO SE SUPERPONE AL 
SUPERIOR DE LA CLASE “ENTRE 1 Y 2”
HIJOS f¡ Marca de clase
Entre 1 y 2 100 1.5
Entre 3 y 4 250 3.5
Entre 5 y 6 300 5.5
Total (N o n) 650
Conceptos en las variables de intervalos o 
agrupadas (II)
Cuando trabajamos con variables CONTÍNUAS, SI HAY PROBLEMAS UNA 
VEZ QUE LAS AGRUPAMOS O CREAMOS INTERVALOS
 EJEMPLO; VARIABLE EDAD: EL LIMITE INFERIOR DE LA CLASE “ENTRE 3 
Y 4” SE SUPERPONE AL SUPERIOR DE LA CLASE “ENTRE 1 Y 2”
EDAD f¡ Marca de clase
Entre 15 y 18 100 16.5
Entre 19 y 22 250 20.5
Entre 23 y 26 300 24.5
Total (N o n) 650
Conceptos en las variables de intervalos o 
agrupadas (II)
Para resolver el problema, se emplean teóricamente los llamados 
“limites reales”
 EJEMPLO; VARIABLE EDAD: EL LIMITE SUPERIOR DE LA CLASE “ENTRE 
15 Y 18” SE SUMA AL INFERIOS DE LA CLASE “ENTRE 19 Y 22 AÑOS” Y 
SE DIVIDE POR DOS
EDAD fi Marca de clase Límites reales
Entre 15 y 18 100 16.5 De 14.50 a 18,50
Entre 19 y 22 250 20.5 De 18,50 a 22.50
Entre 23 y 26 300 24.5 De 22,50 a 26,50
Total (N o n) 650
Conceptos en las variables de intervalos o 
agrupadas (II)
Si las variables son cuantitativas continuas las tablas de 
frecuencias se realizan con la creación de intervalos 
numéricos que formarán las diferentes clases
Tiempo frecuencia Porcentaje
9331 – 9931 1 0,03
9931 - 10531 1 0,03
10531 – 11131 3 0,10
11131 – 11731 6 0,20
11731 – 12331 5 0,17
12331 – 12931 5 0,17
12931 – 13531 6 0,20
13531 – 14131 3 0,10
Total 30 1,00
Ejemplo
22 19 16 13 18 15 20 14 15 16
15 16 20 13 15 18 15 13 18 15
𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
Dado el siguiente conjunto de datos:
1. Determine el Rango (R)
2. Determine el número de intervalos (K)
3. Determine la Amplitud 𝑅 = 22 − 13 = 9
Regla de Sturges para determinar el 
número de intervalos
𝐾 = 1 + 3,322 𝐿𝑜𝑔 𝑁
• El resultado se aproxima al menor valor
• Se recomienda que el número de intervalos sea impar, en este 
caso de ser necesario se aproxima al número mayor. El número de casillas que se 
realizan en la tabla.
𝐾 = 1 + 3,322 𝐿𝑜𝑔 20 = 5,32 K
𝐾 = 5
Amplitud del intervalo
𝐴 =
𝑅
𝐾
Para llenar las clases en la tabla se toma el menor valor y se le suma la 
amplitud del intervalo.
Es recomendable aproximar al siguiente entero (no es necesario)
El primer valor de cada clase es el Limite inferior (Li) y el otro se denomina 
limite superior (Ls)
𝐴 =
9
5
= 1,8 ≅ 2
Clases
13 - 15
15 – 17
…
Marca de clase
𝑥 =
𝐿𝑖 + 𝐿𝑠
2
Clases x f fr % fA
[13 – 15) 14 4 0,2 20 4
[15 – 17) 16 9 0,45 45 13
[17 – 19) 18 3 0,15 15 16
[19 – 21) 20 3 0,15 15 19
[21 – 23) 22 1 0,05 5 20
20 1 100
Representación gráfica de 
distribuciones de frecuencias
El análisis de cada variable se hace de
acuerdo a su escala de medición
Podemos hacer diagramas, 
tablas y resúmenes 
numéricos de los datos 
recopilados
Diagrama de tallo y hojas
 El diagrama de tallo y hojas (Stem-and-Leaf Diagram) es un semigráfico que
permite presentar la distribución de una variable cuantitativa. Consiste en
separar cada dato en el último dígito (que se denomina hoja) y las cifras
delanteras restantes (que forman el tallo).
 Útil para pocos elementos (20 y 50 elementos).
Este diagrama se utilizaba más en los años 80 y 90, 
cuando los ordenadores no dibujaban gráficos aunque si 
que escribían dígitos.
Ejemplo: Horario de trenes
Según un articulo de Juan C. Dürsteler en InfoVis.net, tomamos
como ejemplo un horario de trenes confeccionado a partir de un díptico de la
línea Castelldefels-Barcelona/Sants recogido en la estación de Renfe.
Originalmente el horario ocupa una tabla de 10 filas y 9 columnas más una
columna "viuda" con el tren de las 22:38. Un total de 91 campos con formato
hh.mm cada uno, 455 caracteres.
En el diagrama Stem & Leaf se
representa la hora a la izquierda de la
barra de separación | y los minutos de
la salida de cada tren a la derecha.
La frecuencia de los trenes se deduce
fácilmente de la longitud de las filas y
es, además, muy fácil ver en que
minutos de cada hora pasan típicamente
los mismos.
Por otra parte, dado que a algunas horas se repite exactamente el horario de 
los trenes se puede reducir aún más el tamaño del gráfico, sin perder 
información y ganando en claridad.
Al final tenemos 59 campos de 2 dígitos, 118 caracteres más los separadores, es 
decir 4 veces menos dígitos que con el horario original, menos espacio y más 
claridad.
Ejemplo Diagrama de Tallo y hojas
 Se usa con pocos valores
 Los datos están ordenados
 Encontramos fácilmente mínimo 
y máximo
 Encontramos fácilmente los 
percentiles
 Da una visión gráfica de la 
distribución de los datos
diagrama de tallo y hojas
para la variable edad 38|0
= 38.0
Ejercicio
 Construir un diagrama de Tallo – hoja que representa la calificación de 20 
estudiantes.
82 74 88 66 58 74 78 84 96 76
62 68 72 92 86 76 52 76 82 78
Ordenemos los datos de menor a mayor.
Realice el diagrama de tallo y hojas
¿Cuál es el dato con mayor frecuencia?
¿En que tallo esta la mayor frecuencia?
Diagrama de Puntos
Útil para cuando tenemos pocos datos 
discretos
 Normalmente, las distribuciones de frecuencias se 
representan de forma gráfica.
 Es una manera de mostrar de forma visual las relaciones 
entre los datos.
 Tres agrupaciones en cuanto al tipo de representación:
 Gráficos para comparar categorías dentro de una variable
 Gráficos para análisis y comparación de distribuciones
 Gráficos para la distribución conjunta de dos variables
Las representaciones de las distribuciones 
de frecuencias
 La elección de cada tipo de gráfico dependerá 
de:
 Los objetivos del análisis que vayamos a efectuar.
 Del tipo de variable que vayamos a 
tratar.(cualitativas/cuantitativas y continuas o 
discretas)
Las representaciones de las distribuciones de 
frecuencias
 Diagrama de barras (simples y apilables)
 Grafico de áreas
 Diagrama de sectores
Gráficos para la descripción y comparación 
de categorías en una variable
 DIAGRAMA DE BARRAS
 Interesa comparar las categorías de una variable
 Tipo de variables; cualitativas o cuantitativas discretas.
 Compara datos en % o en frecuencias para cada una de 
las categorías.
40
60
0
10
20
30
40
50
60
Hombres Mujeres
sexo
Diagrama de barras. Variable cuantitativa 
discreta
20
25
40
10
2 3
0
5
10
15
20
25
30
35
40
Uno dos tres cuatro cinco seis
Num de hijos en hogar
-Este tipo de gráfico se utiliza generalmentepara
representar la frecuencia de las categorías de una
variable cualitativa.
-Cuando una variable es cuantitativa se puede
utilizar este tipo de gráfico sólo si la variable se
ha transformada en categorías.
-Hay distintas versiones de estos gráficos (por
ejemplo en Excel), y en algunos casos son muy
útiles para describir el comportamiento de una
variable en distintos grupos.
Diagrama de barras. Barras apiladas. Variable 
cuantitativa discreta en dos poblaciones
20 25
25 15
40 45
10 10
2 53
0
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
Andalucia Galicia
seis
cinco
cuatro
Tres
Dos
Uno
 GRAFICO DE AREAS
 Interesa comparar dos categorías o dos 
poblaciones (o más) sobre una variable 
cuantitativa continua.
 Muy empleado en análisis de series 
temporales.
 Gráfico de Áreas. Variable cuantitativa continua. Comparación de 
tres categorías de la variable “situación laboral” en cuanto a los 
ingresos
45
30
20
10
30
52
65 85
25
18 15
5
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
2000 3000 4000 5000
desconocido
ocupados
parados
 DIAGRAMA DE SECTORES
 Para comparar pocas categorías de una variable cualitativa o 
cuantitativa discreta.
 El cálculo de los grados: el arco de cada sector equivale a la 
frecuencia de esa categoría, con lo cual se DIVIDE LA 
FRECUENCIA ABSOLUTA DE CADA CATEGORÍA POR EL NUMERO 
TOTAL DE CASOS Y SE MULTIPLICA POR 360
 Hombres: 700/1200*360=210 grados
 Mujeres: 500/1200*360=150 grados
 Un circulo tiene 360 grados
 NOTACION DE LOS GRADOS DEL ANGULO: άi
30
70
Hombres mujeres
DIAGRAMA DE SECTORES. Variable CUALITATIVA. 
Comparación de sexo en una muestra
56
TIPOS DE GRÁFICOS 1. Gráfico de Sectores Circulares (de Torta)
Distribución de las unidades de análisis de 
acuerdo a variable 1
A
20%
D
10%
C
40%
B
30%
Distribución de las unidades de 
análisis de acuerdo a variable 1
B
30%
C
40%
D
10% A
20%
Distribución de las unidades de 
análisis de acuerdo a variable 1
B
30%
C
40%
D
10%
A
20%
 GRAFICOS PARA EL ANALISIS Y LA COMPARACION DE 
DISTRIBUCIONES
 Histogramas
 Polígonos de frecuencias
 Diagrama de CAJAS
Las representaciones de las 
distribuciones de frecuencias
 HISTOGRAMA
 Adecuadas para variables de intervalo, cuantitativas de tipo 
contínuo
 Los distintos intervalos se ordenan de menor a mayor y de 
izquierda a derecha.(convención que no siempre se aplica)
 A diferencia del diagrama de barras, el histograma representa 
superficies. La dimensión de cada categoría se calcula mediante
 S=b (base =amplitud del intervalo)*h (altura=porcentaje o 
frecuencias)
 CALCULO DE DENSIDAD DE FRECUENCIA (EN INTERVALOS DE 
AMPLITUD DESIGUAL: Di= fi
Ci
Las representaciones de las distribuciones de 
frecuencias
59
Histograma
- Permite la representación de la
frecuencia de una variable
Cuantitativa.
- El eje x se refiere a la variable.
- El eje y se refiere a la frecuencia
(Nº , %).
- Cada barra representa la
frecuencia de la variable en la
población en estudio (o la
muestra).
-El histograma se puede construir
desde los datos de la tabla de
frecuencia de la variable en
estudio.
1413121110987
15
10
5
0
edad
F
re
c
u
e
n
c
ia
N
º
edad
Histograma
Distribución de los hijos de trabajadores de la empresa de acuerdo a edad
Ejemplo
En el gráfico se puede observar el número de 
hijos , de menor edad (7-8 años), las de mayor 
edad (13-14 años); y además que la mayoría de 
hijos de los trabajadores están entre los 10 y 12 
años.
HISTOGRAMA. Variable cuantitativa contínua y de intervalo
Datos agrupados/intervalos iguales
 POLIGONO DE FRECUENCIA
 Adecuadas para variables de intervalo, cuantitativas 
de tipo continuo
 Son una alternativa a los histogramas
 La línea que cruza en cada categoría representa la 
marca de clase
62
edad
1413121110987
15
10
5
0
edad
F
re
c
u
e
n
c
ia
N
º
Distribución de los hijos de trabajadores 
de la empresa de acuerdo a edad
-Esta representación se basa en el
Histograma.
-Sólo es útil para variables cuantitativas.
-El eje x se refiere a la variable.
- El eje y se refiere a la frecuencia (Nº ,
%).
-Los puntos que permiten la unión de las
líneas representa el centro de clase (o
marca de clase).
 DIAGRAMA DE CAJA (BOX PLOT)
 Tiene como finalidad evaluar la FORMA de una 
distribución. 
 Se trata de un gráfico basado en los CUARTILES, 
(dividen a la distribución en 4 partes) que ofrece 
información sobre la simetría y concentración de la 
distribución.
 Útil para detectar casos atípicos en la distribución
65
- Permite identificar
gráficamente la mediana, los
cuartiles 1 y 3 (percentiles 25 y
75), mínimo y máximo de una
variable.
- Sólo es útil para variables
cuantitativas.
-El eje x permite identificar la
población en estudio.
- El eje y representa los valores
de la variable en estudio.1473584N =
HombresMujeres
E
d
ad
100
90
80
70
60
50
40
30
20
10
0
Edad de las personas que se realizaron angioplastia entre 1980 y 2000
Otros tipos de Gráficos
Número de alumnos matriculados en la 
Carrera A según año de ingreso
0
20
40
60
80
100
1998 1999 2000 2001 2002 2003
año de ingreso
N
º 
d
e
 a
lu
m
n
o
s
Número de alumnos matriculados en la 
Carrera B según año de ingreso
0
20
40
60
80
100
1998 1999 2000 2001 2002 2003
año de ingreso
N
º 
d
e
 a
lu
m
n
o
s
68
Número de alumnos matriculados en las Carreras 
según año de ingreso
0
50
100
150
200
1998 1999 2000 2001 2002 2003
año ingreso
N
º 
d
e
 a
lu
m
n
o
s
Carrera B
Carrera A
año de ingreso Carrera A Carrera B
1998 60 80
1999 55 70
2000 80 50
2001 40 60
2002 68 50
2003 70 75
Nº de alumnos
70
Ejercicio: confección de una tabla de frecuencia para una variable continua
10,5 10,7 9,5 10,5 11,8 11,2 
12,0 10,3 13,5 12,3 10,6 9,8 
10,7 11,5 11,1 10,6 9,3 12,9 
10,4 7,5 10,2 8,7 10,9 9,9 
11,7 10,3 10,6 10,5 11,9 11,0 
13,9 10,6 10,0 10,8 10,6 - 
7,3 8,0 8,5 12,5 9,7 - 
 
Los datos corresponden a la edad de los hijos de 
los trabajadores de una empresa 
7,3 9,7 10,4 10,6 11,1 12,3 
7,5 9,8 10,5 10,6 11,2 12,5 
8,0 9,9 10,5 10,7 11,5 12,9 
8,5 10,0 10,5 10,7 11,7 13,5 
8,7 10,2 10,6 10,8 11,8 13,9 
9,3 10,3 10,6 10,9 11,9 - 
9,5 10,3 10,6 11,0 12,0 - 
 
Datos ordenados de menor a mayor
1) Construya un Diagrama de Tallo y Hoja
2) ¿Cuál es la variable?; ¿Cuál es la Unidad de 
análisis?; ¿Cuánto vale n?; ¿Cuál es el rango 
de la variable?. 
3) Sobre una Tabla de frecuencia: ¿Cuántos 
intervalos podría construir?; ¿Cuál es la 
amplitud de cada intervalo?; ¿Cuántas 
medidas de frecuencia puede obtener para 
cada intervalo?.
4) Construir tabla de frecuencia para la 
variable: Intervalos, centro de clase, 
amplitud, frecuencias.
Realice la siguiente actividad
Diagrama de Tallo y Hoja: permite organizar los
datos de una variable medida sobre un conjunto de
individuos. Su utilidad viene dada cuando no
contamos con herramientas automáticas para
ordenar los datos.
Tablas de Contingencia
 Cuando el interés es estudiar las respuestas de los sujetos
a dos variables, es necesario construir tablas de
clasificación cruzada conocidas como Tablas de
contingencia o de doble entrada.
 Se construyen para datos cualitativos.
 Para datos cuantitativos es necesario categorizarlas.
Ejemplo
 En una encuesta se recogieron los datos de diez sujetos 
respecto al estado civil y el sexo.
Sujeto 1 2 3 4 5 6 7 8 9 10
Estado Civil C S S D C D S S C D
Sexo M M F F M M F M F M
¿Cómo se clasifican estos 10 sujetos en base a estas dos variables?
Sexo
Estado Civil
Masculino Femenino Total
Soltero 2 1 3
Casado 2 2 4
Divorciado 2 1 3
Total 6 4 10
Fuente: Datos Imaginarios
Tabla 1. Estado Civil y sexo de los encuestados
 ¿Cual es el porcentaje de mujeres encuestadas?
 ¿Cual es el porcentaje de mujeres solteras?
 ¿De los solteros cual es el porcentaje de mujeres?
Tablas de contingencia para variablescuantitativas
Sujeto 1 2 3 4 5 6 7 8 9 10
Estado Civil C S S D C D S S C D
Sexo M M F F M M F M F M
Edad 18 25 18 20 21 21 23 25 23 20
Sexo
Edad
Masculino Femenino Total
18 - 29 1 1 2
20 - 21 3 1 4
22 - 23 0 2 2
24 - 25 2 0 2
Total 6 4 10
Tabla 1. Edad y sexo de los encuestados
Permiten observar la respuesta simultanea de dos variables.
Para la construcción de la tabla de contingencia: en las filas se colocan las 
modalidades de una variable y en las columnas las de la segunda variable.
Cada casilla de la tabla contiene las frecuencias absolutas de los sujetos 
que cumplen con los dos criterios de clasificación.
Ejercicio
 Dados los datos recopilados en clase correspondientes en SEXO y EDAD, 
realice la tabla de contingencia correspondiente. 
Sexo
Edad
Masculino Femenino Total
18 - 20
21 - 23
24 - 26
27 - 29
30 - 32
Total
Analicemos lo que la tabla indica
 ¿Cuál es el porcentaje de hombres entre 24 y 26 años?
 De las mujeres ¿Cuál es el porcentaje que tiene entre 30 y 32 años de edad?
 De los hombres ¿Cuál es la proporción que tiene entre 21 y 23?
Gracias por su atención

Continuar navegando