Logo Studenta

SEMANA DOS ORGANIZACIÓN DE DATOSJJHO

¡Este material tiene más páginas!

Vista previa del material en texto

Estadística para 
Ciencias Sociales
Juan José Hernández Ocaña
Semana dos
Objetivos
Determinar los
procedimientos para 
la agrupación y 
representación de 
datos de variables. 
Estadística 
Descriptiva 
para 
Variables 
Cualitativas
Escala 
Nominal y 
Ordinal 
 1.- Empleo de Tablas de 
Distribución 
 2.- Uso Gráfica de barras o 
sectores
 3.- Estadístico descriptivo: 
MODA
Tabla de 
frecuencias
 Juan José Hernández Ocaña
Estadística 
descriptiva para 
variables 
cualitativas
 Clase : Es un conjunto de valores o categorías en 
que son agrupados los datos. 
 En el caso de género : hombre , mujeres 
 Colores : rojo, verde, azul … 
 Agrupar valores
 1 a 10
 11 a 20
 21 a 30 
Estadística 
descriptiva para 
variables 
cualitativas
 Frecuencia.- Es la cantidad de datos que están 
incluidos en cada una de las clases 
 Por ejemplo, cuántos hombres y cuántas mujeres? 
 La frecuencia es Contar ¡¡¡¡ 
Tabla Distribución de 
frecuencias 
 Una distribución de 
frecuencias es el resumen 
tabular de un conjunto de 
datos que muestra el 
número o frecuencia de 
artículos en cada una de las 
clases.
Estadística 
descriptiva para 
variables 
cualitativas
 ¿Qué información debe tener una tabla de 
frecuencias ?
 1.- Distribución de frecuencia individual ( absoluta)
 2.- Distribución de frecuencia acumulada
 3.- Distribución de Frecuencias relativas 
 4.- Distribución de frecuencias relativa acumuladas
Pregunta de 
investigación
 ¿ Qué porcentaje de mujeres y 
de hombres se han vacunado 
en su país
 Señala que tipo de gráfico se 
emplea para porcentajes
 Señala que tipo de gráfico se 
emplea para cantidades de un 
variable cualitativa
Frecuencia relativa=
𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑎𝑙
𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠
 Una bolsa de cacahuates de N&N contiene 21 dulces 
de diferentes colores y la distribución de los datos es 
la siguiente:
Categoría o clase frecuencia
Café 6
anaranjado 5
verde 3
amarillo 3
rojo 2
azul 2
Total (N) 21
Frecuencia
acumulada
Frecuencia
relativa
6 6/21= 0.2857
6+5=11 5/21=0.2380
11+3=14 3/21=0.1428
14+3= 17 3/21=0.1428
17+2=19 2/21=0.0952
19+2=21 2/21=0.0952
1
Frecuencia
acumulada
Frecuencia
relativa
6 6/21= 0.2857
6+5=11 5/21=0.2380
11+3=14 3/21=0.1428
14+3= 17 3/21=0.1428
17+2=19 2/21=0.0952
19+2=21 2/21=0.0952
1
PORCENTAJE
PORCENTAJE 
ACUMULADO
fr x 100 
28.57 28.57
23.8 52.37
14.28 66.65
14.28 80.93
9.52 90.45
9.52 99.97
ejercicio
 La siguiente tabla muestra las preferencias de los usuarios de 
Internet sobre los buscadores de la Web.
buscador Frecuencia
GOOGLE 35
YAHOO 28
AOL TIME 19
MSN 15
ASK 10
OTROS 3
total (110)
Frecuencia acumulada
35
63
82
97
107
110
Frecuencia relativa
0.3181 (35/110)
0.2545
0.1727
0.1363
0.0909
0.0272
1.000
Frecuencia relativa acumulada
.3181 31.81%
.5726 57.26% 
.7453 74.53%
.8816 88.16%
.9725 97.25%
0.9997 99.97%
buscador Frecuencia
GOOGLE 35
YAHOO 28
AOL TIME 19
MSN 15
ASK 10
OTROS 3
total (110)
 Venta de autos en el mes de julio
Categoría frecuencia
Compacto 38
Subcompacto 23
Sedan 20
Deportivo 15
Camioneta 8
4 x 4 2
Total (N) 106
Frecuencia
acumulada
38
61
81
96
104
106
frecuencia
38
23
20
15
8
2
106
Frecuencia relativa
38/106 = 0.3584
23/106 = 0.2169
20/106= 0.1886
15/106= .1415
8/106= .0754
2/106= 0.0188
106
Frecuencia 
relativa 
acumulada 
0.3584
0.5753
0.7639
0.9054
0.9808
0.9996
Porcentaje
acumulado
35.84
57.53
76.39
90.54
98.08
99.96
 Venta de autos en el mes de julio
Categoría frecuencia
Compacto 38
Subcompacto 23
Sedan 20
Deportivo 15
Camioneta 8
4 x 4 2
Total (N) 106
Frecuencia relativa
38/106 = 0.3584
23/106 = 0.2169
20/106= 0.1886
15/106= .1415
8/106= .0754
2/106= 0.0188
106
Frecuencia 
relativa 
acumulada 
0.3584
0.5753
0.7639
0.9054
0.9808
0.9996
Porcentaje
acumulado
35.84
57.53
76.39
90.54
98.08
99.96
Categoría frecuencia
Mal etiqueta 120
Ralladura 50
Fuga 30
Bajo volumen 18
rotura 10
Otros 2
Total (N) 230
Frecuencia
acumulada
120
170
200
218
228
230
La siguiente tabla muestra el número de defectos que se han detectado 
en una línea de producción, por lo que se le pide que se haga una tabla de 
distribución de frecuencias 
frecuencia
120
50
30
18
10
2
230
Frecuencia relativa
120/230 = 0.5217
50/230 = 0.2173
30/230= 0.1304
18/230= .0782
10/230= .0434
2/230= 0.0086
Frecuencia 
relativa 
acumulada 
0.5217
0.739
0.8694
0.9476
0.991
0.9996
Porcentaje
acumulado
52.17
73.90
86.94
94.76
99.1
99.96
Gráficas para 
variables 
cualitativas
 Una bolsa de cacahuates de N&N contiene 21 dulces 
de diferentes colores y la distribución de los datos es 
la siguiente:
Categoría frecuencia
Café 6
anaranjado 5
verde 3
amarillo 3
rojo 2
azul 2
Total (N) 21
Frecuencia
acumulada
Frecuencia
relativa
6 6/21= 0.2857
6+5=11 5/21=0.2380
11+3=14 3/21=0.1428
14+3= 17 3/21=0.1428
17+2=19 2/21=0.0952
19+2=21 2/21=0.0952
1
 Empleemos el ejercicio de los 
dulces 
 Si representamos frecuencias 
se recomienda una gráfico de 
barras
 Variable cualitativa
0
1
2
3
4
5
6
frecuencia
6
5
3 3
2 2
Café anaranjado verde
amarillo rojo azul
 Si es porcentaje lo que se 
quiere representar
 Se recomienda un gráfico de 
sectores
29%
24%14%
14%
9%
10%
frecuencia 
Café
anaranjado
verde
amarillo
rojo
azul
Frecuencia relativa PORCENTAJE PORCENTAJE ACUMULADO
fr x 100 
6/21= 0.2857 28.57 28.57
5/21=0.2380 23.8 52.37
3/21=0.1428 14.28 66.65
3/21=0.1428 14.28 80.93
2/21=0.0952 9.52 90.45
2/21=0.0952 9.52 99.97
1
0
20
40
60
80
100
120
CAFÉ ANARANJADO VERDE AMARILLO ROJO AZUL
TÍTULO DEL GRÁFICOPORCENTAJE 
ACUMULADO
CAFÉ 28.57
ANARANJADO 52.37
VERDE 66.65
AMARILLO 80.93
ROJO 90.45
AZUL 99.97
Gráficos para 
variables 
cuantitativas
Diagrama de líneas
Permite mostrar el comportamiento de 
variables cuantitativas a través del tiempo 
 En el eje horizontal va el 
tiempo
 En el eje vertical van los 
valores 
0
50
100
150
200
250
300
350
400
ENERO MARZO ABRIL MAYO JUNIO JULIO
Ventas en miles 
Serie 1
Diagrama de dispersión
Es una representación gráfica que muestra la 
relación entre dos variables cuantitativas
 Horas de estudio puntos 
 en examen
 0 4
 0.5 5
 1 6
 1.5 8
 2 10
0
2
4
6
8
10
12
0 0.5 1 1.5 2 2.5
Histograma
Es una representación gráfica que permite organizar 
datos cuantitativos que han sido divididos en intervalos 
0
5
10
15
20
25
30
35
40
21 a 30 31 a 40 41 a 50 51 y mayores
frecuencia
frecuencia
edad frecuencia
21 a 30 20
31 a 40 30
41 a 50 35
51 y mayores 15
EjerciciOS Práctica para la tarea de Actividades y de 
Examen
Los siguientes datos son la distribución 
de frecuencias de los tiempos de 
espera en las cajas de un banco.
 Determine 
 Frecuencia acumulada
 Frecuencia relativa
 Porcentaje individual
 Porcentaje acumulado
Tiempo de espera frecuencia
1 a 5 5
6 a 10 6
11 a 15 13
16 a 20 9
21 a 25 7
total 40
 ¿ Qué porcentaje representa la cantidad de personas que tardaron de 1 a 10 
minutos? 
 ¿Cuál es la cantidad de personas que tardan de 6 a 20 minutos ?
 Determine la frecuencia relativa de las personas que tardan de 11 a 15 minutos
Gráficos
 1. Primero hay que determinar si la variable es cualitativa o es 
cuantitativa
 Recordemos que los datos de una variable cualitativa no tiene un 
promedio . 
 Ahora si ya determinamos que es cualitativa
 1.- Si se desea representar frecuencia ( las cantidades ) se emplean 
gráficos de barras
 2.- Si se desea representar porcentajes entonces se recomienda 
gráficas de círculos 
 Si son variables cuantitativas 1.- Si se desea representar la frecuencia de datos se elige el 
histograma
 2.- Si se desea representar los cambios en el tiempo, se elige la 
línea de tiempo
 3.- Si se desea representar la relación entre variables, se elige el 
diagrama de dispersión
34 35 33 45 56
22 23 46 48 57
28 32 31 39 59
51 52 53 56 45
46 47 45 22 44
21 45 44 43 55
F1 fr fra % acumulado
21 a 27
28 a 34
35 a 41
42 a 48
49 a 55
56 a 62
K = 1 + 3.322 log 
= 1 + 3.322 log30
= 5.90
59-21= rango= 38
38/6= 6.3 
Ajustar a inmediato 
superior 7

Continuar navegando