Logo Studenta

ESTADÍSTICA APLICADA

¡Este material tiene más páginas!

Vista previa del material en texto

ESTADÍSTICA APLICADA 
 
 
 
 
 
 
 
 
 
 
 
ANÁLISIS ESTADÍSTICO DE DATOS 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Maturín, 17 de febrero de 2023 
 
ESTADÍSTICA APLICADA 
 
 
 
2 
 
CONTENIDO 
 
INTRODUCCIÓN ............................................................................................................. 4 
PLANTEAMIENTO SITUACIONAL PARA EL ANÁLISIS ESTADÍSTICO .................. 6 
CONSTRUCCIÓN TABLA DE FRECUENCIA UTILIZANDO EL MÉTODO DE 
STURGES. ........................................................................................................................ 7 
MEDIDAS DE TENDENCIA CENTRAL: ........................................................................ 9 
MEDIA ARITMÉTICA ................................................................................................. 9 
MEDIANA ..................................................................................................................... 9 
MODA ........................................................................................................................... 9 
GRÁFICOS ESTADÍSTICOS: ........................................................................................ 12 
HISTOGRAMA: .......................................................................................................... 12 
POLÍGONO DE FRECUENCIAS: ............................................................................... 12 
OJIVA: ......................................................................................................................... 12 
GRÁFICO CIRCULAR: .............................................................................................. 12 
MEDIDAS DE POSICIÓN .............................................................................................. 16 
CUARTILES ................................................................................................................ 16 
QUINTILES ................................................................................................................. 16 
DECILES ..................................................................................................................... 16 
PERCENTILES............................................................................................................ 16 
MEDIDAS DE DISPERSIÓN.......................................................................................... 21 
DESVIACIÓN MEDIA ................................................................................................ 21 
VARIANZA ................................................................................................................. 21 
DESVIACIÓN TÍPICA ................................................................................................ 21 
COEFICIENTE DE VARIACIÓN ............................................................................... 21 
COEFICIENTE DE CURTOSIS. ..................................................................................... 23 
PROBABILIDADES ....................................................................................................... 23 
DISTRIBUCIÓN PROBABILÍSTICA NORMAL ........................................................ 24 
PROBABILIDADES PARA EVENTOS INDEPENDIENTES..................................... 27 
PROBABILIDADES PARA EVENTOS DEPENDIENTES ......................................... 28 
 
ESTADÍSTICA APLICADA 
 
 
 
3 
 
PROBABILIDADES PARA EVENTOS MUTUAMENTE EXCLUYENTES ............. 30 
TOMA DE DECISIONES................................................................................................ 30 
MEDIDAS DE CORRELACIÓN ................................................................................. 30 
Coeficiente de Correlación de Pearson: ..................................................................... 31 
Coeficiente de Correlación de Spearman ................................................................... 32 
MUESTREO ................................................................................................................ 34 
Cálculo de la Muestra: .............................................................................................. 34 
Muestreo Aleatorio (tabla números aleatorios): ......................................................... 35 
Muestreo Sistemático: ............................................................................................... 35 
Muestreo Estratificado: ............................................................................................. 36 
CONTRASTE DE HIPÓTESIS .................................................................................... 37 
CONCLUSIONES ........................................................................................................... 39 
BIBLIOGRAFÍA ............................................................................................................. 42 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
ESTADÍSTICA APLICADA 
 
 
 
4 
 
INTRODUCCIÓN 
 
 La estadística ha estado presente desde hace siglos atrás con las antiguas civilizaciones, 
su uso ha sido necesario en primeras instancias para resolver casos de la vida diaria por 
llamarlo de alguna manera, luego sería empleada con fines a mayor escala como trabajos 
investigativos o estudios, y ha adquirido relevancia, ya que por medio de ella se puede 
procesar una extensa información, lo cual se puede llevar a cabo de forma más sencilla sin 
pasar a ser algo tedioso. 
 
 Para lograr un verdadero aprendizaje de la estadística, como en cualquier rama de las 
matemáticas, no basta con la memorización de sus conceptos ni definiciones, incluso ni de 
sus procesos. La estadística tiene como objetivo el desarrollo de las capacidades racionales 
del estudiante, considerando sus conocimientos previos, con la finalidad de propiciar el logro 
de aprendizajes significativos que le permitan comprender la importancia y utilidad en lo que 
será su vida profesional 
 
 Tanto así es su importancia que ha dejado de ser solo una parte de las matemáticas y 
se ha convertido en una ciencia empleada en diferentes campos, pues han tomado sus 
métodos para aplicarlos a sus aéreas independientemente de la que sea, como por ejemplo: 
la psicología, la medicina, la contaduría, administración, entre otras. 
 
 La significación de la estadística es posibles gracias a que los métodos que la 
acompañan son reconocidos por su gran confiabilidad y validez, son totalmente apropiados 
para manejar información. 
 
En esta investigación se resumen los datos recolectados, así como su tratamiento 
estadístico en la comunidad de Campo Ayacucho sector popular ubicado al sur-oeste de la 
ciudad de Maturín del Estado Monagas, Venezuela, perteneciente a la Parroquia Alto de los 
Godos, conformada por 405 viviendas y un total de 625 familias distribuidas en 13 calles; y 
 
ESTADÍSTICA APLICADA 
 
 
 
5 
 
corresponde a los datos de una muestra de 100 viviendas. No se incluyen puntuaciones en 
bruto, sino mas bien datos estadística descriptiva (media, desviación estándar, entre otros) y 
los datos fruto de las pruebas estadísticas implementadas. 
 
Incluye las tablas y figuras que, por si solas, deben poder expresar claramente los 
resultados del estudio. La construcción de esta sección debe comenzar por la elaboración de 
las tablas y figuras, y solo posteriormente redactar los textos pertinentes (comentarios o 
interpretaciones) en función de ellas. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
ESTADÍSTICA APLICADA 
 
 
 
6 
 
PLANTEAMIENTO SITUACIONAL PARA EL ANÁLISIS 
ESTADÍSTICO 
La comunidad de Campo Ayacucho es un barrio popular enclavado al sur oeste de la 
ciudad de Maturín, en el Estado Monagas, Venezuela, perteneciente a la Parroquia Alto de 
los Godos, conformada por 405 viviendas y un total de 625 familias distribuidas en 13 calles.La información que se presenta a continuación fue suministrada por la Estructura del 
Comité Local de Abastecimiento y Producción (CLAP) del sector y corresponde a los datos 
de una muestra de 100 viviendas. 
Tabla Nº 1 Ingresos Mensuales por Vivienda (En Bs.) 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Tabla Nº 2 Distribución de Viviendas por Calles de la muestra 
Calle Nº 7 16 18 19 20 
Nº de Viviendas 24 18 22 17 19 
Tabla Nº 3 Distribución de Número de Personas por Vivienda 
582.400,00 841.210,00 458.882,00 535.211,00 385.656,00 
283.427,00 433.792,00 413.914,00 485.925,00 452.318,00 
463.710,00 848.607,00 417.028,00 550.409,00 384.916,00 
291.932,00 538.597,00 438.579,00 223.878,00 690.247,00 
280.678,00 947.218,00 240.334,00 391.814,00 750.317,00 
622.441,00 781.633,00 503.314,00 700.010,00 705.757,00 
762.212,00 681.517,00 593.656,00 221.135,00 736.707,00 
570.688,00 382.734,00 431.972,00 718.487,00 584.196,00 
688.648,00 775.123,00 592.240,00 317.555,00 920.824,00 
341.204,00 1.147.607,00 303.165,00 716.003,00 1.115.851,00 
696.637,00 926.773,00 380.497,00 647.222,00 978.298,00 
315.031,00 584.599,00 635.302,00 345.931,00 576.128,00 
753.701,00 500.558,00 617.137,00 285.715,00 465.540,00 
262.217,00 1.115.432,00 551.668,00 698.338,00 310.504,00 
398.000,00 655.230,00 821.100,00 293.312,00 828.898,00 
346.031,00 415.560,00 558.260,00 306.300,00 272.328,00 
394.019,00 347.485,00 341.103,00 400.496,00 310.504,00 
469.799,00 773.411,00 357.441,00 192.019,00 828.898,00 
191.021,00 810.474,00 504.725,00 489.025,00 480.314,00 
382.482,00 353.289,00 376.616,00 480.314,00 272.328,00 
 
ESTADÍSTICA APLICADA 
 
 
 
7 
 
Nº de 
Personas 
por 
Vivienda 
1 2 3 4 5 6 7 8 
fi 2 12 16 22 20 12 13 3 
 
Tabla Nº 4 Distribución Absoluta y Porcentual de la Población 
de la muestra por Genero 
Genero fi % 
Masculino 233 52% 
Femenino 216 48% 
Totales 449 100% 
 
CONSTRUCCIÓN TABLA DE FRECUENCIA UTILIZANDO EL 
MÉTODO DE STURGES 
En estadística descriptiva esta regla es muy utilizada cuando se quiere realizar una tabla 
de frecuencias y distribuir los datos analizados por clases, ya que con esta regla se calcula el 
número de clases (o intervalos) necesarios para representar fielmente los datos. Consta de 
tres pasos a saber: 
1. Determinación del Rango. 
𝑹𝒈𝒐 = 𝑫𝑴𝑨𝒀 − 𝑫𝒎𝒆𝒏 + 𝑭𝒄 
Dónde: Rgo = Rango; DMAY = Dato de mayor valor; Dmen = Dato de menor valor y 
Fc = Factor de Corrección. 
2. Determinación del Número de Clases 
𝑵º 𝑪𝒍𝒂𝒔𝒆𝒔 = 𝟏 + 𝟑, 𝟑𝟐 𝐥𝐨𝐠 𝑵 
 Donde: N = Número de datos 
3. Determinación del Intervalo de Clases: 
𝑰𝒄 =
𝑹𝒈𝒐
𝑵º 𝒅𝒆 𝑪𝒍𝒂𝒔𝒆𝒔
 
Empleando los datos de los ingresos mensuales (TABLA Nº1) y aplicando las fórmulas 
señaladas se tiene: 
 
ESTADÍSTICA APLICADA 
 
 
 
8 
 
N =100 
DMAY =1.147.607 
Dmen = 191.021 
Rgo = 1.147.607 − 191.021 + 1 
 
Nº Clases = 1 + 3,32 log 100 
Nº Clases = 7,64 ≈ 8 
 
Ic =
956.587
8
 
 
 
Teniendo en cuenta los valores hallados se procede a elaborar la tabla colocando como 
límite inferior de la primera clase el valor menor de los datos (Dmen) al cual se le irá sumando 
el Intervalo de clase (Ic) y así determinar los limites inferiores de cada clase hasta completar 
el número de clases definido, en este caso de 8. Quedando las clases de la tabla de frecuencias 
de la siguiente manera: 
Tabla Nº 5 Determinación de las Clases 
CLASES 
Li Ls 
191.021 310.594 
310.595 430.168 
430.169 549.742 
549.743 669.316 
669.317 788.890 
788.891 908.464 
908.465 1.028.038 
1.028.039 1.147.613 
Li = Límite Inferior Ls = Límite Superior 
Rgo = 956.587 
 
Nº Clases = 8 
Ic = 119574 
 
 
ESTADÍSTICA APLICADA 
 
 
 
9 
 
MEDIDAS DE TENDENCIA CENTRAL: 
Son indicadores estadísticos quemuestran hacia qué valor (o valores) se agrupan los 
datos,de los cuales, las más conocidas son: la media aritmética, la moda y la mediana. 
MEDIA ARITMÉTICA 
Es el valor resultante que se obtiene al dividirla sumatoria de un conjunto de datos 
sobre el número total de datos. 
En el caso de los datos agrupados se emplea la siguiente fórmula: 
𝑿 =
𝜮 𝒇𝒊. 𝑿𝒎
𝑵
 
 Donde: fi = Frecuencia absoluta onúmero de veces que se repite un valordentro de un 
conjunto de datos. 
 Xm = Punto medio de un intervalode clase o Marca de Clase. 
 N = Número de datos 
MEDIANA 
Valor que divide una serie de datos en dos partes iguales. La cantidad de datos que 
queda por debajo y por arriba de la mediana son iguales.Para su determinación se utiliza la 
siguiente fórmula: 
𝑴𝒅 = 𝑳𝒊 +
𝑷𝒐𝒔𝒊𝒄𝒊ó𝒏 − 𝑭𝑨 − 𝟏
𝒇𝒊
 𝒙 𝑰𝒄 
Donde: Li = Límite real inferior; Posición = N/2; FA-1 = Frecuencia acumulada de la 
clase anterior a la mediana; fi = frecuencia simple de la clase mediana; Ic = Intervalo de 
Clase. 
MODA 
Indica el valor que más se repite, o la clase que poseemayor frecuencia. Para su cálculo 
se emplea la siguiente fórmula: 
 
𝑴𝒐 = 𝑳𝒊 +
∆𝟏
∆𝟏 + ∆𝟐
 𝒙 𝑰𝒄 
∆𝟏 = 𝒇𝒄𝒎 − 𝒇𝒄𝒎 − 𝟏 
∆𝟐 = 𝒇𝒄𝒎 − 𝒇𝒄𝒎 + 𝟏 
 
ESTADÍSTICA APLICADA 
 
 
 
10 
 
 Donde: Li = Límite real inferior; fcm = Frecuencia simple de la clase modal; fcm-1 = 
Frecuencia simple de la clase anterior a la modal; fcm+1 = Frecuencia simple de la clase 
posterior a la modal; Ic = Intervalo de Clase. 
Entonces se procede a completar la tabla de frecuencias para obtener la información 
requerida para el cálculo de las medidas de tendencia a central como sigue: 
Tabla Nº 6 Distribución de Frecuencias 
CLASES fi Xm Fi*Xm FA> 
191.021 310.594 17 250.808 4.263.728 17 
310.595 430.168 22 370.382 8.148.393 39 Clase moda 
430.169 549.742 17 489.956 8.329.244 56 Clase mediana 
549.743 669.316 15 609.530 9.142.943 71 
669.317 788.890 16 729.104 11.665.656 87 
788.891 908.464 6 848.678 5.092.065 93 
908.465 1.028.038 4 968.252 3.873.006 97 
1.028.039 1.147.613 3 1.087.826 3.263.478 100 
1.147.613 N= 100 Σ= 53.778.512 
 
 Para el cálculo de la media aritmética: 
Σfi. Xm = 53.778.512 
 N=100 
X =
53.778.512
100
 
 
Interpretación: El promedio de ingresos mensuales es de Bs. 537.785,1. 
 Para el cálculo de la mediana: 
Posición =
𝑁
2
 =>Posición =
100
2
 Posición = 50 
Se busca este valor de 50 en la columna FA> para establecer la clase mediana, la cual 
es la clase: 430.169 -549.742, lo que permite establecer los valores requeridos para el cálculo 
de esta medida. 
𝐗 = 𝟓𝟑𝟕. 𝟕𝟖𝟓, 𝟏 
 
ESTADÍSTICA APLICADA 
 
 
 
11 
 
Para determinar el límite inferior real al límite inferior de la clase indicada se le resta 
0,5, quedando: 
Li = 430.169 – 0,5 => Li = 430.168,5 
FA-1 = 39 
fi = 17 
Ic = 119.574 
Sustituyendo en la fórmula 
 Md = 430.168,5 +
50− 39
17
 x 119.574 
 
Interpretación: por debajo de Bs. 507.539,9 se encuentra la mitad de los datos 
estudiados. 
 Para calcular la moda: 
Se ubica la clase con la mayor frecuencia simple, la cual es: 310.595 - 430.168, de 
donde se determinan los datos requeridos para el cálculo respectivo 
Li = 310.595 – 0,5 => Li = 310.594,5 
fcm = 22 
fcm-1 = 17 
fcm+1 = 17 
∆𝟏 = 𝟐𝟐 − 𝟏𝟕 =>∆𝟏 = 𝟓 
∆𝟐 = 𝟐𝟐 − 𝟏𝟕 =>∆𝟐 = 𝟓 
𝑀𝑜 = 310.594,5 +
5
5 + 5
 𝑥 119.574 
 
 Interpretación: La mayoría de las familias tienen ingresos mensuales iguales a Bs. 
370.381,5 
 
Md = 507.539,9 
Mo = 370.381,5 
 
ESTADÍSTICA APLICADA 
 
 
 
12 
 
GRÁFICOS ESTADÍSTICOS 
Son representaciones visuales que empleansímbolos, barras, polígonos y sectores, de 
los datos contenidos entablas de frecuencias. Se presentarán cinco tipos de gráficos 
estadísticos: 
HISTOGRAMA: 
Representan las frecuencias mediante columnas (o barras), a través de la altura de las 
mismas en un plano cartesiano, con la particularidad de que no existeespacio entre las barras. 
POLÍGONO DE FRECUENCIAS: 
Este gráfico se utiliza para el caso de variables cuantitativas, tanto discretas 
comocontinuas, partiendo del histograma, según eltipo de tabla de frecuencia manejada.OJIVA: 
En este gráfico se emplea un polígono de frecuencia o curva suavizada con 
unacaracterística muy particular: muestra las frecuencias absolutas o relativasacumuladas.Se 
clasifica en OJIVA > y OJIVA <. 
GRÁFICO CIRCULAR: 
Este tipo de diagramas consideran una figura geométrica en que la distribución 
defrecuencias se reparte dentro de la figura como puede ser una dona, pastel,círculo o anillo, 
en el que cada porción dentro de la figura representa la información porcentual del total de 
datos. 
Para la elaboración de estos gráficos se requiere completar la tabla inicial, la cual 
quedará: 
Tabla Nº 7 Distribución de Frecuencias Ampliada 
CLASES fi Xm Fi*Xm fr % Grados FA> FA< 
191.021 310.594 17 250.808 4.263.728 0,17 17% 61º 17 100 
310.595 430.168 22 370.382 8.148.393 0,22 22% 79º 39 83 
430.169 549.742 17 489.956 8.329.244 0,17 17% 61º 56 61 
549.743 669.316 15 609.530 9.142.943 0,15 15% 54º 71 44 
669.317 788.890 16 729.104 11.665.656 0,16 16% 58º 87 29 
788.891 908.464 6 848.678 5.092.065 0,06 6% 22º 93 13 
908.465 1.028.038 4 968.252 3.873.006 0,04 4% 14º 97 7 
1.028.039 1.147.613 3 1.087.826 3.263.478 0,03 3% 11º 100 3 
 n= 100 Σ= 53.778.512 1,00 100% 360º 
Donde: 
 
ESTADÍSTICA APLICADA 
 
 
 
13 
 
 fi = frecuencia simple de la clase 
 Xm = Punto medio de la clase 
 fr = frecuencia relativa de clase 
 FA> = Frecuencia acumulada mayor que 
 FA< = Frecuencia acumulada menor que 
 
 
17
22
17
15
16
6
4
3
0
5
10
15
20
25
Fr
e
cu
en
ci
a
Límite de Clases
Gráfico Nº 1 Histograma
 
ESTADÍSTICA APLICADA 
 
 
 
14 
 
 
 
 
17
22
17
15
16
6
4
3
0
5
10
15
20
25
Fr
e
cu
e
n
ci
a
Xm
Gráfico Nº 2 Polígono de Frecuencia
17
39
56
71
87
93
97 100
0
20
40
60
80
100
120
Fa
 >
Xm
Gráfico Nº 3 Ojiva >
 
ESTADÍSTICA APLICADA 
 
 
 
15 
 
 
 
 
100
83
61
44
29
13
7
3
0
20
40
60
80
100
120
Fa
 <
Xm
Gráfico Nº 4 Ojiva <
17%
22%
17%
15%
16%
6%
4% 3%
Gráfico Nº 5 Circular
 
ESTADÍSTICA APLICADA 
 
 
 
16 
 
MEDIDAS DE POSICIÓN 
Las medidas de posición equivalen a los valores que puede tomaruna variable 
caracterizados por agrupar a cierto porcentaje deobservaciones en la muestra o población y 
son ideales para obtener informaciónadicional a partir de datos resumidos, es decir, que 
presentanpérdida de información por agrupamiento en intervalos de clase. 
En esta partese analizarán cuatro medidas de posición: Cuartiles, Quintiles, Deciles y 
Percentiles. 
CUARTILES 
Los cuartiles, dividen el total de los datos en 4 partes iguales. Se denota como Qx. 
QUINTILES 
Los cuartiles, dividen un conjunto de datos en 5 partes iguales. Se denota como Kx. 
DECILES 
Para los deciles, se toma el total de los datos divididos en 10 partes iguales, por tanto, 
existirán 10 deciles representado como Dx. 
PERCENTILES 
Los percentiles representan los valores de la variable que están por debajo de 
unporcentaje, en otras palabras, el totalde los datos es divido en 100 partes iguales. Se denota 
como Px. 
Para el cálculo de las medidas de posición se emplea la fórmula que se señala a 
continuación, en donde en el círculo se sustituirá la medida respectiva. 
 
= 𝑳𝒊 +
𝑷𝒐𝒔𝒊𝒄𝒊ó𝒏 − 𝑭𝑨 − 𝟏
𝒇𝒊
 𝒙 𝑰𝒄 
 Aquí se hará un ajuste en relación a la posición para cada medida de posición según 
sea el caso a saber: 
Posición para Cuartiles: 
 
𝑷𝑸𝒙 =
𝑿. 𝑵
𝟒
 
 
 
ESTADÍSTICA APLICADA 
 
 
 
17 
 
 
Posición para Quintiles: 
𝑷𝑲𝒙 =
𝑿. 𝑵
𝟓
 
Posición para Deciles: 
𝑷𝑫𝒙 =
𝑿. 𝑵
𝟏𝟎
 
Posición para Percentiles: 
𝑷𝑷𝒙 =
𝑿. 𝑵
𝟏𝟎𝟎
 
Tomando como referencia los datos de la tabla nº 7 se procederá a determinar las 
siguientes medidas de posición: D1, D9, Q1, Q3, K1, K2, K4, P26, y P91. 
Para el Decil 1: 
Posición: PD1 =
𝑋.𝑁
10
 =>PD1 =
1.100
10
 PD1 = 10 
Se busca este valor de 50 en la columna FA>para establecer la clase del D1, la cual es 
la clase: 191.021 - 310.594, lo que permite establecer los valores requeridos para el cálculo 
de esta medida. 
Para determinar el límite inferior real, al límite inferior de la clase indicada se le resta 
0,5, quedando: 
Li = 191.021 – 0,5 => Li = 191.020,5 
FA-1 = 0 
fi = 17 
Ic = 119.574 
Sustituyendo en la fórmula 
 D1 = 191.1020,5 +
10− 0
17
 x 119.574 
 
 Interpretación: Por debajo de Bs. 507.539,9 está el 10% de los datos. 
𝐃𝟏 = 507.539,9 
 
ESTADÍSTICA APLICADA 
 
 
 
18 
 
Como el procedimiento es similar solo se tomará en cuenta los datos necesarios para 
el cálculo respectivo. 
Para el Decil 9: 
Posición: PD9 =
𝑋.𝑁
10
 =>PD9 =
9.100
10
 PD9 = 90 
Clase del D9: 788.891 - 908.464 
Li = 788.891 – 0,5 => Li = 788.890,5 
FA-1 = 87 
fi = 6 
Ic = 119.574 
Sustituyendo en la fórmula 
 D9 = 788.890,5 +
90− 87
6
 x 119.574 
 
 Interpretación: Por debajo de Bs. 848.677,5 está el 90% de los datos. 
Para el Cuartil 1: 
Posición: PQ1 =
𝑋.𝑁
4
 =>PQ1 =
1.100
4
 PQ1 = 25 
Clase del Q1: 310.595 - 430.168 
Li = 310.595 – 0,5 => Li = 310.594,5 
FA-1 = 17 
fi = 22 
Ic = 119.574 
Sustituyendo en la fórmula 
 Q1 = 310.594,5 +
25− 17
22
 x 119.574 
 
 Interpretación: Por debajo de Bs. 353.641,14está el 25% de los datos. 
Para el Cuartil 3: 
Posición: PQ3 =
𝑋.𝑁
4
 =>PQ3 =
4.100
4
 PQ3= 75 
𝐃𝟗= 848.677,5 
𝐐𝟏 = 353.641,14 
 
ESTADÍSTICA APLICADA 
 
 
 
19 
 
Clase del Q3: 669.317 - 788.890 
Li = 669.317 – 0,5 => Li = 669.316,5 
FA-1 = 71 
fi = 16 
Ic = 119.574 
Sustituyendo en la fórmula 
 Q3 = 669.316,5 +
75− 71
16
 x 119.574 
 
 Interpretación: Por debajo de Bs. 699.211está el 75% de los datos. 
Para el Quintil 1: 
Posición:PK1 =
𝑋.𝑁
5
 =>PK1 =
1.100
5
 PK1 = 20 
Clase del K1: 310.595 - 430.168 
Li = 310.595 – 0,5 => Li = 310.594,5 
FA-1 = 17 
fi = 22 
Ic = 119.574 
Sustituyendo en la fórmula 
 K1 = 310.594,5 +
20− 17
22
 x 119.574 
 
 Interpretación: Por debajo de Bs. 327.334,86está el 20% de los datos. 
Para el Quintil 4: 
Posición: PK4 =
𝑋.𝑁
5
 =>PK4 =
4.100
5
 PK4 = 80 
Clase del K4: 669.317 - 788.890 
Li = 669.317 – 0,5 => Li = 669.316,5 
FA-1 = 71 
fi = 16 
𝐐𝟑 = 699.211 
K1= 327.334,86 
 
ESTADÍSTICA APLICADA 
 
 
 
20 
 
Ic = 119.574 
Sustituyendo en la fórmula 
 K4 = 669.316,5 +
80− 71
16
 x 119.574 
 
 Interpretación: Por debajo de Bs. 736.277,94 está el 80% de los datos. 
Para el Percentil 26: 
Posición: PP26 =
𝑋.𝑁
100
 =>PP26 =
26.100
100
 PP26 = 26 
Clase del P26: 310.595 - 430.168 
Li = 310.595 – 0,5 => Li = 310.594,5 
FA-1 = 17 
fi = 22 
Ic = 119.574 
Sustituyendo en la fórmula 
 P26 = 310.594,5 +
26− 17
22
 x 119.574 
 
 Interpretación: Por debajo de Bs. 359.619,84 está el 26% de los datos. 
Para el Percentil 91: 
Posición: PP91 =
𝑋.𝑁
100
 =>PP91 =
91.100
100
 PP91 = 91 
Clase del P91: 788.891 - 908.464 
Li = 788.891 – 0,5 => Li = 788.890,5 
FA-1 = 87 
fi = 6 
Ic = 119.574 
Sustituyendo en la fórmula 
 P91 = 788.890,5 +
91− 87
6
 x 119.574 
 
𝐊𝟒 = 736.277,94 
𝐏𝟐𝟔 = 359.619,84 
𝐏𝟗𝟏 = 869.005,08 
 
ESTADÍSTICA APLICADA 
 
 
 
21 
 
 Interpretación: Por debajo de Bs. 869.005,08 está el 91% de los datos. 
MEDIDAS DE DISPERSIÓN 
Son indicadores estadísticos que muestran ladistancia promedio que existe entre los 
datos y la media aritmética.En el estudio de las medidas de dispersión daremos un vistazo a 
cuatroindicadores básicos: 
DESVIACIÓN MEDIA 
 Equivale a la división de la sumatoria del valorabsoluto de las distancias existentes 
entre cada dato y su mediaaritmética y el número total de datos. Para su cálculo se emplea la 
siguiente fórmula: 
𝑫𝑴 =
𝜮 𝒇𝒊│𝑿𝒎 − 𝑿│
𝑵
 
VARIANZA 
Es el resultado de la división de la sumatoria de lasdistancias existentes entre cada dato 
y su media aritmética elevadas alcuadrado, y el número total de datos. La fórmula para su 
determinación es la siguiente: 
𝝈𝟐 =
𝜮 𝒇𝒊│𝑿𝒎 − 𝑿│𝟐
𝑵
 
DESVIACIÓNTÍPICA 
Es igual a la raíz cuadrada de lavarianza. Para su cálculo se emplea la siguiente fórmula: 
𝝈 = √
𝜮 𝒇𝒊│𝑿𝒎 − 𝑿│𝟐
𝑵
 
COEFICIENTE DE VARIACIÓN 
Equivale a la razón entre la mediaaritmética y la desviación típica o estándar. Se calcula 
con la siguiente fórmula: 
𝐂𝐕 =
𝝈
𝑿
𝒙𝟏𝟎𝟎 
Para proceder a los cálculos de las medidas de dispersión se hace necesario completar 
la tabla de frecuencias con las columnas que generaran la información requerida para tal fin 
como se muestra a continuación: 
 
ESTADÍSTICA APLICADA 
 
 
 
22 
 
Tabla Nº 8 Determinación de los Valores Requeridos para el Cálculo de las 
Medidas de Dispersión 
CLASES fi Xm fiXm │Xm - 𝑿│ │Xm - 𝑿│2 fi│Xm - 𝑿│ fi│Xm - 𝑿│2 
191.021 310.594 17 250.808 4.263.728 286.973,1 82.353.560.123,6 4.878.542,7 1.400.010.522.101,4 
310.595 430.168 22 370.382 8.148.393 167.399,1 28.022.458.680,8 3.682.780,2 616.494.090.977,8 
430.169 549.742 17 489.956 8.329.244 47.825,1 2.287.240.190,0 813.026,7 38.883.083.230,2 
549.743 669.316 15 609.530 9.142.943 71.748,9 5.147.904.651,2 1.076.233,5 77.218.569.768,2 
669.317 788.890 16 729.104 11.665.656 191.322,9 36.604.452.064,4 3.061.166,4 585.671.233.030,6 
788.891 908.464 6 848.678 5.092.065 310.896,9 96.656.882.429,6 1.865.381,4 579.941.294.577,7 
908.465 1.028.038 4 968.252 3.873.006 430.470,9 185.305.195.746,8 1.721.883,6 741.220.782.987,2 
1.028.039 1.147.613 3 1.087.826 3.263.478 550.044,9 302.549.392.016,0 1.650.134,7 907.648.176.048,0 
 N= 100 Σ= 2.056.681,8 738.927.085.902,5 18.749.149,2 4.947.087.752.721,0 
Sustituyendo los valores obtenidos en las formulas indicadas se tiene: 
 Desviación Media 
𝐷𝑀 =
𝛴 𝑓𝑖│𝑋𝑚 − 𝑋│
𝑁
 
𝐷𝑀 =
18.749.149,2
100
 
DM = Bs. 187.491,49 
 Varianza 
σ2 =
Σ fi│Xm − X│2
N
 
𝜎 =
4.947.087.752.721
100
 
σ2=49.470.877.527,21Bs2 
 Desviación típica 
σ = √
Σ fi│Xm − X│2
N
 
σ = √49.470.877.527,21 
σ = Bs. 222.420,50 
 
 
ESTADÍSTICA APLICADA 
 
 
 
23 
 
 Coeficiente de Variación 
CV =
𝜎
𝑋
𝑥100 
CV =
222.450,50
537.781,1
𝑥100 
CV = 41,36% 
 
COEFICIENTE DE CURTOSIS 
Indica que tan apuntada o achatada se encuentra una distribución respecto a un 
comportamiento normal (distribución normal). Se emplea la fórmula que se muestra a 
continuación: 
𝐂𝐮 =
𝑸𝟑 − 𝑸𝟏
𝟐(𝑫𝟗 − 𝑫𝟏)
 
 Para su cálculo se utilizarán los cuartiles 1 y 3, así como los deciles 1 y 9 calculados 
en la sección de Medidas de Posición, cuyos resultados son: 
Q1 = 353.641,14 
Q3 = 699.211,00 
D1 = 507.539,90 
D9 = 848.677,50 
Sustituyendo en la fórmula: 
Cu =
699.211,00 − 353.641,14
2(848.677,50 − 507.539,90)
 
Cu = 0,506 
Como Cu = 0,506 >0,263 se determina que la curva es platicúrtica. 
 
PROBABILIDADES 
La probabilidad es la mayor o menor posibilidad de que ocurra un determinado suceso 
y se orienta a medir cuantitativamente la certeza o duda de que un suceso dado ocurra o no, 
estableciendo una relación entre el número de sucesos favorables y el número total de sucesos 
posibles. Con los datos determinados se procederá a realizar la aplicación de este concepto. 
 
ESTADÍSTICA APLICADA 
 
 
 
24 
 
DISTRIBUCIÓN PROBABILÍSTICA NORMAL 
Se sabe que el ingreso promedio mensual de la Comunidad de Campo Ayacucho se 
ubica en Bs. 537.785,10 con una desviación típica de Bs. 222.420, 50. Hallar la probabilidad: 
a. Que el ingreso se ubique entre Bs. 600.000 y Bs. 900.000. 
b. Que el ingreso sea superior a Bs 450.000. 
c. Que el ingreso sea menor al Salario mínimo de mes de noviembre de 2017. 
Datos: 
X = Bs. 537.785,1 
σ = Bs. 222.420,50 
Incógnitas: 
a) P (Bs. 600.000 < X < Bs. 900.000) 
b) P (X > 450.000) 
c) P (X < Salario mínimo de noviembre de 2017) 
Solución: 
 Para estos casos se empleará la variable estandarizada “Z”, a fin de tipificar los datos. 
a) P (Bs. 600.00 < X < Bs. 900.000) 
Fórmula: 
𝒁𝒊 =
𝑿𝒊 − 𝑿
𝛔
 
𝑍1 =
𝐵𝑠. 600.000 − 𝐵𝑠. 537.785,1
Bs. 222.420,50
 
𝑍1 =
𝐵𝑠. 62.214,9
Bs. 222.420,50
 
Z1 = 0,27 
El área bajo la curva normal que corresponde a este valor de Z es A1 = 0,1064 
𝑍2 =
𝐵𝑠. 900.000 − 𝐵𝑠. 537.785,1
Bs. 222.420,50
 
𝑍2 =
𝐵𝑠. 3 62.214,9
Bs. 222.420,50
 
Z2 = 1,62 
 
ESTADÍSTICA APLICADA 
 
 
 
25 
 
El área bajo la curva normal que corresponde a este valor de Z es A1 = 0,4474 
Gráfica: 
 
El área buscada (AB) será: 
AB = A2 – A1 
AB = 0,4474 – 0,1064 
AB = 0,341 
% = 34,10 
Interpretación: La probabilidad de que el ingreso mensual se ubique entre Bs. 
600.00 y Bs. 900.000 es de 34,10%. 
b) P (X > Bs. 450.000) 
Fórmula: 
𝒁𝒊 =
𝑿𝒊 − 𝑿
𝛔
 
𝑍1 =
𝐵𝑠. 450.000 − 𝐵𝑠. 537.785,1
Bs. 222.420,50
 
𝑍1 = −
𝐵𝑠. 87.785,1
Bs. 222.420,50
 
Z1 = - 0,39 
El área bajo la curva normal que corresponde a este valor de Z es A1 = 0,1517 
Gráfica: 
𝐗 𝑍1 = 0,27 𝑍2 = 1,62 
A
1
 A
2
 
 
ESTADÍSTICA APLICADA 
 
 
 
26 
 
 
El área buscada (AB) será: 
AB = A1 + 0,5 
AB = 0,1517 + 0,5 
AB = 0,6517 
% = 65,17 
Interpretación: La probabilidad de que el ingreso mensual sea mayor a Bs. 450.00 
es de 65,17%. 
 c) P (X < Salario mínimo de noviembre 2017) 
 El salario mínimo de noviembre 2017 se ubicó en Bs. 117.507 
Fórmula: 
𝒁𝒊 =
𝑿𝒊 − 𝑿
𝛔
 
𝑍1 =
𝐵𝑠. 177.507 − 𝐵𝑠. 537.785,1
Bs. 222.420,50
 
𝑍1 = −
𝐵𝑠. 360.278,1
Bs. 222.420,50
 
Z1 = - 1,62 
El área bajo la curva normal que corresponde a este valor de Z es A1 = 0,4474 
 
 
Gráfica: 
𝑍1 = −0,39 𝐗 
A
1
 
0,5 
 
ESTADÍSTICA APLICADA 
 
 
 
27 
 
 
El área buscada (AB) será: 
AB = 1 – (0,4474 + 0,5) 
AB = 1 - 0,9474 
AB = 0,0526 
% = 5,26 
Interpretación: La probabilidad de que el ingreso mensual sea menor al salario 
mínimo de noviembre de 2017 (Bs. 117.507) es de 5,26%. 
 
PROBABILIDADES PARA EVENTOS INDEPENDIENTES 
Se sabe que las calles 7 y 19 tienen 24 y 17 viviendas respectivamente (información 
disponible en la tabla nº 2), supongamos que tenemos los expedientes sobre una mesa y que 
estos no se encuentran ordenados por calle, si se toman dos expedientes de manera sucesiva 
hallar la probabilidad que: 
a) Ambos pertenezcan a la calle 7 
b) Ambos pertenezcan a la calle 19 
c) El primero sea de la calle 7 y el segundo sea de la calle 19 
d) El primero sea de la calle 19 y el segundo sea de la calle 7 
Solución: 
Se establece el espacio muestral por medio del siguiente Diagrama Tabular: 
 Calle 7 Calle 19 
Calle 7 C7,C7 C7,C19 
Calle 19 C19,C7 C19,C19 
a) P(C7, C7) = P(C7) . P(C7/C7) 
𝑍1 = −1,62 𝐗 
A
1
 
0,5 
 
ESTADÍSTICA APLICADA 
 
 
 
28 
 
P(C7, C7) =
24
41
 x
23
40
 
P(C7, C7) =
552
1640
 
𝐏(𝐂𝟕, 𝐂𝟕) =
𝟔𝟗
𝟐𝟎𝟓
 
b) P(C19, C19) = P(C19) . P(C19/C19) 
P(C19, C19) =
17
41
 x
23
40
 
P(C19, C19) =
272
1640
 
𝐏(𝐂𝟕, 𝐂𝟕) =
𝟑𝟒
𝟐𝟎𝟓
 
c) P(C7, C19) = P(C7) . P(C19/C7) 
P(C7, C19) =
24
41
 x
17
40
 
P(C7, C19) =
408
1640
 
𝐏(𝐂𝟕, 𝐂𝟕) =
𝟓𝟏
𝟐𝟎𝟓
 
d) P(C19, C7) = P(C19) . P(C7/C19) 
P(C19, C7) =
17
41
 x
24
40
 
P(C19, C7) =
408
1640
 
𝐏(𝐂𝟏𝟗, 𝐂𝟕) =
𝟓𝟏
𝟐𝟎𝟓
 
 
PROBABILIDADES PARA EVENTOS DEPENDIENTES 
Se ha clasificado a los grupos familiares de las calles 7 y 19 de Campo Ayacucho de 
acuerdo al nivel de ingresos mensuales percibidos como se muestra a continuación: 
 
Calle Calle 7 Calle 19 Totales 
 
ESTADÍSTICA APLICADA 
 
 
 
29 
 
Ingreso 
> Bs. 395.000 8 14 22 
< Bs. 395.000 9 10 19 
Totales 17 24 41 
 
Se quiere determinar la probabilidad que al seleccionar una familia: 
a) Esta resida en la calle 19 y perciba un ingreso mayor a Bs. 395.000 
b) Esta perciba un ingreso mayor a Bs. 395.000 
Solución: 
Evento A: que resida en la calle 7. 
Evento B: que resida en la calle 19. 
Evento M: ingreso mayor a Bs. 395.000 
Evento N: ingreso menor a Bs. 395.000 
a) Probabilidad de que resida en la calle 19 y perciba ingreso mayor a Bs 395.000 
P(M/B). 
P(M/B) =
P(M⋂B)
P(B)
 
P(M⋂B) =
14
41
 
P(B) =
24
41
 
P(M/B) =
14
41
24
41
 
 
𝐏(𝐌/𝐁)=
𝟏𝟒
𝟐𝟒
 
b) Probabilidad que perciba un ingreso mayor a Bs. 395.000 P(M) 
𝐏(𝐌) =
𝟐𝟐
𝟒𝟏
 
 
Como P(M/B) ≠ P(M) se concluye que los eventos son dependientes. 
 
ESTADÍSTICA APLICADA 
 
 
 
30 
 
PROBABILIDADES PARA EVENTOS MUTUAMENTE EXCLUYENTES 
 Tomando en cuenta la clasificación de los grupos familiares de las calles 7 y 19 de 
Campo Ayacucho de acuerdo al nivel de ingresos mensuales percibidos ya señalado, se 
determinará la probabilidad que sea de la calle 7 o gane menos de Bs. 395.000. 
Calle 
Ingreso 
Calle 7 Calle 19 Totales 
> Bs. 395.000 8 14 22 
< Bs. 395.000 9 10 19 
Totales 17 24 41 
 
Solución: 
Evento A: que resida en la calle 7. 
Evento N: ingreso menor a Bs. 395.000 
𝐏(𝐀 ∪ 𝐍) = 𝐏(𝐀) + 𝐏(𝐍) − 𝐏(𝐀 ∩ 𝐍) 
P(A) =
17
41
 ; P(N) =
19
41
; P(A ∩ N) =
9
41
 
P(A ∪ N) =
17
41
+
19
41
−
9
41
 
 𝐏(𝐀 ∪ 𝐍) =
𝟐𝟕
𝟒𝟏
 
 
TOMA DE DECISIONES 
Es el proceso mediante el cual se realiza una elección entre diferentes situaciones en 
diferentes contextos utilizando metodologías cuantitativas para ello. 
 
MEDIDAS DE CORRELACIÓN 
 
Entre las medidas de relación más utilizadas se tiene la correlación que es una medida 
estadística de asociación de variables y que expresa la relación entre dos o más variables de 
una muestra o población. Entre los coeficientes de correlación más utilizados se tienen el 
lineal de Pearson y el ordinal de Spearman, que se analizarán a continuación: 
 
ESTADÍSTICA APLICADA 
 
 
 
31 
 
 
Coeficiente de Correlación de Pearson: 
Tomando como referencia los datos aportados por el CLAP de Campo Ayacucho, se 
procede a determinar la relación entre las variables ingreso familiar mensual y el número de 
miembros en el grupo familiar. 
 
Solución: 
Se definen las variables de la siguiente manera: 
 
X = Ingresos mensuales de la familia 
 
Y = Nº de personas por familia. 
 
Fórmula: 
Se empleará la fórmula de los desvíos: 
 
𝐫 =
𝚺𝐱𝐲
√(𝚺𝐱𝟐)(𝚺𝐲𝟐 )
 
 
Para lo que se construirá la tabla que permita obtener los datos requeridos para su cálculo: 
 
 
 
 
Tabla Nº 9 Determinación de Valores para el Cálculo del Coeficiente de 
Correlación De Pearson 
FAMILIA X Y x y x2 y2 xy 
1 391.814 2 -54.617,30 -1,65 2.983.049.459,29 2,7225 90.118,55 
2 700.010 8 253.578,70 4,35 64.302.157.093,69 18,9225 1.103.067,35 
3 221.135 3 -225.296,30 -0,65 50.758.422.793,69 0,4225 146.442,60 
4 718.487 6 272.055,70 2,35 74.014.303.902,49 5,5225 639.330,90 
5 317.555 3 -128.876,30 -0,65 16.609.100.701,69 0,4225 83.769,60 
6 716.003 7 269.571,70 3,35 72.668.901.440,89 11,2225 903.065,20 
7 647.222 5 200.790,70 1,35 40.316.905.206,49 1,8225 271.067,45 
 
ESTADÍSTICA APLICADA 
 
 
 
32 
 
8 345.931 3 -100.500,30 -0,65 10.100.310.300,09 0,4225 65.325,20 
9 285.715 2 -160.716,30 -1,65 25.829.729.085,69 2,7225 265.181,90 
10 698.338 6 251.906,70 2,35 63.456.985.504,89 5,5225 591.980,75 
11 293.312 2 -153.119,30 -1,65 23.445.520.032,49 2,7225 252.646,85 
12 306.300 3 -140.131,30 -0,65 19.636.781.239,69 0,4225 91.085,35 
13 400.496 2 -45.935,30 -1,65 2.110.051.786,09 2,7225 75.793,25 
14 192.019 1 -254.412,30 -2,65 64.725.618.391,29 7,0225 674.192,60 
15 489.025 3 42.593,70 -0,65 1.814.223.279,69 0,4225 -27.685,91 
16 480.314 4 33.882,70 0,35 1.148.037.359,29 0,1225 11.858,95 
17 385.656 2 -60.775,30 -1,65 3.693.637.090,09 2,7225 100.279,25 
Σ= 7.589.332 62 0 0 537.613.734.667,53 65,8825 5.337.519,77 
 
Sustituyendo en la fórmula: 
r =
5.337.519,77
√(537.613.734.667,53)(65,8825)
 
r =
5.337.519,77
5.951.414,70
 
r = 0,90 
Interpretación: de acuerdo a este resultado se puede establecer que existe una 
correlación muy alta entre el número de personas por familia y el ingreso mensual percibido. 
 
Coeficiente de Correlación de Spearman 
 
Para su determinación se emplearán los datos correspondientes a 10 familias como se 
muestra a continuación: 
 
 
FAMILIA X Y 
1 700.010 8 
2 718.487 6 
3 317.555 3 
4 716.003 7 
5 698.338 6 
6 293.312 2 
7 400.496 2 
8 192.019 1 
9 489.025 3 
10 385.656 2 
 
ESTADÍSTICA APLICADA 
 
 
 
33 
 
 
X = Ingresos mensuales de la familia; Y = Nº de personas por familia. 
Con esta información se procede a ordenar de mayor a menor cada variable para 
establecer los rangos en cada caso: 
X RX Y RY 
718.487 1 8 1 
716.003 2 7 2 
700.010 3 6 3,5 
698.338 4 6 3,5 
489.025 5 3 5,5 
400.496 6 3 5,5 
385.656 7 2 8 
317.555 8 2 8 
293.312 9 2 8 
192.019 10 1 10 
 
Luego con los rangos asignados se procede a calcular los desvíos para determinar el 
coeficiente de correlación de Spearman: 
 
 
 
 
 
 
 
Tabla Nº 10 Determinación de Valores para el Cálculo del Coeficiente de 
Correlación de Spearman 
X Y RX RY d d2 
700.010 8 3 1 2 4 
718.487 6 1 3,5 -2,5 6,25 
317.555 3 8 5,5 2,5 6,25 
716.003 7 2 2 0 0 
698.338 6 4 3,5 0,5 0,25 
 
ESTADÍSTICA APLICADA 
 
 
 
34 
 
293.312 2 9 8 1 1 
400.496 2 6 8 -2 4 
192.019 1 10 10 0 0 
489.025 3 5 5,5 -0,5 0,25 
385.656 2 7 8 -1 1 
 Σ= 0 23 
 
Con los resultados de la tabla anterior se procede al cálculo del coeficiente de 
correlación de Spearman mediante la siguiente fórmula: 
𝐩 = 𝟏 − 
𝟔𝚺𝐝𝟐
𝐍(𝐍𝟐 − 𝟏)
 
Sustituyendo: 
p = 1 − 
6(23)
10(102 − 1)
 
p = 1 − 
138
990
 
p = 1 – 0,1394 
p = 0,86 
 
Interpretación: de acuerdo a este resultado se puede establecer que existe una alta 
correlación entre el nº de personas por familia y el ingreso que percibe. 
MUESTREO 
Técnica empleada para la selección de un conjunto de elementos que se consideran 
representativos del grupo al que pertenecen, con la finalidad de estudiar o determinar las 
características del grupo. 
Cálculo de la Muestra: 
Para determinar el tamaño de la muestra se aplica la siguiente fórmula: 
𝐧 =
𝐍
𝐞𝟐(𝐍 − 𝟏) + 𝟏
 
 Donde: N = tamaño de la población y e = error máximo permitido. 
 
ESTADÍSTICA APLICADA 
 
 
 
35 
 
Sabiendo que la población objeto de estudio, es decir, el número de viviendas que 
conforman la Comunidad de Campo Ayacucho, es de 405, y estableciendo que el error 
máximo permitido es 10%, empleando la formula anterior se procede a determinar el tamaño 
de la muestra: 
n =
405
(0,09)2(405 − 1) + 1
 
n = 94,74 ≈ 95 viviendas 
Muestreo Aleatorio (tabla números aleatorios): 
Se cuenta con los expedientes de 100 familias de la comunidad de Campo Ayacucho y 
se desea establecer el nivel de ingresos mensual de 10 de ellas. 
En primer lugar, se le asignó un número de tres dígitos pues se cuenta con 100 
viviendas. 
Seguidamente se establece como criterio de selección empezar por la fila 1 de la 
columna 11-15 y se considerará los primeros y el último dígito, teniéndose el siguiente 
resultado: 
Nº FAMILIA 
INGRESO 
MENSUAL Bs. 
Nº FAMILIA 
INGRESO 
MENSUAL Bs. 
021 Castillo Núñez 841.210,00 005 Barreto Girón 280.678,00 
095 Corvo Maiz 828.898,00 032 Moreno Moreno 584.599,00 
035 Gómez Benavides 655.230,00 010 Sánchez 341.204,00 
076 Serrano Ruiz 306.300,00 083 Marcano Aguilera 1.115.851,00 
014 Molina Rojas 262.217,00 089 Mujica Vázquez 920.824,00 
 
Muestreo Sistemático: 
Manejando la información de los expedientes de las 100 familias por vivienda se 
procede a aplicar el muestreo sistemático para seleccionar una muestra de 10 viviendas a fin 
determinar el nivel de ingresos mensuales de cada una de ellas. 
Teniendo en este caso la población (N) de 100 viviendas y se desea una muestra (n) de 
10, se procede a determinar el intervalo de selección (K) mediante la siguiente fórmula 
𝐊 =
𝐍
𝐧
 
 
ESTADÍSTICA APLICADA 
 
 
 
36 
 
K =
100
10
 =>K = 10 
Ahora se procede a establecer el número aleatorio (i) de arranque el cual se estableció 
sería i = 5, a partir del cual se seleccionan los elementos de la muestra de la siguiente manera: 
i; i+K; i + 2K; i + 3K; ………….; i + (n-1)K 
En este caso serían 5; 15; 25; 35; 45; 55; 65; 75; 85; 95; números que se corresponden 
conlos números asignados a las familias: 
Nº FAMILIA INGRESO MENSUAL Bs. 
5 Barreto Girón 280.678,00 
15 Morao Chacín 398.000,00 
25 Benavides Salazar 947.218,00 
35 Gómez Benavides 655.230,00 
45 López Núñez 240.334,00 
55 González Marcano 821.100,00 
65 León Palma 391.814,00 
75 Chacón Limpio 293.312,00 
85 Maiz Salazar 750.317,00 
95 Corvo Maiz 828.898,00 
Muestreo Estratificado: 
Para este caso se tomará la información de la tabla nº 2 referida al número de viviendas 
por calle: 
 
Calle Nº 7 16 18 19 20 
Nº de Viviendas 24 18 22 17 19 
 
 Se desea tomar una muestra de 15 viviendas, y al ser los estratos (Calles) con números 
de viviendas distintas se empleará la afijación proporcional utilizando la fórmula: 
𝐪𝐡 =
𝐧
𝐍
𝒙𝑵𝒉 
 Donde: nh = tamaño muestral de cada estrato; Nh = tamaño de cada estrato 
Para la Calle 7, el tamaño muestral será: 
q7 =
15
100
𝑥24 = 3,6 ≈ 4 viviendas 
 Igual procedimiento se aplica para cada calle, teniéndose el siguiente resultado: 
 
ESTADÍSTICA APLICADA 
 
 
 
37 
 
Estrato (Calle) Tamaño del Estrato Tamaño Muestral del Estrato 
7 24 4 
16 18 3 
18 22 3 
19 17 2 
20 19 3 
 N=100 n=15 
 
CONTRASTE DE HIPÓTESIS 
 Es un procedimiento para juzgar si una propiedad que se supone en una población 
estadística es compatible con lo observado en una muestra de dicha población. 
 Teniendo en cuenta la información suministrada por un funcionario del Instituto 
Nacional de Estadística (INE) se pudo saber que el ingreso promedio mensual del venezolano 
se ubicó en Bs. 196.700 con una deviación estándar de Bs. 230.250 y que de acuerdo a los 
cálculos realizados para la muestra de 100 viviendas el promedio del ingreso mensual se 
ubicó en Bs. 537.785,10. Empleando un error tipo I de 1%, ¿Se puede aceptar la hipótesis 
del INE? 
 Para establecer el contraste de hipótesis se seguirá el esquema para contrastar, a saber: 
a) Enunciar la hipótesis nula (Ho) y la hipótesis alternativa (H1) 
Ho: μ = Bs. 196.700 
H1: μ > Bs. 196.700 
b) Se selecciona el estadístico y se calcula: 
Por tratarse de una muestra mayor a 30 observaciones y conocer la desviación típica 
(σ), se empleará “Z”, cuya fórmula es: 
𝐙 =
𝑿 − 𝛍
𝛔/√𝐧
 
 Sustituyendo los valores en la fórmula: 
Z =
537.785,19 − 196.700
σ230.250/√100
 
 Z = 14,81 
 
ESTADÍSTICA APLICADA 
 
 
 
38 
 
c) Se seleccionan gráficamente las zonas de aceptación y rechazo y se establece el valor 
crítico con el nivel de significación establecido, en este caso 1% 
El Valor Crítico a este nivel de significación es VC = 2,32. 
 
d) Se toma la decisión: 
Como Z = 14,81 es mayor al Valor Crítico VC = 2,32, se rechaza la hipótesis nula, 
es decir, que el ingreso mensual promedio es mayor a Bs. 196.700 
 
 
VC = −2,32 
ZONA DE ACEPTACION 
ZONA DE RECHAZO 
 
ESTADÍSTICA APLICADA 
 
 
 
39 
 
CONCLUSIONES 
 
Con todo lo aprendido, se puede concluir que la estadística es una rama de la 
matemática que está no se encuentra muy visible en lo cotidiano pero que en realidad es de 
mucha utilidad para interpretar y ver desde un punto de vista muy general datos que se 
obtienen. A través de sus gráficas, medidas de tendencia central y de dispersión podemos ver 
más claro y concreto un conjunto de datos que se nos hacen muy complicados, en resumen 
son un verdadero método de ayuda para informar. 
 La estadística es el conjunto de diversos métodos matemáticos que tienen como 
objetivo obtener, presentar y analizar datos (ya sean cualitativos o cuantitativos); nos permite 
realizar estudios reales, con poblaciones exactas; lo cual nos ayuda a mejorar nuestra 
planificación. 
Llevar un buen registro de datos estadísticos nos permite conocer de mejor manera el 
problema, cuando nosotros conocemos la realidad de nuestras áreas afectadas; es más fácil 
dar soluciones. Los diferentes tipos de distribuciones nos permiten prever eventos que puedan 
ocurrir, teniendo en cuenta lo que ha sucedido anteriormente (datos históricos). 
Una de las técnicas más utilizadas dentro de la estadística es la medición de parámetros 
de tendencial central, la moda, mediana y media. Lo cual nos permite centrar el problema y 
plantear puntos de referencia. 
Una distribución de frecuencia es una tabla de resumen en la que los datos se disponen 
en agrupamientos o categorías convenientemente establecidas de clases ordenadas 
numéricamente. En esta forma las características más importantes de los datos se aproximan 
muy fácilmente, compensando así el hecho de que cuando los datos se agrupan de ese modo, 
la información inicial referente a las observaciones individuales de que antes se disponía se 
pierde a través del proceso de agrupamiento o condensación. 
La principal ventaja de usar una de estas tablas de resumen es que las principales 
características de los datos se hacen evidentes inmediatamente para el lector. 
La principal desventaja de tal tabla de resumen es que no podemos saber cómo se 
distribuyen los valores individuales dentro de un intervalo de clase particular sin tener acceso 
 
ESTADÍSTICA APLICADA 
 
 
 
40 
 
a los datos originales. El punto medio de la clase, sin embargo, es el valor usado para 
representar todos los datos resumidos en un intervalo particular; y a su vez es el punto a la 
mitad de los límites de cada clase y es representativo de los datos de esa clase. 
La probabilidad es la posibilidad u oportunidad de que suceda un evento particular. La 
probabilidad involucrada es una porción o fracción cuyo valor varía entre cero y uno 
exclusivamente. 
En definitiva, se tienen las siguientes conclusiones según la información y resultados 
obtenidos: 
 La comunidad que se consideró para aplicar los diferentes métodos estadísticos fue 
Campo Ayacucho ubicado al sur oeste de la ciudad de Maturín, en el Estado Monagas, 
Venezuela, perteneciente a la Parroquia Alto de los Godos, conformada por 405 
viviendas y un total de 625 familias distribuidas en 13 calles. 
 La información fue suministrada por la Estructura del Comité Local de 
Abastecimiento y Producción (CLAP) del sector y corresponde a los datos de una 
muestra de 100 viviendas. 
 El resultado de calcular la media aritmética resulto que el promedio de ingresos 
mensuales es de Bs. 537.785,1. 
 La mediana resulto por debajo de Bs. 507.539,9 es decir, se encuentra la mitad de los 
datos estudiados. 
 Con respecto a la moda, la mayoría de las familias tienen ingresos mensuales iguales 
a Bs. 370.381,5. 
 El resultado del Decil 1, se interpreta que por debajo de Bs. 507.539,9 está el 10% de 
los datos. 
 El resultado del Decil 9, se interpreta que por debajo de Bs. 848.677,5 está el 90% de 
los datos. 
 El resultado del Cuartil 1, se interpreta que por debajo de Bs. 353.641,14está el 25% 
de los datos. 
 
ESTADÍSTICA APLICADA 
 
 
 
41 
 
 El resultado del Cuartil 3, se interpreta que por debajo de Bs. 699.211está el 75% de 
los datos 
 El resultado del Quintil 1, se interpreta que por debajo de Bs. 327.334,86está el 20% 
de los datos. 
 El resultado del Quintil 4, se interpreta que por debajo de Bs. 736.277,94 está el 80% 
de los datos. 
 El resultado del Percentil 26, se interpreta que por debajo de Bs. 359.619,84 está el 
26% de los datos. 
 El resultado del Percentil 91, se interpreta que por debajo de Bs. 869.005,08 está el 
91% de los datos. 
 Con respecto a los cálculos de las medidas de dispersión dieron como resultado los 
siguientes: Desviación Media (DM) Bs. 187.491,49. Varianza (σ2) 
49.470.877.527,21. Desviación Típica (σ) Bs. 222.420,50. Coeficiente de Variación 
(CV) 41,36%. 
 Para el cálculo del Coeficiente de Curtosis se utilizaron los cuartiles 1 y 3, así como 
los deciles 1 y 9 calculados en la sección de Medidas de Posición. Su resultado arrojó 
que Como Cu = 0,506 >0,263 se determina que la curva es platicúrtica. 
 La probabilidad de que el ingreso mensual se ubique entre Bs. 600.00 y Bs.900.000 
es de 34,10%. 
 La probabilidad de que el ingreso mensual sea mayor a Bs. 450.00 es de 65,17%. 
 La probabilidad de que el ingreso mensual sea menor al salario mínimo de noviembre 
de 2017 (Bs. 117.507) es de 5,26%. Coeficiente de Pearson (r) es igual a 0,90 de 
acuerdo a este resultado se puede establecer que existe una correlación muy alta entre 
el número de personas por familia y el ingreso mensual percibido. 
 Coeficiente de Espearman (p) dio como resultado 0,86 de acuerdo a este resultado se 
puede establecer que existe una alta correlación entre el nº de personas por familia y 
el ingreso que percibe. 
 
 
ESTADÍSTICA APLICADA 
 
 
 
42 
 
BIBLIOGRAFÍA 
 
 Alcoba, José. Guías de Clases de Estadística Aplicada. 
 Apuntes de Clases de Estadística Aplicada, Enero 2018. 
 Censo Poblacional aplicado por el Comité Local de Abastecimiento y 
Producción (CLAP) del Sector Campo Ayacucho. Octubre 2017. 
 
	INTRODUCCIÓN
	PLANTEAMIENTO SITUACIONAL PARA EL ANÁLISIS ESTADÍSTICO
	CONSTRUCCIÓN TABLA DE FRECUENCIA UTILIZANDO EL MÉTODO DE STURGES
	MEDIDAS DE TENDENCIA CENTRAL:
	MEDIA ARITMÉTICA
	MEDIANA
	MODA
	GRÁFICOS ESTADÍSTICOS
	HISTOGRAMA:
	POLÍGONO DE FRECUENCIAS:
	OJIVA:
	GRÁFICO CIRCULAR:
	MEDIDAS DE POSICIÓN
	CUARTILES
	QUINTILES
	DECILES
	PERCENTILES
	MEDIDAS DE DISPERSIÓN
	DESVIACIÓN MEDIA
	VARIANZA
	DESVIACIÓN TÍPICA
	COEFICIENTE DE VARIACIÓN
	COEFICIENTE DE CURTOSIS
	PROBABILIDADES
	DISTRIBUCIÓN PROBABILÍSTICA NORMAL
	PROBABILIDADES PARA EVENTOS INDEPENDIENTES
	PROBABILIDADES PARA EVENTOS DEPENDIENTES
	PROBABILIDADES PARA EVENTOS MUTUAMENTE EXCLUYENTES
	TOMA DE DECISIONES
	MEDIDAS DE CORRELACIÓN
	Coeficiente de Correlación de Pearson:
	Coeficiente de Correlación de Spearman
	MUESTREO
	Cálculo de la Muestra:
	Muestreo Aleatorio (tabla números aleatorios):
	Muestreo Sistemático:
	Muestreo Estratificado:
	CONTRASTE DE HIPÓTESIS
	CONCLUSIONES
	BIBLIOGRAFÍA

Continuar navegando