Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
ESTADÍSTICA APLICADA ANÁLISIS ESTADÍSTICO DE DATOS Maturín, 17 de febrero de 2023 ESTADÍSTICA APLICADA 2 CONTENIDO INTRODUCCIÓN ............................................................................................................. 4 PLANTEAMIENTO SITUACIONAL PARA EL ANÁLISIS ESTADÍSTICO .................. 6 CONSTRUCCIÓN TABLA DE FRECUENCIA UTILIZANDO EL MÉTODO DE STURGES. ........................................................................................................................ 7 MEDIDAS DE TENDENCIA CENTRAL: ........................................................................ 9 MEDIA ARITMÉTICA ................................................................................................. 9 MEDIANA ..................................................................................................................... 9 MODA ........................................................................................................................... 9 GRÁFICOS ESTADÍSTICOS: ........................................................................................ 12 HISTOGRAMA: .......................................................................................................... 12 POLÍGONO DE FRECUENCIAS: ............................................................................... 12 OJIVA: ......................................................................................................................... 12 GRÁFICO CIRCULAR: .............................................................................................. 12 MEDIDAS DE POSICIÓN .............................................................................................. 16 CUARTILES ................................................................................................................ 16 QUINTILES ................................................................................................................. 16 DECILES ..................................................................................................................... 16 PERCENTILES............................................................................................................ 16 MEDIDAS DE DISPERSIÓN.......................................................................................... 21 DESVIACIÓN MEDIA ................................................................................................ 21 VARIANZA ................................................................................................................. 21 DESVIACIÓN TÍPICA ................................................................................................ 21 COEFICIENTE DE VARIACIÓN ............................................................................... 21 COEFICIENTE DE CURTOSIS. ..................................................................................... 23 PROBABILIDADES ....................................................................................................... 23 DISTRIBUCIÓN PROBABILÍSTICA NORMAL ........................................................ 24 PROBABILIDADES PARA EVENTOS INDEPENDIENTES..................................... 27 PROBABILIDADES PARA EVENTOS DEPENDIENTES ......................................... 28 ESTADÍSTICA APLICADA 3 PROBABILIDADES PARA EVENTOS MUTUAMENTE EXCLUYENTES ............. 30 TOMA DE DECISIONES................................................................................................ 30 MEDIDAS DE CORRELACIÓN ................................................................................. 30 Coeficiente de Correlación de Pearson: ..................................................................... 31 Coeficiente de Correlación de Spearman ................................................................... 32 MUESTREO ................................................................................................................ 34 Cálculo de la Muestra: .............................................................................................. 34 Muestreo Aleatorio (tabla números aleatorios): ......................................................... 35 Muestreo Sistemático: ............................................................................................... 35 Muestreo Estratificado: ............................................................................................. 36 CONTRASTE DE HIPÓTESIS .................................................................................... 37 CONCLUSIONES ........................................................................................................... 39 BIBLIOGRAFÍA ............................................................................................................. 42 ESTADÍSTICA APLICADA 4 INTRODUCCIÓN La estadística ha estado presente desde hace siglos atrás con las antiguas civilizaciones, su uso ha sido necesario en primeras instancias para resolver casos de la vida diaria por llamarlo de alguna manera, luego sería empleada con fines a mayor escala como trabajos investigativos o estudios, y ha adquirido relevancia, ya que por medio de ella se puede procesar una extensa información, lo cual se puede llevar a cabo de forma más sencilla sin pasar a ser algo tedioso. Para lograr un verdadero aprendizaje de la estadística, como en cualquier rama de las matemáticas, no basta con la memorización de sus conceptos ni definiciones, incluso ni de sus procesos. La estadística tiene como objetivo el desarrollo de las capacidades racionales del estudiante, considerando sus conocimientos previos, con la finalidad de propiciar el logro de aprendizajes significativos que le permitan comprender la importancia y utilidad en lo que será su vida profesional Tanto así es su importancia que ha dejado de ser solo una parte de las matemáticas y se ha convertido en una ciencia empleada en diferentes campos, pues han tomado sus métodos para aplicarlos a sus aéreas independientemente de la que sea, como por ejemplo: la psicología, la medicina, la contaduría, administración, entre otras. La significación de la estadística es posibles gracias a que los métodos que la acompañan son reconocidos por su gran confiabilidad y validez, son totalmente apropiados para manejar información. En esta investigación se resumen los datos recolectados, así como su tratamiento estadístico en la comunidad de Campo Ayacucho sector popular ubicado al sur-oeste de la ciudad de Maturín del Estado Monagas, Venezuela, perteneciente a la Parroquia Alto de los Godos, conformada por 405 viviendas y un total de 625 familias distribuidas en 13 calles; y ESTADÍSTICA APLICADA 5 corresponde a los datos de una muestra de 100 viviendas. No se incluyen puntuaciones en bruto, sino mas bien datos estadística descriptiva (media, desviación estándar, entre otros) y los datos fruto de las pruebas estadísticas implementadas. Incluye las tablas y figuras que, por si solas, deben poder expresar claramente los resultados del estudio. La construcción de esta sección debe comenzar por la elaboración de las tablas y figuras, y solo posteriormente redactar los textos pertinentes (comentarios o interpretaciones) en función de ellas. ESTADÍSTICA APLICADA 6 PLANTEAMIENTO SITUACIONAL PARA EL ANÁLISIS ESTADÍSTICO La comunidad de Campo Ayacucho es un barrio popular enclavado al sur oeste de la ciudad de Maturín, en el Estado Monagas, Venezuela, perteneciente a la Parroquia Alto de los Godos, conformada por 405 viviendas y un total de 625 familias distribuidas en 13 calles.La información que se presenta a continuación fue suministrada por la Estructura del Comité Local de Abastecimiento y Producción (CLAP) del sector y corresponde a los datos de una muestra de 100 viviendas. Tabla Nº 1 Ingresos Mensuales por Vivienda (En Bs.) Tabla Nº 2 Distribución de Viviendas por Calles de la muestra Calle Nº 7 16 18 19 20 Nº de Viviendas 24 18 22 17 19 Tabla Nº 3 Distribución de Número de Personas por Vivienda 582.400,00 841.210,00 458.882,00 535.211,00 385.656,00 283.427,00 433.792,00 413.914,00 485.925,00 452.318,00 463.710,00 848.607,00 417.028,00 550.409,00 384.916,00 291.932,00 538.597,00 438.579,00 223.878,00 690.247,00 280.678,00 947.218,00 240.334,00 391.814,00 750.317,00 622.441,00 781.633,00 503.314,00 700.010,00 705.757,00 762.212,00 681.517,00 593.656,00 221.135,00 736.707,00 570.688,00 382.734,00 431.972,00 718.487,00 584.196,00 688.648,00 775.123,00 592.240,00 317.555,00 920.824,00 341.204,00 1.147.607,00 303.165,00 716.003,00 1.115.851,00 696.637,00 926.773,00 380.497,00 647.222,00 978.298,00 315.031,00 584.599,00 635.302,00 345.931,00 576.128,00 753.701,00 500.558,00 617.137,00 285.715,00 465.540,00 262.217,00 1.115.432,00 551.668,00 698.338,00 310.504,00 398.000,00 655.230,00 821.100,00 293.312,00 828.898,00 346.031,00 415.560,00 558.260,00 306.300,00 272.328,00 394.019,00 347.485,00 341.103,00 400.496,00 310.504,00 469.799,00 773.411,00 357.441,00 192.019,00 828.898,00 191.021,00 810.474,00 504.725,00 489.025,00 480.314,00 382.482,00 353.289,00 376.616,00 480.314,00 272.328,00 ESTADÍSTICA APLICADA 7 Nº de Personas por Vivienda 1 2 3 4 5 6 7 8 fi 2 12 16 22 20 12 13 3 Tabla Nº 4 Distribución Absoluta y Porcentual de la Población de la muestra por Genero Genero fi % Masculino 233 52% Femenino 216 48% Totales 449 100% CONSTRUCCIÓN TABLA DE FRECUENCIA UTILIZANDO EL MÉTODO DE STURGES En estadística descriptiva esta regla es muy utilizada cuando se quiere realizar una tabla de frecuencias y distribuir los datos analizados por clases, ya que con esta regla se calcula el número de clases (o intervalos) necesarios para representar fielmente los datos. Consta de tres pasos a saber: 1. Determinación del Rango. 𝑹𝒈𝒐 = 𝑫𝑴𝑨𝒀 − 𝑫𝒎𝒆𝒏 + 𝑭𝒄 Dónde: Rgo = Rango; DMAY = Dato de mayor valor; Dmen = Dato de menor valor y Fc = Factor de Corrección. 2. Determinación del Número de Clases 𝑵º 𝑪𝒍𝒂𝒔𝒆𝒔 = 𝟏 + 𝟑, 𝟑𝟐 𝐥𝐨𝐠 𝑵 Donde: N = Número de datos 3. Determinación del Intervalo de Clases: 𝑰𝒄 = 𝑹𝒈𝒐 𝑵º 𝒅𝒆 𝑪𝒍𝒂𝒔𝒆𝒔 Empleando los datos de los ingresos mensuales (TABLA Nº1) y aplicando las fórmulas señaladas se tiene: ESTADÍSTICA APLICADA 8 N =100 DMAY =1.147.607 Dmen = 191.021 Rgo = 1.147.607 − 191.021 + 1 Nº Clases = 1 + 3,32 log 100 Nº Clases = 7,64 ≈ 8 Ic = 956.587 8 Teniendo en cuenta los valores hallados se procede a elaborar la tabla colocando como límite inferior de la primera clase el valor menor de los datos (Dmen) al cual se le irá sumando el Intervalo de clase (Ic) y así determinar los limites inferiores de cada clase hasta completar el número de clases definido, en este caso de 8. Quedando las clases de la tabla de frecuencias de la siguiente manera: Tabla Nº 5 Determinación de las Clases CLASES Li Ls 191.021 310.594 310.595 430.168 430.169 549.742 549.743 669.316 669.317 788.890 788.891 908.464 908.465 1.028.038 1.028.039 1.147.613 Li = Límite Inferior Ls = Límite Superior Rgo = 956.587 Nº Clases = 8 Ic = 119574 ESTADÍSTICA APLICADA 9 MEDIDAS DE TENDENCIA CENTRAL: Son indicadores estadísticos quemuestran hacia qué valor (o valores) se agrupan los datos,de los cuales, las más conocidas son: la media aritmética, la moda y la mediana. MEDIA ARITMÉTICA Es el valor resultante que se obtiene al dividirla sumatoria de un conjunto de datos sobre el número total de datos. En el caso de los datos agrupados se emplea la siguiente fórmula: 𝑿 = 𝜮 𝒇𝒊. 𝑿𝒎 𝑵 Donde: fi = Frecuencia absoluta onúmero de veces que se repite un valordentro de un conjunto de datos. Xm = Punto medio de un intervalode clase o Marca de Clase. N = Número de datos MEDIANA Valor que divide una serie de datos en dos partes iguales. La cantidad de datos que queda por debajo y por arriba de la mediana son iguales.Para su determinación se utiliza la siguiente fórmula: 𝑴𝒅 = 𝑳𝒊 + 𝑷𝒐𝒔𝒊𝒄𝒊ó𝒏 − 𝑭𝑨 − 𝟏 𝒇𝒊 𝒙 𝑰𝒄 Donde: Li = Límite real inferior; Posición = N/2; FA-1 = Frecuencia acumulada de la clase anterior a la mediana; fi = frecuencia simple de la clase mediana; Ic = Intervalo de Clase. MODA Indica el valor que más se repite, o la clase que poseemayor frecuencia. Para su cálculo se emplea la siguiente fórmula: 𝑴𝒐 = 𝑳𝒊 + ∆𝟏 ∆𝟏 + ∆𝟐 𝒙 𝑰𝒄 ∆𝟏 = 𝒇𝒄𝒎 − 𝒇𝒄𝒎 − 𝟏 ∆𝟐 = 𝒇𝒄𝒎 − 𝒇𝒄𝒎 + 𝟏 ESTADÍSTICA APLICADA 10 Donde: Li = Límite real inferior; fcm = Frecuencia simple de la clase modal; fcm-1 = Frecuencia simple de la clase anterior a la modal; fcm+1 = Frecuencia simple de la clase posterior a la modal; Ic = Intervalo de Clase. Entonces se procede a completar la tabla de frecuencias para obtener la información requerida para el cálculo de las medidas de tendencia a central como sigue: Tabla Nº 6 Distribución de Frecuencias CLASES fi Xm Fi*Xm FA> 191.021 310.594 17 250.808 4.263.728 17 310.595 430.168 22 370.382 8.148.393 39 Clase moda 430.169 549.742 17 489.956 8.329.244 56 Clase mediana 549.743 669.316 15 609.530 9.142.943 71 669.317 788.890 16 729.104 11.665.656 87 788.891 908.464 6 848.678 5.092.065 93 908.465 1.028.038 4 968.252 3.873.006 97 1.028.039 1.147.613 3 1.087.826 3.263.478 100 1.147.613 N= 100 Σ= 53.778.512 Para el cálculo de la media aritmética: Σfi. Xm = 53.778.512 N=100 X = 53.778.512 100 Interpretación: El promedio de ingresos mensuales es de Bs. 537.785,1. Para el cálculo de la mediana: Posición = 𝑁 2 =>Posición = 100 2 Posición = 50 Se busca este valor de 50 en la columna FA> para establecer la clase mediana, la cual es la clase: 430.169 -549.742, lo que permite establecer los valores requeridos para el cálculo de esta medida. 𝐗 = 𝟓𝟑𝟕. 𝟕𝟖𝟓, 𝟏 ESTADÍSTICA APLICADA 11 Para determinar el límite inferior real al límite inferior de la clase indicada se le resta 0,5, quedando: Li = 430.169 – 0,5 => Li = 430.168,5 FA-1 = 39 fi = 17 Ic = 119.574 Sustituyendo en la fórmula Md = 430.168,5 + 50− 39 17 x 119.574 Interpretación: por debajo de Bs. 507.539,9 se encuentra la mitad de los datos estudiados. Para calcular la moda: Se ubica la clase con la mayor frecuencia simple, la cual es: 310.595 - 430.168, de donde se determinan los datos requeridos para el cálculo respectivo Li = 310.595 – 0,5 => Li = 310.594,5 fcm = 22 fcm-1 = 17 fcm+1 = 17 ∆𝟏 = 𝟐𝟐 − 𝟏𝟕 =>∆𝟏 = 𝟓 ∆𝟐 = 𝟐𝟐 − 𝟏𝟕 =>∆𝟐 = 𝟓 𝑀𝑜 = 310.594,5 + 5 5 + 5 𝑥 119.574 Interpretación: La mayoría de las familias tienen ingresos mensuales iguales a Bs. 370.381,5 Md = 507.539,9 Mo = 370.381,5 ESTADÍSTICA APLICADA 12 GRÁFICOS ESTADÍSTICOS Son representaciones visuales que empleansímbolos, barras, polígonos y sectores, de los datos contenidos entablas de frecuencias. Se presentarán cinco tipos de gráficos estadísticos: HISTOGRAMA: Representan las frecuencias mediante columnas (o barras), a través de la altura de las mismas en un plano cartesiano, con la particularidad de que no existeespacio entre las barras. POLÍGONO DE FRECUENCIAS: Este gráfico se utiliza para el caso de variables cuantitativas, tanto discretas comocontinuas, partiendo del histograma, según eltipo de tabla de frecuencia manejada.OJIVA: En este gráfico se emplea un polígono de frecuencia o curva suavizada con unacaracterística muy particular: muestra las frecuencias absolutas o relativasacumuladas.Se clasifica en OJIVA > y OJIVA <. GRÁFICO CIRCULAR: Este tipo de diagramas consideran una figura geométrica en que la distribución defrecuencias se reparte dentro de la figura como puede ser una dona, pastel,círculo o anillo, en el que cada porción dentro de la figura representa la información porcentual del total de datos. Para la elaboración de estos gráficos se requiere completar la tabla inicial, la cual quedará: Tabla Nº 7 Distribución de Frecuencias Ampliada CLASES fi Xm Fi*Xm fr % Grados FA> FA< 191.021 310.594 17 250.808 4.263.728 0,17 17% 61º 17 100 310.595 430.168 22 370.382 8.148.393 0,22 22% 79º 39 83 430.169 549.742 17 489.956 8.329.244 0,17 17% 61º 56 61 549.743 669.316 15 609.530 9.142.943 0,15 15% 54º 71 44 669.317 788.890 16 729.104 11.665.656 0,16 16% 58º 87 29 788.891 908.464 6 848.678 5.092.065 0,06 6% 22º 93 13 908.465 1.028.038 4 968.252 3.873.006 0,04 4% 14º 97 7 1.028.039 1.147.613 3 1.087.826 3.263.478 0,03 3% 11º 100 3 n= 100 Σ= 53.778.512 1,00 100% 360º Donde: ESTADÍSTICA APLICADA 13 fi = frecuencia simple de la clase Xm = Punto medio de la clase fr = frecuencia relativa de clase FA> = Frecuencia acumulada mayor que FA< = Frecuencia acumulada menor que 17 22 17 15 16 6 4 3 0 5 10 15 20 25 Fr e cu en ci a Límite de Clases Gráfico Nº 1 Histograma ESTADÍSTICA APLICADA 14 17 22 17 15 16 6 4 3 0 5 10 15 20 25 Fr e cu e n ci a Xm Gráfico Nº 2 Polígono de Frecuencia 17 39 56 71 87 93 97 100 0 20 40 60 80 100 120 Fa > Xm Gráfico Nº 3 Ojiva > ESTADÍSTICA APLICADA 15 100 83 61 44 29 13 7 3 0 20 40 60 80 100 120 Fa < Xm Gráfico Nº 4 Ojiva < 17% 22% 17% 15% 16% 6% 4% 3% Gráfico Nº 5 Circular ESTADÍSTICA APLICADA 16 MEDIDAS DE POSICIÓN Las medidas de posición equivalen a los valores que puede tomaruna variable caracterizados por agrupar a cierto porcentaje deobservaciones en la muestra o población y son ideales para obtener informaciónadicional a partir de datos resumidos, es decir, que presentanpérdida de información por agrupamiento en intervalos de clase. En esta partese analizarán cuatro medidas de posición: Cuartiles, Quintiles, Deciles y Percentiles. CUARTILES Los cuartiles, dividen el total de los datos en 4 partes iguales. Se denota como Qx. QUINTILES Los cuartiles, dividen un conjunto de datos en 5 partes iguales. Se denota como Kx. DECILES Para los deciles, se toma el total de los datos divididos en 10 partes iguales, por tanto, existirán 10 deciles representado como Dx. PERCENTILES Los percentiles representan los valores de la variable que están por debajo de unporcentaje, en otras palabras, el totalde los datos es divido en 100 partes iguales. Se denota como Px. Para el cálculo de las medidas de posición se emplea la fórmula que se señala a continuación, en donde en el círculo se sustituirá la medida respectiva. = 𝑳𝒊 + 𝑷𝒐𝒔𝒊𝒄𝒊ó𝒏 − 𝑭𝑨 − 𝟏 𝒇𝒊 𝒙 𝑰𝒄 Aquí se hará un ajuste en relación a la posición para cada medida de posición según sea el caso a saber: Posición para Cuartiles: 𝑷𝑸𝒙 = 𝑿. 𝑵 𝟒 ESTADÍSTICA APLICADA 17 Posición para Quintiles: 𝑷𝑲𝒙 = 𝑿. 𝑵 𝟓 Posición para Deciles: 𝑷𝑫𝒙 = 𝑿. 𝑵 𝟏𝟎 Posición para Percentiles: 𝑷𝑷𝒙 = 𝑿. 𝑵 𝟏𝟎𝟎 Tomando como referencia los datos de la tabla nº 7 se procederá a determinar las siguientes medidas de posición: D1, D9, Q1, Q3, K1, K2, K4, P26, y P91. Para el Decil 1: Posición: PD1 = 𝑋.𝑁 10 =>PD1 = 1.100 10 PD1 = 10 Se busca este valor de 50 en la columna FA>para establecer la clase del D1, la cual es la clase: 191.021 - 310.594, lo que permite establecer los valores requeridos para el cálculo de esta medida. Para determinar el límite inferior real, al límite inferior de la clase indicada se le resta 0,5, quedando: Li = 191.021 – 0,5 => Li = 191.020,5 FA-1 = 0 fi = 17 Ic = 119.574 Sustituyendo en la fórmula D1 = 191.1020,5 + 10− 0 17 x 119.574 Interpretación: Por debajo de Bs. 507.539,9 está el 10% de los datos. 𝐃𝟏 = 507.539,9 ESTADÍSTICA APLICADA 18 Como el procedimiento es similar solo se tomará en cuenta los datos necesarios para el cálculo respectivo. Para el Decil 9: Posición: PD9 = 𝑋.𝑁 10 =>PD9 = 9.100 10 PD9 = 90 Clase del D9: 788.891 - 908.464 Li = 788.891 – 0,5 => Li = 788.890,5 FA-1 = 87 fi = 6 Ic = 119.574 Sustituyendo en la fórmula D9 = 788.890,5 + 90− 87 6 x 119.574 Interpretación: Por debajo de Bs. 848.677,5 está el 90% de los datos. Para el Cuartil 1: Posición: PQ1 = 𝑋.𝑁 4 =>PQ1 = 1.100 4 PQ1 = 25 Clase del Q1: 310.595 - 430.168 Li = 310.595 – 0,5 => Li = 310.594,5 FA-1 = 17 fi = 22 Ic = 119.574 Sustituyendo en la fórmula Q1 = 310.594,5 + 25− 17 22 x 119.574 Interpretación: Por debajo de Bs. 353.641,14está el 25% de los datos. Para el Cuartil 3: Posición: PQ3 = 𝑋.𝑁 4 =>PQ3 = 4.100 4 PQ3= 75 𝐃𝟗= 848.677,5 𝐐𝟏 = 353.641,14 ESTADÍSTICA APLICADA 19 Clase del Q3: 669.317 - 788.890 Li = 669.317 – 0,5 => Li = 669.316,5 FA-1 = 71 fi = 16 Ic = 119.574 Sustituyendo en la fórmula Q3 = 669.316,5 + 75− 71 16 x 119.574 Interpretación: Por debajo de Bs. 699.211está el 75% de los datos. Para el Quintil 1: Posición:PK1 = 𝑋.𝑁 5 =>PK1 = 1.100 5 PK1 = 20 Clase del K1: 310.595 - 430.168 Li = 310.595 – 0,5 => Li = 310.594,5 FA-1 = 17 fi = 22 Ic = 119.574 Sustituyendo en la fórmula K1 = 310.594,5 + 20− 17 22 x 119.574 Interpretación: Por debajo de Bs. 327.334,86está el 20% de los datos. Para el Quintil 4: Posición: PK4 = 𝑋.𝑁 5 =>PK4 = 4.100 5 PK4 = 80 Clase del K4: 669.317 - 788.890 Li = 669.317 – 0,5 => Li = 669.316,5 FA-1 = 71 fi = 16 𝐐𝟑 = 699.211 K1= 327.334,86 ESTADÍSTICA APLICADA 20 Ic = 119.574 Sustituyendo en la fórmula K4 = 669.316,5 + 80− 71 16 x 119.574 Interpretación: Por debajo de Bs. 736.277,94 está el 80% de los datos. Para el Percentil 26: Posición: PP26 = 𝑋.𝑁 100 =>PP26 = 26.100 100 PP26 = 26 Clase del P26: 310.595 - 430.168 Li = 310.595 – 0,5 => Li = 310.594,5 FA-1 = 17 fi = 22 Ic = 119.574 Sustituyendo en la fórmula P26 = 310.594,5 + 26− 17 22 x 119.574 Interpretación: Por debajo de Bs. 359.619,84 está el 26% de los datos. Para el Percentil 91: Posición: PP91 = 𝑋.𝑁 100 =>PP91 = 91.100 100 PP91 = 91 Clase del P91: 788.891 - 908.464 Li = 788.891 – 0,5 => Li = 788.890,5 FA-1 = 87 fi = 6 Ic = 119.574 Sustituyendo en la fórmula P91 = 788.890,5 + 91− 87 6 x 119.574 𝐊𝟒 = 736.277,94 𝐏𝟐𝟔 = 359.619,84 𝐏𝟗𝟏 = 869.005,08 ESTADÍSTICA APLICADA 21 Interpretación: Por debajo de Bs. 869.005,08 está el 91% de los datos. MEDIDAS DE DISPERSIÓN Son indicadores estadísticos que muestran ladistancia promedio que existe entre los datos y la media aritmética.En el estudio de las medidas de dispersión daremos un vistazo a cuatroindicadores básicos: DESVIACIÓN MEDIA Equivale a la división de la sumatoria del valorabsoluto de las distancias existentes entre cada dato y su mediaaritmética y el número total de datos. Para su cálculo se emplea la siguiente fórmula: 𝑫𝑴 = 𝜮 𝒇𝒊│𝑿𝒎 − 𝑿│ 𝑵 VARIANZA Es el resultado de la división de la sumatoria de lasdistancias existentes entre cada dato y su media aritmética elevadas alcuadrado, y el número total de datos. La fórmula para su determinación es la siguiente: 𝝈𝟐 = 𝜮 𝒇𝒊│𝑿𝒎 − 𝑿│𝟐 𝑵 DESVIACIÓNTÍPICA Es igual a la raíz cuadrada de lavarianza. Para su cálculo se emplea la siguiente fórmula: 𝝈 = √ 𝜮 𝒇𝒊│𝑿𝒎 − 𝑿│𝟐 𝑵 COEFICIENTE DE VARIACIÓN Equivale a la razón entre la mediaaritmética y la desviación típica o estándar. Se calcula con la siguiente fórmula: 𝐂𝐕 = 𝝈 𝑿 𝒙𝟏𝟎𝟎 Para proceder a los cálculos de las medidas de dispersión se hace necesario completar la tabla de frecuencias con las columnas que generaran la información requerida para tal fin como se muestra a continuación: ESTADÍSTICA APLICADA 22 Tabla Nº 8 Determinación de los Valores Requeridos para el Cálculo de las Medidas de Dispersión CLASES fi Xm fiXm │Xm - 𝑿│ │Xm - 𝑿│2 fi│Xm - 𝑿│ fi│Xm - 𝑿│2 191.021 310.594 17 250.808 4.263.728 286.973,1 82.353.560.123,6 4.878.542,7 1.400.010.522.101,4 310.595 430.168 22 370.382 8.148.393 167.399,1 28.022.458.680,8 3.682.780,2 616.494.090.977,8 430.169 549.742 17 489.956 8.329.244 47.825,1 2.287.240.190,0 813.026,7 38.883.083.230,2 549.743 669.316 15 609.530 9.142.943 71.748,9 5.147.904.651,2 1.076.233,5 77.218.569.768,2 669.317 788.890 16 729.104 11.665.656 191.322,9 36.604.452.064,4 3.061.166,4 585.671.233.030,6 788.891 908.464 6 848.678 5.092.065 310.896,9 96.656.882.429,6 1.865.381,4 579.941.294.577,7 908.465 1.028.038 4 968.252 3.873.006 430.470,9 185.305.195.746,8 1.721.883,6 741.220.782.987,2 1.028.039 1.147.613 3 1.087.826 3.263.478 550.044,9 302.549.392.016,0 1.650.134,7 907.648.176.048,0 N= 100 Σ= 2.056.681,8 738.927.085.902,5 18.749.149,2 4.947.087.752.721,0 Sustituyendo los valores obtenidos en las formulas indicadas se tiene: Desviación Media 𝐷𝑀 = 𝛴 𝑓𝑖│𝑋𝑚 − 𝑋│ 𝑁 𝐷𝑀 = 18.749.149,2 100 DM = Bs. 187.491,49 Varianza σ2 = Σ fi│Xm − X│2 N 𝜎 = 4.947.087.752.721 100 σ2=49.470.877.527,21Bs2 Desviación típica σ = √ Σ fi│Xm − X│2 N σ = √49.470.877.527,21 σ = Bs. 222.420,50 ESTADÍSTICA APLICADA 23 Coeficiente de Variación CV = 𝜎 𝑋 𝑥100 CV = 222.450,50 537.781,1 𝑥100 CV = 41,36% COEFICIENTE DE CURTOSIS Indica que tan apuntada o achatada se encuentra una distribución respecto a un comportamiento normal (distribución normal). Se emplea la fórmula que se muestra a continuación: 𝐂𝐮 = 𝑸𝟑 − 𝑸𝟏 𝟐(𝑫𝟗 − 𝑫𝟏) Para su cálculo se utilizarán los cuartiles 1 y 3, así como los deciles 1 y 9 calculados en la sección de Medidas de Posición, cuyos resultados son: Q1 = 353.641,14 Q3 = 699.211,00 D1 = 507.539,90 D9 = 848.677,50 Sustituyendo en la fórmula: Cu = 699.211,00 − 353.641,14 2(848.677,50 − 507.539,90) Cu = 0,506 Como Cu = 0,506 >0,263 se determina que la curva es platicúrtica. PROBABILIDADES La probabilidad es la mayor o menor posibilidad de que ocurra un determinado suceso y se orienta a medir cuantitativamente la certeza o duda de que un suceso dado ocurra o no, estableciendo una relación entre el número de sucesos favorables y el número total de sucesos posibles. Con los datos determinados se procederá a realizar la aplicación de este concepto. ESTADÍSTICA APLICADA 24 DISTRIBUCIÓN PROBABILÍSTICA NORMAL Se sabe que el ingreso promedio mensual de la Comunidad de Campo Ayacucho se ubica en Bs. 537.785,10 con una desviación típica de Bs. 222.420, 50. Hallar la probabilidad: a. Que el ingreso se ubique entre Bs. 600.000 y Bs. 900.000. b. Que el ingreso sea superior a Bs 450.000. c. Que el ingreso sea menor al Salario mínimo de mes de noviembre de 2017. Datos: X = Bs. 537.785,1 σ = Bs. 222.420,50 Incógnitas: a) P (Bs. 600.000 < X < Bs. 900.000) b) P (X > 450.000) c) P (X < Salario mínimo de noviembre de 2017) Solución: Para estos casos se empleará la variable estandarizada “Z”, a fin de tipificar los datos. a) P (Bs. 600.00 < X < Bs. 900.000) Fórmula: 𝒁𝒊 = 𝑿𝒊 − 𝑿 𝛔 𝑍1 = 𝐵𝑠. 600.000 − 𝐵𝑠. 537.785,1 Bs. 222.420,50 𝑍1 = 𝐵𝑠. 62.214,9 Bs. 222.420,50 Z1 = 0,27 El área bajo la curva normal que corresponde a este valor de Z es A1 = 0,1064 𝑍2 = 𝐵𝑠. 900.000 − 𝐵𝑠. 537.785,1 Bs. 222.420,50 𝑍2 = 𝐵𝑠. 3 62.214,9 Bs. 222.420,50 Z2 = 1,62 ESTADÍSTICA APLICADA 25 El área bajo la curva normal que corresponde a este valor de Z es A1 = 0,4474 Gráfica: El área buscada (AB) será: AB = A2 – A1 AB = 0,4474 – 0,1064 AB = 0,341 % = 34,10 Interpretación: La probabilidad de que el ingreso mensual se ubique entre Bs. 600.00 y Bs. 900.000 es de 34,10%. b) P (X > Bs. 450.000) Fórmula: 𝒁𝒊 = 𝑿𝒊 − 𝑿 𝛔 𝑍1 = 𝐵𝑠. 450.000 − 𝐵𝑠. 537.785,1 Bs. 222.420,50 𝑍1 = − 𝐵𝑠. 87.785,1 Bs. 222.420,50 Z1 = - 0,39 El área bajo la curva normal que corresponde a este valor de Z es A1 = 0,1517 Gráfica: 𝐗 𝑍1 = 0,27 𝑍2 = 1,62 A 1 A 2 ESTADÍSTICA APLICADA 26 El área buscada (AB) será: AB = A1 + 0,5 AB = 0,1517 + 0,5 AB = 0,6517 % = 65,17 Interpretación: La probabilidad de que el ingreso mensual sea mayor a Bs. 450.00 es de 65,17%. c) P (X < Salario mínimo de noviembre 2017) El salario mínimo de noviembre 2017 se ubicó en Bs. 117.507 Fórmula: 𝒁𝒊 = 𝑿𝒊 − 𝑿 𝛔 𝑍1 = 𝐵𝑠. 177.507 − 𝐵𝑠. 537.785,1 Bs. 222.420,50 𝑍1 = − 𝐵𝑠. 360.278,1 Bs. 222.420,50 Z1 = - 1,62 El área bajo la curva normal que corresponde a este valor de Z es A1 = 0,4474 Gráfica: 𝑍1 = −0,39 𝐗 A 1 0,5 ESTADÍSTICA APLICADA 27 El área buscada (AB) será: AB = 1 – (0,4474 + 0,5) AB = 1 - 0,9474 AB = 0,0526 % = 5,26 Interpretación: La probabilidad de que el ingreso mensual sea menor al salario mínimo de noviembre de 2017 (Bs. 117.507) es de 5,26%. PROBABILIDADES PARA EVENTOS INDEPENDIENTES Se sabe que las calles 7 y 19 tienen 24 y 17 viviendas respectivamente (información disponible en la tabla nº 2), supongamos que tenemos los expedientes sobre una mesa y que estos no se encuentran ordenados por calle, si se toman dos expedientes de manera sucesiva hallar la probabilidad que: a) Ambos pertenezcan a la calle 7 b) Ambos pertenezcan a la calle 19 c) El primero sea de la calle 7 y el segundo sea de la calle 19 d) El primero sea de la calle 19 y el segundo sea de la calle 7 Solución: Se establece el espacio muestral por medio del siguiente Diagrama Tabular: Calle 7 Calle 19 Calle 7 C7,C7 C7,C19 Calle 19 C19,C7 C19,C19 a) P(C7, C7) = P(C7) . P(C7/C7) 𝑍1 = −1,62 𝐗 A 1 0,5 ESTADÍSTICA APLICADA 28 P(C7, C7) = 24 41 x 23 40 P(C7, C7) = 552 1640 𝐏(𝐂𝟕, 𝐂𝟕) = 𝟔𝟗 𝟐𝟎𝟓 b) P(C19, C19) = P(C19) . P(C19/C19) P(C19, C19) = 17 41 x 23 40 P(C19, C19) = 272 1640 𝐏(𝐂𝟕, 𝐂𝟕) = 𝟑𝟒 𝟐𝟎𝟓 c) P(C7, C19) = P(C7) . P(C19/C7) P(C7, C19) = 24 41 x 17 40 P(C7, C19) = 408 1640 𝐏(𝐂𝟕, 𝐂𝟕) = 𝟓𝟏 𝟐𝟎𝟓 d) P(C19, C7) = P(C19) . P(C7/C19) P(C19, C7) = 17 41 x 24 40 P(C19, C7) = 408 1640 𝐏(𝐂𝟏𝟗, 𝐂𝟕) = 𝟓𝟏 𝟐𝟎𝟓 PROBABILIDADES PARA EVENTOS DEPENDIENTES Se ha clasificado a los grupos familiares de las calles 7 y 19 de Campo Ayacucho de acuerdo al nivel de ingresos mensuales percibidos como se muestra a continuación: Calle Calle 7 Calle 19 Totales ESTADÍSTICA APLICADA 29 Ingreso > Bs. 395.000 8 14 22 < Bs. 395.000 9 10 19 Totales 17 24 41 Se quiere determinar la probabilidad que al seleccionar una familia: a) Esta resida en la calle 19 y perciba un ingreso mayor a Bs. 395.000 b) Esta perciba un ingreso mayor a Bs. 395.000 Solución: Evento A: que resida en la calle 7. Evento B: que resida en la calle 19. Evento M: ingreso mayor a Bs. 395.000 Evento N: ingreso menor a Bs. 395.000 a) Probabilidad de que resida en la calle 19 y perciba ingreso mayor a Bs 395.000 P(M/B). P(M/B) = P(M⋂B) P(B) P(M⋂B) = 14 41 P(B) = 24 41 P(M/B) = 14 41 24 41 𝐏(𝐌/𝐁)= 𝟏𝟒 𝟐𝟒 b) Probabilidad que perciba un ingreso mayor a Bs. 395.000 P(M) 𝐏(𝐌) = 𝟐𝟐 𝟒𝟏 Como P(M/B) ≠ P(M) se concluye que los eventos son dependientes. ESTADÍSTICA APLICADA 30 PROBABILIDADES PARA EVENTOS MUTUAMENTE EXCLUYENTES Tomando en cuenta la clasificación de los grupos familiares de las calles 7 y 19 de Campo Ayacucho de acuerdo al nivel de ingresos mensuales percibidos ya señalado, se determinará la probabilidad que sea de la calle 7 o gane menos de Bs. 395.000. Calle Ingreso Calle 7 Calle 19 Totales > Bs. 395.000 8 14 22 < Bs. 395.000 9 10 19 Totales 17 24 41 Solución: Evento A: que resida en la calle 7. Evento N: ingreso menor a Bs. 395.000 𝐏(𝐀 ∪ 𝐍) = 𝐏(𝐀) + 𝐏(𝐍) − 𝐏(𝐀 ∩ 𝐍) P(A) = 17 41 ; P(N) = 19 41 ; P(A ∩ N) = 9 41 P(A ∪ N) = 17 41 + 19 41 − 9 41 𝐏(𝐀 ∪ 𝐍) = 𝟐𝟕 𝟒𝟏 TOMA DE DECISIONES Es el proceso mediante el cual se realiza una elección entre diferentes situaciones en diferentes contextos utilizando metodologías cuantitativas para ello. MEDIDAS DE CORRELACIÓN Entre las medidas de relación más utilizadas se tiene la correlación que es una medida estadística de asociación de variables y que expresa la relación entre dos o más variables de una muestra o población. Entre los coeficientes de correlación más utilizados se tienen el lineal de Pearson y el ordinal de Spearman, que se analizarán a continuación: ESTADÍSTICA APLICADA 31 Coeficiente de Correlación de Pearson: Tomando como referencia los datos aportados por el CLAP de Campo Ayacucho, se procede a determinar la relación entre las variables ingreso familiar mensual y el número de miembros en el grupo familiar. Solución: Se definen las variables de la siguiente manera: X = Ingresos mensuales de la familia Y = Nº de personas por familia. Fórmula: Se empleará la fórmula de los desvíos: 𝐫 = 𝚺𝐱𝐲 √(𝚺𝐱𝟐)(𝚺𝐲𝟐 ) Para lo que se construirá la tabla que permita obtener los datos requeridos para su cálculo: Tabla Nº 9 Determinación de Valores para el Cálculo del Coeficiente de Correlación De Pearson FAMILIA X Y x y x2 y2 xy 1 391.814 2 -54.617,30 -1,65 2.983.049.459,29 2,7225 90.118,55 2 700.010 8 253.578,70 4,35 64.302.157.093,69 18,9225 1.103.067,35 3 221.135 3 -225.296,30 -0,65 50.758.422.793,69 0,4225 146.442,60 4 718.487 6 272.055,70 2,35 74.014.303.902,49 5,5225 639.330,90 5 317.555 3 -128.876,30 -0,65 16.609.100.701,69 0,4225 83.769,60 6 716.003 7 269.571,70 3,35 72.668.901.440,89 11,2225 903.065,20 7 647.222 5 200.790,70 1,35 40.316.905.206,49 1,8225 271.067,45 ESTADÍSTICA APLICADA 32 8 345.931 3 -100.500,30 -0,65 10.100.310.300,09 0,4225 65.325,20 9 285.715 2 -160.716,30 -1,65 25.829.729.085,69 2,7225 265.181,90 10 698.338 6 251.906,70 2,35 63.456.985.504,89 5,5225 591.980,75 11 293.312 2 -153.119,30 -1,65 23.445.520.032,49 2,7225 252.646,85 12 306.300 3 -140.131,30 -0,65 19.636.781.239,69 0,4225 91.085,35 13 400.496 2 -45.935,30 -1,65 2.110.051.786,09 2,7225 75.793,25 14 192.019 1 -254.412,30 -2,65 64.725.618.391,29 7,0225 674.192,60 15 489.025 3 42.593,70 -0,65 1.814.223.279,69 0,4225 -27.685,91 16 480.314 4 33.882,70 0,35 1.148.037.359,29 0,1225 11.858,95 17 385.656 2 -60.775,30 -1,65 3.693.637.090,09 2,7225 100.279,25 Σ= 7.589.332 62 0 0 537.613.734.667,53 65,8825 5.337.519,77 Sustituyendo en la fórmula: r = 5.337.519,77 √(537.613.734.667,53)(65,8825) r = 5.337.519,77 5.951.414,70 r = 0,90 Interpretación: de acuerdo a este resultado se puede establecer que existe una correlación muy alta entre el número de personas por familia y el ingreso mensual percibido. Coeficiente de Correlación de Spearman Para su determinación se emplearán los datos correspondientes a 10 familias como se muestra a continuación: FAMILIA X Y 1 700.010 8 2 718.487 6 3 317.555 3 4 716.003 7 5 698.338 6 6 293.312 2 7 400.496 2 8 192.019 1 9 489.025 3 10 385.656 2 ESTADÍSTICA APLICADA 33 X = Ingresos mensuales de la familia; Y = Nº de personas por familia. Con esta información se procede a ordenar de mayor a menor cada variable para establecer los rangos en cada caso: X RX Y RY 718.487 1 8 1 716.003 2 7 2 700.010 3 6 3,5 698.338 4 6 3,5 489.025 5 3 5,5 400.496 6 3 5,5 385.656 7 2 8 317.555 8 2 8 293.312 9 2 8 192.019 10 1 10 Luego con los rangos asignados se procede a calcular los desvíos para determinar el coeficiente de correlación de Spearman: Tabla Nº 10 Determinación de Valores para el Cálculo del Coeficiente de Correlación de Spearman X Y RX RY d d2 700.010 8 3 1 2 4 718.487 6 1 3,5 -2,5 6,25 317.555 3 8 5,5 2,5 6,25 716.003 7 2 2 0 0 698.338 6 4 3,5 0,5 0,25 ESTADÍSTICA APLICADA 34 293.312 2 9 8 1 1 400.496 2 6 8 -2 4 192.019 1 10 10 0 0 489.025 3 5 5,5 -0,5 0,25 385.656 2 7 8 -1 1 Σ= 0 23 Con los resultados de la tabla anterior se procede al cálculo del coeficiente de correlación de Spearman mediante la siguiente fórmula: 𝐩 = 𝟏 − 𝟔𝚺𝐝𝟐 𝐍(𝐍𝟐 − 𝟏) Sustituyendo: p = 1 − 6(23) 10(102 − 1) p = 1 − 138 990 p = 1 – 0,1394 p = 0,86 Interpretación: de acuerdo a este resultado se puede establecer que existe una alta correlación entre el nº de personas por familia y el ingreso que percibe. MUESTREO Técnica empleada para la selección de un conjunto de elementos que se consideran representativos del grupo al que pertenecen, con la finalidad de estudiar o determinar las características del grupo. Cálculo de la Muestra: Para determinar el tamaño de la muestra se aplica la siguiente fórmula: 𝐧 = 𝐍 𝐞𝟐(𝐍 − 𝟏) + 𝟏 Donde: N = tamaño de la población y e = error máximo permitido. ESTADÍSTICA APLICADA 35 Sabiendo que la población objeto de estudio, es decir, el número de viviendas que conforman la Comunidad de Campo Ayacucho, es de 405, y estableciendo que el error máximo permitido es 10%, empleando la formula anterior se procede a determinar el tamaño de la muestra: n = 405 (0,09)2(405 − 1) + 1 n = 94,74 ≈ 95 viviendas Muestreo Aleatorio (tabla números aleatorios): Se cuenta con los expedientes de 100 familias de la comunidad de Campo Ayacucho y se desea establecer el nivel de ingresos mensual de 10 de ellas. En primer lugar, se le asignó un número de tres dígitos pues se cuenta con 100 viviendas. Seguidamente se establece como criterio de selección empezar por la fila 1 de la columna 11-15 y se considerará los primeros y el último dígito, teniéndose el siguiente resultado: Nº FAMILIA INGRESO MENSUAL Bs. Nº FAMILIA INGRESO MENSUAL Bs. 021 Castillo Núñez 841.210,00 005 Barreto Girón 280.678,00 095 Corvo Maiz 828.898,00 032 Moreno Moreno 584.599,00 035 Gómez Benavides 655.230,00 010 Sánchez 341.204,00 076 Serrano Ruiz 306.300,00 083 Marcano Aguilera 1.115.851,00 014 Molina Rojas 262.217,00 089 Mujica Vázquez 920.824,00 Muestreo Sistemático: Manejando la información de los expedientes de las 100 familias por vivienda se procede a aplicar el muestreo sistemático para seleccionar una muestra de 10 viviendas a fin determinar el nivel de ingresos mensuales de cada una de ellas. Teniendo en este caso la población (N) de 100 viviendas y se desea una muestra (n) de 10, se procede a determinar el intervalo de selección (K) mediante la siguiente fórmula 𝐊 = 𝐍 𝐧 ESTADÍSTICA APLICADA 36 K = 100 10 =>K = 10 Ahora se procede a establecer el número aleatorio (i) de arranque el cual se estableció sería i = 5, a partir del cual se seleccionan los elementos de la muestra de la siguiente manera: i; i+K; i + 2K; i + 3K; ………….; i + (n-1)K En este caso serían 5; 15; 25; 35; 45; 55; 65; 75; 85; 95; números que se corresponden conlos números asignados a las familias: Nº FAMILIA INGRESO MENSUAL Bs. 5 Barreto Girón 280.678,00 15 Morao Chacín 398.000,00 25 Benavides Salazar 947.218,00 35 Gómez Benavides 655.230,00 45 López Núñez 240.334,00 55 González Marcano 821.100,00 65 León Palma 391.814,00 75 Chacón Limpio 293.312,00 85 Maiz Salazar 750.317,00 95 Corvo Maiz 828.898,00 Muestreo Estratificado: Para este caso se tomará la información de la tabla nº 2 referida al número de viviendas por calle: Calle Nº 7 16 18 19 20 Nº de Viviendas 24 18 22 17 19 Se desea tomar una muestra de 15 viviendas, y al ser los estratos (Calles) con números de viviendas distintas se empleará la afijación proporcional utilizando la fórmula: 𝐪𝐡 = 𝐧 𝐍 𝒙𝑵𝒉 Donde: nh = tamaño muestral de cada estrato; Nh = tamaño de cada estrato Para la Calle 7, el tamaño muestral será: q7 = 15 100 𝑥24 = 3,6 ≈ 4 viviendas Igual procedimiento se aplica para cada calle, teniéndose el siguiente resultado: ESTADÍSTICA APLICADA 37 Estrato (Calle) Tamaño del Estrato Tamaño Muestral del Estrato 7 24 4 16 18 3 18 22 3 19 17 2 20 19 3 N=100 n=15 CONTRASTE DE HIPÓTESIS Es un procedimiento para juzgar si una propiedad que se supone en una población estadística es compatible con lo observado en una muestra de dicha población. Teniendo en cuenta la información suministrada por un funcionario del Instituto Nacional de Estadística (INE) se pudo saber que el ingreso promedio mensual del venezolano se ubicó en Bs. 196.700 con una deviación estándar de Bs. 230.250 y que de acuerdo a los cálculos realizados para la muestra de 100 viviendas el promedio del ingreso mensual se ubicó en Bs. 537.785,10. Empleando un error tipo I de 1%, ¿Se puede aceptar la hipótesis del INE? Para establecer el contraste de hipótesis se seguirá el esquema para contrastar, a saber: a) Enunciar la hipótesis nula (Ho) y la hipótesis alternativa (H1) Ho: μ = Bs. 196.700 H1: μ > Bs. 196.700 b) Se selecciona el estadístico y se calcula: Por tratarse de una muestra mayor a 30 observaciones y conocer la desviación típica (σ), se empleará “Z”, cuya fórmula es: 𝐙 = 𝑿 − 𝛍 𝛔/√𝐧 Sustituyendo los valores en la fórmula: Z = 537.785,19 − 196.700 σ230.250/√100 Z = 14,81 ESTADÍSTICA APLICADA 38 c) Se seleccionan gráficamente las zonas de aceptación y rechazo y se establece el valor crítico con el nivel de significación establecido, en este caso 1% El Valor Crítico a este nivel de significación es VC = 2,32. d) Se toma la decisión: Como Z = 14,81 es mayor al Valor Crítico VC = 2,32, se rechaza la hipótesis nula, es decir, que el ingreso mensual promedio es mayor a Bs. 196.700 VC = −2,32 ZONA DE ACEPTACION ZONA DE RECHAZO ESTADÍSTICA APLICADA 39 CONCLUSIONES Con todo lo aprendido, se puede concluir que la estadística es una rama de la matemática que está no se encuentra muy visible en lo cotidiano pero que en realidad es de mucha utilidad para interpretar y ver desde un punto de vista muy general datos que se obtienen. A través de sus gráficas, medidas de tendencia central y de dispersión podemos ver más claro y concreto un conjunto de datos que se nos hacen muy complicados, en resumen son un verdadero método de ayuda para informar. La estadística es el conjunto de diversos métodos matemáticos que tienen como objetivo obtener, presentar y analizar datos (ya sean cualitativos o cuantitativos); nos permite realizar estudios reales, con poblaciones exactas; lo cual nos ayuda a mejorar nuestra planificación. Llevar un buen registro de datos estadísticos nos permite conocer de mejor manera el problema, cuando nosotros conocemos la realidad de nuestras áreas afectadas; es más fácil dar soluciones. Los diferentes tipos de distribuciones nos permiten prever eventos que puedan ocurrir, teniendo en cuenta lo que ha sucedido anteriormente (datos históricos). Una de las técnicas más utilizadas dentro de la estadística es la medición de parámetros de tendencial central, la moda, mediana y media. Lo cual nos permite centrar el problema y plantear puntos de referencia. Una distribución de frecuencia es una tabla de resumen en la que los datos se disponen en agrupamientos o categorías convenientemente establecidas de clases ordenadas numéricamente. En esta forma las características más importantes de los datos se aproximan muy fácilmente, compensando así el hecho de que cuando los datos se agrupan de ese modo, la información inicial referente a las observaciones individuales de que antes se disponía se pierde a través del proceso de agrupamiento o condensación. La principal ventaja de usar una de estas tablas de resumen es que las principales características de los datos se hacen evidentes inmediatamente para el lector. La principal desventaja de tal tabla de resumen es que no podemos saber cómo se distribuyen los valores individuales dentro de un intervalo de clase particular sin tener acceso ESTADÍSTICA APLICADA 40 a los datos originales. El punto medio de la clase, sin embargo, es el valor usado para representar todos los datos resumidos en un intervalo particular; y a su vez es el punto a la mitad de los límites de cada clase y es representativo de los datos de esa clase. La probabilidad es la posibilidad u oportunidad de que suceda un evento particular. La probabilidad involucrada es una porción o fracción cuyo valor varía entre cero y uno exclusivamente. En definitiva, se tienen las siguientes conclusiones según la información y resultados obtenidos: La comunidad que se consideró para aplicar los diferentes métodos estadísticos fue Campo Ayacucho ubicado al sur oeste de la ciudad de Maturín, en el Estado Monagas, Venezuela, perteneciente a la Parroquia Alto de los Godos, conformada por 405 viviendas y un total de 625 familias distribuidas en 13 calles. La información fue suministrada por la Estructura del Comité Local de Abastecimiento y Producción (CLAP) del sector y corresponde a los datos de una muestra de 100 viviendas. El resultado de calcular la media aritmética resulto que el promedio de ingresos mensuales es de Bs. 537.785,1. La mediana resulto por debajo de Bs. 507.539,9 es decir, se encuentra la mitad de los datos estudiados. Con respecto a la moda, la mayoría de las familias tienen ingresos mensuales iguales a Bs. 370.381,5. El resultado del Decil 1, se interpreta que por debajo de Bs. 507.539,9 está el 10% de los datos. El resultado del Decil 9, se interpreta que por debajo de Bs. 848.677,5 está el 90% de los datos. El resultado del Cuartil 1, se interpreta que por debajo de Bs. 353.641,14está el 25% de los datos. ESTADÍSTICA APLICADA 41 El resultado del Cuartil 3, se interpreta que por debajo de Bs. 699.211está el 75% de los datos El resultado del Quintil 1, se interpreta que por debajo de Bs. 327.334,86está el 20% de los datos. El resultado del Quintil 4, se interpreta que por debajo de Bs. 736.277,94 está el 80% de los datos. El resultado del Percentil 26, se interpreta que por debajo de Bs. 359.619,84 está el 26% de los datos. El resultado del Percentil 91, se interpreta que por debajo de Bs. 869.005,08 está el 91% de los datos. Con respecto a los cálculos de las medidas de dispersión dieron como resultado los siguientes: Desviación Media (DM) Bs. 187.491,49. Varianza (σ2) 49.470.877.527,21. Desviación Típica (σ) Bs. 222.420,50. Coeficiente de Variación (CV) 41,36%. Para el cálculo del Coeficiente de Curtosis se utilizaron los cuartiles 1 y 3, así como los deciles 1 y 9 calculados en la sección de Medidas de Posición. Su resultado arrojó que Como Cu = 0,506 >0,263 se determina que la curva es platicúrtica. La probabilidad de que el ingreso mensual se ubique entre Bs. 600.00 y Bs.900.000 es de 34,10%. La probabilidad de que el ingreso mensual sea mayor a Bs. 450.00 es de 65,17%. La probabilidad de que el ingreso mensual sea menor al salario mínimo de noviembre de 2017 (Bs. 117.507) es de 5,26%. Coeficiente de Pearson (r) es igual a 0,90 de acuerdo a este resultado se puede establecer que existe una correlación muy alta entre el número de personas por familia y el ingreso mensual percibido. Coeficiente de Espearman (p) dio como resultado 0,86 de acuerdo a este resultado se puede establecer que existe una alta correlación entre el nº de personas por familia y el ingreso que percibe. ESTADÍSTICA APLICADA 42 BIBLIOGRAFÍA Alcoba, José. Guías de Clases de Estadística Aplicada. Apuntes de Clases de Estadística Aplicada, Enero 2018. Censo Poblacional aplicado por el Comité Local de Abastecimiento y Producción (CLAP) del Sector Campo Ayacucho. Octubre 2017. INTRODUCCIÓN PLANTEAMIENTO SITUACIONAL PARA EL ANÁLISIS ESTADÍSTICO CONSTRUCCIÓN TABLA DE FRECUENCIA UTILIZANDO EL MÉTODO DE STURGES MEDIDAS DE TENDENCIA CENTRAL: MEDIA ARITMÉTICA MEDIANA MODA GRÁFICOS ESTADÍSTICOS HISTOGRAMA: POLÍGONO DE FRECUENCIAS: OJIVA: GRÁFICO CIRCULAR: MEDIDAS DE POSICIÓN CUARTILES QUINTILES DECILES PERCENTILES MEDIDAS DE DISPERSIÓN DESVIACIÓN MEDIA VARIANZA DESVIACIÓN TÍPICA COEFICIENTE DE VARIACIÓN COEFICIENTE DE CURTOSIS PROBABILIDADES DISTRIBUCIÓN PROBABILÍSTICA NORMAL PROBABILIDADES PARA EVENTOS INDEPENDIENTES PROBABILIDADES PARA EVENTOS DEPENDIENTES PROBABILIDADES PARA EVENTOS MUTUAMENTE EXCLUYENTES TOMA DE DECISIONES MEDIDAS DE CORRELACIÓN Coeficiente de Correlación de Pearson: Coeficiente de Correlación de Spearman MUESTREO Cálculo de la Muestra: Muestreo Aleatorio (tabla números aleatorios): Muestreo Sistemático: Muestreo Estratificado: CONTRASTE DE HIPÓTESIS CONCLUSIONES BIBLIOGRAFÍA
Compartir