Descarga la aplicación para disfrutar aún más
Esta es una vista previa del archivo. Inicie sesión para ver el archivo original
R. B. Avila Acosta ESTADISTICA ELEMENTAL ESTADISTICA ELEMENTAL R E V IS A D A , A C T U A L IZ A D A ROBERTO B. AVILA ACOSTA ESTADISTICO-DEMOGRAFO Director del Instituto de Biomatemática de la Facultad de Ciencias Matemáticas. Profesor Principal de la Universidad Nacional Mayor de San Marcos. Premio Nacional "Godofredo García" en Matemáticas Aplicadas - CONCYTEC 1988. ESTADISTICA ELEMENTAL CON 500 PROBLEMAS RESUELTOS NUEVA EDICION 19 96 E su jd ios y EdicioNES R.A. L ¡ma - P erú DERECHOS DE AUTOR RESERVADOS C opyright© 1996 Esíudios y EdicioNts R.A. Lima, Perú Impreso en Perú. Informática y Diagramación : Víctor Hugo Esquicha Paz Wüliam L. Esquicha Paz. Revisión : Mathinet Avila Salinas A SILVIA, MAGALLY, MARTHINET PUBLICACIONES DEL AUTOR: "Sumatorias y Productos" “Manual de Estadística Básica” “Modelo Matricial para analizar la evolución de los efectivos escolares” “Técnicas e Instrumentos de Recolección de datos” “Estadística Aplicada a la Educación” "Aspectos cuantitativos del analfabetismo del Perú” “Perfil Educativo de la Costa del Perú” “MEDICIÓN DE LA DESIGUALDAD SOCIAL : MÉTODO DE LA DISPERSIÓN RELATIVA. (MEDIRA)” “ANÁLISIS SOCIO DEMOGRÁFICO DE LA REGIÓN LORETO” “GUIA PARA ELABORAR LA TESIS” “ESTADISTICA ELEMENTAL” PUBLICACIONES 1996-1997 “La Agenda Estadística del Perú” “Elementos de Inferencia Estadística y Aplicaciones” “Perfil Socio Demográfico del Perú” “1010 Problemas Resueltos de Estadística y Probabilidades" “Modelos Estadísticos en la Investigación” “Marginación y desigualdad Social en el Perú : Una dimensión estructural” 6 > R o b E RTO B. A v í I a A costa PRESENTACION Esta NUEVA EDICION del libro «ESTADISTICA ELEMENTAL» totalmente renovada, actualizada y ampliada, ha sido estructurada de acuerdo a los programas de estudios de los cursos de ESTADISTICA GENERAL que se vienen desarrollando en las Universidades, Institutos Superiores Tecnológicos e Institutos Pedagógicos; presenta algunas innovaciones didácticas para una lectura activa y amena que facilita el proceso de enseñanza-aprendizaje de la Estadística. Por su ordenamiento, graduación e ilustración de conceptos, propiedades, métodos, fórmulas y aplicaciones es muy útil como TEXTO DE ESTUDIO, cuyo contenido se puede desarrollar totalmente y con suma facilidad en dos semestres académicos. Participo que mi libro «ESTADISTICA ELEMENTAL» está dirigido, preferentemente, a estudiantes y profesionales que utilizan la Estadística como técnica y ciencia auxiliar en su formación profesional, en sus trabajos de investigación o en el desarrollo de proyectos. El contenido ha sido sistematizado con el propósito que estudiantes y lectores logren una mayor comprensión y aplicación de la Estadística Básica, para cuyo efecto se utiliza un vocabulario sencillo y preciso, reforzado a través del desarrollo de más de 200 ejemplos y problemas con datos reales, evitando en todo momento complejidades matemáticas. Para comprender y aprender Estadística, con este libro, es suficiente conocer las seis operaciones elementales de la Matemática. «ESTADISTICA ELEMENTAL» comprende nueve capítulos planificados gradualmente, desde la Estadística unidimensional a la bidimensional, para finalizar con un capítulo de Cálculo de Probabilidades. El primer capítulo tiene como finalidad explicar por qué y para qué estudiar Estadística y precisar cuáles son los objetivos de esta Ciencia, así como familiarizarnos con la ESTADISTICA ELEMENTAL < 7 terminología y la clasificación de las variables, y una motivación hacia la Investigación Estadística. En el segundo, se presentan las diversas técnicas e instrumentos de recolección de datos, así como la identificación de las fuentes de datos. El tercer capítulo corresponde a las formas de organización y presentación de datos, construcción de tablas, cuadros y gráficos estadísticos. En el cuarto capítulo se estudia el proceso de reducción de datos, determinación y cálculo de indicadores y medidas de resumen estadístico, como los estadígrafos de posición, dispersión, deformación y de apuntamiento, insistiendo en la interpretación, utilidad y aplicaciones. El quinto capítulo presenta en forma detallada los Números Indices, destacando la metodología para calcular Indices de Precios al Consumidor (IPC), la elaboración y análisis de la Canasta Familiar; también se estudia el efecto del IPC en el poder adquisitivo del dinero y los niveles de vida de la población. A partir del sexto capítulo se inicia el trabajo con las estadísticas bidimensionales, o de dos variables, con la construcción de tablas de doble entrada y el cálculo de algunos indicadores, como las frecuencias bidimensionales, además de la Covarianza. El sétimo capítulo corresponde al estudio de la relación o asociación entre variables mediante la Teoría de la Regresión y Correlación, la construcción y aplicación de diversos modelos de regresión y correlación lineal y no lineal. Para completar el objetivo de la previsión y proyección de la Estadística, en el octavo capítulo se estudia las Series Cronológicas o de Tiempo, analizando en detalle sus componentes, construyendo modelos para estimar y proyectar valores de las variables para un período futuro. Como inicio a la Inferencia Estadística en el noveno y último capítulo se hace una introducción al Cálculo de Probabilidades y las distribuciones teóricas de probabilidad, destacando el estudio de la Distribución Normal como modelo de aplicación frecuente en la ciencia estadística. Se completa con un.Anexo sobre Sumatorias, Tablas Estadísticas de mayor uso y una miscelánea de problemas resueltos. Nuevamente reitero mi gratitud y reconocimiento a mis colegas, alumnos y lectores por su constante estímulo, simpatía y sugerencias. Escribir un libro es el desafío más noble de la cátedra universitaria, y difundir ideas es hacer la vida eterna, porque los hombres pasan y las obras quedan Qué mejor satisfacción en mi vida, que tener dos hijas, cultivar valiosas inteligencias en mis alumnos, y ahora dejarles este libro como testimonio de mi compromiso y aporte al desarrollo técnico y científico de nuestra juventud. Lima, Verano de 1996 R. 6. Avila Acosta 8 > RobERTO B. A v í Ía A c o s i a INDICE CAPITULO 1. INTRODUCCION 1.1 La Estadística...............................................................................................................13 1.2 ¿Por qué estudiar Estadística ? .................................................................................. 15 1.3 Objetivos de la Estadística................................................................................... 16 1.4 Breve Reseña Histórica.............................................................................................. 19 1.5 Nomenclatura Estadística........................................................................................... 22 1.6 Elementos Básicos de la Estadística Matriz Tripartita de Datos..................................24 1.7 Clasificación de Variables : 1.7.1. Según la naturaleza de la variable...................................................................27 1.7.2. Según el orden de las observaciones..............................................................28 1.7.3. Según el número de las variables....................................................................28 1.7.4. Según la escala de medición...........................................................................29 1.7.5. Según la amplitud de las unidades de observación........................................ 30 1.7.6. Según la relación entre variables.....................................................................30 1.8 Elementos de una Variable.........................................................................................31 1.9 La Investigación Estadística........................................................................................33 1.10 Sugerencia de Investigaciones ...................................................................................38 1.11 Pasos en procesamiento de datos de una investigación en el computador................38 CAPITULO 2. RECOLECCION DE DATOS 2.1 La Recolección de Datos............................................................................................41 2.2 La Información Estadística..........................................................................................42 2.3 Las Fuentes de Datos................................................................................................. 42 2.4 Técnicas de Recolección de Datos: 2.4.1. La Observación................................................................................................. 43 2.4.2. La técnica documental......................................................................................44 2.4.3. La Entrevista..................................................................................................... 45 2.4.4. El Cuestionario.................................................................................................. 45 2.4.5. Preparación del cuestionario y formulario.................................................. 46 2.4.6. La encuesta o investigación estadística............................................................49 ESTADISTICA ELEMENTAL CAPITULO 3. PRESENTACION DE DATOS 3.1 Organización y Presentación de Datos....................................................................... 53 3.2 Tablas Estadísticas...................................................................................................... 55 3.2.1. Tablas de Frecuencia o de Distribución............................................................ 56 3.2.2. Cuadros Estadísticos.........................................................................................56 3.3 Partes principales de un cuadro estadístico................................................................ 57 3.4 Recomendaciones para la Construcción de Cuadros................................................. 61 3.5 Construcción de Tablas de Frecuencia....................................................................... 62 3.5.1. Tablas de Frecuencia para variables cuantitativas........................................... 63 3.5.2. Elementos de una tabla de frecuencia.............................................................. 75 3.5.3. Propiedades de las frecuencias........................................................................ 77 3.5.4. Tablas de frecuencia para variables cualitativas o estadísticas de atributos... 78 3.6 Los Gráficos Estadísticos.............................................................................................80 3.6.1. Construcción de Gráficos........... .......................................................................80 3.6.2. Principales partes de un gráfico........................................................................ 81 3.6.3. Principales tipos de gráficos...............................................................................81 3.6.4. Gráficos de la distribución de frecuencias........................................................ 82 3.6.5. Miscelánea de gráficos......................................................................................86 CAPITULO 4. R ED U C C IO N DE LO S D ATO S 4.1 Generalidades: Estadígrafos........................................................................................93 4.2 Estadígrafos de Posición..............................................................................................96 4.3 La Media Aritmética : Cálculo y Propiedades...............................................................96 4.4 La Mediana : Cálculo y Ventajas de la Mediana........................................................ 110 4.5 LasCuartilas.......................................................................................... 121 4.6 LasDecilas................................................................. 127 4.7 Las Quintilas.............................................................................................................. 128 4.8 Los Percentiles........................................................................................................... 128 4.9 LasRanilas................................................................................................................ 131 4.10 La Moda o Valor Modal.......................................................... 131 4.11 La Media Geométrica................................................................................................. 136 4.12 La Media Armónica.............. ..................................................................................... 138 4.13 Estadígrafos de Dispersión........................................................................................139 4.14 Recorrido o rango...................................................................................................... 142 4.15 Desviación Media....................................................................................................... 143 4.16 Recorrido Semi Intercuartil.........................................................................................144 4.17 La Varianza : Cálculo y Propiedades..... ................................................................... 145 4.18 Componentes de la Varianza...................................................... 150 w > RobEnm B. Avila Acosta 4.19 La Desviación Estándar.......................................................................................... 154 4.20 Coeficiente de Variación...........................................................................................155 4.21 Aplicación de la desviación estándar........................................................................156 4.22 Estadígrafos de Deformación....................................................................................157 4.23 Estadígrafos de Apuntamiento o Kurtosis.................................................................. 159 4.24 La Medición de la Desigualdad................................................................................. 161 4.24.1. Coeficiente de Concentración de Giní......................................................... 161 4.24.2. Método de la Dispersión Relativa. MEDIRÁ............................................... 166 CAPITULO 5. NUMEROS INDICES 5.1 Generalidades........................................................................................................... 175 5.2 Clases de Números indices......................................................................................176 5.3 Cálculo de Números Indices : Simples y Ponderados...................................... 177 5.4 Indice de Precios al Consumidor : Antecedentes y Aspectos Conceptuales............191 5.5 Indice de Quantum y de Valor Unitario..................................................................... 198 5.6 Cambio de Base y Empalme.....................................................................................200 5.7 Deflactación.............................................................................................................. 202 5.8 Principales usos del Indice de Precios al Consumidor............................................. 205 CAPITULO 6. DISTRIBUCIONES BIDIMENSIONALES DE FRECUENCIA 6.1 Generalidades...........................................................................................................209 6.2 Tablas Bidimensionales de Frecuencia....................................................................210 6.3 Variables Bidimensionales Discretas................................................. .....................211 6.4 Variables Bidimensionales Continuas.......................................................................218 6.5 Variable Discreta y Variable Continua......................................................................220 6.6 Valores Medios...................................... :....................................... ’............... ........ 221 6.7 Varianza y Covarianza..............................................................................................223 6.8 Variables Cualitativas................................................................................................230 6.9 Variable Cualitativa y Variable Cuantitativa..............................................................230 6.10 Asociación entre Variables........................................................................................231 CAPITULO 7. REGRESION Y CORRELACION 7.1 7.2 7.3 Nociones Básicas.......... Regresión Simple......... Regresión Simple Lineal ESTADISTICA 235 238 243 ELEMENTAL 7.4 Correlación Lineal.............. ........................................................................................255 7.5 Correlación por rangos............................................................................................... 269 7.6 Otras medidas de correlación simple............................... 276 7.7 Regresión y Correlación Simple No Lineal.......... .'....................................................279 La parábola de segundo grado. La función potencial. La función exponencial. La hipérbolaequilátera. 7.8 Regresión y Correlación Lineal Múltiple.....................................................................300 CAPITULO 8. SERIES CRONOLOGICAS 8.1 Generalidades................................................ 313 8.2 Componentes de una serie cronológica.....................................................................316 8.3 Estudio de la tendencia.............................................................................................. 318 8.4 Tendencia Lineal: Ajuste de una Linea Recta............................................................322 8.5 La Tendencia Parabólica........................................................................................... 328 8.6 La Tendencia Exponencial......................................................................................... 332 8.7 Estudio de las Variaciones Estacionales....................................................................338 8.8 Las Variaciones Cíclicas............................................................................................ 349 8.9 Ajuste de Polinomios............................................................................................ 354 CAPITULO 9. INTRODUCCION A LA PROBABILIDAD 9.1 Noción de Probabilidad.............................................................................................. 358 9.2 Espacio Muestral y Sucesos...................................................................................... 361 9.3 Axiomas de Probabilidad........................................................................................... 368 9.4 Probabilidad de Adición de Sucesos..........................................................................370 9.5 Probabilidad Condicional............................................................................................ 372 9.6 Teorema de la Multiplicación.....................................................................................375 9.7 Sucesos Independientes............................................................................................ 376 9.8 Teorema de Bayes..................................................................................................... 379 9.9 Distribución de Probabilidad.................... 382 9.10 La Distribución Binomial............................................................................................. 383 9.11 La Distribución Normal...............................................................................................388 9.12 La Distribución de Poisson.........................................................................................398 ANEXO UNO: SUMATORIAS SIMPLES ANEXO DOS: PROBLEMAS................. TABLAS ESTADISTICAS..................... BIBLIOGRAFIA...................................... RobeRio B. Av í Ia Acosta 401 409 417 423 Capítulo 1 INTRODUCCION LA ESTADISTICA El origen etimológico de la palabra «estadística» no está bien determinado, puesto que existen distintas opiniones y referencias. Para algunos viene de la voz griega STATERA que significa «balanza», otros sostienen que deriva del latín STATUS que significa «situación», mientras que algunos autores afirman que procede del alemán STAAT que significa «estado». En el caso concreto de suponer que viene del vocablo «estado», es por el hecho que una de las funciones tradicionales del gobierno central y del Estado es llevar registros sobre la situación de la población, nacimientos, defunciones, producción, impuestos y otros hechos contables o de control. La evolución y desarrollo de la Estadística en el mundo actual definitivamente ha superado el significado etimológico de esta ciencia; la Estadística constituye hoy en día un valioso instrumento de decisión en todas las situaciones de la vida, desde el hogar hasta la política nacional y mundial. Un concepto no siempre caracteriza la esencia y contenido de una ciencia, sin embargo es costumbre presentar alguna definición. En el caso de Estadística, se encuentra por ejemplo en el diccionario Larousse, «Estadística es la ciencia que tiene por objeto agrupar metódicamente todos los hechos que se prestan a una evaluación numérica (población, riqueza, impuestos, etc. )». Por su parte, el diccionario de la Academia de la Lengua, establece «Estadística (de Estadista) censo o recuento de la población, de los recursos naturales o industriales, del tráfico o de cualquier otra manifestación de un ESTADISTICA ELEMENTAL < 13 Estado, Provincia, pueblo, clase, etc. Estudio de los hechos morales o físicos del mundo que se prestan a numeración o recuento y a comparación de las cifras a ellos referentes». En el mundo actual por Estadística debemos entender algo más elaborado y susceptible de un tratamiento científico. La Estadística ya no es la errónea concepción de recopilación de grandes masas de datos y presentarlos en tablas o gráficos; ni tampoco el simple cálculo de totales, promedios y porcentajes, etc. En todo caso estas ideas corresponden a los inicios de la Estadística o a las etapas del proceso estadístico. En el intento de precisar una idea o definición, se puede decir que la Estadística es la «ciencia que tiene por objeto la clasificación y análisis de conjuntos de datos de observaciones, para interpretarlos y obtener leyes y relaciones entre ellas. Es la ciencia que orienta la toma de decisiones a partir del análisis e interpretación de observaciones realizadas en forma directa o experimentalmente». Aún cuando aquí se establece que la Estadística es una ciencia, sin embargo entre los propios especialistas existen algunas discrepancias de considerarla como ciencia o como una técnica. Mientras no se supere definitivamente esta discusión, resultará más preciso describir a la Estadística como «la tecnología del m étodo científico» (A.M.Mood), entendiendo que la tecnología se ocupa de la aplicación sistemática de conocimientos científicos para resolver problemas prácticos. En este sentido la Estadística proporciona reglas, técnicas e instrumentos para los investigadores, las que pueden ser de aplicación completamente general y útiles en cualquier campo de las ciencias: física, química, biología, economía, sociología, ingeniería, etc., y en cualquier campo del conocimiento. H. Cramer, sostiene que «el principal objeto de la Teoría Estadística consiste en la investigación de la posibilidad de obtener inferencias válidas a partir de los datos estadísticos, y en la construcción de métodos para realizar dichas inferencias». Jerzy Neyman, afirma que la «Estadística trata de problemas relativos a las características operatorias de las reglas de comportamiento inductivo basado en experimentos aleatorios». Para A. Wald el «objetivo principal de la Estadística es el estudio de las funciones decisorias estadísticas». 14> Robenro B. Aví Ia A costa Proponer ahora una definición de la Estadística puede resultar poco significativa porque no se lograría precisar su esencia, su cobertura y los hechos que estudia esta ciencia. A manera de información, conviene indicar que hace más de un siglo Gustavo Rumelin sostenía que había por lo menos 63 definiciones de Estadística, y que pueden añadir otras si se tiene en cuenta el avance de esta disciplina. «La función principal de la Estadística es elaborar principios y métodos que nos ayuden a tomar decisiones frente a la incertidumbre» sostiene Ya Lun Chou, por esta razón podría definirse la Estadística como «un método de toma de decisiones frente a la incertidumbre». La Estadística como ciencia cumple los aspectos principales del método cien tífico , tales como: i) R ealización de experim entos y observaciones; ii) obtención de conclusiones o proposiciones objetivas a partir de los resultados de dichos experimentos y observaciones, ¡ii)formulación de leyes que simplifiquen la descripción de un gran número de experiencias u observaciones. Para conocer una ciencia hay que estudiarla con interés y profundidad, para comprenderla y tener una idea más ciara de lo que es Estadística, será conveniente analizar sus objetivos. n ^ c-POR QUÉ ESTUDIAR ESTADÍSTICA ? 1. La Estadística, como la Matemática, constituye uno de los idiomas esenciales para comunicarse en el mundo universal de la ciencia y la tecnología. La Estadística permite comprender con mayor facilidad la bibliografía especializada. La mayoría de los libros, estudios e investigaciones especializadas en economía, educación, sociología, medicina, psicología, etc., contienen resultados basados en el análisis estadístico. Sin lugar a dudas, aquellos profesionales que no conozcan Estadística tendrán serias dificultades para ser expertos en su respectivo campo científico. 2. En las diversas áreas y especialidades de la formación profesional y científica, la Estadística constituye una ciencia auxiliar y complementaria, ESTADISTICA ELEMENTAL que ofrece técnicas, métodos, modelos y procedimientos para el análisis cuantitativo y cualitativo de los fenómenos y hechos que interesa estudiar a los profesionales. La Estadística es una herramienta auxiliar de utilidad inmediata y práctica en el trabajo profesional. Permite registrar hechos, calcular repeticiones, analizar datos y observaciones y calcular indicadores. Ayuda a cuantificar o dimensionar el comportamiento de los hechos y va riables en una población determinada, realizar estimaciones y proyeciones. 3. La Estadística ayuda a desarrollar una investigación rigurosa. La Estadística no es simplemente un conjunto de fórmulas, procedimientos y modelos, la Estadística por la forma como está estructurada operacionaliza los datos, ofrece los fundamentos lógicos en los que se sustenta la investigación básica y aplicada, de allí que la Estadística constituye «la tecnología del método científico». En toda investigación una vez formulado el problema, la tarea inmediata es el diseño del plan de análisis estadístico, antes de obtener los datos en las unidades de análisis. La Estadística participa en la solución del problema, puesto que permite revelar la información vital para la solución de un problema práctico. Ayuda a conocer las características de una población, cuyos resultados orienta la toma de decisiones. La Estadística permite hacer inferencias acerca de una población a partir de datos obtenidos de una muestra representativa. Los profesionales que no conozcan Estadística tendrán serias dificultades para diseñar un plan de investigación y conocer una realidad, que están interesados en transformar o desarrollar. Téngase presente que sólo se puede transformar con éxito aquello que se conoce. [ ¡ ¡ i]OBJETIVOS DE LA ESTADISTICA En términos generales los objetivos de la Estadística pueden ser clasificados o agrupados en tres grandes capítulos: descripción, análisis y predicción. a) Descripción de grandes colecciones de datos empíricos, reduciéndolos a un pequeño número de características que concentra la parte más importante y significativa de la información proporcionada por los datos. Según la terminología de R.A. Fisher, este proceso se conoce con la denominación de «reducción de datos». La descripción supone que los datos que vienen expresados en su forma natural deben ser clasificados y RobERTO B. Av í Ia A cosia presentados sistemáticamente en cuadros o tablas como una primera reducción de datos, sin embargo la «reducción de datos» propiamente dicha se obtiene cuando el comportamiento y características de los datos se expresan por un conjunto de indicadores, medidas de resumen o estadígrafos. El trabajo estadístico se inicia con el estudio del problema, la identificación de variables y la recolección de datos. Tanto la reducción como la descripción de la información se estudia en el gran capítulo denominado Estadística Descriptiva. Es importante anotar que la descripción estadística de los fenómenos o hechos es el primer aspecto al cual se redujo la ciencia estadística durante mucho tiempo, aplicándose especialmente a los datos demográficos, sociales, económicos, etc. b) A nálisis estadístico de datos experimentales y de los fenómenos observados. Toda investigación estadística incluye un problema de análisis de datos experimentales, con el objeto de formarse un concepto de una población o universo y adoptar decisiones. En este caso no es necesario observar toda la población sino que será suficiente elegir una muestra representativa. La preocupación del análisis estadístico es inferir propiedades para una población sobre la base de resultados muéstrales conocidos. Aquí se presenta varios problemas que trata la Estadística de hoy, como aquellos relacionados con el muestreo estadístico, la estimación estadística y el cálculo de probabilidades, las pruebas estadísticas, etc. Estos son aspectos que corresponde esencialmente a la Inferencia Estadística Todo análisis debe suponer la elección adecuada de una muestra representativa, la que será estudiada en detalle para obtener conclusiones y resultados, que dentro de ciertos márgenes de aceptación sean válidas a toda la población de la cual fue elegida la muestra. Por ejemplo, para analizar la sangre de una persona, será suficiente extraer una pequeña cantidad de sangre; del mismo modo para conocer la simpatía o demanda de un artículo, no será necesario consultar o encuestar a toda una población de un país o ciudad, es suficiente elegir una muestra de pobladores o familias, etc. c) Predicción o comportamiento de los fenómenos en el futuro, lo cual constituye la máxima aspiración práctica de toda ciencia. Este objetivo de predicción y previsión está implícito tanto en la descripción como en el análisis estadístico, puesto que en general interesa orientar la toma de decisiones con vigencia y efecto en el futuro. «El pasado puede ser evaluado, el presente descrito con cierta exactitud y el futuro puede ser ESTADISTICA ELEMENTAL < 17 previsto». La predicción puede entenderse como ia estimación de resultados en el futuro. Con este objetivo se pretende responder por ejemplo, cuál será el volumen de las exportaciones en el siguiente quinquenio; cuál será la población escolar del Perú dentro de 10 años; cuáles serán los niveles de desempleo por sectores en América Latina; qué efecto producirá un incentivo tributario en las futuras inversiones de un país, etc. Naturalmente que las estimaciones y proyecciones dependen del grado de conocimiento del comportamiento pasado y presente de las variables en estudio. Para concretar estos objetivos y fines, la Estadística se vale por una parte del CENSO, que recopila datos del todo, analiza la distribución y variación de las características de los elementos que componen una población claramente definida; por otra parte del muestreo, que permite estimar o inferir características de un todo considerando una parte representativa. En base al análisis de experiencias y evaluaciones pasadas y actuales, hace estimaciones de fenómenos y características para un futuro, propone valores esperados. La Estadística también se vale de una serie de artificios matemáticos y del cálculo de probabilidades, para inferir sobre la validez de supuestos, construir modelos y métodos estadísticos. En sus inicios la Estadística se limitaba a una mera descripción empírica, ahora puede hacer una crítica e interpretación de la situación estudiada, porque ha desarrollado métodos matemáticos y estadísticos para hacer inferencias y pruebas estadísticas. La Estadística Moderna concede mayor importancia al análisis, a las muestras, que a los datos procedentes de toda la población. Quizás para el hombre común, todavía la Estadística es un simple procedimiento de recopilación y acumulación de datos numéricos; en la mayoría de los casos estas acumulaciones estaban relacionadas con las decisiones administrativas, fiscales o militares. La observación o registro de ciertos hechos, constituía naturalmente un primer avance para lograr una explicación o descripción de su comportamiento. El especialista, por su parte, considera a la Estadística como un método científico, un poderoso instrumento del pensamiento. La Estadística ha permitido investigar las propiedades numéricas de los conjuntos de hechos, y de este modo este instrumento de la investigación ha transformado completamente ciertas ramas de la ciencia. Su faceta probabilistica incluso ha resquebrajado sólidas construcciones filosóficas: «ha renovado las discusiones determinismo/probabilidad y la de esencia/existencia» (E.Borei. Probabilité et certitude 1956). RobERTO B. A vÜa A c o s i a La Estadística es una técnica indispensable en la investigación pura o aplicada. En la investigación, el especialista obtiene muestras, toma medidas, tabula datos, efectúa cálculos y luego los interpreta. Los métodos y afirmaciones estadísticas son cada vez más significativos. Los principios básicos de esta rama del sober son requeridos por todo el mundo, sea en el trabajo o en la vida diaria. BREVE RESEÑA HISTÓRICA Las estadísticas son tan antiguas como la humanidad misma. Los esfuerzos del hombre por evaluar en forma cuantitativa las características que lo rodean, dio como resultado la Estadística. En Egipto, se hacía recopilaciones regulares de datos de la administración estatal. Los hebreos utilizaron datos estadísticos a menudo; así la Biblia menciona el censo que Moisés levantó a instancias de Jahve. En el año 2258 A.C. el Emperador Yao dispuso el levantamiento de un censo en la China. En Roma, se llevaban registros numéricos para fines tributarios, en tiempo de Octavio Augusto se realizó un censo. Algunos sostienen que el año 0, año del nacimiento de Jesucristo, está relacionado con un empadronamiento. Se sabe que el año 727, los árabes realizaron un censo más o menos completo en la península Ibérica. En la Edad Media ya se encuentran estadísticas sistematizadas. El clero se dedicó a la recopilación, ordenamiento y estudio de los datos de tipo demográfico. En el siguió XV durante el gobierno de los Reyes Católicos, en el siglo XVI reinado de Felipe II y siguientes, se levantaron censos relativamente completos. Es digno de mencionar el llamado censo del Marqués de la Ensenada en 1748; así como también las numerosas estadísticas económicas contenidas en et Archivo de Indias de Sevilla. En América morena es posible encontrar algunos antecedentes estadísticos en la época pre colombina. Aún cuando los pobladores del Tahuantinsuyo no conocían la estadística como tal, estaban familiarizados con datos e informes sobre aspectos demográficos y económicos. En el Imperio Incaico existía la costumbre de registrar todos los hechos demográficos y socio económicos, lo cual permitió desarrollar técnicas de ESTADISTICA ELEMENTAL < £ > recopilación y archivo de datos. El Inca y su esforzada élite cooperadora, conocían por medio de los Quipus el potencial humano y económico del Imperio y, en consecuencia, deducían las necesidades que debían satisfacer. El Quipu consistía en un cordón central de lana del que pendían otros cordones unidos por otros, que se diferenciaban entre si por su grosor, color, número y forma de nudos. El «nudo» dice Garcilaso de la Vega, expresa el número pero no la palabra. La Yupana o Abaco, era el accesorio del Quipu, y facilitaba el cálculo de grandes cantidades. El Quipu Camayoc era el funcionario que conocía la técnica del registro por medio de los nudos. En el Cusco se ubicaba la Oficina Central de los Quipus. El Quipu sirvió a los antiguos peruanos para levantar los censos de población cada cierto número de años. El Imperio Incaico era una sociedad veraz y, por tanto todos los habitantes estaban acostumbrados a decir la verdad en el acto censal. Durante el despotismo ilustrado de Federico Guillermo I y de Federico El Grande de Prusia, la Estadística pasó a ser una organización estatal. Desde hace mucho tiempo, la Iglesia siempre se dedicó a recopilar ciertos datos demográficos y, a partir del Concilio de Trento (1545-1563), se establece la obligatoriedad de inscribir los nacimientos, matrimonios y defunciones. Los antecedentes históricos de la Estadística se encuentran fundamental mente en la Demografía, recién a mediados del siglo XVII se considera a la Estadística como una disciplina independiente. En Alemania, se creó por pri mera vez la cátedra de Estadística, originándose la Escuela Universitaria Admi nistrativa, la que consideraba la Estadística como una descripción de los fenó menos pertenecientes al Estado, según la orientación de Vito de Seckendorff (1626-1689) y Hermann Conring (1606-1681), quien en 1660 empezó a dictar un curso en la Universidad de Helmstadt. Su discípulo Godofredo de Achenwall (1719-1772), fue el primer gran teórico de la Estadística en lengua alemana y le dio el nombre de Estadística, basándose en el origen etimológico «Status». Por la misma época, en Inglaterra nace la Escuela Demográfica o de los aritméticos políticos, quienes se proponían determinar en forma cuantitativa las leyes empíricas que regían el comportamiento de los fenómenos políticos y sociales, que de ninguna manera eran independientes del volumen, estructura y distribución de la población. Entre los miembros de esta escuela destacaron William Petty (1623-1687), Edmundo Halley (1662-1742), King, Devenant y John Graunt (1620-1674), este último realizó un trabajo matemático de estadísticas vitales y económicas. En Alemania, esta orientación, en dura lucha con la escuela de Achenwall y Schlózer, obtuvo el primer éxito definitivo gracias al esfuerzo de Johann Peter Süssmilch. 20 > RobrRio B. Aví Ia AcosrA Por la época Contemporánea, en Francia se originó la Escuela de Probabilística, basada en los problemas de juegos de azar planteados a Blas Pascal (1623-1662) por el Caballero de Mére (Antonio Gambaud). La solución de estos problemas motivó el auge del Cálculo de Probabilidades, con destacada participación de Pedro de Fermat (1601-1665), Laplace (1749- 1827), Poisson (1777-1855), los hermanos Bernouilli (Daniel, Jacob y Nicolás), Gauss y De Moivré (1667-1754). Poco tiempo después el Cálculo de Probabilidades toma gran impulso debido a los trabajos de los franceses Borel, Fréchet y Levy, y de los rusos Tchevyshev (1821-1894), Tchuprov, Markov, Kintchine y Kolmogorov (nacido en 1903). Entre los ingleses destacó el clérigo Tomás Bayes. Cabe destacar el aporte de Adolph Quetelet (1796-1874) que fué el priemro en aplicar métodos estadísticos modernos al estudio de conjuntos de datos, razón por la cual se le reconoce como padre de la estadística moderna. Durante el siglo XIX y a principios del XX el trabajo estadístico se caracteriza por el estudio de grandes masas de datos. La ¡dea básica era la colección completa de datos. Pero, a principios del siglo XX y específicamente alrededor de los años treinta, se produjo un nuevo giro en el desarrollo de la Estadística. Nació la Estadística Moderna, la Estadística Inductiva o Inferencia Estadística, la Estadística Analítica. Se espera obtener información de cada detalle en particular; actualmente se buscan métodos que hagan posible obtener conclusiones generales a partir de muestras y de estudios parciales. En la Estadística Moderna, la palabra clave es «muestra». Estos cambios en la teoría y práctica estadística requirieron cada vez más de las matemáticas superiores, entonces surge la Estadística Matemática, cuyos procedimientos característicos son el análisis de la varianza, el cálculo de correlaciones y las pruebas de hipótesis estadísticas. En el campo de la Estadística Moderna destacaron Francisco Galton (1822- 1911) y Kart Pearson (1857-1936), que desarrollaron ideas sobre regresión y correlación, William Gosset (1876-1936) que escribía con el seudónimo de «Student» y Sir Ronald A. Fisher (1890-1962), quienes desarrollaron métodos de trabajo usados en el análisis estadístico y en la prueba de hipótesis. Por su parte en 1894, Jerzy Neyman, conjuntamente con el hijo de Pearson, crearon la Teoría del Muestreo. Otro destacado estadístico fué Abraham Wald (1902-1950) con aplicaciones al campo de la Genética. Resumiendo, en la evolución histórica de la Estadística se pueden distinguir tres fases: ESTADISTICA ELEMENTAL < 21 1. Censos y empadronamientos (Hasta el siglo XVI). 2. De la descripción de poblaciones a la aritmética política (S. XVI a XVIII). 3. Estadística y Cálculo de Probabilidades (S. XIX a la fecha). 1.5 NOMENCLATURA ESTADISTICA Considerando que existe un conjunto de términos que se usan frecuentemente en la Estadística, conviene precisar el significado de algunos de ellos. Estadística, servirá para designar a la ciencia que vamos a estudiar. Estadísticas, se tomará como sinónimo de datos estadísticos, servirá para designar a toda colección sistemática de datos referentes a un determinado fenómeno. Estadístico, es la persona que se dedica al estudio de la Estadística, es el profesional que analiza estadísticas, desarrolla métodos y modelos estadísticos y contribuye a la evolución de la ciencia estadística. Estadígrafo, es cualquier función de datos empíricos que se usa con fines descriptivos o analíticos; son medidas de resumen estadístico de un conjunto de datos, por ejemplo, la media aritmética, la mediana, la varianza, el coeficiente de correlación, etc. Algunas veces al profesional en Estadística se le da el nombre de «Estadígrafo», término que no resulta muy apropiado si se tiene en cuenta que en diversas Universidades y Centros Superiores, se otorgan el título de Estadístico, Estadístico-Matemático, Ingeniero Estadístico, Master en Estadística, Licenciado en Estadística, etc. Dato, es el valor o respuesta que adquiere la variable en cada unidad de análisis. Dato es el resultado de la observación, entrevista o recopilación en general. Los datos son la materia prima de la Estadística. Información, es el resultado de los datos procesados de acuerdo a ciertos objetivos. No hay información sin datos. Indicadores, son elementos característicos que describen una situación permitiendo su análisis. Son referentes empíricos que permiten una medición, 22 >RobERTO B. Aví Ia Acosia descripción, ordenamiento de los datos o características en forma válida y confiable. Los indicadores no determinan la realidad, la realidad determina el valor del indicador. La validez y confiabilidad del indicador depende de la validez de los datos utilizados y de la lógica de su relación o construcción. Indicador, es toda cantidad, valor o elemento que permite conocer el estado de un hecho, también permite expresar o conocer la variación, el comporta miento, la intensidad o relación de una o más características, variables, hechos o fenómenos. En este sentido, los llamados índices, tasas, estadígrafos, medidas de resumen, etc., son indicadores. M uestra, es una parte o subconjunto de una población en estudio. La muestra está constituida de elementos seleccionados de una manera deliberada, con el objeto de investigar las propiedades de su población. La muestra sólo da información de aquella población de la que ha sido extraída. Por ejemplo, una muestra de salarios de trabajadores de la industria pesquera de la ciudad de Chimbóte, no nos diría mucho de los salarios de los trabajadores de construcción civil de la misma ciudad, como tampoco se podrá inferir conclusiones válidas para los trabajadores pesqueros de Paita. Parámetro, es un valor obtenido para describir en forma resumida las características pertinentes o más importantes acerca de una población. Son las medidas de resumen de una población, en tanto que las medidas de resumen de una muestra se llamará estadígrafos. Una población puede tener muchas características y por tanto muchos parámetros. Población o universo, está referido a cualquier colectivo finito o infinito de elementos que interesan a un estudio. Población es un conjunto completo de individuos u objetos que poseen alguna característica común observable. Población es el número de elementos que definen la cobertura de un estudio. La población es el universo de estudio que está integrado por la totalidad de todas las unidades de análisis. U nidad de análisis, es el objeto o elemento indivisible que será estudiado en una población, sobre los cuales se va a obtener datos. La unidad de análisis no es el fenómeno investigado sino el que genera el fenómeno y proporciona datos concretos. V ariable, es una característica que puede tomar diferentes valores. Las variables son características observables, susceptibles de adoptar distintos valores o ser expresados en varias categorías. Variable es un aspecto específico de la realidad referido a la unidad de análisis, y que puede ser ESTADISTICA susceptible de ser medido o cuantificado. La variable adquiere un valor determinado en cada unidad de análisis Todas las variables tienen una escala de registro. Puede ser una característica medible (peso, ingresos, coeficiente de inteligencia, grados de estudio, etc.) o una cualidad no medible (estado civil, nacionalidad, sexo, etc.); en general variable es una característica que se puede categorizar. Las variables surgen de los objetivos de toda investigación. IT?!ELEMENTOS BASICOS DE LA ESTADISTICA Matriz T ripartita de Datos Después de la conceptualización de Estadística y la precisión de sus objetivos, es fácil advertir que en el trabajo estadístico existen tres elementos básicos como son: la población o muestra (unidades de análisis), las variables o características, y los datos. En todo estudio, el investigador (sujeto) observa sistemáticamente fenómenos o hechos de algún sector de la realidad (objeto de estudio), donde le interesa analizar algunas características (variables) y que con el propósito de dimensionar o cualificar el fenómeno, registra o simplemente recibe valores ya registrados, es decir obtiene o recopila datos. Por ejemplo, los hechos socio-económicos, debido a la enorme extensión de su objeto, adoptan diferentes formas y generan una estructura que tiene tres componentes o elementos. 1. Los e lem entos o unidades de análisis (población) que pueden ser personas, instituciones, objetos, familias, animales y otras unidades más complejas. Estas unidades tienen una característica en común, en cuanto constituyen el objeto de estudio de una investigación. Toda población tiene «N» elementos o unidades de análisis, y una muestra «n» elementos, donde n<N. 2. Las variab les, dimensiones o características que se desea conocer en relación a las unidades de análisis, tales como edad, ingresos, consumo de carne, lugar de nacimiento, ahorros, etc. Las variables se definen e identifican en función de los objetivos del estudio. 3. Los datos o valores que alcanzan las unidades en las variables estudiadas, son las respuestas o resultados que se obtienen cuando las unidades de 24/l iobERio B. Aví Ia A costa análisis son interpelados o preguntados. Habrá tantos datos como elementos tiene la población en estudio. Definida la población (o elemento de estudio) e identificadas las variables, se procede a la recolección de los datos. Estos tres elementos se pueden detallar en la llamada Matriz Tripartita de Datos, que como se aprecia en el ejemplo, permite conocer los datos para las variables en cada unidad de análisis. Además ayuda a definir el recorrido y categorías de las variables y luego construir las tablas de frecuencia con una o más variables. Hay dos formas de matrices tripartitas: i) Matriz Tripartita de Datos Básicos (Cuadro N° 1.1) ii) Matriz Tripartita de Datos Precodificados (Cuadro N° 1.2) La primera es un registro de los datos para cada elemento de la población, expresado en sus propias unidades, en esta forma se ingresa a la computadora para el proceso de tabulación. Cuadro N° 1.01 MATRIZ TRIPARTITA DE DATOS : CARACTERISTICAS SOCIOECONOMICAS DE LOS TRABAJADORES DE UN SUPERMERCADO. 1995. Unidades de análisis (Población) V a r i a b I e s Edad v . Sexo v 2 Estado Civil v 3 N° de Hijos v 4 Tiempo de Servicios V5 01 48 F Casada 4 21 02 37 F Casada 3 15 03 28 M Soltero 1 6 04 36 M Conviviente 3 15 05 25 M Soltero 0 5 06 38 F Divorciada 2 18 07 45 F Viuda 5 25 08 37 M Divorciado 3 16 09 48 F Casada 5 25 10 41 F Soltera 1 17 11 50 M Casado 2 26 12 35 F Soltera 1 13 Fuente: Fichas Personales 1995 Es una matriz porque los datos están organizados en filas (N° de unidades de análisis) y columnas (N° de variables). En esta forma, se presenta ESTADISTICA ELEMENTAL \ 25 detalladamente las características y datos para cada unidad de análisis. Esta matriz puede tener muchos elementos y variables, para poblaciones muy grandes se trabaja con un computador, donde justamente el registro de datos es una matriz tripartita, aquí la tabulación obedece a un programa para elaborai los cuadros de salida considerados en el Plan de Tabulación de todo estudie o investigación. Si se tiene pocos elementos, resulta muy cómodo realizar Is tabulación en forma manual, sea para construir tablas de frecuencia unidimensional, bidimensional, etc. La matriz tripartita también se puede construir como un cuadro resumen de un conjunto de formularios, donde cada fila corresponde a todos los datos considerados en cada formulario, registrando en las columnas las variables c preguntas con sus respectivos datos o respuestas. Estos significa, que si se tiene por ejemplo 80 formularios de 12 preguntas con un total de 40 categorías, se tendría una matriz de 80 filas y 40 columnas. La matriz tripartita de datos precodificados también es un registro de datos especificados en cada categoría de las variables. Se puede apreciar que esta disposición facilita el proceso de tabulación manual. Para obtener tablas de frecuencia unidimensionales, es suficiente sumar las aspas (x) o registro de cada columna. Esta matriz es recomendable para estudios de poblaciones o muestras pequeñas. Ejemplo 1.1 Aquí se detallan los tres elementos básicos, y puede apreciar se que cada categoría de las cinco variables tiene su código. Muestra Padres de Familia del C.E Unidad de análisis Padre de Familia Variables: Sexo: 1) Hombre 2) Mujer. Edad. 1) 20-29 2) 30-39 4) 50-59 5) 60-69 Nivel Educativo: 0) Sin Nivel 1) Primaria 2) Secundaria 3)Superior Tenencia de Vivienda: 1) Alquilada 2) Propia Número de Hijos: 0) Sin hijos 1) 1 a 3 3) 40-49 3) Otra. 2) 4 y más. 26 > Robemo B. Avila A costa Cuadro N°1.2 MATRIZ TRIPARTITA DE DATOS PRECODIFICADOS SEXO EDAD NIVEL EDUCATIVO TENECIA DE VIVIENDA N° DE HUOS Cód. 1 2 1 2 3 4 5 0 1 2 ¡ 3 1 2 3 0 1 2 01 02 32 I o ta l I^CUVSIFICAC IO nTd E VARIABLES Antes de considerar aspectos relacionados con la recopilación, descripción y reducción de datos estadísticos, es necesario distinguir los diversos tipos de variables que se pueden encontrar en los diversos estudios e investigaciones. Entre los muchos criterios de clasificación, podemos mencionar seis tipos: 1.7.1 SEGUN LA NATURALEZA DE LA VARIABLE a) V ariables cualitativas o estadísticas de atributos. Cuando expresan una cualidad, característica o atributo, tienen carácter cualitativo, sus datos se expresan mediante una palabra, es no numérico. Por ejemplo: estado civil, los colores, lugar de nacimiento, profesiones, actividad económica, causas de accidentes, etc. b) V ariables cuantitativas. Cuando el valor de la variable se expresa por una cantidad, es de carácter numérico. El dato o valor puede resultar de la operación de contar o medir. Por ejemplo: edad, número de hijos por familia, ingresos, viviendas por centro poblado, niveles de desempleo, producción, utilidades por empresas, etc. Las variables cuantitativas pueden ser: discreta y continua. ESTADISTICA ELEMENTAL <27 b.1. V ariable discreta. Cuando el valor de la variable resulta de la operación de contar, su valor está representado sólo por números naturales (enteros positivos). Ejemplos: hijos por familia, número de accidentes por día, trabajadores por empresa; población por distritos, habitaciones por vivienda, etc. b.2. V ariable continua. Cuando la variable es suceptible de medirse, es toda variable cuyo valor se obtiene por medición o comparación con una unidad o patrón de medida Las variables continuas pueden tener cualquier valor dentro de su rango o recorrido, por tanto se expresa por cualquier número real. Ejemplos: área de parcelas, ingresos monetarios, producción de maíz, peso, estatura, tiempo de servicios, horas trabajadas, niveles de empleo, etc. 1.7.2 SEGLN EL ORDEN DE LAS OBSERVACIONES a) Datos a tem porales o no ordinales. Cuando se prescinde del orden en que se realiza las observaciones. El orden de la observación no altera el valor de la variable. Por ejemplo, averiguar las edades de los alumnos de un aula, en este caso, cualquiera sea el orden que elijan los alumnos, la edad no va a variar. b) Series de tiem po, cronológicas o históricas. Cuando en la obtención de los datos se tiene en cuenta el orden cronológico de la observación, o al momento o tiempo que pertenece, son variables analizadas en función del tiempo. Por ejemplo: población demográfica en la década 1985-1995, variación mensual de precios, volumen anual de las exportaciones, evolución y tendencia de la matrícula en educación superior en el periodo 1990-1995, etc. 1.7.3 SEGLN EL NLMERO DE VARIABLES a) Estadísticas unid im ensionales. Son las estadísticas de una sola variable, es el caso de considerar independientemente un aspecto del fenómeno estudiado. Por ejemplo, clasificar personas por la edad; viviendas por el número de habitaciones; la estatura de los estudiantes de Estadística, etc. 28 > RobEuro B. AvíIa A c o s ia b) Estadísticas bid im ensionales Cuando se considera simultáneamente dos variables o aspectos en cada elemento del conjunto o fenómeno que se estudia. La bidimensionalidad requiere que las variables tengan cierta asociación o relación, de modo que una variable pudiera de alguna manera explicar el comportamiento de la otra. Por ejemplo, número de hijos según el nivel educativo de la madre, profesores por edad y tiempo de servicios, producción por años, importaciones anuales, etc. c) Estadísticas p lurid im ensionales Cuando se considera simultáneamente más de dos variables o aspectos en cada elemento de la población o muestra. Lo pluridimensional también supone que entre las variables exista alguna relación o interdependencia, entre los cuales es posible determinar una variable dependiente y otras independientes Por ejemplo, el consumo según el ingreso y número de personas por familia; la demanda, el precio y la inversión en propaganda, el nivel de fecundidad según la edad, nivel educativo de la madre y área de residencia, etc. — 1.7.4 SEGUN LA ESCALA DE MEDICION a) Variables nom inales. Son aquellas variables que establecen la distinción de los elementos en diversas categorías, sin implicar algún orden entre ellas, distribuye a la unidad de análisis en dos o más categorías. Ejemplos: sexo, estado civil, deportes que practica, profesiones, lugar de nacimiento, etc. b) Variables ordinales. Aquellas variables que implican orden entre sus categorías, pero no grados de distancia iguales entre ellas; están referidas a un orden o jerarquía, donde las categorías expresan una posición de orden. Ejemplo: grado de instrucción, clases sociales, grado de simpatía, rango de agresividad, orden de mérito, etc. c) V ariables de in te rva lo Son aquellas que suponen a la vez orden y grados de distancia ¡guales entre las diversas categorías, pero no tienen un origen natural, sino convencional, tiene un cero relativo. Ejemplo: coeficiente de inteligencia, temperatura, puntuación obtenida en una escala, etc. ESTADISTICA ELEMENTAL <29 d) Variab les de razón Estas variables comprenden a la vez a todos los casos anteriores, distinción, orden, distancia y origen único natural; el valor se expresa con un número real, tiene un cero absoluto. Ejemplo: edad, peso, ingresos, número de hijos, producción, accidentes de tránsito, etc. 1.7.5 SEGUN LA AMPLITUD DE LAS UNIDADES DE OBSERVACION a) V a ria b le s in d iv id u a le s , referida a características de individuos o personas, una empresa, centro educativo. Son variables para estudio de casos, donde se pueden sub dividir en variables públicas y privadas. a.1. V a riab le pública, aquella en que los valores individuales son conocidos por otras personas y se sabe que son conocidos. Ejemplos.’ edad, sexo, la ocupación, estado civil, deporte que practica, etc. a .2. V a riab le p rivada, cuando los valores individuales pueden ser conocidos por otros, una vez averiguados. Ejemplos, el coeficiente de inteligencia, opiniones frente a la política económica, grado de agresividad, conductas de consumo, etc. b) V ariables colectivas, aquellas que se refieren a características de las unidades cuando estas son colectivas, conjuntos o grupos (empresas, ciudades, escuelas, etc.). Ejemplos: tasa de mortalidad, urbanización, nivel educativo promedio, tasa de crecimiento demográfico, etc. 1.7.6 SEGUN LA RELACION ENTRE VARIABLES a) V a ria b le s depend ien tes, son aquellas que se explican por otras variables, son los efectos o resultados respecto a los cuales hay que buscar su motivo, causas o razón de ser. Es la variable que traduce la consecuen cia del efecto de una o varias razones o causas, de otras variables. b) Variab les independientes, son las variables explicativas o predictivas, cuya asociación, relación o influencia en la variable dependiente se pretende descubrir en la investigación. Las variables independientes (VI) son los que traducen o explican las causas o razones de las variaciones en la variable dependiente (VD). Simplificando, en la relación de variables, las causas o antecedentes serían las variables independientes (VI) y el efecto o consecuente es la variable dependiente (VD). 30 >RobERTO B. A v í I a A costa Ejemplo 1.2 En el caso más simple, para la relación de dos variables. 1. El presupuesto familiar (VD) depende de los ingresos (VI). 2. El volumen de ventas (VD) se explica por la inversión en propaganda (VI). 3. El número de hijos por familia (VD) tiene relación con el nivel educativo de los padres (VI). 4. El analfabetismo (VD) tiene relación con el lugar de residencia (VI) y la expansión del servicio educativo (VI). c) Variables intervin ientes o interferentes, son aquellas que coparticipan con la variable independiente condicionando el comportamiento de la variable dependiente. En el caso de la relación entre presupuesto familiar (VD) y los ingresos (VI), algunas variables intervinientes serían la conducta de consumo, la edad de los miembros de la familia, etc. [ELEMENTOS DE UNA VARIABLE □ La identificación y definición de variables es la tarea más delicada de toda investigación y del trabajo estadístico. Téngase presente que las variables se deducen a partir de los objetivos de un estudio o investigación. En consecuen cia, para tener éxito en la selección de variables, es recomendable distinguir los siguientes cinco elementos: a) Nombre o denominación de la variable. b) Definición o conceptualización de la variable. c) Un conjunto de categorías o niveles, que es definida por el investigador. Las categorías no son únicas, lo mínimo es dos categorías y dependen de los objetivos de la investigación. d) Procedimientos para categorizar o agrupar las unidades de análisis. e) Algunas medidas de resumen o indicadores. E¡em pio 1.3 Veamos la variable estado c iv il : a) Nombre b) Definición Estado civil o conyugal. Es la situación de la persona empadronada en relación con las leyes y costumbres del país. ESTADISTICA ELEMENTAL c) Categorías : (01) Soltero (a) (02) Casado (a) (03) Conviviente (04) Viudo (a) (05) Divorciado (a). (06) Separado (a). También puede ser (01) Soltero (02) No Soltero d) Categorización : ¿Cuál es su estado civil o conyugal? e) Medidas de resumen, Indicadores : - Distribución porcentual. - Tasa de nupcialidad, que indica la frecuencia de matrimonios, etc. Ejemplo 1.4 Veamos la variable cuantitativa, ingreso : a) N om bre Ingresos b) Definición : Son los recursos monetarios netos, incluyendo todas las bonificaciones que percibe una persona por su ocupación principal y secundaria durante el período de referencia de la encuesta. c) Categorías : Puede proponerse en forma de niveles o simplemente intervalos. Para Niveles de ingreso Para Intervalos (01) Menos de 200 (04)601-800 (07) 1401-1800 (10) 2601-3000 alto, medio, bajo. Por ejemplo 11 intervalos (dólares) (02)201-400 ; (03)401-6 00 (05)801-1000 ; (06)1001-1400 (08)1801-2200 ; (09)2201-2600 (11) Más de 3000 dólares. d) Categorización ¿Cuál fué su ingreso total en el último mes? e) Indicadores Ingreso promedio, ingreso mediano, Dispersión de los ingresos, Indice de Gini, etc. Ejemplo 1.5 El analfabetismo en la población de 15 y más años, dimen sionando a partir de la tasa de analfabetismo. a) Nom bre Tasa de analfabetismo (%) b) Definición : Proporción de peruanos de 15 y más años, que no saben leer ni escribir. 32 /R obE R io B. Av í Ia Acosta c) Categor ías ; Bajo Menos del 10% Medio : De 10 a 20% Alto ; De 21 a 30% Muy Alto Más de 30% d) Categor ización ¿Sabe leer y escribir? e) Ind icadores Proporción de analfabetos hombres y Analfabetos por área urbano-rural, etc B U LA INVESTIGACION ESTADISTICA 1.9.1 QUE ES INVESTIGACION El objetivo de la Investigación es descubrir respuestas a determinadas interrogantes a través de la aplicación de procedimientos científicos. El punto de partida de la investigación es la existencia de un problema que habrá que definir, examinar, valorar y analizar críticamente, para poder luego formular y entender su solución. Ander Egg (1971), define la Investigación Científica como «un proceso formal, sistemático, racional e intencionado en el que se lleva a cabo el método científico de análisis; como un procedimiento reflexivo, controlado y crítico que permite descubrir nuevos hechos o datos, relaciones o leyes, en cualquier campo del conocimiento, en un momento histórico». La Investigación es un proceso de producción de conocimientos científicos; es un proceso sistemático a través del cual se recogen datos e información de la realidad objetiva para dar respuesta a las interrogantes que se plantean. No hay investigación grande o pequeña, simplemente investigar es buscar respuestas para plantear soluciones. Cuando se aplica el método científico al estudio de los problemas económi cos se habla de investigación económica, asimismo se tiene investigación educativa, investigación agropecuaria, etc. Toda investigación requiere de datos, sin datos no hay investigación, entonces surge la necesidad de definir métodos de análisis o tratamiento de datos, con el propósito de obtener algunas ESTADISTICA ELEMENTAL <33 medidas o indicadores que expresan la dimensión o niveles de las variables estudiadas, es decir, realizar la operacionalización de las variables; en este contexto la Estadística surge como ciencia auxiliar de la investigación, que por su naturaleza, estructura y métodos, en este proceso, el análisis estadístico también cumple con los diversos pasos de toda investigación. «El desarrollo científico y la investigación no es posible sin la estadística». (R.A.)'-------------------------------------------------- ---------- En este contexto, se hablará de Investigación Estadística Aplicada, orien tada el análisis estadístico de los fenómenos sociales, económicos y demográ ficos, dentro de los tres objetivos de la Estadística, como son: Descripción, Análisis Experimental y Predicción. 1.9.2 ETAPAS DE LA INVESTIGACION ESTADISTICA La investigación estadística por su naturaleza, es fundamentalmente de tipo descriptiva; se preocupa de la confiabilldad, validez y significación de los datos, de las muestras, así como de los métodos y técnicas de recolección y análisis estadístico. Es importante distinguir entre Investigación Estadística y la Estadística como técnica o ciencia auxiliar para la investigación científica, social, educativa, económica, etc. La investigación social, económica o de otro tipo, estudia el fenómeno en su totalidad, dentro de un marco teórico y conceptual con el propósito de contribuir al conocimiento científico; por ejemplo hay que distinguir entre hecho estadístico y hecho social, económico, educativo, etc. La investigación estadística se preocupa fundamentalmente de la dimensión y la relación de los elementos que caracterizan al fenómeno en estudio. La investigación estadística es un proceso donde se distinguen cinco etapas: I o Planeamiento o preparación a) Fundamentación y comprensión del estudio e identificación de las variables. b) Determinación de objetivos. RobERTO B. A v í I a A c o s ía c) Organización de las variables, precisión de los datos e información requerida. d) Identificación y evaluación de las fuentes de información. e) Identificación y análisis de estudio similares. f) Determinación del ámbito de la investigación: • Ambito geográfico. • Población, grupo humano o elementos que serán estudiados. Determinación de las unidades de análisis. • Período de análisis. g) Preparación del plan para ejecutar la investigación. • Fijación de la población. • Determinación de los métodos, técnicas e instrumentos de recolección y análisis de datos. • Método de selección de las muestras. • Elaboración de cuestionarios e instrumentos de recolección de datos. • Preparación del Plan de Tabulaciones y de los cuadros de análisis. h) Formación y capacitación del equipo de trabajo. i) Elaboración del calendario de actividades. j) Formulación del presupuesto y fuentes de financiamiento. k) Diseño y ejecución de una prueba piloto o experimental. 2o RECOPILACION DE LOS DATOS La recopilación o recolección de datos es el momento en el cuál el investigador se pone en contacto con los objetos o elementos sometidos a estudio, con el propósito de obtener los datos o respuestas a las variables analizadas. Los métodos de recolección son diversos y dependen de las posibilidades de acceso o contacto con los elementos investigados, del tamaño de la población o muestra de la oportunidad de obtener datos y del presupuesto y de las exigencias del tiempo. El método de recolección está asociado también con el tipo y naturaleza de la fuente de datos. 3o O rg an iza ció n y presentación de datos Después de la recopilación de los datos, se procede a su organización, clasificación y tabulación, de modo que se facilite la presentación en tablas, cuadros o gráficos. Como tarea previa a la organización es indispensable realizar una evaluación, crítica, corrección y ajuste de los datos, el propósito es superar las omisiones, inconsistencias y desechar las respuestas no significativas o ESTADISTICA erróneas. Téngase presente que la validez de sus resultados y conclusiones dependen en gran medida de la fidelidad de los datos utilizados. No existen computadoras que por sí, corrijan los errores de recopilación. Realizadas las correciones o ajustes, se procede a la clasificación o establecimiento de categorías o intervalos, para la agrupación de los datos. Finalmente se procede a la tabulación o procesamiento de los datos, de acuerdo a un plan de tabulaciones previamente definido. Los cuadros y tablas estadísticas como primera fase de la reducción de datos, facilita el cálculo de los indicadores (porcentajes, promedios, proporciones, índices, tasas, etc.) con los cuales se inicia la descripción, análisis e interpretación de los datos, variables e información estadística. 4o A nálisis e interpretación de los datos En este etapa se aplican los argumentos matemáticos y teóricos de la Estadística. A través de métodos estadísticos se calcula indicadores y medidas de resumen, se establecen relaciones entre variables, se estiman valores, se ejecutan pruebas estadísticas, etc., como elementos de referencia para la descripción, análisis e interpretación del comportamiento de los datos, hacer inferencias válidas y obtener información de los elementos o unidades estudiadas. Los métodos de análisis de datos estadísticos son numerosos y pueden consistir en una simple observación, hasta recurrir a métodos más elaborados o sofisticados matemáticamente, aspectos que se pretenden presentar en este libro. Es importante destacar que al Estadístico le corresponde fundamentalmente, proporcionar indicadores, modelos estadísticos e información estadística de un determinado fenómeno para el desarrollo de las investigaciones en general. La interpretación de los datos y resultados se hacen en el contexto de los objetivos de la investigación. 5o FORMULACION DE CONCLUSIONES Y PREPARACION DEL INFORME En toda investigación debe analizarse el cumplimiento de los objetivos, en función de los resultados fundamentales. Esta contrastación permite elaborar un resumen de los aspectos sustantivos, que luego se expresarán en forma de conclusiones y sugerencias orientadoras en la toma de decisiones. Es recomendable elaborar un informe previo o preliminar con un resumen de las conclusiones y sugerencias con el propósito de ofrecer información actualizada, oportuna y novedosa; mientras, se prepara el informe final cuya estructura obedece a objetivos y requerimientos metodológicos. 3 6 >RobERTO B. A v í I a A costa 1.9.3 ELECCION DE LAS UNIDADES ESTADISTICAS La unidad estadística es el hecho elemental e indivisible que será estudiado y sobre los cuales se va a obtener datos estadísticos, pueden ser: personas, animales, objetos, instituciones, etc. En la investigación social, se denomina unidad de análisis. Esta unidad no es el fenómeno investigado, sino el que genera el fenómeno y proporciona datos concretos. En primer lugar, la elaboración de una buena estadística implica una definición correcta de las unidades que se van a considerar y una delimitación de la materia a investigar. Antes de iniciar la observación y las operaciones de recuento, el Estadístico debe tener una ¡dea clara, tanto del conjunto que quiere estudiar como de los individuos o unidades que constituyen dicho conjunto^ La unidad estadística debe definirse cuidadosamente teniendo en cuenta los siguientes criterios: • Debe ser sencilla, de modo que se puede caracterizar con facilidad, que los encargados de la recopilación no tengan duda en su identificación; • Debe ser precisa, de modo que facilite su identificación y saber que observar. No es lo mismo decir «población infantil» que «población infantil de 6 a 14 años de edad». • Fácilmente com prensible y adaptada a los objetivos que se persiguen. • Deben ser semejantes, de manera que sean aditivos; • Respetar las posibles definiciones oficiales o estatales. En el caso que la definición sufra cambios, el Estadístico deberá elaborar un cuadro comparativo o de correspondencia que permita realizar cálculos también en el marco antiguo; de ninguna manera debe anularse las posibilidades de comparación por cambio de definiciones. Con el propósito de promover la investigación, y en especial ilustrar la operacionalización estadística, se propone los siguientes estudios: 1. «Determinación del Presupuesto Familiar del Docente Universitario Perua- SUGERENCIA DE INVESTIGACIONES no». E S T A D IS T IC A E L E M E N T A L < £ > 2. Estudio Económico del Transporte Urbano de Pasajeros en Lima Metropolitana. 3. «Oferta y Demanda del Profesionales Universitarios». 4. «Ampliación de la Frontera Tributaria en el Distrito de Lince». 5. «Alma Mater Sanmarquina en acción: Financiamiento no tradicional de San Marcos». 6. «Implicancias en la Demanda Socio Económica del crecimiento de la población». 7. «Efectos Económicos del Atraso Académico en la Universidad Nacional Mayor de San Marcos». 8. «Necesidad de Inversión para satisfacer el requerimiento de viviendas en la zona urbana». 9. «Niveles de Vida y Pobreza por áreas geográficas». 10 «Implicancias de la Educación en los Niveles de Fecundidad». PASOS EN EL PROCESAMIENTO DE DATOS DE UNA INVESTIGACION EN EL COMPUTADOR 1) El especialista o investigador explica y presenta al program ador: • El prob lem a y los objetivos de la investigación. • Las variab les y los datos que necesita o ha obtenido. • Los métodos e instrumentos de recolección de datos. • El Plan de Tabulación, conjunto de cuadros donde estarán los datos ordenados de acuerdo a las categorías de las variables. Estos son los Cuadros de salida. • Los indicadores, estadígrafos y medidas de resumen que se necesita calcular, explicando los métodos y fórmulas. • Requerimiento de gráficos. • El cronograma de la investigación. Aquí se explica y presenta las necesidades de procesamiento de datos de la investigación, entregando o diseñando los formatos de entrada/ salida al Programador. 2) Determinación del software. Después de conocido el problema y los objetivos, el Programador realiza lo siguiente: • Escribe todas las ideas en borrador. • Confecciona el d iagram a de flu jo para analizar las necesidades del problema y desarrolla la estructura del Programa. 3 8 >>RobEHTO B. A v í I a A c o s ia • Traduce y codifica el programa en un lenguaje o software que reúna las características para procesar los datos como: L o t u s , e x c e l , q p r o , D B A S E , C L IP P E R , F O X -P R O , etc. 3) ingreso de los Datos. • Lectura de los instrumentos de recolección de datos y de las fórmulas para el cálculo de indicadores. • Utilizando el teclado se ingresan los datos y el programa a la memoria del ordenador o computador (Unidad Central de Proceso). • Se almacena en algún dispositivo de almacenamiento de datos: Diskettes, Disco Duro, etc. 4) Procesamiento de los datos en el ordenador • Aplicación del programa o Software. • Los cálculos se realizan internamente en la CPU (Unidad Central de Proceso). • La información resultante se transmite posteriormente a los periféricos (Monitor o pantalla, Impresora, etc.). 5) Salida de la información • Se puede hacer por el Monitor o Pantalla del computador. • Imprimir los resultados y la información. Obtener una copia impresa de los cuadros de salida (plan de tabulación) y de los resultados de los indicadores, estadígrafos y medidas de resumen. • Elaborar e imprimir los gráficos. 6) Decisiones y acciones del usuario final. Si el programa es correcto y satisface los requerimientos de la investigación, entonces el problema ya está resuelto. Los resultados son analizados e interpretados por el equipo o responsable de la investigación, en el contexto de los objetivos y las hipótesis de la investigación. Nota D Planteada una investigación, el Estadístico tiene que precisar y determinar los elementos básicos del trabajo estadístico. 1) Población (N) c£> objetivos O 2) variables O 3) Datos Base de Datos ESTADISTICA ELEMENTAL < 39 O PE R A C IO N A LI ZA C IO N D EL T R A B A JO E ST A D ÍS TI C O 4 0 / R o b e i u o B. A v 'i Ia A costa Capítulo RECOLECCION DE DATOS E ffllA RECOLECCION DE DATOS_____________________ La recopilación o recolección de datos es el momento en el cual el investigador se pone en contacto con los objetos o elementos sometidos a estudio, con el propósito de obtener los datos o respuestas de las variables consideradas; a partir de estos datos se prepara la Información estadística, se calculan medidas de resumen e indicadores para el análisis estadístico. Antes de recopilar o recoger datos, es importante analizar los objetivos del estudio, precisar las variables e identificar las fuentes de datos, a fin de definir qué datos hay que recopilar y cómo hacer esta tarea. La formulación del problema y del marco teórico, la definición de-las hipótesis y de los objetivos de la investigación permiten especificar los tipos de información y las variables que son requeridas. Realizada esta tarea, el investigador debe a continuación seleccionar y elaborar las técnicas e instrumentos para recolectar los datos. El trabajo de recolección de datos, en general, se puede realizar mediante dos modalidades: a ) La técnica de investigación documental o bibliográfica. b) La técnica de trabajo de campo. Por su parte, el trabajo de campo puede realizarse de dos maneras: b .l.L a observación y la exploración en el terreno, que consiste en el contacto directo del investigador con el objeto de estudio. ESTADISTICA ELEMENTAL < 41 b.2.La encuesta y la entrevista, que consiste en el acopio de testimonios orales y escritos de personas vivas. La fase de recolección de datos es uno de los puntos principales de la investigación, en consecuencia, debe dotarse de ciertas garantías para que los datos científicos puedan ser confiables y comparables, evitar las desviaciones y la falta de representatividad. 2.2 LA INFORMACION ESTADISTICA La información estadística, como datos procesados de acuerdo a ciertos objetivos, es un medio que permite cuantificar aspectos de una realidad, de un fenómeno o problema determinado, en un momento o período dado y un ámbito concreto. A partir de la información estadística se puede describir y explicar esa realidad, así como inferir conclusiones para definir un plan de acción o desarrollo específico. La información, en general, sirve para tomar decisiones. Por ejemplo, si se desea mejorar la balanza de pagos a través de las exportaciones, deberán conocerse la producción existente, los precios del mercado, la cantidad que se requiere para satisfacer adecuadamente las necesidades internas del país, la demanda externa por países, entre otros aspectos. La preparación de esta información requiere de datos sobre cada uno de los aspectos o variables consideradas en el estudio. Para el efecto, hay que identificar de dónde y cómo obtener los datos estadísticos. En primer lugar, se tienen que identificar las fuentes de datos, evaluar qué y cómo están los datos, y luego diseñar los métodos, técnicas e instrumentos para la recopilación de los datos. 2.3 LAS FUENTES DE DATOS La fuente de datos es el lugar, la institución, las personas o elementos donde están o que poseen los datos que se necesitan para cada una de las variables o aspectos de la investigación o estudio. En general, se puede disponer de cinco tipos de fuentes de datos: 4 2 / RobtRio B. A v Üa A costa 1. Las O fic inas de Estadística, como instituciones responsables de recopilar, procesar y publicar las estadísticas sociales o nacionales. 2. Archivos o Registros Adm inistrativos, como el Registro Civil, Registro Electoral, Escalafón de
Compartir