Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
REPÚBLICA BOLIVARIANA DE VENEZUELA UNIVERSIDAD NACIONAL EXPERIMENTAL POLITÉCNICA "ANTONIO JOSÉ DE SUCRE" VICE-RECTORADO “LUIS CABALLERO MEJÍAS” DEPARTAMENTO DE INGENIERÍA INDUSTRIAL ORGANIZACIÓN, CLASIFICACIÓN E INTERPRETACIÓN DE LA INFORMACIÓN COMO GUÍA DEL INGENIERO INDUSTRIAL TRABAJO DE ASCENSO PRESENTADO COMO REQUISITO PARA OPTAR A LA CATEGORIA DE PROFESOR AGREGADO AUTOR: CENTENO SILVA, RAQUEL CARACAS, 10 DE NOVIEMBRE DE 2003 2 INDICE INDICE DE FIGURAS 4 INDICE DE TABLAS 7 PRÓLOGO 8 I. CONCEPTOS BÁSICOS SOBRE ESTADÍSTICA 9 A) IDEAS SOBRE LA IMPORTANCIA, APLICACIÓN Y ORIGEN DE LA ESTADÍSTICA. 10 B) CLASIFICACIÓN DE LA ESTADÍSTICA 17 I).- ESTADÍSTICA DESCRIPTIVA 17 II).- ESTADÍSTICA INFERENCIAL 17 C) TÉRMINOS COMUNES EMPLEADOS EN ESTADÍSTICA 18 I).- UNIVERSO 18 II).- POBLACIÓN 18 III).- MUESTRA 20 IV).- VARIABLES Y SU CLASIFICACIÓN 21 V).- UNIDAD ESTADÍSTICA 24 D) MEDIDAS Y MEDICIONES 25 E) RECOLECCIÓN DE DATOS 32 I).- INVESTIGACIÓN ESTADÍSTICA 32 II).- OBSERVACIÓN DE LA POBLACIÓN 33 III).- FUENTES DE DATOS ESTADÍSTICOS 36 F) RESUMEN 38 G) EJERCICIOS PROPUESTOS 38 II. DISTRIBUCIONES DE FRECUENCIA 41 A) SERIES ESTADÍSTICAS 42 I).- SERIES TEMPORALES 42 II).- SERIES ATEMPORALES 42 B) DISTRIBUCIONES DE FRECUENCIA 43 C) REPRESENTACIÓN GRÁFICA DE LAS DISTRIBUCIONES DE FRECUENCIA 58 3 D) ANÁLISIS DE LAS DISTRIBUCIONES DE FRECUENCIA 66 E) RESUMEN 74 F) EJERCICIOS PROPUESTOS 75 III. FORMAS TABULARES DE PRESENTAR INFORMACIÓN 80 A) DESCRIPCIÓN DE LAS TABLAS ESTADÍSTICAS 83 B) CLASIFICACIÓN DE LAS TABLAS ESTADÍSTICAS 85 I).- TABLAS DE REFERENCIA 85 II).- TABLAS ANALÍTICAS O DE RESUMEN 86 III).- TABLAS EN UN SOLO SENTIDO 87 IV).- TABLAS DE CLASIFICACIÓN CRUZADA 89 V).- TABLAS DE MÚLTIPLES CLASIFICACIONES 90 C) CONSIDERACIONES PARA OBTENER INFORMACIÓN DE LAS TABLAS ESTADÍSTICAS 91 D) RESUMEN 92 E) EJERCICIOS PROPUESTOS 92 IV. FORMAS GRÁFICAS DE PRESENTAR INFORMACIÓN 95 A) TIPOS DE GRÁFICAS 98 I).- DIAGRAMAS LINEALES 98 II).- DIAGRAMAS DE BARRAS 104 III).- GRÁFICOS CIRCULARES 110 III).- PICTOGRAMAS 113 IV).- CARTOGRAMAS 115 B) RESUMEN 116 C) EJERCICIOS PROPUESTOS 116 AGRADECIMIENTOS 118 V. REFERENCIAS BIBLIOGRÁFICAS 119 4 INDICE DE FIGURAS FIGURA N° 1 MAPA CONCEPTUAL DE LA ESTADÍSTICA 16 FIGURA N° 2 MODELO BÁSICO PARA LA ESTADÍSTICA INFERENCIAL 18 FIGURA N° 3 POBLACIONES A PARTIR DE UN UNIVERSO 19 FIGURA N° 4 SELECCIÓN DE UNA MUESTRA A PARTIR DE UN UNIVERSO 20 FIGURA N° 5 SELECCIÓN DE UNA MUESTRA A PARTIR DE UNA POBLACIÓN 20 FIGURA N° 6 TIPOLOGÍA DE LAS VARIABLES EN ESTADÍSTICA 24 FIGURA N° 7 NIVELES DE MEDICIÓN 27 FIGURA N° 8 BOSQUEJO DE UNA TABLA DE CONTEO 44 FIGURA N° 9 REPRESENTACIÓN DE UNA TABLA DE CONTEO LLENA 45 FIGURA N° 10 EJEMPLO DE UNA TABLA DE FRECUENCIAS 45 FIGURA N° 11 REPRESENTACIÓN GRÁFICA DE LAS FUNCIONES DE FRECUENCIA Y DISTRIBUCIÓN 47 FIGURA N° 12 PROBLEMAS CON LOS LÍMITES DE CLASE 48 FIGURA N° 13 COMPARACIÓN DE LOS MÉTODOS EMPÍRICOS 53 FIGURA N° 14 ORGANIZADOR GRÁFICO PARA FACILITAR LA CONSTRUCCIÓN DE DISTRIBUCIONES AGRUPADAS DE FRECUENCIAS 56 FIGURA N° 15 RESOLUCIÓN DE UN EJEMPLO DE CONSTRUCCIÓN DE DISTRIBUCIONES DE FRECUENCIAS AGRUPADAS EMPLEANDO EL ORGANIZADOR GRÁFICO 57 FIGURA N° 16 SENSIBILIDAD DE UN HISTOGRAMA AL NÚMERO DE CLASES 61 5 FIGURA N° 17 COMPARACIÓN DE LA FORMA DE LOS HISTOGRAMAS DEL EJEMPLO 61 FIGURA N° 18 HISTOGRAMA DEL NIVEL DE CO EN EL AIRE CON FRECUENCIAS AGRUPADAS EN SEIS CLASES 62 FIGURA N° 19 DIAGRAMA DE TALLO Y HOJAS PARA LA CONCENTRACIÓN DE CO EN AIRE 63 FIGURA N° 20 POLÍGONO Y OJIVAS PARA LA CONCENTRACIÓN DE CO EN AIRE 64 FIGURA N° 21 ILUSTRACIÓN DEL RANGO PERCENTIL ACOTADO ENTRE DOS VALORES 68 FIGURA N° 22 DIAGRAMA DE PARETO PARA EL CONSULTORIO ODONTOLÓGICO 74 FIGURA N° 23 ESQUEMA DE LAS PARTES FUNCIONALES DE UNA TABLA ESTADÍSTICA 83 FIGURA N° 24 ESQUEMA DE TABLAS CLASIFICADAS EN UN SOLO SENTIDO 88 FIGURA N° 25 CARACTERÍSTICAS DE UNA TABLA DE CLASIFICACIÓN CRUZADA 89 FIGURA N° 26 ESQUEMA DE UNA TABLA DE CLASIFICACIÓN CRUZADA MÚLTIPLE 90 FIGURA N° 27 ELEMENTOS QUE COMPONEN UN GRÁFICO 96 FIGURA N° 28 BOSQUEJO DE LA CONSTRUCCIÓN DE UN DIAGRAMA LINEAL 99 FIGURA N° 29 VENTAS DE LAS COMPAÑÍA TVB 100 FIGURA N° 30 INFLUENCIA DE LOS EJES EN LOS DIAGRAMAS DE LÍNEA 101 FIGURA N° 31 EVOLUCIÓN DE LAS VENTAS DE LA EMPRESA TVB SEGÚN EL SEGMENTO DE MERCADO 102 6 FIGURA N° 32 VENTAS TOTALES Y POR SEGMENTO DE MERCADO DE LA EMPRESA TVB, PERÍODO (1992-2002) 103 FIGURA N° 33 COMPRA DE MATERIA PRIMA PARA RECICLAR POR LA EMPRESA TVB 107 FIGURA N° 34 CAMBIOS PORCENTUALES DEL AÑO 2001 RELATIVO AL AÑO 2000 DE LA PRODUCCIÓN DE LA EMPRESA TVB, SEGÚN EL TIPO DE PRODUCTO 108 FIGURA N° 35 NÚMERO DE ÓRDENES DE PEDIDO RECIBIDAS, ENTREGADAS E INSATISFECHAS, EMPRESA TVB AÑO 1997 109 FIGURA N° 36 NÚMERO DE ÓRDENES PRODUCIDAS POR LA EMPRESA TVB EN EL AÑO 1997 109 FIGURA N° 37 COSTO DE PRODUCCIÓN UNITARIA DE CONDENSADORES TIPO �A�, EMPRESA TVB (AÑO 1997) 110 FIGURA N° 38 CONSTRUCCIÓN DE UN DIAGRAMA DE PASTEL 112 FIGURA N° 39 DISTRIBUCIÓN DE LOS INGRESOS POR VENTAS SEGÚN PRODUCTO DE LA EMPRESA TVB, AÑO 2001 112 FIGURA N° 40 COMPARACIÓN DE LA DISTRIBUCIÓN DE LOS INGRESOS POR VENTAS SEGÚN PRODUCTO DE LA EMPRESA TVB, AÑOS SELECCIONADOS 113 FIGURA N° 41 PICTOGRAMA DEL COSTO DE PRODUCCIÓN UNITARIA DE CONDENSADORES TIPO �A� 114 EMPRESA TVB (AÑO 1997) 114 FIGURA N° 42 DENSIDAD POBLACIONAL EN VENEZUELA POR ENTIDAD FEDERAL 115 7 INDICE DE TABLAS TABLA N° 1 PPM DE CO EN AIRE 57 TABLA N° 2 LISTADO DE IDENTIFICACIÓN DE LAS CLASES NOMINALES 58 TABLA N° 3 FRECUENCIAS EN LA MEDICIÓN DE LA CONTAMINACIÓN DEL AIRE 58 TABLA N° 4 TABLA DE FRECUENCIAS Y PORCENTAJE ACUMULADO DE LA CONCENTRACIÓN DE CO EN AIRE 70 TABLA N° 5 FRECUENCIA DE RESPUESTAS �NO ACEPTABLE� 72 TABLA N° 6 DISTRIBUCIÓN DE FRECUENCIAS ORDENADAS PARA ANÁLISIS DE PARETO 73 8 PRÓLOGO En la actualidad una de las habilidades más importante que debe caracterizar al profesional de la ingeniería industrial es la búsqueda de la optimización de respuestas asertivas en el proceso de toma de decisiones, la cual debe ir acompasada por una excelente presentación de reportes de carácter técnico basados en información cuantitativa. Este proceso de consolidación de respuestas es sólo posible en la medida que el profesional se desarrolle vasta y profundamente en la estadística. No obstante, mi experiencia docente apunta en sentido contrario a la afirmación señalada, de hecho, es curioso observar en los estudiantes una actitud apática y pasiva, y a menudo de rechazo, la cual se manifiesta en el alto porcentaje de retirados y repitientes, elemento acrecentado por la dificultad de asistencia regular que evidencian la mayoría de los alumnos. Asimismo, el desconocimiento por parte de los estudiantes de la importancia y aplicación de las técnicas estadísticas, especialmente las relativas a la organización, clasificación e interpretación de la información, en conjunto con el vacío detectado en la bibliografía recomendada en los cursos de estadística para ingenieros, han brindado la oportunidad al autor de presentar en un instrumento exhaustivo, en forma de texto, que permita al estudiante la identificación con la herramienta estadística como factor coadyuvante en la comprensión, instrumentación e interpretación de los fenómenos que atienen a los procesos relacionados con el campo de la ingeniería industrial. El texto se realizó con el propósito de concretar una herramienta autodidáctica que promueva la responsabilidad del estudiante en gestionar sus propios aprendizajes, construyéndolos, compartiéndolos y valorándolos. Este enfoque se considera nuevo en cuanto a la concepción del aprendizaje, ya que se encuentra influenciada por las tendencias cognoscitiva y constructivista, lo que le permite al lector ejecutarun aprendizaje auto dirigido al mismo tiempo utilizar el material como una herramienta de apoyo auxiliar a las actividades de aula. 9 I. CONCEPTOS BÁSICOS SOBRE ESTADÍSTICA Todo aquel que da los primeros pasos en cualquier campo del conocimiento debe procurar identificar el léxico, origen, aplicaciones y conceptos básicos del área, para poder comunicarse de manera efectiva y tener una idea clara de lo que le espera. Para los ingenieros industriales el campo de la estadística es prioritario, porque está vinculado a la mayoría de sus actividades profesionales, tal como descubrirá al leer este capítulo. La estadística es una ciencia de abolengo, desde su nacimiento ha estado vinculado al Estado y, consecuentemente, al poder. El marco referencial estadístico es una habilidad fundamental de pensamiento que convierte a quién lo posee en un mejor ciudadano y en un profesional más efectivo. Mediante el estudio de este capítulo se pretende que Usted sea capaz de: 1. Definir que es estadística reconociendo su importancia y aplicabilidad para el ingeniero. 2. Explicar que se quiere decir con estadística descriptiva y estadística inferencial. 3. Distinguir entre universo y población, identificando muestras de estos grupos a través de situaciones planteadas. 4. Identificar la unidad estadística reconociendo las diferencias cuando está referida al universo, la población o la muestra. 5. Definir una o más variables explicativas de una unidad estadística dada distinguiendo entre variables cualitativas y variables cuantitativas. 6. Distinguir entre una variable discreta y una variable continua. 7. Definir los términos mutuamente excluyente y colectivamente exhaustivo. 8. Expresar el concepto de medida describiendo sus alcances y haciendo énfasis en las diferencias entre las escalas de medición: nominal, ordinal, de intervalo y de razón y sus limitaciones operacionales basadas en el análisis de las medidas de diferentes variables. 9. Expresar el concepto de dato estadístico, explicándolo brevemente. 10. Distinguir entre las fuentes primarias y fuentes secundarias de recolección de datos. 11. Seleccionar el método más conveniente para recolectar los datos en una situación dada. Conceptos Básicos sobre Estadística Raquel Centeno Silva 10 a) IDEAS SOBRE LA IMPORTANCIA, APLICACIÓN Y ORIGEN DE LA ESTADÍSTICA. Herbert George Wells, historiador y escritor inglés, comentó hace un siglo que �El pensamiento estadístico será un día tan necesario para el ciudadano eficiente como la capacidad de leer y escribir�. En la actualidad y después de reflexionar acerca de los resultados de la revolución industrial y de los desafíos que representa la competitividad y la globalización a las organizaciones, se diría que el pensamiento estadístico es necesario tanto para ser un buen ciudadano como para tomar decisiones acertadas en cualquier ámbito organizacional. Las aplicaciones estadísticas son necesarias en cualquier actividad que pueda desarrollar una persona, es más, la experiencia docente del autor permite concluir que el pensamiento estadístico es primordial en el desempeño profesional de los ingenieros industriales, considerando que la toma de decisiones es su actividad principal. De hecho, el conocimiento cabal de la estadística y la probabilidad es un poderoso auxilio para que los ingenieros diseñen nuevos productos y sistemas, optimicen los existentes y para que evalúen, desarrollen y mejoren los procesos de producción. La estadística ha elaborado ciertas técnicas ajustadas a las peculiaridades de los distintos campos de aplicación. En el ámbito de las ciencias sociales (administración, economía, educación, sociología, etc.) se han desarrollado, entre otros, los números índice (p.e. índice de precios al consumidor1 (IPC), índice Dow Jones2, etc.), las series de tiempo (son una colección de datos medidos cronológicamente a lo largo de intervalos uniformes, por ejemplo: el precio por barril de petróleo exportado durante cada uno de los doce meses del año 2003, el número total de alumnos inscritos en la UNEXPO por semestre desde el año 2000 hasta la fecha, etc.), las técnicas de análisis factorial. Las técnicas estadísticas para el diseño de experimentos son muy empleadas en las ciencias físicas como biología. En ingeniería, las aplicaciones de las técnicas estadísticas abarcan un rango de mayor amplitud que incluye, entre otras: el diseño de experimentos para situaciones reales, el análisis de riesgo enfocado en la gerencia y control de proyectos, la teoría de colas para evaluar y mejorar la prestación de servicios, la programación dinámica estocástica y las cadenas de Markov para estudiar la evolución de los sistemas en el tiempo, etc. 1 Es un indicador utilizado para conocer el impacto inflacionario midiendo la variación de los precios a los cuales un consumidor adquiere cantidades determinadas de un grupo de productos seleccionados entre los extremos de un intervalo de tiempo de interés; habitualmente, la extensión del intervalo puede ser mensual, trimestral, semestral o anual. 2 Este indicador pondera los valores de las cotizaciones en la Bolsa de Valores de Wall Street para un grupo de acciones seleccionadas y se emplea para definir tendencias sobre el estado de la economía, al comparar los valores extremos del índice en un intervalo dado de estudio, frecuentemente de un día de duración. Conceptos Básicos sobre Estadística Raquel Centeno Silva 11 Particularmente, dentro del campo de la ingeniería industrial destaca, sobre otros usos, las técnicas estadísticas de control de calidad tales como: la estimación de índices de capacidad de procesos y los gráficos de control, ya que la calidad, entre otros atributos, impacta profundamente la productividad, la competitividad y por ende la rentabilidad del negocio. Un proceso que mantiene un estándar elevado de calidad es inversamente proporcional tanto al volumen de materia prima desperdiciada como a la cantidad de horas hombre empleadas en detener y poner nuevamente a punto las líneas de producción; además los productos de calidad generan muchos más clientes satisfechos y por lo tanto, leales. El impacto de las bondades del control de calidad, en la manufactura de cualquier producto o servicio, han generado un incremento en el interés que la industria ha puesto en la estadística, perneando su influencia a todas las áreas de conocimiento que coexisten en la empresa, sean ellas ingeniería, investigación y desarrollo de nuevos procesos y productos, mercadeo o gerencia. El impacto más significativo de la estadística, como una herramienta objetiva para la gerencia científica, es el resultado de la conexión entre el análisis de datos cuantitativos y los problemas de toma de decisiones. Las técnicas de la estadística descriptiva resumen la información disponible para la toma de decisiones, por ejemplo, el ingeniero supervisor de una línea de producción puede revisar los registros diarios de productos defectuosos y encontrar que ayer fue de un 3% mientras que hoy alcanzó 5%, sin embargo, la teoría estadística va más allá y es necesaria para conocer si el incremento en la proporción de ítems defectuosos es una señal de deterioro en el proceso productivo o es simplemente el resultado de la variabilidad normal en el día a día de las operaciones. Está claro que las decisiones que se tomarán serán distintas al responder esa fundamentalísima interrogante; en el primer caso se implementarán acciones remediales urgentes, mientras que en el segundo no se actuará al nivel de influencia del supervisor, puesto que una inconformidad con resultados estadísticamente normales implicaría acciones de mayor envergadura, tales como, una inversión en adiestramiento de los operarios, un rediseño de la línea, etc. El aspecto más relevante de una situación como la descritaestá en la necesidad de tomar una decisión en un entorno de incertidumbre, caracterizado por la variabilidad de las características analizadas y por la disponibilidad de información incompleta. Los métodos estadísticos permiten, no sólo tomar decisiones racionales y eficientes en dichas circunstancias, sino además, fijar en un nivel preestablecido los riesgos de tomar decisiones incorrectas al confiar en información incompleta. La piedra angular sobre la que se cimientan la mayor parte de los conocimientos requeridos en las diversas aplicaciones enunciadas es la comprensión de la variabilidad y para comprender esta Conceptos Básicos sobre Estadística Raquel Centeno Silva 12 manifestación se requiere un sólido pensamiento estadístico y un manejo adecuado de los métodos estadísticos para la descripción del fenómeno; por ello y dado que, cada momento en la naturaleza o en una organización es único e imperan diferentes condiciones, todo colectivo que existe en la vida real muestra variabilidad y demanda de los ciudadanos para acostumbrarse a manejar el pensamiento estadístico y darle a los sucesos cotidianos la importancia de su magnitud relativa; ésto es tan relevante que regularmente aparecen en prensa y otros medios de comunicación, en artículos contenidos en revistas de difusión científica y en conversaciones profesionales y académicas, estudios estadísticos para cuya lectura crítica la mayoría de los ciudadanos no están capacitados, es más Utts (2003) afirma: �He encontrado siete tópicos incluidos en cualquier curso elemental de estadística que son comúnmente mal entendidos por los ciudadanos, incluyendo los articulistas que presentan estudios estadísticos al público. De hecho investigadores que presentan sus resultados en revistas arbitradas y reuniones científicas interpretan mal varios de ellos� La teoría general de la estadística es aplicable a cualquier campo científico en el cual se realicen observaciones, de hecho Deseda (1988) afirma: �No existen ciencias cuyos fenómenos no pueden ser estudiados estadísticamente�. Esta razón es la que provoca que la estadística esté incorporada en diversidad de planes de estudio tanto a nivel de pregrado como de postgrado y, cabe preguntarse: ¿en que difieren los cursos de esta asignatura cuando se dictan para ingenieros, administradores, psicólogos, o educadores?, la respuesta es trivial e inmediata, los contenidos que se imparten son, esencialmente, los mismos; no obstante como los intereses de los profesionales formados en cada área son disímiles, las aplicaciones y por lo tanto los ejemplos y ejercicios deben constituir la única diferencia. Una definición que subraya la utilidad de la estadística fue propuesta por Cobb y Moore (1997): �La estadística es una disciplina metodológica; existe no por sí misma sino para ofrecerle a otros campos del saber un conjunto coherente de ideas y herramientas para tratar con datos�. Las primeras aplicaciones de la estadística fueron los asuntos de gobierno (recabar y presentar información); luego las utilizaron las compañías de seguros y los empresarios de juegos de azar (análisis de riesgos y probabilidad); después siguieron los comerciantes y los industriales (toma de decisiones), los educadores y científicos sociales (formulación de hipótesis). En la actualidad resulta difícil indicar profesiones que no empleen la estadística, en parte, porque la asertividad de las decisiones que se toman está estrechamente entrelazada con la información disponible y gran parte de ella existe en forma numérica; por ello es fundamental disponer de métodos y Conceptos Básicos sobre Estadística Raquel Centeno Silva 13 herramientas que permitan procesar dicha información para sacar conclusiones válidas dentro de un determinado nivel de certidumbre. La estadística surge en parte de la interacción entre la matemática y las necesidades de análisis de datos en diversas ciencias aplicadas; sin embargo se ha sugerido que la estadística no es una rama de la matemática sino una disciplina independiente, con su propio y único origen, interrogantes y contenido [Bessant & MacPherson, 2002]. Tanto el término como la disciplina de la estadística comparten un largo y enigmático pasado, a pesar de que existen diversos autores interesados en la historia de la estadística [Hald, 1990], [Pearson, 1978] y [Stigler, 1986]; no se ha logrado consenso acerca de su origen preciso; muchos mencionan las antiguas encuestas conducidas con propósitos fiscales o militares. Se sabe que, por ejemplo, los censos3 quinquenales de personas y propiedades en la República Romana se señalan como precursores de la estadística descriptiva. Más aún, se sabe que 2000 a 2500 años antes de Cristo, los chinos y los egipcios efectuaron censos que eran simples inventarios elementales. Etimológicamente, se ha descubierto que la palabra estadística presenta una raíz italiana, cuyo significado era el ensamblaje de información y hechos de interés para el estadista (statista) o pertenecientes al Estado (stato). Paralelamente, Portus, (1998) considera fundador de la estadística a Godofredo Achenwall (1719-1772), economista alemán y profesor en la Universidad de Leipzig, quién escribió sobre el descubrimiento de una nueva ciencia que llamó estadística (palabra derivada de Staat que significa gobierno) y que definió como �el conocimiento profundo de la situación respectiva y comparativa de cada estado�. El y sus seguidores estructuraron los métodos estadísticos que se orientaron a investigar, medir y comparar las riquezas de las naciones. Una definición en concordancia con esta idea es la siguiente: �Estadística en su acepción más común, no es más que una colección de datos numéricos ordenados y clasificados según un determinado criterio� [Lobez & Casa, 1969]. Llegado a este punto resulta interesante acotar que también existió durante el siglo XVII una rama del conocimiento llamada Statistik, que concernía con los temas del estado y la historia constitucional, una especie de híbrido no numérico del oficio del estadista, que naturalmente no desembocó en la acepción común del término. Uno de los argumentos que se opone a considerar estas ideas pioneras como génesis de la disciplina, se centra en que comenzar la historia de la estadística haciendo referencia a los esfuerzos del mundo antiguo para registrar la información acerca de los Estados, es fallar en la comprensión tanto de la base del enfoque estadístico como de la naturaleza de su método. De 3 Del latín censare, que significa valuar o tasar. Conceptos Básicos sobre Estadística Raquel Centeno Silva 14 hecho, los métodos estadísticos fueron ampliamente utilizados en astronomía desde 1830; sin embargo, aplicaciones similares no se hicieron un lugar común en las ciencias sociales hasta el siglo X, a pesar de que se le acredita a Quetelet (1796-1874) varias contribuciones al desarrollo de la matemática de las ciencias sociales durante el siglo XIX; de ellas, el aspecto central de la física social de Quetelet fue su noción del hombre promedio (L�homme moyen) que fungió como invención metodológica para suavizar las variaciones aleatorias y revelar regularidades que podrían ser usadas como bases para un estudio social comparativo, más vinculadas a este enfoque están las definiciones propuestas por Haber & Runyon, (1972) �La estadística puede ser considerada como un método para tratar datos numéricos � es un instrumento que se orienta a la recolección, organización y análisis de datos numéricos o de observaciones� y por Yule & Kendall, (1954) �La estadística es la ciencia que trata de la recolección, clasificación y presentación de los hechos sujetos a una apreciación numérica como base a la explicación, descripción y comparación de los fenómenos�. El análisis descriptivo de las tasas de mortalidad ylas causas de muerte, realizado por Graunt, en el Londres del siglo XVII, publicado en 1662, está considerado como uno de los primeros ejemplos de lo que se denominó Aritmética Política y que en la actualidad se llama estadística, definida por Pearson como: �la aplicación de la teoría matemática a la interpretación de las observaciones masificadas�. El cambio de enfoque, desde la mera enumeración de hechos al razonamiento acerca de lo que los datos representan, son los albores de la estadística inferencial, de hecho Cowles sugiere una definición funcional: �Ir más allá de los datos, realizar inferencias y esbozar conclusiones con un mayor o menor grado de certeza, en una forma ordenada y consistente es el objetivo de la estadística moderna aplicada�; fundamentalmente de acuerdo con esta aproximación están las siguientes definiciones: �Consideraremos la estadística como un conjunto de métodos y técnicas aplicables a realidades cuantificables, con el objeto de obtener indicadores que permitan diagnosticar dichas realidades� [Deseda, 1988], �Estadística es el sistema que estudia los métodos científicos para recopilar datos, analizarlos, agruparlos y presentarlos en cuadros o gráficos para su interpretación� [Portus, 1998] y �Estadística es la ciencia de aprender a partir de los datos� [Kettering, 2000]. Existen autores que no logran consenso en un concepto único y prefieren emplear una colección de acepciones; por ejemplo Leach, (1979) plantea: �Generalmente se considera que la estadística tiene dos funciones. Una es describir conjuntos de datos; la otra es ayudar a hacer inferencias.� Los párrafos anteriores revelan dos significados distintos para el término estadística, el primero de ellos concerniente a la colección de información numérica y no numérica acerca del Estado, Conceptos Básicos sobre Estadística Raquel Centeno Silva 15 mientras que en un sentido más moderno el término incluye tanto aspectos descriptivos como deductivos en el tratamiento de datos, pero con un énfasis en las conjeturas en oposición del amontonamiento de datos. También resulta evidente que el desarrollo y la aparición de los métodos estadísticos están soportados en el trabajo de matemáticos pioneros en la combinación de observaciones y el uso de modelos probabilísticos en la inferencia, tal como se manifiesta en la definición propuesta por Canavos, (1987): �La estadística es el estudio de los fenómenos aleatorios�; sin embargo, la estadística se distingue de la matemática en que los estadísticos interpretan los números en un determinado contexto. Tal vez lo más interesante que se constata al revisar la contribución filosófica de los distintos autores y el devenir histórico de la estadística es que la difusión del pensamiento estadístico y sus técnicas a diversos campos evidencia las múltiples influencias interdisciplinarias que le han dado forma al carácter único de esta disciplina. Quizás el aprendizaje más reiterado en esta reseña histórica fue apuntado por Moore, (2000) al señalar que a pesar de que la disciplina ha evolucionado en forma y funciones, persisten dos características clave: datos e inferencia. No obstante, es extremadamente importante señalar que la inferencia por si sola es una función inocua, al menos en el contexto actual, porque no se infiere por conjeturar sino para tomar decisiones, para actuar. Más cónsonas con este énfasis están las definiciones de Spiegel, (1991): �La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis.�, Montgomery & Runger, (1996): �El campo de la estadística tiene que ver con la recopilación, presentación, análisis y uso de datos para tomar decisiones y resolver problemas.� y Lind, et. al., (2001): �La ciencia de reunir, organizar, presentar, analizar e interpretar datos para ayudar a tomar mejores decisiones� Leída la información precedente, se puede enunciar la siguiente definición de estadística que estará vigente a lo largo de lo expuesto en este texto: Estadística es el estudio de los diversos métodos y técnicas para la recolección, organización y presentación de datos y su aplicación para la cabal interpretación de ellos convirtiéndolos en información, con la cual se realizan inferencias y se extraen conclusiones cuyo nivel de certidumbre puede conocerse lo cual permite tomar mejores decisiones. A menos que los datos cuantitativos sean precisos, presentados apropiadamente, y correctamente analizados, la información numérica puede ser peligrosamente engañosa; es por esta razón que la estadística como una metodología concerniente a la recolección, presentación y el análisis de datos numéricos es tan importante. Conceptos Básicos sobre Estadística Raquel Centeno Silva 16 El cálculo de medidas descriptivas que resuman grandes cantidades de datos estadísticos es un paso importante en la toma de decisiones basada en dichos datos; pero para que esas medidas estadísticas sean útiles a la gerencia deben ser analizadas de forma que se comprenda completamente su significado para un problema particular. Una vez propuesta una definición de estadística que compila la naturaleza distintiva de sus orígenes y los vínculos e influencias en otros campos del saber, en fin su identidad, significado y propósito, es una exigencia resumir las razones por las que es importante estudiar estadística, ellas son: a) abundan los datos en todas partes, b) las técnicas estadísticas son usadas por otros para tomar muchas decisiones que afectan nuestra vida y c) sea cual sea su futura línea de trabajo tomará decisiones que estarán basadas en datos y serán mejores si domina el pensamiento estadístico. En síntesis, cada vez más la estadística viene a ser una herramienta insuperable e insuplantable en el manejo de la información, como consecuencia de que los sucesos que ocurren de manera común o extraordinaria vienen descritos por un mayor número de elementos o componentes, y esta expansión de datos está cada día más extendida en virtud de la proliferación de elementos electrónicos de almacenamiento masivo de información. Podría ser útil tratar de representar lo aprendido hasta aquí en una figura: FIGURA N° 1 MAPA CONCEPTUAL DE LA ESTADÍSTICA Conceptos Básicos sobre Estadística Raquel Centeno Silva 17 b) CLASIFICACIÓN DE LA ESTADÍSTICA Hemos descubierto a través de la lectura de la sección precedente que los dos objetivos fundamentales de la estadística son la descripción de datos y la producción de inferencias a partir ellos; ello conduce a una categorización de la estadística en: estadística descriptiva o deductiva y estadística inferencial o inductiva. i).- Estadística Descriptiva La estadística descriptiva es el conjunto de métodos cuantitativos para organizar, resumir y presentar datos de manera informativa para obtener conclusiones sobre los mismos, sin que sobrepasen los conocimientos que proporcionan esos datos, es decir las conclusiones obtenidas a partir de las observaciones recopiladas no trascienden sobre un conjunto mayor de datos. Tiene por objeto fundamental describir y analizar las características del conjunto de datos para derivar explicaciones acerca de las peculiaridades de dicho conjunto y sobre las relaciones existentes con otros grupos de datos. Los procedimientos que se emplean permiten visualizar los datos, es decir, cuanto difieren los valores de los datos que conforman el conjunto observado, empleando algunas representaciones gráficas que ilustran los datos o bien se emplean cuadros o tablas que permiten que el conjunto de datos se convierta en información legible. Así mismo, se provee de medios que resuman las características más importantes de los datos. La principal ventaja de la estadística descriptiva es que al disponer de todos los datosobjeto de análisis no existe incertidumbre respecto a las determinaciones establecidas. ii).- Estadística Inferencial La inferencia estadística es el conjunto de técnicas que se utilizan para establecer un juicio sobre todo un colectivo mediante un metódico procesamiento de un subconjunto de los datos contenidos en él. Las conclusiones que se obtienen sobrepasan los límites de los conocimientos aportados por los datos en sí mismos, debido a que no se examina al grupo entero, las inferencias no son del todo exactas y debe determinarse las condiciones bajo las cuales la generalización es válida, precisando la probabilidad de que la inferencia sea correcta y esa incertidumbre, asociada a las conclusiones obtenidas, se mide empleando técnicas estadísticas. En virtud de que al realizar estadística inferencial se extrapola desde lo particular hacia lo general, el procedimiento que se sigue es inductivo y de allí el otro nombre que comúnmente recibe. La mayor parte de las interrogantes que requieren análisis inferencial están enfocadas en los siguientes propósitos: examinar las relaciones entre variables, determinar diferencias entre distintos grupos, predecir la Conceptos Básicos sobre Estadística Raquel Centeno Silva 18 membresía a un grupo dado, probar modelos, predecir resultados y examinar cambios a lo largo del tiempo. La estadística inferencial y la descriptiva están estrechamente vinculadas y esta relación se podría observar en el siguiente diagrama: FIGURA N° 2 MODELO BÁSICO PARA LA ESTADÍSTICA INFERENCIAL Adaptado de Dietrich & Schulze, 1999 Los métodos de la estadística inductiva son necesarios cuando no se pueden reproducir los resultados con la frecuencia o con el grado de precisión que se desea a causa de influencias c) TÉRMINOS COMUNES EMPLEADOS EN ESTADÍSTICA Toda disciplina tiene su propia identidad y esa identidad se conforma a partir del lenguaje que se emplea y el significado que se adopta para ciertos términos que se utilizan comúnmente. Al comenzar a estudiar cualquier campo del saber es menester conocer el vocabulario especializado; en nuestro caso precisaremos las siguientes expresiones: i).- Universo Es el conjunto total de elementos recolectados que atrae nuestro interés, bien sean ellos personas u otros organismos vivientes, objetos inanimados, hechos, situaciones o abstracciones tales como el tiempo y el espacio. ii).- Población Es el conjunto de todos los elementos que pertenecen al universo en consideración y que presentan una característica común susceptible de ser estudiada. Nótese que de un determinado universo pueden obtenerse tantas poblaciones como características compartan y puedan ser observadas, contadas o medidas. Esta distinción entre universo y población corresponde a una Conceptos Básicos sobre Estadística Raquel Centeno Silva 19 interpretación muy estricta y es un uso más generalizado en la bibliografía emplear una interpretación más amplia, donde se consideran ambos términos como uno solo. El conjunto de elementos que conforman la población puede resultar finito si el investigador puede someter a medida cada uno de ellos; en cambio si el tamaño de la población, entendido como el número de elementos que abarca, es tal que con los medios de los que dispone el observador le es imposible valorar cada uno de ellos, considerando que la población bajo estudio es infinita. Cuando se trabaja con datos poblacionales los resultados obtenidos del proceso de análisis se denominan parámetros y poseen la condición de ser únicos e invariables. Universo de Vehículos Volskwagen Escarabajo R A N R A R 982 983 982 980 977 975 N A N A A N 986 984 983 974 979 977 A R R R N A 984 978 979 988 989 973 Población: �Color del VW� Población: �Peso del VW� 108932 111345 73514 212498 100801 67854 214566 99854 44599 143567 94321 301901 67954 209888 111387 177233 39990 192100 Población: �Número de Kilómetros Recorridos por el VW� FIGURA N° 3 POBLACIONES A PARTIR DE UN UNIVERSO Apoyándonos en la figura se intentará ilustrar los conceptos de universo y población. A través de la caracterización de los miembros de un universo se pueden obtener tantas poblaciones como características distintas se deseen describir; tal como se ha mencionado previamente, en el ejemplo se han seleccionado tres variables de un universo finito: una cualitativa, observando el color de cada elemento del universo se distingue una población finita denominada �Color del Volkswagen�. Otra variable cuantitativa discreta permite contar el número de kilómetros Conceptos Básicos sobre Estadística Raquel Centeno Silva 20 recorridos por cada uno de los Volkswagen que integran el universo y obtener una segunda población finita. Por último, la medición de una variable cuantitativa continua permite determinar otra población llamada �Peso de los Vehículos Volkswagen�. iii).- Muestra Según lo explicado en el inciso anterior, cuando el tamaño del universo o de la población lo amerita el investigador debe conformarse con estudiar una parte o porción de ellos que sirve para representarla. Este subconjunto de elementos definidos sobre la base del universo específico o de la población determinada se denomina muestra. Es importante destacar, que la manipulación de datos muestrales arroja resultados que se denominan estadísticos. Dado que la reproducción de un dato individual casi nunca puede lograrse los estadísticos necesariamente variarán conforme cambien los datos que se seleccionan para la muestra. Esto significa que el valor real tiene cierta probabilidad de ser ligeramente menor o mayor al que estima un estadístico. Este rango debe reportarse junto con la evaluación de cualquier valor estadístico y se denomina intervalo de confianza. FIGURA N° 4 SELECCIÓN DE UNA MUESTRA A PARTIR DE UN UNIVERSO De seguido su representación en términos de población y muestra: Rojo Amarillo Naranja Rojo Amarillo Naranja Amarillo Naranja Amarillo Amarillo Rojo Amarillo Rojo Naranja Amarillo Amarillo Rojo Rojo Rojo Naranja Población �Color de los Vehículos VW� Muestra �Color de los Vehículos VW� FIGURA N° 5 SELECCIÓN DE UNA MUESTRA A PARTIR DE UNA POBLACIÓN Conceptos Básicos sobre Estadística Raquel Centeno Silva 21 En las figuras anteriores se aprecian dos tipos de muestra, una de ellas referida a los elementos que conforman el universo, y la otra tomada a partir de los datos estadísticos de los colores que conforman el conjunto poblacional seleccionado particularmente para este caso. En ambas circunstancias, se han seleccionado 5 elementos de un total de 15 unidades estadísticas, cuya manipulación permitirá extrapolar conclusiones acerca del universo � población si la muestra en cuestión es representativa. Para que la muestra sea representativa y, consecuentemente, las conclusiones que se establezcan sean válidas, deben tomarse ciertas precauciones que van más allá del espectro de este trabajo, la más importante es asegurar que cada elemento del universo- población a estudiar tenga la misma probabilidad de ser incluido en la muestra. No obstante las precauciones que se tomen las afirmaciones hechas a partir de datos muestrales siempre tendrán un grado de incertidumbre asociado a ellas. Si dos muestras son representativas, las conclusiones generadas a partir de la mayor de ellas son más coincidentes con la realidad que las desprendidas de la otra muestra. En conocimiento de que se comete un error al extrapolar conclusiones a partir de una muestra, cabría preguntarse ¿Por qué tomarla si se puede haber caracterizado a todos los elementos? La respuesta a la interrogante planteada se puede despejar si reflexionamos sobre dos aspectos que no emergen al observar la figura: a) ¿qué sucede si el universo � población de interés no tuviera 15 unidades estadísticas sino 125.000?, y b) si lavariable de interés fuese, por ejemplo, la resistencia del chasis al esfuerzo mecánico ¿sería razonable deformar todos los vehículos para concluir acerca del universo � población? ¿Qué utilidad tendría la información recabada? Ambos planteamientos ilustran las razones fundamentales para realizar muestreo; en ciertos casos el tamaño del universo � población es tal que no resulta factible la inversión de recursos y tiempo para observarlos a plenitud y en otros casos los ensayos forzosamente destruyen al elemento lo cual no permitiría su uso o venta posterior. Ninguna de las dos situaciones es razonable en el ámbito empresarial, por ello, es preferible que las conclusiones a las que se lleguen contengan un grado de incertidumbre conveniente que haya sido definido a priori. iv).- Variables y su Clasificación Es intuitivo asumir que dentro de un colectivo las características particulares que pueden someterse al análisis y que son compartidas por los elementos de una muestra, población o universo, no se presentan con la misma intensidad ni forma en cada uno de ellos y por ende se les puede asignar distintos valores, razón por la cual dichas características se denominan variables. Para el estudio de las variables, es necesario distinguir entre los valores posibles y los valores Conceptos Básicos sobre Estadística Raquel Centeno Silva 22 observados, entendidos los primeros como todos los que teóricamente puede exhibir una unidad estadística y los segundos como aquellos obtenidos a través de la observación, conteo o medición del colectivo con el que se esté experimentando. Si el experimento en cuestión consiste en registrar el número que aparece cuando se lanza un dado al aire diez veces, los valores observados pueden ser: 3 veces uno, una vez dos, dos veces cuatro y cuatro veces cinco; no obstante, los valores posibles para esta experiencia son los seis representados en cada una de las caras del dado. Si los datos se obtienen estudiando una característica que puede ser expresada mediante datos numéricos por medición o conteo constituyen variables cuantitativas; ejemplos de este tipo de variables lo forman el número de personas esperando a ser atendidas en una taquilla, el tiempo que tarda en ajustarse una maquinaria para comenzar a elaborar puertas de Astra después de haber fabricado guardafangos de TrailBlazer, el saldo disponible en la cuenta corriente de una empresa o la vida útil de una lámpara fluorescente. Las variables cuantitativas se subdividen en variables discretas y variables continuas. Son variables discretas las que sólo toman un determinado número de valores correspondientes a números enteros, tales como el valor que se obtiene al lanzar un dado, el número de obreros requeridos para operar una línea de producción a su máximo nivel, el número de alumnos inscritos en Inferencia Estadística I el semestre anterior o el número de tanqueros cargados en Azuay los días lunes. Las mediciones obtenidas de una variable continua pueden, en principio, tomar cualquier valor teóricamente posible entre dos valores dados; ésto significa que los números en que se transforman los datos continuos pueden ser enteros o no; ejemplos de variables continuas puede ser: el diámetro interno de las tuberías de acero comercial catálogo 40 de 1½� producidas en el turno nocturno en Sidetur, la presión de operación de la unidad de desulfonación de la Refinería de Guaraguao, el tiempo de conexión a Internet para descargar un video, el peso de los clavos contenidos en un paquete, etc. Una propiedad importante de los datos continuos es que no es posible obtener dos valores exactamente iguales; si dos de los clavos que se pesaron exhibieran una masa de 4,5 g sería una señal de que el aparato de medición no es lo suficientemente sensible; con una balanza más sofisticada4 debe ser posible diferenciar entre los dos pesos. En el caso de los datos discretos es factible observar empates que no sean el resultado de un conteo deficiente, sino que significa valores exactamente iguales, por ejemplo el número de inscritos en las secciones uno y dos de la 4 Con una balanza analítica como la del laboratorio de química cuya precisión como recordarán es de hasta diezmilésimas de gramo uno de los clavos podría pesar 4,4968 g y el otro 4,5251 g, valores para los cuales el instrumento usado en primera instancia registraría 4,5 g. Conceptos Básicos sobre Estadística Raquel Centeno Silva 23 asignatura estadística y probabilidades en un semestre cualquiera puede ser, en ambos casos, 38 alumnos. Es interesante destacar nuevamente que a pesar de que las limitaciones de precisión en los instrumentos de medición usados por el hombre interrumpen los valores posibles de la variable continua; sin embargo ello no las hace discretas, en todos los casos lo que define a las variables continuas no es el número que se observa, sino la escala teórica subyacente. La distinción no es meramente filosófica porque los métodos de procesamiento e interpretación de los datos están vinculados al tipo de variable bajo estudio, tal como se aclarará más adelante. En general, dos son las formas de reunir datos acerca de las variables: las enumeraciones o recuentos que dan lugar a datos discretos y las mediciones a datos continuos. La exactitud en las medidas depende de las limitaciones propias del instrumento � particularmente su apreciación � y de la pericia de quien lo emplea. La magnitud de un valor medido, cualquiera que este sea, se encuentra en algún valor del rango centrado en la medida con radio igual a la apreciación del instrumento. Aclarado el punto, es conveniente recordar que los valores de las observaciones de variables discretas están perfectamente definidos porque ninguna forma de contar dará un valor diferente, mientras que para las variables continuas se pueden realizar sucesivos afinamientos de los valores medidos aumentando la resolución en la escala del instrumento de medición. Todas las características que definen a los elementos de una población o una muestra no se ajustan a la descripción de las variables cuantitativas, en particular si estas características son no numéricas, de forma tal que cada elemento bajo análisis sólo pueda configurarse como poseedor o no de dicha característica; se está en presencia de lo que se designa como variable cualitativa o atributo. Cuando se estudian datos representados mediante variables cualitativas suele ser objeto de atención cuantos de ellos o en que proporción caen en cada categoría. Ejemplos de variables cualitativas pueden ser sexo, estado civil, ausencia de defectos en los productos de una línea de montaje, modelos de vehículos que se ensamblan en una fábrica, y el tipo de preguntas que se tratan de responder son: ¿Cuántos hombres estudian ingeniería industrial en el Vicerrectorado �Luis Caballero Mejías� de la UNEXPO?, ¿Qué proporción de docentes solteros dictan asignaturas del área de matemáticas?, ¿Cuál es el porcentaje de botellas sin etiqueta que se despacharon desde la Planta de Polar en San Joaquín el mes pasado?, ¿Cuántos Chevrolet Corsa Conceptos Básicos sobre Estadística Raquel Centeno Silva 24 fueron comercializados en el Programa del Vehículo Familiar el año 2002?, etc. Se resume la clasificación de las variables mediante el siguiente esquema: FIGURA N° 6 TIPOLOGÍA DE LAS VARIABLES EN ESTADÍSTICA Cada una de las formas de descripción de las variables cualitativas y cada uno de los valores de medición o enumeración de las variables cuantitativas, se conocen en estadística con el nombre de variantes, categorías o clases, siendo este último el más popular de los tres sinónimos. v).- Unidad Estadística Es el sujeto en particular sobre el cual se está observando, contando o midiendo la variable, es decir cada uno de los elementos contenidos en la muestrao en el universo � población objeto de análisis. Se desarrollarán algunos casos a manera de ejemplos clarificadores de los términos definidos hasta ahora: EJEM PL O : De las 24.000 botellas de Seven Up que salen, durante el turno de la mañana, del proceso de lavado en la Embotelladora de Pespsi Cola ubicada en Caucagua se realiza un estudio tomando 240 botellas al azar, encontrándose que existe un defecto (astillas) en 5 de ellas, dos defectos (astillas y sucio externo) en 3 de ellas y en el resto no se perciben defectos. Identifique: a) población, b) muestra, c) variable indicando su tipo, d) valores posibles, y e) unidad estadística. RESO LUC IÓ N : a) Las 24.000 botellas de Seven Up. b) Las 240 botellas seleccionadas aleatoriamente. c) Numero de defectos (variable cuantitativa discreta). d) Tiene tres valores posibles: cero defectos, un defecto y dos defectos. Conceptos Básicos sobre Estadística Raquel Centeno Silva 25 e) La botella de Seven Up. EJEM PL O : La fábrica de Kraft Foods en Barquisimeto está sometiendo a un control de calidad riguroso el peso de los empaques de galletas Oreo de 4 servicios; para ello se selecciona la producción de un día y se le somete al proceso de control. Identifique: a) población, b) muestra, c) variable indicando su tipo y d) unidad estadística. RESO LUC IÓ N : a) La producción de galletas Oreo en empaques de 4 servicios. b) La producción de 1 día de galletas Oreo en empaques de 4 servicios. c) El peso (variable cuantitativa continua). d) El paquete de de 4 servicios. EJEM PL O : El Ministerio de Producción y Comercio desea presentar un informe acerca de la calidad de los modelos beneficiados con el Programa del Vehículo Familiar (Accent, Brisa, Corsa, Energy, Fiesta y Terios); para ello entrevista a un grupo de cincuenta y cinco compradores del 2002 que fueron atendidos por garantía para saber cuál modelo poseían. Las respuestas se discriminaron en los siguientes modelos: Chevrolet Corsa (26 propietarios), Ford Fiesta (11 propietarios), Chrysler Brisa (4 propietarios) y Toyota Terios (14 propietarios). Identifique: a) población, b) muestra, c) variable indicando su tipo, d) valores posibles, e) valores observados y f) unidad estadística. RESO LUC IÓ N : a) Los propietarios de vehículos del Programa Familiar comprados en el 2002. b) Los 55 propietarios entrevistados. c) Modelo de vehículo (variable cualitativa) d) Cada uno de los seis modelos beneficiados por el Programa de Vehículo Familiar en el 2002: Accent, Brisa, Corsa, Energy, Fiesta y Terios. e) Los cuatro de los que se obtuvieron respuestas: Brisa, Corsa, Fiesta y Terios. f) El propietario de un vehículo beneficiado con el Programa Familiar. d) MEDIDAS Y MEDICIONES La observación de valores o características se desarrolla a través de un proceso de medición. Se entiende por medición la acción de asignar números a ciertos elementos para cuantificar una propiedad; esta operación implica comparar las variables con escalas de valores establecidas. Dicho número debe simultáneamente representar la magnitud o intensidad de la característica que se desea medir, así como ser susceptible de análisis mediante su manipulación en concordancia Conceptos Básicos sobre Estadística Raquel Centeno Silva 26 con ciertas reglas. La relación que se establece entre las observaciones y los números asignados no siempre es evidente, por lo cual es preciso establecer el alcance o significación de dicha asignación antes de proceder al análisis de los mismos por medio de manipulaciones u operaciones algebraicas, con la finalidad de obtener nueva información acerca del objeto que se está estudiando. La reflexión acerca del alcance de la asignación numérica provoca que se distinga entre cuatro niveles de medición, los cuales se diferencian entre sí por la forma en que se adecuan a las propiedades de los números y, por tanto, se diferencian en las operaciones que se puedan hacer con los números asignados. Matemáticamente hablando, los números pueden clasificarse, de acuerdo a su uso, en: cardinales, ordinales y nominales. Un conjunto de números que carecen de propiedades aritméticas se conocen como números nominales y su misión es identificar algo mediante el símbolo numérico; ejemplos de este uso se encuentran en cualquier código de clasificación numérica, entre otros: las cédulas de identidad, los valores expuestos en las caras de un dado, el número de camiseta de los atletas de un equipo deportivo. Por el papel que representan estos números no tiene sentido sumarlos, multiplicarlos e inclusive ordenarlos5. Sin embargo, se sabe que los números son un cuerpo algebraico que cumple con la propiedad de orden que se enuncia a continuación: DEF IN IC IÓ N : [Portus, 1998] Todo par de números a y b cumple con una y sólo una de las relaciones siguientes: a < b a = b a > b Un conjunto de números usados para abstraer la naturaleza de los objetos teniendo en cuenta exclusivamente el orden que ocupa, gracias a la propiedad que se definió previamente, se denominan números ordinales. Casos típicos, entre otros, resultan de señalar la posición que ocupó un piloto en cierto Gran Premio de Fórmula 1 o designar el orden de atención en una cola para el servicio de charcutería de un supermercado. Los números además del orden, pueden usarse para expresar cantidades, tales como: 20 centímetros, 20 grados centígrados, 20 5 Nótese que un jugador con el número 8 en un equipo de fútbol puede desempeñarse como defensa, medio campista o delantero; no es el más joven no el mayor de ellos; el mejor no tiene el número más bajo ni el más alto; el número representa un código para registrar la actuación individual (amonestaciones, goles, etc.). En el caso de la cédula de identidad, aún cuando los números pueden ser ordenados, no tiene ni siquiera relación con la edad de la persona, por que el correlativo asignado depende de la entidad federal de registro y no sucede al nacer, por lo que depende de la edad en que la persona fue identificada por primera vez. Conceptos Básicos sobre Estadística Raquel Centeno Silva 27 kilogramos, 20 segundos, etc., en cuyo caso se conocen como números cardinales y las variables representadas por ellos son apropiadas para aplicarle operaciones aritméticas. Los niveles o formas en que se puede medir o clasificar una variable dependen de la naturaleza de la variable de forma tal que el conjunto de números que sean asignados le sean representativos. Hay cuatro niveles de medición en estrecha relación con la clasificación del conjunto numérico utilizado, por lo tanto, estos niveles indican los cálculos que se pueden realizar para resumir y presentar los datos y las pruebas estadísticas que pueden llevarse a cabo. Dichos niveles, ordenados por el nivel de información que aportan de la observación, son: nominal, ordinal, de intervalo y de razón, tal como se ilustra en Figura N° 7 plasmada de seguido: FIGURA N° 7 NIVELES DE MEDICIÓN Para la medición o clasificación de variables cualitativas se utilizan escalas nominales, dado que como se ha discutido previamente en este capítulo, las observaciones de estos datos sólo pueden ser clasificadas o contadas y no existe un orden particular para las distintas clases. Pueden ser tan simples como cuando ofrecen sólo dos categorías o valores posibles, en cuyo caso, a las variables se les conoce como variables dicotómicas, el género es un ejemplo adecuado, si observamos a los estudiantes de ingeniería industrial de la UNEXPO-Caracas podemos discriminarlos según su Conceptos Básicos sobre Estadística Raquel Centeno Silva 28 género, contando cuantas son del sexo femenino y cuantos son del sexo masculino. Estas categorías son mutuamente excluyentes, lo que significa que un individuo no puede pertenecer a ambas simultáneamente; ademáslas categorías empleadas son colectivamente exhaustivas porque todo estudiante que conforme la población se puede clasificar en alguna de ellas. Los casos donde los valores posibles no están nítidamente identificados desde un comienzo se suelen tratar incluyendo una categoría denominada �otros�, por ejemplo si usted está interesado en construir un modelo para evaluar la necesidad de comprar un horno para pintar las piezas metálicas puede ser relevante determinar el número de días al año que el horno es útil; para ello una posibilidad es asignarle a la variable clima las categorías: i) soleado y seco, ii) soleado y húmedo y iii) otros climas, en virtud de que si llueve, existe una neblina fría o nieva son exactamente igual de perjudiciales para la pintura fuera del horno. Esta colección de categorías es colectivamente exhaustiva y mutuamente excluyente, dado que a cada uno de los días de operación puede asignársele una y sólo una de las categorías propuestas; todos los eventos que pertenecen a una categoría tienen una característica igual (el mismo tipo de clima) y el número de ellos que pertenecen a una misma categoría se llama frecuencia. Además, las categorías no pueden ser ordenadas lógicamente, es decir, es indistinto que la primera de ellas sea soleada y seca o soleada y húmeda. Con los datos medidos mediante escalas nominales se pueden realizar pocos indicadores estadísticos, tales como: determinar la frecuencia (contar el número de elementos en una categoría) con lo cual podemos calcular el porcentaje respecto al total de observaciones y establecer la categoría modal (estipular la categoría que presenta mayor frecuencia). Si una escala es susceptible de interpretarse en forma jerárquica, se convierte en una escala ordinal; una escala cuya medición se efectúa a nivel ordinal es una escala nominal para la cual existe la característica especial que se ordena por rango; algunas aplicaciones pueden ser: clasificar los trabajadores según el nivel de experticia en la preparación de una estampadora para cambiar entre la producción de una pieza y otra, que pueden agruparse en: alta, intermedia y baja; las respuestas a una pregunta de apreciación de opción múltiple: ¿Cómo considera Ud. que funciona el proceso de inscripción? (5) Excelente (4) Bien (3) Regular (2) Mal (1) Muy Mal Conceptos Básicos sobre Estadística Raquel Centeno Silva 29 En estos casos podemos concluir que una apreciación de cuatro puntos (bien) es mejor que una de dos puntos (mal); sin embargo, no podemos considerar que la opinión que se expresa como bien es dos veces mejor que la expresada con mal, a pesar de que un valor es el doble del otro. Nótese que el uso del nivel de medición ordinal exige orden entre las categorías antes de iniciar cualquier medición y, por el mismo hecho de poder ordenar todas sus categorías, permite sumariar los datos mediante el cálculo de las medidas estadísticas de posición. El siguiente nivel de medición es el nivel de intervalo; este nivel tiene todas las características del nivel ordinal, pero, además la diferencia entre dos valores cualesquiera es de longitud constante y utiliza como cero un valor arbitrario que no significa la ausencia de la característica. Quizás, el caso más representativo de este nivel de medición son las escalas habituales de temperatura. Un termómetro que marque 0ºC no representa la ausencia de energía sino que hace frío, además diferencias iguales entre dos temperaturas están representadas por diferencias iguales en los números asignados, sin importar la posición que ocupen en la escala. En este nivel de medición el orden de las observaciones se efectúa en concordancia con la cantidad de característica que posean; las variables que se miden en este tipo de escala son cuantitativas y pueden calculársele todas las medidas estadísticas a excepción del coeficiente de variación. El nivel de medición más alto es el nivel de razón, el cual tiene todas las características del nivel de intervalo, pero además, el valor cero significa ausencia de la característica y la relación entre dos números tiene sentido; por ello, las cantidades medidas con escalas de razón pueden compararse estableciendo proporcionalidades y el cociente entre dos datos que exhiban la misma intensidad en la característica es independiente de la unidad de medida. Cuando la variable en estudio se mide a nivel de razón es susceptible de analizarse con todos los indicadores estadísticos; este tipo de variables se encuentra generalmente en las ciencias físicas. Un buen ejemplo puede ser el peso de una persona; la balanza sólo arroja un valor de cero en ausencia de masa y además se cumple que; 5,2 libras 4093,4 libras 0232,11 kilogramos 2 kilogramos 5 En cambio, un nivel de medición de intervalos no mantiene las proporciones al cambiar de unidad de medida por ubicar el cero de manera arbitraria, por ejemplo: 2,7533 Fº 77 Fº 212 4 C º 25 Cº 100 EJEM PL O : Identifique en cada uno de los siguientes casos propuestos la variable y su tipo, y el nivel de medición que se está empleando: a) el código de barras de los nuevos productos Conceptos Básicos sobre Estadística Raquel Centeno Silva 30 ingresados al almacén de un supermercado, b) los rangos que detentan en el ejército 100 encuestados, c) el precio de venta, en �, de cada uno de los productos de una comercializadora, d) la distancia entre los ejes de 35 vehículos ensamblados por Mack de Venezuela, e) el peso de una muestra de 59 baldosas tipo �A� elaboradas por Balgres, f) las profesiones de los egresados de la UCV en el año 2002, g) la diferencia en el valor de la electronegatividad de Pauling de una muestra 7 no metales al compararlas con la del Carbono, h) el turno en que fueron manufacturadas 300 griferías de lujo en Fundición Pacífico, i) el número de defectos de las 50 piezas incluidas en una muestra de la producción de una suplidora de muebles modulares, j) la localización geográfica de las cooperativas textileras beneficiadas con el Programa de Uniformes Escolares para el año 2002, k) la temperatura, medida en Kelvin, a la que trabajaron los hornos de SIDOR en cada una de las últimas 72 horas, y l) el número de horas mensuales dedicadas a mantenimiento en la Refinería El Palito en el último semestre. RES PU EST AS : La mayoría de las respuestas son directas y se resumen a continuación en forma tabular. Los casos polémicos se comentan al final de la tabla de respuestas Variable Tipo de Variable Nivel de Medición a) El código de barras Cualitativa Nominal b) El rango en el ejército Cualitativa Ordinal c) El precio de venta en � Cuantitativa Continua De Razón d) La distancia entre ejes Cuantitativa Continua De Razón e) El peso Cuantitativa Continua De Razón f) Profesión Cualitativa Nominal g) La diferencia de electronegatividad Cuantitativa Continua De Intervalo h) El turno de manufactura Cualitativa Nominal i) El número de defectos Cuantitativa Discreta De Razón j) Localización geográfica Cualitativa Nominal k) La temperatura en Kelvin Cuantitativa Continua De Razón l) El número de horas Cuantitativa Discreta De Razón Entre los casos dignos de comentarios están el: b, f, g, k y l. Los rangos del ejército son una escala nominal pero demuestran una posición jerárquica, por lo tanto se establece un orden relativo a la autoridad de cada entrevistado. Las profesiones presentan un inconveniente interesante: al clasificar a los graduandos, algunos de ellos pueden exhibir más de una titulación, por ejemplo, ingeniero y abogado; esta particularidad puede llevar a pensar que los datos no pueden ser clasificados en categorías mutuamente excluyentes y, por ende, la variable profesiones no tendría asociado ningún nivel de medición por violar esta condición, que como se Conceptos Básicos sobre Estadística Raquel Centeno Silva 31 muestra en la FiguraN° 7 es común a todos las escalas de medición. Este inconveniente aparente es subsanado de forma inmediata cuando se entiende que un individuo que se haya graduado de abogado, ostentando previamente el título de ingeniero, lo que hace es conformar una nueva categoría y, por lo tanto, existiría un nivel de medición, con la peculiaridad de que no se sabe a priori el número de categorías; en virtud de que las combinaciones de dos o más profesiones elevaría sustancialmente el número de categorías, podría considerarse establecer una categoría tal como �múltiples profesiones�, con lo cual todos aquellos con por lo menos dos titulaciones se clasificarían en ella. La escala de electronegatividad de Pauling es en sí una escala arbitraria, es decir, el cero carece de significado; pero en particular el conocimiento de ésto no es necesario para establecer que el nivel de medición, en el caso ejemplificado, es de intervalo, en virtud de que en el enunciado se establece una comparación o diferencia con un elemento particular; en todos los casos en que ésto sucede un dato cuya diferencia sea de 0,8 unidades, por ejemplo, no representa necesariamente el doble de uno con diferencia de 0,4 unidades porque el elemento de comparación representa un valor que es cero al establecer la diferencia pero que no es ausencia de la propiedad. Para ilustrar lo que explicado previamente, coloquemos unos valores de electronegatividad según la escala de Pauling. El Carbono tiene una electronegatividad de 2,6; el Nitrógeno una de 3,0; y el Oxígeno un valor de 3,4; y los tres se ajustan a lo expresado en el enunciado, veamos: ENC = ENitrógeno - ECarbono = 3,0-2,6 = 0,4 (1) EOC = EOxígeno - ECarbono = 3,4-2,6 = 0,8 (2) 2 4,0 8,0 E E NC OC (3) 1,133' 0,3 4,3 E E N O (4) C O NC OC E E E E (5) La relación que se establece en (5) indica que esta escala no es de nivel de razón pues no conserva las proporciones; ésto sucedería también si consideramos, por ejemplo, la diferencias de alturas respecto a un patrón o las diferencias en volúmenes de venta respecto a un año base. En el caso de la temperatura, a pesar de que se comentó durante la exposición de los niveles de medición como un nivel de intervalo, es un hecho conocido que la escala Kelvin no es arbitraria y el cero en ella representa el cero absoluto, es decir, ausencia de energía. El último de los casos Conceptos Básicos sobre Estadística Raquel Centeno Silva 32 que merece un comentario deliberado se refiere a las horas de mantenimiento; la confusión puede presentarse porque las horas son unidades de tiempo y el tiempo es una variable continua; sin embargo, está claro que el caso en cuestión, tal como está enunciado, tiene un propósito enumerativo, es decir funciona como un contador y no es una medida de tiempo en el sentido que comúnmente se le atribuye. e) RECOLECCIÓN DE DATOS El propósito de esta sección es familiarizar al lector con algunas de las fuentes principales de datos estadísticos e indicar alguna de las prácticas que deben ser observadas para que los datos recolectados en estudios estadísticos sean confiables. Como se ha señalado hasta ahora, el primer paso en un proceso estadístico es la obtención de datos para que sean procesados, convirtiéndolos así en un insumo útil para el análisis y la toma de decisiones; el procesamiento abarca lo relativo a la ordenación y presentación de la data. Por ser el dato el principal insumo de los procesos estadísticos y el protagonista de la estadística descriptiva, es necesario ocuparse brevemente del proceso de recolección. i).- Investigación Estadística Las investigaciones estadísticas son frecuentemente asociadas con las encuestas, de hecho estas últimas se han convertido en una de las fuentes primordiales de datos estadísticos útiles para que gerentes públicos y privados seleccionen acertadamente entre las diversas opciones de las que disponen. Realizar una operación orientada a la recopilación de información original sobre un universo � población es una tarea complicada que requiere de una planificación y conducción competente para obtener datos precisos; en muchos casos la complejidad y envergadura de la investigación exige la colaboración de equipos interdisciplinarios altamente especializados, tal como sucede en la elaboración de los censos de población de una nación. En otras oportunidades la labor investigativa puede referirse a la medición sistemáticamente organizada de los resultados de múltiples experimentos estadísticos, entendiéndose como tales los estudios de un situación creada en la que la población es inexistente o mejor dicho hipotética; el objeto del experimento es establecer, por métodos estadísticos, algunas características de la población si ésta existiera. Por ejemplo, los experimentos biológicos, farmacológicos, psicológicos y médicos donde se evalúa el efecto o impacto de alguna intervención bajo ciertas condiciones que varían a voluntad del investigador. Por último, las investigaciones pueden ser tan simples como la recopilación de datos estadísticos obtenidos de informaciones provenientes de fuentes oficiales a nivel Conceptos Básicos sobre Estadística Raquel Centeno Silva 33 institucional o de publicaciones de organismos altamente especializados en estas materias. Todos los profesionales en contacto con datos estadísticos deben conocer ampliamente los problemas enfrentados su recopilación para poder evaluar la influencia de esas limitaciones cuando sean usados, a razón de lo cual se pretende dar una orientación sobre algunos de los aspectos básicos en el planteamiento de una investigación, las cuales abarcan las siguientes fases: Objeto de la investigación: comprende la respuesta a la pregunta: ¿qué se investigará?, precisando adicionalmente en qué condiciones, con qué medios, en que momento y en cuál sitio se llevará a cabo. Unidad de investigación: corresponde a la unidad estadística y significa el elemento del universo � población que origina la información, debe ser clara en su definición, fácilmente identificable y mesurable. Recolección de la observación: es la fase de observación del universo � población que permite obtener los valores de la variable que la definen. Procesamiento de la información: consiste en ordenar la información, filtrarla eliminando posibles errores y analizarla mediante los métodos y normas de la estadística. Publicación: es la etapa final de entrega de la información después de revisada, ya sea para uso propio o ajeno. Esta fase requiere que los datos se presenten adecuadamente. Al diseñar el plan de la investigación, es decir, al organizar las actividades que son necesarias desarrollar para lograr el objetivo propuesto, deben definirse cada una de las actividades, prever posibles obstáculos, y establecer los requerimientos de recursos y tiempo para llevarlas a cabo. ii).- Observación de la Población Muchos de los datos estadísticos que se requieren en una organización son datos internos, es decir, datos acerca de la producción, venta y otras operaciones propias de la empresa. Esos datos internos se compilan en infinidad de registros básicos que se realizan en las empresas, por ejemplo: el número de personas que solicitó ayuda al Help Desk, la temperatura del horno en intervalos regulares de tiempo durante la jornada de operación, las ausencias y horas extras laboradas por el personal, el costo de la materia prima y el momento de su recepción, las características físicas, químicas o estructurales de la producción, las comisiones y las ventas de cada departamento, etc. Por la naturaleza de los ejemplos citados, es intuitivo descubrir que los registros internos se llevan a cabo durante la ejecución de las operaciones y que estos insumos se presentan en forma de reportes, de los cuales destacan los financieros y los de operación. Estos últimos son quizáslos más relevantes para el desempeño profesional de un ingeniero industrial, Conceptos Básicos sobre Estadística Raquel Centeno Silva 34 porque no sólo contienen información en unidades monetarias, sino que versan sobre aspectos tales como: unidades manufacturadas, compras de material, gastos de mantenimiento, unidades defectuosas, fallas en maquinarias y operarios, tiempos de ejecución de actividades rutinarias, reportes de verificación de estándares de calidad en materias primas y productos terminados, tiempo de espera para cumplir con pedidos, horas extras, volumen de trabajo en proceso (WIP6), disponibilidad de productos en inventario, tiempos de entrega de los proveedores de bienes y servicios, condiciones de operación de las maquinarias, etc. Asimismo, los reportes se recaudan en una base temporal, pudiendo ser: diaria, mensual, trimestral, semestral o anualmente, dependiendo de su impacto en los resultados de la empresa y la frecuencia con que son llevadas a cabo las actividades que los originan. Muchos de estos reportes sirven para comparar con las metas empresariales lo que permite aplicar correctivos cuando es necesario o prever la atención de nuevas actividades o mercados; por ello, pueden estar estandarizados o responder a requerimientos especiales y específicos demandados por los ingenieros, administradores y gerentes. La mayoría de los datos y reportes internos en formato electrónico están a la disposición de quienes los necesitan para decidir, prácticamente con inmediatez, debido a los potentes y minuciosamente diseñados sistemas de información tan comunes hoy en día. Además de estos datos también son necesarios otros que escapan del alcance de la actividad interna de la empresa, particularmente buscados en la actualidad; son datos acerca de otras compañías similares para comparar el desempeño (benchmarking). Estos datos se obtienen de reportes y publicaciones, impresas o electrónicas, elaboradas por organizaciones gubernamentales, asociaciones industriales, gremiales o comerciales, empresas especializadas en la recopilación de información y el desarrollo de estudios estadísticos. Esta situación permite identificar una de las formas más comunes de diferenciar a los datos estadísticos según su fuente. Cuando se utiliza un informe que contiene datos que fueron originalmente recopilados y publicados por cualquier ente distinto a quien lo publica, se habla de la utilización de fuentes secundarias u observación indirecta; en cambio, si los que publican el reporte también acopiaron los datos se identifican como datos estadísticos de fuentes primarias o de observación directa. Muchas publicaciones son fuentes primarias de algunos datos y secundarias de otros. 6 Se le conoce por sus siglas en ingles Work in Process, y significa la cantidad de pedidos ya comenzados y aún no terminados en un momento de tiempo determinado. Conceptos Básicos sobre Estadística Raquel Centeno Silva 35 Las fuentes primarias presentan ventajas respecto a las secundarias en aspectos como la presentación y la cantidad de información, debido a que suelen mostrarse de forma más completa y detallada, incluyendo explicaciones acerca de los métodos utilizados en la recolección, lo que se convierte en un auxilio para la evaluación e interpretación de los datos. Además, siempre existe la posibilidad de que aparezcan en una fuente secundaria errores que no existían en los datos originales, principalmente asociados al proceso de trascripción7 e intercambio de datos. Estos errores en trascripción, procesamiento y presentación de los datos no son exclusivos de las fuentes secundarias, de hecho, el trabajo de trascripción es una labor fundamental y muy delicada en el momento de coleccionar los datos, aunado a la imposibilidad de descartar que en su compendio se hayan empleado técnicas inapropiadas de obtención y la diversidad de datos de distintas fuentes que se compilan en las fuentes secundarias las hacen muy convenientes; de hecho este es el tipo de observación que se usa al resolver los ejercicios y ejemplos de este texto. El profesional debe prestar mucha atención al momento de evaluar la precisión y pertinencia de los datos estadísticos consultados o recabados para cualquier análisis. Como se ha señalado hasta ahora, para recolectar los datos de un estudio estadístico, es necesario observar al universo � población que reviste interés, ya se ha expuesto el principal criterio para clasificar la tarea observadora. Sin embargo, existen otros juicios igualmente válidos para clasificar las distintas formas de observación, enumeración y medición del objeto a estudiar. Dependiendo de la concepción del problema se puede establecer una tipología en atención no sólo con la fuente, sino considerando también la periodicidad y la cobertura. Atendiendo a la fuente las observaciones se clasifican en directas e indirectas; según la periodicidad puede ser continua, periódica o circunstancial; y en relación con la cobertura pueden separarse en exhaustiva, parcial o mixta. A continuación se desarrollan un poco las clasificaciones recién introducidas: Observación Continua: es aquella que se lleva a cabo de un modo permanente, por ejemplo, los registros contables de una empresa. Observación Periódica: es la que se ejecuta en períodos de tiempo constantes; normalmente la base temporal puede ser diaria, semanal, mensual, trimestral, anual, etc. El resultado de 7 Muchos se preguntarán ¿quién se va a poner a pasar los datos existiendo disquetes, CD�s y mail? la respuesta es trivial, existen casos en que ello sigue siendo necesario por que los datos que se necesitan sólo existen en un material impreso y la segunda razón está vinculada a que el intercambio electrónico no está exento de problemas de corrupción de la información en el proceso de transferencia, ni de vulnerabilidad de la integridad de la data por errores del operario del software. Conceptos Básicos sobre Estadística Raquel Centeno Silva 36 este tipo de observación produce series estadísticas denominadas series de tiempo cronológicas, sobre las cuales se realizan extensas actividades de investigación por su relación con los pronósticos. Observación Circunstancial: en este caso responde a una necesidad momentánea y específica que requiere una evaluación esporádica, por ejemplo, el número de pacientes diagnosticados con fiebre amarilla en el Estado Zulia en agosto de este año. En lo relativo a la cobertura puede aclararse que: Observación Exhaustiva: se denomina cuando la actividad se realiza sobre la totalidad de los elementos que conforman el universo-población; un ejemplo adecuado son los censos que elabora el Instituto Nacional de Estadística (INE8). En virtud de que esta operación se ejecuta cada diez años, es también una observación periódica; más aún por ser una encuesta que es administrada y publicada por el mismo organismo corresponde a una observación directa. Es importante resaltar que cada investigación estadística podrá ser clasificada a partir de todos y cualquiera de los criterios señalados. Observación Parcial: como se argumentó anteriormente la observación de los universos � poblaciones es poco práctica y no siempre factible. Por lo tanto, es más común centrar la investigación en una muestra, dado que en este caso el investigador se fija en sólo una parte de las unidades estadísticas, se clasifica como observación parcial. Observación Mixta: cuando un estudio se hace sobre una serie de características, es natural que todas ellas no revistan igual atractivo. Una alternativa para enfrentar estos estudios, de forma que la información recabada justifique su costo, consiste en la adecuada combinación de la observación exhaustiva con la parcial, de tal manera que las características
Compartir