Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
PROBABILIDAD Y ESTADÍSTICA UNIDAD 1: COLECCIÓN DE DATOS Y DISTRIBUCIÓN DE FRECUENCIAS 1.1 Colección de datos. 1.1.1 Introducción. La estadística es una materia que ha adquirido una importante presencia durante los últimos años; en diferentes áreas del que hacer industrial, en el desarrollo tecnológico, en el diseño de nuevos productos y nuevos descubrimientos científicos. Algunos ejemplos de estadística son: - Evaluar los resultados en la protección de la capa de ozono. - Calcular las tasas de desempleo y ocupación en américa latina. - Los censos poblacionales. - Determinar la lista de las 40 canciones más escuchadas en la radio durante la última semana. - Predecir la confiabilidad de productos como: celulares, estufas, luminarias, por mencionar algunos. - Determinar la incidencia del Covid 19 en el mundo. Actualmente la estadística se define como la ciencia que brinda los instrumentos (métodos y técnicas) para recopilar, organizar, presentar, analizar e interpretar información que apoye los procesos de toma de decisiones en cualquier ámbito. Extrayendo la información contenida en los datos, podremos comprender mejor las situaciones que ellos representan. Los métodos estadísticos abarcan todas las etapas de la investigación, desde el diseño de la investigación hasta el análisis final de los datos. En general, la estadística se clasifica en dos grandes ramas: a) Inferencial. Comprende los métodos y técnicas utilizadas para que a partir del estudio de una parte de la población (muestra), se hagan generalizaciones, predicciones o estimaciones con el fin de tomar las decisiones correctas. b) Descriptiva. Es una rama de la estadística que enseña técnicas para describir los conjuntos de mediciones. Se basa en: - La recolección de datos por medio de encuestas o de otras técnicas. - La caracterización de datos por medio del cálculo de medidas estadísticas como la media (promedio). - La presentación de datos mediante tablas y gráficas. 1.1.2 Población y muestra. El procedimiento para recabar información consiste en identificar a la población que será objeto de estudio. La población (N) está constituida, por una colección de individuos u objetos a los que se les observa algún atributo (característica particular), que será objeto de estudio. La población debe estar bien definida antes de iniciar cualquier estudio. Una vez definida la población el siguiente paso es obtener una muestra (n) de la población. Una muestra consiste en seleccionar una parte de la población para realizar el estudio y conocer las características de la población. Sus ventajas consisten en reducir el tiempo y el esfuerzo para obtener lo que quiere. El muestreo es, por consiguiente, un conjunto de técnicas empleadas para seleccionar la “mejor” muestra posible, es decir, la que se considera que representa mejor a la población. El término censo se refiere a la obtención de datos de cada uno de los miembros que forman una población. En todo estudio, lo ideal sería llevar a cabo un censo, pues así se conocería muy bien a la población, pero cuando no se tienen los recursos necesarios se recurre al muestreo. El muestreo se centra en obtener, por medio de métodos diversos, una muestra de toda la población para luego, una vez que se cuenta con los resultados acerca de las características que se desean estudiar, hacer una proyección respecto de toda la población. Muestreo aleatorio simple: Se pueden usar varios métodos para seleccionar una muestra a partir de una población; uno de los más comunes es el muestreo aleatorio simple. La definición de este método y el proceso de seleccionar una muestra aleatoria simple dependen de si la población es finita o infinita (Solano and Álvarez, 2005). Muestra aleatoria simple (población finita): Una muestra aleatoria simple de tamaño n, de una población finita de tamaño N, es una muestra seleccionada de tal manera que cada muestra posible de tamaño n tenga la misma probabilidad de ser seleccionada. Un procedimiento para identificar una muestra aleatoria simple a partir de una población finita es seleccionar uno por uno los elementos que constituyen a la muestra, de tal modo que cada uno de los elementos que aun queden en la población tenga la misma probabilidad de ser seleccionados. Al muestrear n elementos en esa forma, satisface la definición de una muestra aleatoria simple de una población finita. Muestreo para poblaciones infinitas: La mayoría de los casos de muestreo en los negocios y la economía son de poblaciones finitas, pero en algunas situaciones, la población es infinita o (si es finita) es tan grande que, para fines prácticos, se puede considerar como infinita. AI muestrear una población infinita debemos usar una nueva definición de muestra aleatoria simple. Además, como no se pueden numerar los elementos de una población infinita, debemos emplear un proceso distinto para seleccionar los elementos de la muestra (Solano and Álvarez, 2005). Supongamos que se desea estimar el tiempo promedio que transcurre entre colocar un pedido y recibirlo, para los clientes de un restaurante de comida rápida, entre las II:30 A.M. y la I:30 P.M., que es el horario del almuerzo. Si consideramos la población de todos los posibles clientes, vemos que no sería factible especificar un límite finito de la cantidad de posibles visitas. De hecho, si definimos que Ia población es todas las visitas de clientes que se pudieran recibir concebiblemente durante las horas del almuerzo, podemos considerar que la población es infinita. Nuestra tarea consiste en seleccionar una muestra aleatoria simple de n clientes de esa población. Muestra aleatoria simple (población infinita): Una muestra aleatoria simple de una población infinita es aquella que se selecciona en tal forma que se satisfacen las siguientes condiciones: I. Cada elemento seleccionado proviene de la misma población. 2. Cada elemento se selecciona en forma independiente. En el caso del problema de seleccionar una variable aleatoria simple de asistencias de clientes a un restaurante de comida rápida, vemos que se satisface la primera condición antes mencionada, para cualquier asistencia de cliente durante el horario del almuerzo estando trabajando el restaurante con su personal regular y bajo condiciones "normales" de funcionamiento. La segunda condición se satisface asegurando que la selección de determinado cliente no influye sobre la selección de cualquier otro. Esto es, los clientes son seleccionados en forma independiente. Un restaurante muy conocido de comida rápida implemento un procedimiento de muestreo aleatorio simple para este caso. EI procedimiento de muestreo se basa en el hecho de que algunos clientes presentan cupones de descuento en precios de emparedados, bebidas, papas fritas, etc. Siempre que un cliente presenta un cupón de descuento, se selecciona para la muestra al siguiente cliente que llega. Como los clientes que presentan cupones de descuento lo hacen al azar e independientemente, la empresa considera que el plan de muestreo satisface las dos condiciones del muestreo aleatorio simple de poblaciones infinitas. La encuesta es un estudio o investigación que se realiza a una muestra de individuos representativa seleccionada de una población, empleando procedimientos de interrogación con el fin de obtener mediciones cuantitativas y cualitativas de una diversidad de características objetivas y subjetivas de una población. Ejemplo 1. Unos estudiantes desean saber que tan bueno es el servicio que ofrece la cafetería de la escuela y están interesados en todos los posibles clientes de la cafetería. a) ¿Cuáles son los posibles clientes? Alumnos, Maestros, Trabajadores, etc. b) ¿Qué personas deben incluirse en la población? Visitantes (supervisor, padres de familia, proveedores, etc) c) ¿Cuál es la muestra?Parte de los clientes de la cafetería. d) ¿Cómo podrías evaluar el servicio que ofrece la cafetería? Haciendo encuesta a los clientes que forman la muestra, entrevista. Ejemplo 2. La dirección de una escuela desea estudiar la compresión de la lectura de sus estudiantes antes y después de un programa de capacitación en la lectura. Si la escuela cuenta con 5000 estudiantes, podría ser virtualmente imposible medir la comprensión de la lectura de todos ellos. a) ¿Cuál es la población de interés? Los alumnos que hayan tomado el curso de capacitación. b) ¿Cuál podría ser la muestra? Una parte de esos estudiantes que tomaron el curso, mediante encuestas/entrevistas. 1.1.3 Tipos de gráficas. Una vez que se han coleccionado los datos se debe dar una mirada general a ellos para obtener una percepción de sus características principales y de algún rasgo sorprendente antes de contestar cualquier pregunta formal. Esta etapa del estudio de los datos es generalmente conocida como la fase exploratoria. Es posible que un investigador que ha recopilado datos desee resumir y describir características importantes de los mismos. Esto implica utilizar métodos de estadística descriptiva. Algunos de ellos son de naturaleza gráfica; la construcción de histogramas, diagramas de caja y gráficas de puntos, grafica de tallos y hojas, son ejemplos primordiales. Primero se propone la manera en que los datos deben presentarse, particularmente en tablas. Las tablas estadísticas representan toda la información de modo esquemático y están preparadas para los cálculos posteriores. Los gráficos estadísticos nos transmiten esa información de modo más expresivo, nos van a permitir, con un sólo golpe de vista, entender de que se nos habla, observar sus características más importantes, incluso sacar alguna conclusión sobre el comportamiento de la muestra donde se está realizando el estudio. Los gráficos estadísticos más usuales son: Histograma Un histograma es una representación gráfica de una variable en forma de barras. Se utilizan para variables continuas o para variables discretas, con un gran número de datos, y que se han agrupado en clases. En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo. La superficie de cada barra es proporcional a la frecuencia de los valores representados. Gráficas de Barras. Un gráfico de barras es aquella representación gráfica bidimensional en que los objetos gráficos elementales son un conjunto de rectángulos dispuestos paralelamente de manera que la extensión de los mismos es proporcional a la magnitud que se quiere representar. Los rectángulos o barras pueden estar colocados horizontal o verticalmente. En éste último caso reciben también el nombre de gráficos de columnas. Son de utilidad para representar datos de variables continuas o discretas. Las gráficas de barras son muy similares a los histogramas, como mencionamos anteriormente. Se elaboran con rectángulos que deben tener un ancho igual en su base y una altura equivalente a la frecuencia que se busca representar. La escala horizontal no tiene que ser continúa por tanto las barras o columnas pueden representarse separadamente. Polígono de Frecuencias. Se utilizan para variables estadísticas cuantitativas, discretas o continuas. Para una variable discreta, el polígono de frecuencias se obtiene uniendo por una poligonal, los extremos superiores de las barras. Para una variable continua, el polígono de frecuencias se obtiene uniendo por una poligonal los puntos medios de la base superior de los polígonos del histograma. Las escalas utilizadas para representar los polígonos de frecuencias influyen mucho por el impacto visual de los mismos. Gráficas circulares. Las gráficas circulares también se conocen como sectoriales, de pastel. Este tipo de gráfica sirve especialmente cuando nos fijamos en valores cualitativos en lugar de cuantitativos, permitiendo además comparar muy rápidamente las frecuencias relativas de los diferentes grupos. En la gráfica circular, los diferentes sectores (triángulos) representan diferentes grupos separados por elementos cualitativos. Esto significa que su separación no se correspondería con valores numéricos, si no con características difícilmente traducibles a números, como distintos colores o sectores de la población. Además, las gráficas circulares tienen la ventaja de representar la totalidad de la muestra. Al observar la gráfica, sabemos que estamos viendo el 100% de los eventos representados en ella, con las diferentes frecuencias porcentuales perteneciendo a los distintos sectores en los que hemos separado la muestra de estudio. Diagrama de tallo y hoja Esta gráfica presenta una exhibición gráfica de los datos usando los valores numéricos reales de cada punto de datos. A veces las opciones de tallo disponibles resultan en una gráfica que contiene muy pocos tallos y un gran número de hojas dentro de cada tallo. En esta situación, se pueden prolongar los tallos al dividir cada uno en varias líneas, dependiendo de los valores de hojas que se les asignen. Por lo general los tallos se dividen en una de dos formas: • En dos líneas, con las hojas 0-4 en la primera línea y las hojas 5-9 en la segunda línea. • En cinco líneas, con las hojas 0-1, 2-3, 4-5, 6-7 y 8-9 en las cinco líneas, respectivamente. 4, 11, 13, 14, 15, 16, 17, 18, 18, 18, 19, 21, 22, 22, 23, 24, 25, 26, 26, 26, 26, … 0 (0-4) | 4 0 (5-9) | 1 (0-4)| 1 3 4 1 (5-9)| 5 6 7 8 8 8 9
Compartir